AKP健食天

赛斯·罗伯茨谈自我实验的不合理有效性

未修正

摘要

12 年多来,我的自我实验发现了改善睡眠、情绪、健康和体重的新的有用方法。为什么效果这么好?首先,我的立场不寻常。我拥有内部人员的主题知识、局外人的自由以及遇到问题的人的动机。我不需要定期发布。我不想通过我的研究显示状态。其次,我使用了一个强大的工具。与对身体其他部位的传统研究相比,关于大脑的自我实验可以更容易地测试想法(大约 500,000 倍)。当您收集数据时,您会从类似幂律的进度分布中取样。大多数数据都有一点帮助;一小部分数据有很大帮助。我的主题知识和方法技能(例如,在数据分析中)改进了我从中抽样的分布(即,增加了每个样本的平均进度)。自我实验使我能够比传统研究更频繁地从中取样。我的自我实验异常有效的另一个原因是,与专业科学不同,它类似于我们祖先的探索,包括觅食者、业余爱好者和工匠。

去:

介绍

1960 年,物理学家尤金·维格纳 (Eugene Wigner) 发表了一篇论文,题为《自然科学中数学的不合理有效性》[ 1 ]。维格纳说,为了描述一件事而发明的数学,往往能很好地描述完全不同的事物。他无法解释这一点。我也有类似的困惑。十二年来(1990-2002 年),我的自我实验发现了改善睡眠、情绪、健康和体重的新方法 [ 2]]。四种新方法(不吃早餐减少早醒、看早起改善情绪、站立减少早醒、喝糖水减肥)令人惊讶;几乎所有的都是实用的。在健康领域,就像在其他科学领域一样,我们希望主题专家(例如睡眠研究人员)提供资助。然而,我并不是我所研究的专家,而且我的研究几乎没有任何费用。我是在业余时间做的。尽管这样,我的自我实验研究远远超过我的主流研究更好地[例如,34 ]。很长一段时间,这让我感到困惑。现在我提出一个解释。

这个谜题始于我在研究生院学习实验心理学。为了学习如何做实验,我尝试做尽可能多的实验。当时我长了痘痘。它很容易测量(每天早上计算青春痘),所以我决定做实验。我的皮肤科医生开了四环素,一种抗生素。几个月的自我实验表明,四环素不起作用 [ 5 ],这让我的皮肤科医生感到惊讶。后来的常规研究发现,四环素经常失效[ 6 , 7 ]。我的皮肤科医生有多年的经验。然而,一位非专家的自我实验发现了一些他和其他皮肤科医生不知道的重要事情。

我继续自我实验。我在前十年进步不大,但在接下来的十二年里进步很大 [ 2 ]。我的结果提出的新想法包括(从重要到不重要): 1. 关于情绪和抑郁的理论。2. 体重控制理论。3、早上看脸,晚上心情变差,第二天心情好。4.糖水导致体重减轻。5.更好的睡眠可以大大减少感冒。6.早餐会导致早醒。7. 经常站立可以减少早醒。8.改变人脸大小的方法效果。9.其他减肥方法。我的大部分结论也得到了传统研究的支持。一些减肥方法(如多喝水或吃很多寿司)无法持续,但其他方法是有用的。

没有一个众所周知的想法可以完全解释我取得了多大的进步。更好的设备(例如显微镜、干涉仪)通常会产生新的科学思想。我使用了一台个人电脑(当时是新的),这使得数据收集变得更加容易。然而,这不足以解释我不寻常的进步,因为大多数其他科学家也开始使用个人电脑。库恩 [ 8 ] 认为,莫名其妙的结果的积累有助于产生进步。这有一定的道理。我的体重控制理论部分受到拉米雷斯难以解释的结果的启发 [ 9]。了解它们后,我很快就想到了我的理论。然而,事情并没有那么简单。我还做了四个支持新理论的实验。此外,我的情绪理论不符合库恩的模式。它与莫名其妙的结果无关。这是从我发现的效果中得出的一个明显结论。Sulloway [ 10 ] 表明,晚出生的孩子比第一个出生的孩子更有可能从事和支持激进的科学。我是第一胎。

自我实验也不是充分的解释。自我实验并不新鲜 [ 11 , 12 ]。几乎所有的例子都涉及危险药物或医疗程序。例如,一名男子服用砷来测试解毒剂 [ 12 ]。另一名男子拔了一颗牙齿来测试新的麻醉剂 [ 12 ]。我的自我实验是安全的。我研究了任何人都可以使用的治疗方法。以前的自我实验几乎总是证实了实验者的信念。我的经常让我感到惊讶。毫无疑问,自我实验对于我的进步是必要的。但是它的年龄和可用性(许多科学家可以做我所做的)意味着它是不够的。

我对有效性的解释分为三个部分。第一(情况):我处于一个罕见而强大的位置。我拥有内部人员的主题知识、局外人的自由以及遇到问题的人的动机。第二种(方法):自我实验很强大,关于大脑的自我实验更强大。第三(上下文):一些更广泛的想法将更清楚为什么这种立场和方法的结合如此有效。

去:

第 1 部分:我的强大职位

我处于非常有利的位置,可以取得进步。我拥有内部人员的主题知识、局外人的自由以及遇到问题的人的动机。

内部人员的主题知识

我不是睡眠、情绪或体重专家,但我并不天真。我是一所研究型大学的心理学教授。通过教授入门心理学,我了解了睡眠、情绪和体重研究。我也知道睡眠研究,因为睡眠是由内部时钟控制的,而我的研究是关于一个(不同的)内部时钟 [ 3 ]。我的传统研究让我对实验设计、测量和数据分析有了很好的理解。

我的知识如何发挥作用的四个例子: 1. 1990 年,不寻常的数据分析显示,我的睡眠时间在几个月前减少了。这一发现引发了一系列事件,导致人们发现早餐会导致早醒。2. 因为我对老鼠做过研究,所以我知道一种称为预期活动的实验室效应[ 13]]。我的早餐发现类似于人类的预期活动。这使我的结论(早餐导致早醒)更加可信。3.从教学入门心理学,我知道抑郁症和失眠症是密切相关的。这种联系使我为改善睡眠所做的一些事情(早上看电视)改善情绪变得更加合理。4. 我对联想学习的了解(动物学习的主要主题,我的心理学专业领域)使得从 Ramirez 的结果 [ 9 ] 转向体重控制的新理论变得更加容易。

局外人的自由

我的自我实验不是我的工作。很长一段时间,我没想到会发表;甚至后来,在我决定之后,我不打算用它来获得职业中的地位。这让我可以 (a) 做任何有效的事情,并且 (b) 花尽可能长的时间。专业科学家不能尝试任何事情,也不能花必要的时间。正如戴森 [ 14 ] 所说,“在几乎所有各行各业中,业余​​爱好者 [比专业人士] 拥有更多的实验和创新自由。”

专业科学家在很多方面都受到限制。他们对人类和动物受试者的大部分研究都需要获得内部审查委员会的批准,这可能需要六个月的时间。协议的每项更改都必须得到批准。大多数专业科学家都需要资助。作为莱德伯格 [ 15,第 337] 说,“只有最有成就和最幸运的 [科学家] 才能超越他们的研究资助的更新。” 大多数专业科学家需要源源不断的出版物。要获得终身职位,您必须发布一定数量的信息。要续签赠款,您必须发布一定数量的赠款。如果你有研究生,每个人都应该做可发表的研究。两年写一篇论文可能没问题,但十年太长了。我花了十年时间才开始明白为什么我醒得太早。我尝试了一个又一个可能的解决方案,并最终取得了进展。专业的睡眠研究人员无法做到这一点。

专业科学家也受制于禁忌。1900 年代中期,阿利斯特·哈代 (Alister Hardy) 是牛津大学的生物学教授。在他职业生涯的早期,他提出了人类进化的水猿理论。然而,他什么也没说。“我想成为一名教授。我想成为皇家学会的会员,”他解释说 [ 16,p。13]。三十年后,他实现了这些目标,所以他可以随意谈谈他的理论。一位记者碰巧出席并写了这篇文章。他的一位同事很不高兴,打电话给哈代。永远不要再这样做了!他告诉他。哈代的疯狂理论让牛津看起来很糟糕。在哈代的追悼会上,他的理论没有被提及 [ 16],第 14]。因为我不是睡眠、情绪或体重研究人员,所以我不在乎他们认为什么是不可接受的。也许他们认为自我实验是不可接受的。

重大的科学进步往往与不寻常的自由有关。孟德尔的僧侣工作给了他植物学上的自由。他的同事不关心他的豌豆植物,也不关心他写的关于它们的内容。同样,与生物学教授不同,查尔斯·达尔文可以写任何他想写的东西。他的财富和缺乏工作意味着他没有什么可失去的。提出大陆漂移说的阿尔弗雷德·韦格纳 (Alfred Wegener) 是气象学家,而不是地质学家。他的地质异端当然没有打扰他的同事。孟德尔、达尔文和韦格纳阐述了戴森关于业余爱好者自由的观点。

有问题的人的动机

我做了自我实验以改善自己的生活(例如,睡得更好)。相比之下,专业科学家几乎从不研究自己的问题。他们还有其他目标。

从表面上看,专业科学家应该接受自我实验。这将使他们的生活更轻松。不需要助学金或研究生。不仅自我实验更容易,它还允许研究更广泛的问题。如果你有终身职位,你就可以负担得起进行缓慢而有风险的研究。为什么像我这样的长期自我实验不受欢迎?

在《有闲阶级的理论》 [ 17 ] 中,凡勃伦认为,上层阶级的人,比如教授,为了表明他们的社会地位而付出了相当大的努力。他们以三种方式这样做: 1.展示财富。凡勃伦创造了炫耀性消费这个词。尾鳍不会改善汽车的名义功能(运输),但会显示财富。2.显示无用。凡勃伦说,长指甲(女性)和领带(男性)的习俗之所以出现,是因为两者都表明他们的拥有者不从事体力劳动(有用),而长指甲和领带会干扰这些体力劳动。3.显示细化. 您通过显眼、耗时且价值不大的活动来展示精致。展示无用的知识,例如“死语言和神秘科学的知识;正确的拼写;句法和韵律;各种形式的家庭音乐和其他家庭艺术;服饰、家具和设备的最新属性;游戏、运动和花哨的动物,如狗和赛马”[ 17 ] 是凡勃伦的一些例子。

《有闲阶级论》的最后一章是关于教授的。正如象牙塔一词所表明的那样,大多数学术研究缺乏实用价值(规则 2)。一些事实表明,科学教授遵循凡勃伦的规则。不富有,他们不能展示财富(规则 1),但他们可以遵循规则 2(无用)和 3(精炼)。科学家区分纯研究(没有明显价值)和应用研究(有明显价值);与凡勃伦一致,纯研究具有更高的地位。举一个具体的例子,现代经济学的大部分内容,尤其是高度数学化的部分,几乎没有明显的价值[ 18]。“这是学术性的,”一位著名经济学家最近表示。“它对商界没有什么用处” [ 18 , p. 17 ] 51]。在这里学术意味着无用,就像在学术价值一词中一样。尽管诺贝尔奖应该颁发给有用的研究,但它往往颁发给没有明确实用价值的研究——例如,2009 年端粒研究医学奖。威廉·维克里 (William Vickrey) 获得 1996 年诺贝尔经济学奖后,他告诉记者,他的获奖作品“充其量……对人类福利来说意义不大”[ 18,第 19 页]。50]。据纽约客约翰·卡西迪说作家,诺贝尔经济学奖“培养了一种偏爱技术巫术高于一切的专业文化”[ 18 , p. 17]。60] – 以上实用价值,尤其是。凡勃伦会说这种倾向不需要太多培养。同时,具有重大实用价值的研究,如吸烟导致肺癌的发现,也没有获得诺贝尔奖。

没有明显价值的技术魔法就是一个精致的例子。巫术需要时间来学习。在统计学领域,教授们强调复杂的数值算法。尽管此类算法远不如图 [ 19 ]有用,但统计课本大约是百分之一的图,百分之九十九的复杂数值算法,反映了统计学教授如何度过他们的时间。同样,科学家使用不必要的花哨词。当一位科学家将某物描述为红褐色而不是棕色时,他就表现出精致。大多数人不知道rufous是什么意思。

凡勃伦的想法有助于解释为什么专业科学家很少进行自我实验。这违反了他的所有三个规则。科学家不能炫耀巨额财富,但他们至少可以希望得到一笔巨额资助,购买昂贵的设备,并有很多人为他们工作(规则 1)。由于其低成本,自我实验并不能促进这一点。像我这样的自我实验显然是有用的,违反了规则 2(无用)。任何人都可以做到,这违反了规则 3(细化)。在贬义的意义上,这是很常见的。

凡勃伦的倾向使科学家远离自我实验和有用的工作。但如果你有健康问题,你肯定会更关心减轻它而不是显示状态。一些例子表明了动机的变化有什么不同。Paolo Zamboni 发现多发性硬化症患者血流量减少 [ 20 ] 是因为他的妻子患有多发性硬化症。他不是多发性硬化症专家。实验室技术员丹尼斯·曼根 (Dennis Mangan) 发现,大剂量的烟酸迅速治愈了他母亲的不宁腿综合征 [ 21]],以前没有在科学文献中报道过的东西。最重要的例子是家庭血糖测试,这是糖尿病管理方面的巨大进步。它是由理查德·伯恩斯坦 (Richard Bernstein) 开创的,当时他是一名工程师,他本人也患有糖尿病 [ 22 ]。

去:

第二部分:自我实验的优势,尤其是大脑

我的自我实验比传统研究更有力,原因有四个。两个来自于自我实验的使用;另外两个来自研究大脑控制的测量(睡眠、情绪和体重)。(体重的变化主要是身体脂肪的变化,这是由饥饿控制的。)

自我实验的优势

首先,自我实验比传统研究容易得多​​。它使您可以更快、更便宜、更灵活地测试健康问题的解决方案。例如,自我实验可以测试一种比传统实验更快的减肥方法。在 [ 2 ] 中,我报告了五个关于体重控制的自我实验。我还对六个受试者进行了传统的体重控制实验。以做那个实验所花费的时间和精力,也许我可以做 50 次自我实验。

其次,自我实验可以同时测量很多东西。我们以多种方式持续监控自己,从某种意义上说,我们的大脑接收来自数千条神经的输入。我们的身体可能会以数千种方式出现故障。我们毫不费力地注意到其中的许多。无需尝试,我们就会注意到我们的情绪、思路清晰、困倦、睡眠质量、协调性、饥饿、口渴、我们的大部分皮肤、我们的消化、我们的关节感觉等等。传统的实验测量的要少得多。这种自我实验的广泛网络特征是我发现面孔/情绪的原因。一天早上我看电视,因为我认为它可以改善我的睡眠;第二天早上,没有任何特别的准备,我发现我的心情比平时好很多。为了量化这一点,假设我们以 100 种不同的方式监控自己。常规实验可能测量五个独立的维度。通过这种方式,自我实验比传统实验强大 20 倍。

研究大脑的优势

梭哈Ÿ荷兰国际集团大脑而不是身体的另一部分给了我更多的优势。大脑在两个方面类似于模型系统。

第一,变化很快。大脑对外部变化的反应比身体其他部位快得多。反应时间实验可能会将不同的处理间隔 10 秒。在我的许多测量行为的大鼠实验中,不同的试验涉及不同的治疗;审判相隔大约一分钟。治疗可以在数小时内显着改善大脑功能。大幅提高骨密度可能需要数月时间。假设大脑的变化比其他器官快 10 倍。

其次,测量方便。大脑可以通过测量行为来测量,我可以用我的笔记本电脑来做。我无法使用笔记本电脑测量免疫功能、肝功能、肾功能、骨密度、心脏病发作风险或其他数十项重要的健康指标。也许大脑比其他器官容易测量 50 倍。(一个例外是皮肤,它很容易测量。我的自我实验能力的例子之一涉及痤疮是有道理的。)

前两个功能使自我实验比传统研究强大 1000(50 倍 20)。最后两个功能使大脑的自我实验比其他器官的自我实验强大 500(10 倍 50)倍。总的改进——关于大脑的自我实验与传统研究相比,而不是关于大脑——是 500,000(1000 乘以 500)。这意味着我可以测试 500,000 个关于大脑的因果关系,其代价是传统研究人员测试身体另一部分的因果关系所付出的代价。两大优势(自我实验、大脑)的结合类似于果蝇和唾液腺染色体的结合,对遗传学的早期研究很有帮助。

去:

第三部分:科学进步理论

本说明的第 1 部分和第 2 部分没有解释 [ 2 ] 的两个特征。一是事故多(完全出乎意料的结果)。有六个: 1. 当我将早餐从燕麦片改为水果时,我的早醒变得更糟。2. 当我停止吃任何早餐时,我的早醒几乎消失了。3. 一大早看电视,第二天心情就变好了。4. 站得越久,我的睡眠就会改善。5. 我在巴黎神秘地失去了胃口。6. 我的体重控制理论帮助我发现了新的减肥方法,很大程度上基于拉米雷斯的意外发现 [ 9]]。为什么这么多?另一个无法解释的特征是进度增加的方式。花了十年时间才做出一个实际的发现(关于早餐和睡眠);在接下来的十二年里,我又做了大约十个。

为了解释这些特征,有助于使第 1 部分和第 2 部分背后的假设更加明确。第 1 部分和第 2 部分有意义的上下文有四个假设。

假设 1:科学进步具有幂律分布

据我所知,科学的进步是许多小步骤和几个大步骤的混合。当我仔细观察导致实际发现的理解方面的重大进步时,它们总是建立在大量数据的基础上。每一点数据都有帮助,但在多少方面存在很大差异。几乎所有的观察都是例行公事。他们并不奇怪。他们证实了一个已经很合理的想法。例如,他们重复了一个众所周知的效果。少数人不常规;在某种程度上,它们与预期相矛盾。在这个少数人中,大多数人表明一个看似合理的想法是错误的。驳斥以太理论的迈克尔森-莫雷实验就是一个例子。少数人中的一小部分立即提出了一个新想法。例如,盖革-马斯登实验发现,一些瞄准金箔的亚原子粒子向后反弹。它提出了一种新的物质结构理论。

我自己的研究类似于历史例子。我发现早餐会导致早醒([ 2 ] 中的示例 1 )来自十年的反复试验。在这十年中,我记录了大部分时间的睡眠。我收集的睡眠数据可以分为三组:(a)微小的进步。我醒得太早了数千次。在几乎所有情况下,这都不足为奇,但仍然像对照组一样贡献了一点点进步。(b)中等规模的进展。有时我尝试解决问题的新方法——例如,多锻炼。我所有尝试的解决方案都失败了。这些数据贡献的不仅仅是一点点进步;它表明合理的信念是错误的。©大进展. 两个数据集向前迈进了一大步: 1. 当我早餐开始吃水果时,早醒增加了。2. 当我停止吃早餐时,早醒几乎消失了。

这些观察结果表明,科学进步的分布类似于幂律 (Pareto) 分布,它在对数坐标 (图1)。您在收集数据(日常生活、调查、实验)时从分布中取样。大多数知识的增长都是微小的,只有一小部分是巨大的。最大的通常被称为偶然的,但图1暗示这是误导。该函数的简单性意味着所有大(偶然)、中或小进程都来自相同的底层过程。

包含图片、插图等的外部文件。对象名称为 nihms208125f1.jpg包含图片、插图等的外部文件。对象名称为 nihms208125f1.jpg

图1

科学进步的分布。两个轴都是对数转换的。几乎所有的预付款都很小;一小部分非常大。证实一个已经合理的想法的数据是一个小小的进步;否定一个合理想法的数据是中等规模的进步;产生新想法的数据是一个巨大的进步。

除了 [ 2 ] 之外,Meyer [ 23 ]描述的许多医学例子也证明了这种分布的具体证据。迈耶的每一个医学进步的例子都涉及许多小步骤和一个大步骤。更多的证据是大量的非医学例子,其中科学进步来自一次事故。在维基百科条目情缘列出了来自生物学、化学、物理学和天文学的 44 个例子。(另外 15 个来自药理学,3 个来自不涉及药物的医学,9 个来自工程学。)例如,第一块电池是在 Galvani 注意到金属手术刀产生的火花导致一只死青蛙的腿抽搐后不久制造的——这是一个偶然的发现. (也是研究神经元优势的另一个例子。)在研究这种现象时,他发现青蛙的肌肉在与两种不同的金属接触时会抽搐。第一个电池包含不同金属层。一种不同的支持图1是科学论文被引用的次数具有幂律分布 [ 24 ]。

“天才是百分之一的灵感加上百分之九十九的汗水,”托马斯·爱迪生说。 图1说你需要出汗(大量采样)才能找到灵感(向前迈出一大步)。Tukey [ 25 ] 区分了探索性数据分析(例如,图表)和验证性数据分析(例如,t检验)。再次,图1说这种区分是误导性的。它说你产生想法的方式与测试它们的方式相同。多年来,和 Tukey 一样,我相信创意测试和创意生成需要不同的方法。[ 2 ]的标题(“作为新思想来源的自我实验”)反映了这种区别。它说自我实验是产生想法的好方法——好像它不是测试它们的好方法。[ 2 ] 的表 1说明了同样的事情。图1说我错了。事实支持图1. 我多次使用自我实验来测试想法。大多数产生创意的事故都发生在我测试一个想法时。Ramirez 令人惊讶的观察 [ 9 ] 发生在测试一个想法时。

假设 2:斜率变化

第二个假设是进度分布的斜率是变化的。这取决于你知道什么和做什么。主题知识使分布变平(左侧面板图2)。与非专家相比,睡眠专家将从一项睡眠数据中学到更多。巴斯德的“机会偏爱有准备的头脑”是左侧面板的一个子集图2,这表明所有数据都支持有准备的头脑。此外,科学方法使分布扁平化。与相同数量的非实验数据相比,实验将产生更多进展(右侧面板图2)。同样,更好的数据分析会使分布变平。已经观察到类似幂律分布的这种变化[ 4 ]。

包含图片、插图等的外部文件。对象名称为 nihms208125f2.jpg包含图片、插图等的外部文件。对象名称为 nihms208125f2.jpg

图2

学科知识(左图)和研究类型控制着进展分布的斜率。

知识改善斜率的想法解释了为什么我的进步速度在十年后增加。经过十年的反复试验,我发现早餐会导致早醒。这是向前迈出的一大步。我相信它改善了我的进度分布的斜率,因为它增加了我的知识。它表明在石器时代生活的元素中可能会发现其他强大而有益的治疗方法。这个想法导致了另外三个发现(早晨的面孔和情绪,站立和睡眠,睡眠和感冒)。

假设 3:采样率不同

第三个假设是从分布中抽样的速率是变化的。有些方法允许比其他方法更多的采样。例如,快速实验设计(例如,简单的设计)允许比慢速设计(例如,更仔细的设计)更高的采样率。这可能看起来很明显,但在我读到的关于实验设计采样率的内容中从未提到过。

假设 1-3 解释了为什么我的自我实验异常有效。专家——例如睡眠专家——比我更了解这个主题,使用更好的设备,每个实验的主题比我多,所以他们的分布比我的更平坦。但是他们的斜率优势被我在采样率方面的优势所淹没。

假设 4:自由和动机很重要

早些时候,我举了六个例子(孟德尔、达尔文、韦格纳、赞博尼、曼根、伯恩斯坦),这些例子表明了自由和动机的重要性。它们是内部/外部的相关性:具有异常动机或自由的局外人比内部人员取得更多进步。行业内的相关性也存在,具有不同寻常的自由或动机的内部人员比其他内部人员取得更多进步。在2006-7年的The New Yorker中,Atul Gawande 写了两篇关于医学创新的文章 [ 26 , 27 ]。第一个 [ 26] 是关于 Apgar 分数,它描述了一个新生婴儿的健康状况。自 1953 年推出以来,Apgar 评分逐渐提高,挽救了数千人的生命,尽管根据 Gawande 的说法,产科医生不会以经批准的“循证医学”方式进行研究。此外,产科医生的地位较低:“其他领域的医生总是看不起他们的产科同事,”Gawande 写道。这两个特征——较少“正确”的研究方法和较低的地位——表明比平常更多的自由(研究方法的更多自由)和不寻常的动机(较少渴望地位,因为产科医生在医学领域选择了地位较低的工作)。Gawande的第二篇文章[ 27] 是关于使用检查表来减少手术错误,这是由一位名叫 Peter Pronovost 的医生开创的。当被问及他为什么从事这项工作时,Pronovost 说他的父亲死于医疗失误 [ 28 ],这是一个不寻常的动机。Gawande 没有提到这一点,但确实注意到了 Provonost 工作的奇怪之处:没有“数百万美元的资助”,没有“成群的博士生和实验室动物”[ 26 ]——也就是说,没有显着的财富。“他专注于通常不被认为对学术医学有重大贡献的工作,”Gawande 写道。“然而,在过去的十年里,他的工作已经挽救了比任何实验室科学家更多的生命”[ 26 ]。没有凡勃伦倾向,普罗沃诺斯特取得了非常有用的结果。

去:

对这个解释的测试

在前面的部分中,我已经描述了它的解释和简单的证据。本文的其余部分描述了更复杂的支持(本节)、相关工作(下一节)以及更广泛但兼容的解释(“科学与人性”)。

一种名为 Reichenbach 的共同原因原理的哲学思想有助于解释罕见事件。它表示如果两个事件相关联,要么一个导致另一个,要么它们有一个共同的原因。有一个共同的原因意味着如果您查看导致两个事件中的每一个的触发事件序列(A 导致 B 导致 C),您应该找到两个序列分支的公共元素。例如,假设事件 A 和 B 是相关的。那么导致 A 的事件序列(X 导致 Y 导致 A),如果时间延长,应该满足导致 B 的事件序列(X 导致 Z 导致 B)。在这个例子中,A 和 B 的共同原因(触发事件)是 X。在实践中,赖兴巴赫原理相当于闪电不会因为不同的原因在一个地方发生两次29 ]。例如,有一天晚上你在楼下听到一种奇怪的声音(罕见事件 1)。早上,你的电视不见了(罕见事件 2)。罕见事件 1 和 2 在空间和时间上相关,肯定有一个共同的原因(窃贼)。罕见事件 2 有助于在对罕见事件 1 的可能解释之间做出选择。

我想解释的研究 [ 2 ] 有几个罕见的特征:

很棒的新奇。之前没有人得出任何与早餐导致早醒、站立减少早醒、早晨脸改善一天后的情绪或糖水导致体重减轻的想法相近的结论。

赖兴巴赫原理说这九个罕见的特征应该有一个共同的原因。

我在这里给出的解释通过了这个测试。所有九个特征的触发事件是我开始涉及大脑的自我实验。我拥有近乎专业的学科知识,但我的动机却不同寻常:个人利益。所以我 (a) 有一个有利的进度分布函数,(b) 可以很容易和经常地从中采样,并且 © 可以尝试任何事情。这种组合非常有效,它让我在几个领域(特征 2)中产生了非常新颖的想法(特征 1)。因为它效果很好,我做了很长时间(特性 3),不需要任何昂贵的东西(特性 4),而且我不需要成为专家(特性 5)。因为我这样做是为了个人利益(特征 6),所以我研究了日常治疗(特征 7)。因为我不是出于职业原因,所以我没有发表太多文章(Feature 8)。

其他对有效性的解释在这个测试中失败了,因为它们没有解释所有九个特征。我聪明的解释并没有解释个人利益(特征6)、日常治疗(特征7)、低发表率(特征8)和立即使用(特征9)。我做自我实验的解释无法解释日常治疗(特征7)和低发表率(特征8)。我是局外人的解释未能解释个人利益(特征 6)和立即使用(特征 9)。

去:

相关工作

局外人比内部人拥有更多自由的想法以多种形式出现。凡勃伦认为,外人享有的自由赋予他们解决问题的优势 [ 31 ]。Sulloway 认为,后来出生的人比第一次出生的人更有可能支持激进的科学,因为他们对现状的投入较少 [ 10 ]。美国实验室的一项实验发现,当被告知问题来自希腊时,学生在解决问题的任务上比被告知问题来自附近时表现更好 [ 32 ]。学生们对希腊的了解比美国少,包括对希腊的制约因素了解更少。也许这有助于他们想到更多的解决方案。同样,局外人对约束的了解比内部人员少。

人们投入大量资源来展示地位的想法在人类学中很常见。最近的一个例子是Watching the English: The Hidden Rules of English Behavior [ 33 ],其中包括很多关于课堂展示的内容。在凡勃伦之后,地位象征一词变得普遍。

在许多情况下都观察到类似幂律的分布 [ 34 , 35 ]。理论家 Zipf [ 36 ]、Mandelbrot [ 37 ] 和 Bak [ 38 ] 将它们用作统一主题。我对幂律分布的使用最接近 Taleb 的 [ 39 ],他强调了它们对日常生活的影响。塔勒布认为我们无法预测极端事件——我们“低估”了它们。Taleb 主要讨论金融坏消息,例如股市崩盘,但他的想法也适用于好消息,包括科学发现。他向我指出了他的工作和我的工作之间的联系。正如我们低估了极端的坏消息,我们也低估了极端的好消息消息。金融家承担太多风险;科学家们没有得到足够的。自我实验使测试远景想法变得容易。

去:

科学与人性

我对自我实验的有效性的解释可以概括为我处于一个不寻常的位置并拿起了一个不寻常的工具。一个罕见的事件(不寻常的位置加上不寻常的工具)导致了另一个(不寻常的结果)。我的工作看起来不寻常,是的。如果你阅读 1000 篇科学文章,包括我的,我的就会脱颖而出。但换个角度看,其他999篇文章都是离群值。像大多数人类活动一样,我的自我实验非常符合人性。专业科学——以这 999 篇文章为代表——没有。我相信,这是我的自我实验异常有效的另一个原因:它类似于经过时间考验的探索方式。

科学类似于人性的一部分:我们边做边学的方式。我的第一个自我实验受到一篇关于如何教授数学的文章的启发 [ 40 ]。“最好的学习方法就是去做,”它说[ 40,p。466]。作者的意思是这是关于人性的陈述。边做边学,学习研究人员称之为工具学习,很容易在老鼠和鸟类等动物中进行研究。这意味着我们的大脑长期以来一直在边做边学。科学实验是在方法智慧的辅助下边做边学(例如,实验设计)。在我的自我实验中,我用科学的方法帮助我通过做个人问题来学习,比如如何睡得更好。这些方法帮助我做一些我倾向于做的事情(边做边学)。

有些工作很符合人性。他们利用自然倾向,提供我们快乐所需的大量东西。其他工作没有。它们使工人违背自然倾向或不满足基本需求。作为一份全职工作,科学不适合。我之前讨论过的一个原因是:希望显示状态会妨碍进度。另一个原因来自我们过去进化中的探索地点。几百万年前,当人类谱系与其他灵长类动物谱系分离时,我们的祖先是觅食者。觅食包括开发和探索。有时,您通过返回已经找到食物的地方来找到食物(开发);有时你会寻找新的地方(探索)。蚂蚁清楚地显示了开发/探索的差异。有时它们会跟随其他蚂蚁到食物来源(剥削),在厨房地板上划一条线;有时他们独自徘徊(探索)。

人类是职业专家,而不是觅食者。如果您随机选择 100 人,他们可能有 100 个不同的工作。没有其他物种是这样的。我提出我们的大脑在许多方面发生了变化,以使职业专业化成为可能[ 41 ]。然而,在从觅食到占领的百万年转变中,我相信有些事情保持不变。不变的元素使我的自我实验比专业科学更有效。

我提议,纯粹的觅食之后是一个爱好时代,在此期间,将少量时间用于类似爱好的活动,大概是工具制造。起初,这些爱好都是探索——没有积累的知识可以利用。专业化开始:不同的人有不同的爱好,就像现在一样。通过反复试验(业余爱好者的探索),关于在哪里找到以及如何控制材料的知识慢慢积累。它是通过模仿传递的。据我所知,业余爱好者的探索有四个特点:

由专家。那些爱好它的人想出了如何制作更好的篮子。“最好的学习方式就是去做”,而他们正是这样做的。

最后三个属性类似于作为觅食一部分的探索。觅食不涉及专业化(一个物种的所有成员都寻找并吃相同的食物),但是,就像业余爱好者的探索一样,觅食探索被剥削所包围(动物不会花很长时间去探索),利益流向发现者(你吃你找到的东西)而且好处是立竿见影的(你通常会立即吃掉)。

随着爱好变得更加熟练并且他们的产品更加有用,交易开始了。一位刀术专家用他制造的一把刀换了一把枪术专家制造的枪。双方都从交易中受益。将每个人可用的工具制造知识视为一堆。贸易使这堆东西更有价值。当堆和它的价值增长到足够大时,兼职工作就成为可能:你可以用交易来满足你的一些需求。最终,全职工作成为可能。每个人都学会了一小块桩子来谋生。

在从爱好到工作的转变之后,职业知识的堆积通过我称之为手工探索的方式继续增长。拥有各种专业的人慢慢提高了他们的艺术水平。手工探索与业余探索具有相同的特性。再次,它是由专家。那些以制作篮筐为生的人想出了如何制作更好的篮筐。对于非专家来说,尝试改进篮筐制作是浪费时间。专家们领先一步。再一次,探索被剥削所包围——现在,利用专门知识谋生。根据现代工匠的判断,篮子制造商并没有花很长时间进行纯粹的研究 [例如,43]。他们在日常工作中尝试了新的做事方式。再次,成功探索的好处归发现者所有。一位发现如何制作更好篮子的篮子制造商能够制作出售价更高的篮子。同样,好处是立竿见影的。如果篮筐制造者找到了更好的投篮方法,他就能立即投篮。

这些属性是有道理的。属性 1(由专家提供):专家利用了在他们之前的许多专家(他们的老师)。他们可以将勘探重点放在更有可能获得回报的领域。非专家不知道从哪里开始。属性 2(被剥削包围):大量的手工研究可能是由偶然的观察引发的:有些东西比平时更好或更糟。这导致了对原因的研究。起点,意外发现,没有任何成本,因为它发生在正常工作中。随后对原因的研究可能会通过揭示一些产生影响的新事物来收回成本。一个现代的例子是,一个经常看病人(剥削)的医生比一个从不看病人的医生更有可能知道什么研究是最有益的——他只做研究。特性 3(直接收益)和特性 4(对发现者的收益)激发并维持了探索。对于这个系统中的某些人来说,属性 3 和 4 似乎是必不可少的。如果您没有获得好处,为什么要探索?

我的自我实验具有所有四个特性;专业科学只有第一。属性 1(由专家提供):我不完全是睡眠专家(或情绪专家或体重专家),但我已接近成为一名专家。专业的科学是由专家完成的。属性 2(被剥削包围):我的自我实验只是我所做的一小部分。我的大部分时间都花在通过进行主流研究和教学来利用我在实验心理学方面的专业知识。对于一个把所有时间都花在科学上的专业科学家来说,没有单独的剥削。例如,睡眠研究人员不会以提供睡眠建议为生。大多数大学教授都教书,但在研究型大学,教学只是工作的一小部分。属性 3(立即受益)和 4(对探索者的好处):当我发现如何睡得更好时,它使我立即睡得更好。我的其他发现也是如此。正如我所说,专业科学家不会研究他们自己的问题。每年发表的数以千计的科学论文中,几乎没有一篇能立即受益。在立即受益的极小部分中,几乎没有人受益于所涉及的科学家(在改善他们的日常生活的意义上)。

表格1总结了这些比较。我的自我实验类似于觅食、业余爱好者和手工探索,专业科学与其中任何一个都不匹配。觅食、业余爱好者和手工探索的相似性表明,我们的大脑非常适合需要大量剥削和少量探索的工作。虽然全职科学家被期望全职探索,但全职探索是很不舒服的。想象一下,饿了,不知道在哪里可以找到食物。想象一下每天挨家挨户地向陌生人索要捐款。或拨打电话簿中的号码,招揽业务。科学需要自由。但是,有了给他们的自由,专业科学家就把他们的工作变成了一项主要是剥削的工作。他们选择进行能够产生源源不断科学文章的研究。他们这样做是因为他们想要稳定的可见进步,而开发可以提供但探索不能。此外,他们还利用自己的自由来显示状态。科学需要比其他工作更多的自由。几乎所有目前的工作(公交车司机、工厂工人、秘书、警察、平面设计师)几乎都或完全是剥削。工作人员使用专业技能来完成工作。探索所花费的时间很少或为零。专业科学家的工作是唯一的例外,这是我所知道的唯一一份以探索为主要活动的工作。相比之下,我的自我实验是符合人性的探索。我不需要地位和稳定的进步,因为我是从我的工作(教授)中得到的。我没有'

表格1

不同语境下的探索 勘探类型财产觅食业余爱好者手工制作专业科学我的自我实验由专家不是的是的是的是的混合探索是的是的是的不是的探险者受益是的是的是的不是的立竿见影的利益是的是的是的不是的

开发和勘探的区别在于低风险/低回报活动(开发)和高风险/高回报活动(勘探)之间的区别。觅食者和工匠几乎将所有时间都投入到低风险活动中。我可以将一小部分时间投入到高风险的自我实验中,因为我其余的工作都是低风险的。专业科学家很合理地希望将几乎所有的时间都投入到低风险的活动中,例如可能奏效的实验。因此,他们的大部分研究——比如 95%——都是安全的,不太可能产生我所做的那种发现。剩下的5%呢?当然,科学家们做了一些高风险/高回报的研究。我认为问题在于属性 3 和属性 4。除非科学家本人受益,否则进行高风险/高回报的研究是没有意义的。对于科学家来说,高风险/高回报的研究并不是具有实用价值的研究(例如如何睡得更好)。是研究将获得诺贝尔奖。有用的研究处于低地位。因为诺贝尔奖必须是高地位的(获奖者由高地位的科学家选出),有用的研究往往被排除在外。因此,专业科学家 95% 的研究由于一个原因(希望稳步进步)而没有什么好处,剩下的 5% 则出于另一个原因(高地位 = 无用)。

当科学与人性结合在一起时(我的自我实验),进步很快;当他们不这样做时(传统研究),进展缓慢。我的自我实验出人意料地有效的一个原因是,与将方钉放入圆孔中相比,将圆钉放入圆孔中非常容易。

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2964443/