
婴儿的“混沌探索”,为何能碾压AI的“精准算法”?

文 | 追问nextquestion
这个问题听起来深刻或玄奥,但事实上,倒也不至于抽象到让我们束手无策。无非两种情况,类似问题你之前见过,因此可以直接或调整后使用已知的解决方案;又或者你对问题的背景一无所知,但你还可以随机尝试,摸索以获取信息。
这个问题虽然抽象,却与AI构建密切相关。就像启动一台没有预装软件的计算机,没有预设的问题解决策略,你必须自行设计解决方法。那么,如何确定在不同情境下的最佳解决方案呢?
一种方法是观察人类的真实行为。在理论物理学家肖恩·卡罗尔(Sean Carroll)与心理学家/哲学家艾莉森·高普尼克(Alison Gopnik)的这场对谈中,我们会了解到人类在不同生命阶段采用的不同解决方案。
简而言之,婴儿更具创造力,思维更加自由,他们会尝试各种事情,注意力难以集中——而这恰恰是优点而非缺陷。婴儿难以专注于一件事,这反映了他们通过多种互动方式学习世界的本质。
相对而言,成年人则会对事物进行特定优化,理想情况下,当你30多岁时,将掌握大量问题解决策略,更倾向于完善已知方法而非随机探索新方法。当然,并不是说你做不到,也不是说这不可能,而是你在一些技巧上确实比其他人更擅长。当生育高峰期过去后,你可能重新变得不那么僵化。这或许是理想状态,尽管我们都知道有些人未能达到。
这一现象的核心启示在于:分工不仅存在于团队合作中,也存在于个体的不同生命阶段之中。在接下来的讨论中,我们将探讨一些可能与AI和计算机编程密切相关的经验,并思考如何最好地理解世界。现在就让我们开始吧。
肖恩·卡罗尔,Sean Carroll,约翰霍普金斯大学自然哲学教授、Mindscape播客主理人。他在匹兹堡大学马克·索默实验室获得认知神经科学博士学位。随后在范德堡大学Jeffrey Schall, Geoff Woodman, and Gordon Logan实验室从事博士后研究,研究运动皮层和基底神经节神经群活动如何影响自由行为小鼠的自然行为。
艾莉森·高普尼克,Alison Gopnik,加州大学伯克利分校心理学教授、哲学客座教授,牛津大学实验心理学博士,儿童学习和发展研究的领导者,首位从儿童意识的角度深刻剖析哲学问题的心理学家,心理理论创始人之一,第一位受邀在美国心理学会开设讲座的儿童心理学家。她曾获得心理科学协会终身成就奖等多项荣誉,并曾担任该协会主席。她的著作如《摇篮里的科学家》(The Scientist in the Crib)《宝宝也是哲学家》(The Philosophical Baby)以及《园丁与木匠》(The Gardener and the Carpenter)等,深入探讨了儿童思维与学习模式,对学术界和公众认知产生了深远影响。
01 儿童与成人认知的本质差异
肖恩·卡罗尔:艾莉森·高普尼克,从你的研究中可以提炼出一个观点:儿童、小孩、婴儿不应被简单视为“未成形的成年人”,他们实际上以不同的方式思考。这样表述是否恰当?
艾莉森·高普尼克:完全正确。长久以来,人们总认为35岁是心理学家或哲学家的智慧巅峰。随着年龄增长,我们会逐渐成长为那个“了不起的人”,并且随着年龄进一步增长,我们又会逐渐衰退。但从进化视角看,这毫无道理。越来越清晰的是,儿童的智能与典型成人存在本质差异,老年人的智能也可能具有独特性。因此,这更像是不同种类的智能之间的权衡,而不是有一种所谓的智力,我们或多或少地拥有它,一开始拥有得较少,以后拥有得更多。
我长期研究的这一理念源自计算机科学,即不同智能类型间的权衡——尤其是所谓“利用型智能”(exploit intelligence)与“探索型智能”(explore intelligence)的权衡。我认为,童年本质上属于“探索型智能”,这与成人的“利用型智能”截然不同。
最初提出这一观点时,我只是对那些自诩为智慧顶点的35岁哲学家和心理学家略有微词。随着我的孩子长大并有了孙辈,我的看法彻底反转。时至今日,我感觉:“相比那些可怜的35岁年轻人们,孩子们和祖母们才是真正享受有趣人类活动的人。”
人类在青春期前和绝经期后 才是完整的人类。
中年阶段只是被美化的灵长类动物,我们正在做的事情所有灵长类动物都会——忙着在等级制度中寻找定位、交配、争夺资源等。只有在幼年和老年时,我们才能进行心智理论、世界探索、因果推理、文化传播和大规模叙事等真正“人性化”的活动。所以,“祖母和孩子们确实应该低调些,毕竟我们才是享受乐趣的人。工作的事情还是让35岁的人承担吧。”
肖恩·卡罗尔:究其原因,是因为我们正处于传统语境下或名义上的“成年黄金期”——我们更加专注、执行力更强,但灵活性与创造力不足。
艾莉森·高普尼克:计算机科学认为,解决“高维任务”时,一个问题有很多不同的可能解决方案,这些解决方案在许多不同维度上各不相同。你可以稍微调整一下你已经在做的事情,看看这是否会让事情变得更好一些。这是尝试解决问题的一种非常有效、有效的方法。如果这种改变奏效,那就可以尝试这一调整。这就是基本的“利用型策略”,也就是成年人惯用的策略。
当然,在这个领域中可能还有另一种解决方案,它与我们目前的方案相去甚远。如果你只是不断地做这些小的调整,你或许永远不会达到目标。不妨纵身一跃,尝试更多的事情,不管是否有用,只为看看世界究竟是如何运作的。在计算机科学中,这就是低温搜索(low temperature search)和高温搜索(high temperature search)之间的区别。
想象一下,空气分子的运动,要么非常缓慢地移动,要么在空间中随机弹跳。计算机的解决方案是平衡两种策略。不能同时执行两者,那又该如何?
事实证明,最好的策略是从大规模的、随机的野生搜索开始(当然,这将花费更长的时间,而且很多时间花在了思考实际上没什么益处的事情),然后再逐渐冷静下来,开始进行更集中的搜索。计算机科学家们将这种策略称为“模拟退火”(simulated annealing)。这就像加热金属后再冷却使其更加坚固的过程。我认为,童年本质上是进化“模拟退火”的方式。
“专注且面向输出的”与“嘈杂、跳跃、随机的行为”,不用想也知道哪种描述更适合4岁的孩子。孩子们会说奇怪、疯狂的话,经常进行奇怪的假装游戏,做些乍看毫无意义的事情,从某些角度来看,这可能看起来像是一种缺陷,但这确实是处于探索模式下最想做的事情。这意味着,至少在某些情况下,儿童比成年人更具创造力。
我们通过实证研究证明了这一观点。例如,给儿童和成年人设置同一类问题,这些问题要么有显而易见的解决方案,要么需要提出非常规假设。不出所料,当解决方案比较明显时,成年人更能快速找到答案。但面对需要非直观假设的问题时,四岁儿童的表现反而优于大学生,更能找到正确答案。
如此看来,4岁儿童(某些方面)比成人更有创造力。但问题在于,当我们谈论成人的创造力时,它包含两个层面:第一层是生成大量可能性,第二层是从中筛选出最优解——关注有价值的选项而非无意义的干扰。这两者并不容易直接比较,前者产生很多解决方案,想到很多可能性,这是儿童擅长的领域,而后者需要成人的执行型利用能力。
伟大的哲学家约翰·洛克(John Locke)曾提出,人类智能分两类——“机智”(wit)与“判断”(judgment),机智是生成新想法的能力,判断则是筛选优质想法的能力。如此看来,儿童似乎拥有极强的机智,而判断相对较弱。
▷约翰·洛克(John Locke)是17世纪英国著名的哲学家、思想家,被誉为“自由主义之父”。他提出了“天赋人权”“分权制衡”等重要思想,为现代民主政治和自由主义理论奠定了基础。他的著作《政府论》等对后世的政治哲学和社会思想产生了深远影响。
02 进化视角下的童年期演化逻辑
肖恩·卡罗尔:如果我们认可进化赋予了人类生命周期中这种精妙的“时间分工”,为什么我们需要面对这样一个事实,即婴儿极度依赖他人,需要漫长时间才能自立。能否谈谈这种现象在其他物种中的情况?这是偶然现象,还是某种优化策略的结果?
艾莉森·高普尼克:是的,这很有趣。如果你观察各种各样的物种,会发现从昆虫(甚至植物)到灵长类和哺乳动物,智能水平、学习能力、大脑使用效率与其童年时长呈正相关(从人类视角衡量)。
这首先就体现在鸟类身上,如果你观察像鸦科(corvids)或乌鸦(crows),这些鸟类极其聪明,雏鸟期长达一到两年,需要一直被照顾;而家鸡几周内就成熟了,尽管这说法可能得罪养鸡爱好者,但鸡确实不算聪明。更准确地说,它们只擅长做如啄食谷物之类的事情,它们从出生起就非常擅长做这些事情,但它们不擅长学习。
从“探索-利用”视角看,这种差异合乎逻辑。对于生活在多变环境中需要不断适应新事物的生物而言,它们需要经历一个探索期才能进入发展阶段。在这一时期,个体的生存能力较弱,需要依赖同物种的成年成员照料,以获取充足的营养供给,支撑这段高强度学习期的能量需求。这似乎是一种进化策略。
卡路里的消耗颇具启示性。事实证明,人类大脑的能量消耗惊人——即便是成年人,大脑也要消耗全身20%的热量,这意味着大脑堪称一台高耗能的计算设备;而对于四岁儿童而言,这一比例竟高达60%,甚至接近70%。从这个角度看,一名普通四岁儿童简直就像《神秘博士》里的星际生物的存在——他们带着一个仿佛永不餍足的“饥饿”大脑穿梭世界,既驱使我们不断投喂花生酱三明治以满足其能量需求,又要求海量数据喂养其认知发展。
肖恩·卡罗尔:这观点很有意思,因为它并非纯粹物理层面的解释——与脑容量等直观指标无关。若我们允许自己以诗意的视角,将自然设计的动力归因于某种聪明的智能设计,就会发现:这种刻意设置的生存困境恰有其深意,它迫使孩童在探索中培养创造力,而这种能力终将在未来人生阶段收获丰硕回报。
艾莉森·高普尼克:确实如此。这种观点的核心在于,生物学和进化论本身充满复杂性,且与其他动物性状存在关联。例如,有些聪明的动物并没有漫长的童年期,比如头足类动物中的章鱼。
不同物种似乎演化出各异的“探索-利用”解决方案:某些昆虫如蚂蚁与蜜蜂通过群体分工实现,例如工蜂负责劳作而侦察蜂专注探索。虽然具体策略千差万别,但这种机制在从昆虫到脊椎动物的广泛物种中呈现出惊人普遍性,恰恰印证了其承载的深层自适应性价值。
肖恩·卡罗尔:这种分工是否是普遍现象?我记得迈克尔·穆图克里斯南(Michael Muthukrishna)曾在节目中提过一个心理学经典实验:让儿童和黑猩猩将棍子插入盒子获取奖励;当发现其中一根棍子无效时,儿童并未意识到问题,而黑猩猩却能调整策略。这或许源于儿童对成年人的认知信任机制。
艾莉森·高普尼克:确实如此。这也从另一个维度揭示了人类漫长的童年期与特有智能的深层关联——我们不仅是社会性学习者,更是文化传承者。人类通过代际传递信息的规模远超其他物种,虽然主要发生在父母照料儿童的场景中,但值得关注的是这种机制背后的平衡法则:单纯模仿他人行为并无意义,只会导致文明停滞。因此,在代际传承链条中,总需要有人既能传承既有知识,又能突破常规进行创新。
多项研究表明,儿童在模仿过程中会进行权衡,“这件事的实际逻辑是什么?”“示范者的可信度如何?”有一个可爱的实验:当实验者宣称“我将演示操作方法”时,儿童更倾向于出现你提及的“过度模仿”现象,即完全复刻示范动作。但若实验者改用开放式提问:“哇,快看这个!我也不知道这是怎么回事,你知道吗?”儿童则更倾向于探索,包括以这些看似不合理的方式探索,反之亦然。
▷图源:yzhu.io
我们也做过一些实验,若让儿童接触一台机器,我们常用的是“布克特探测器”(Blicket detector),当他们发现红色积木能激活机器后,而成人声称“蓝色积木才是正确选择”时,儿童会精准地在自身观察与成人陈述之间寻找平衡。他们既不完全依赖自己的发现,也不盲从权威,而是根据两种解决方案的概率权重提出折中方案。
所以,我承认我们确实是社会人这一事实,但在文化和社会进化的过程中,我们必须平衡模仿和创新——这样做相当复杂,我认为这在儿童的特殊智力中也发挥作用。
肖恩·卡罗尔:这让我联想到指导研究生的场景,你会告诫他们“要勇于创新,但也要研读文献”,其中存在平衡,不能只想着盲目地追随其他人已经做过的事情。
艾莉森·高普尼克:当前我们在重点研究照护行为中的认知维度,尤其是当人类承担养育责任时展现的"照护的智慧"。这种智慧的核心在于,如何为被照护者搭建通往自主性的阶梯。
作为教育者、治疗师或家长,既不希望他们盲目模仿,也不愿看到他们因循守旧,更不能任其误入歧途。这种平衡艺术在不同照护场景中具有普适性。不论是两岁孙辈的祖母,还是指导博士后研究员的导师,本质上都在解决同一认知难题——如何在文明传承中平衡模仿与创新。正是这些照护者的存在,文明传承才得以真正实现。
近期我在研究与写作中发现一个有趣现象——祖父母(尤其是祖母)在文化传承中扮演着举足轻重的角色。相当多的人类学证据表明,当涉及文化传播时,老年人而非父母往往承担主要传递者角色。父母更多努力处理日常事务,维持子女温饱与安全,而祖父母则通过给孙辈朗读《纳尼亚》系列书籍、哼唱百老汇经典曲目等精心设计的文化仪式,他们专注于完成这种文化传播。当然,就像我们的童年特别长,我们的绝经后期(老年期)也很长,唯有虎鲸种群呈现出类似的演化奇迹。
虎鲸是为数不多在绝经后仍能长期存活的哺乳动物,它们的祖母鲸群会持续传递生存智慧。当食物匮乏时,正是这些老年雌鲸带领鲸群寻找生机——我记得二十年前某处海域就曾出现这种现象。这种跨代智慧传递机制,展现了区别于常规成年智能的独特认知模式。
肖恩·卡罗尔:这听起来简直可爱得不像真的。虎鲸真的把这么多责任交给祖母吗?
艾莉森·高普尼克:嗯,我喜欢这个例子的原因就是,它显示了传递食谱是非常重要的,而这是为祖母们设计的进化。
03 婴幼儿的主动探索学习
肖恩·卡罗尔:人类婴儿是如何构建世界观的?
艾莉森·高普尼克:过去20-25年间,我们这些儿童发展学家主张:儿童发展本质上类似科学理论的构建。乍一听很荒谬,毕竟幼儿并非真正的聪明的科学家,但当你仔细观察他们理解世界的方式时,会发现这与科学理论的迭代很相似。从计算视角看,这是一种极佳的获取世界信息的方式。婴幼儿从极小时期开始就在探寻因果关系,这对世界观构建至关重要。
通过具有意外因果属性的"布利克特探测器"实验装置可以证明,即使是蹒跚学步的儿童也能对这类系统的运作机制做出正确推断。他们似乎建立了这种"因果模型"(有时称为直觉理论),会随着新数据的输入不断修正其理论体系。我们能够系统性地验证这一点,比如,当向幼儿展示探测器的工作原理后,其推理模式与优秀科学家高度一致。
当然,理解机制原理尚属次要,更重要的是解读周围的人是如何工作的。早在80年代,我与同行发展了“心智理论”(theory of mind)研究,旨在揭示婴儿如何理解他人思想。我们发现,婴儿的初始认知远超我们预期,且婴儿会持续学习,如从1-2岁开始理解“他人可能有不同需求”,3-6岁逐渐掌握“他人可能持有不同信念”。这些都是非常深奥的东西。
最近,发展出了一项非常有意思的工作——儿童直觉社会学(children's intuitive sociology)。他们也会思考一些更深层次的问题,例如,当他们是盟友时,会以某种方式行事,而当他们是敌人时,则会以另一种方式行事。若某个生物体型更大、处于支配地位,他就能如愿以偿。
回到照护主题,我们现在试图弄清婴儿如何理解照护行为。已有证据表明,婴儿甚至能识别“什么样的人可能成为合格的照顾者”。因此,在我谈到他们的无助时,其实有一种有意思的纠结在里面。如果你是那种无助的生物,了解他人、了解爱、了解他人是什么样的,这对你的生存来说真的很重要。当然,作为成年人,这仍然是我们学习的最重要的事情。
肖恩·卡罗尔:我想让听众更直观地理解“布克特探测器”,显然它在你的心理学实验中发挥了重要作用。
艾莉森·高普尼克:我们从20年前开始从事这项实验,当时所有装置都是自己制作的。在那些日子里,我们在心理学系有一家工坊(如今已不复存在)。我们会告诉店员:“我们需要一个简易盒子,当往上面放置物品时,他会随机亮灯并播放音乐。”我们设计了其他的变体,比如齿轮变体,当轻按开关后齿轮会转动,然后发生其他的事情,就像组装的鲁布·戈德堡(Rube Goldberg)机械。
▷布克特探测器以及使用的蝴蝶/花朵刺激物装置. doi: 10.3389/fpsyg.2020.02210
有意思的是,尽管我们曾认为“用触控屏实现这些功能会更高效”,但将实验装置电子化后,孩子们却完全不感兴趣。他们其实需要真实的东西。但我们发现,现在三四岁的孩子就已经能理解交互式屏幕了。对更小的孩子而言,实体装置仍是首选,而大龄儿童已能接受“屏幕装置同样具有因果效力”。
肖恩·卡罗尔:如你所说,“1岁以下的婴儿没有心理理论,2岁才开始有”。那么,这是否意味着存在某些认知发展的里程碑或阶段性转变?
艾莉森·高普尼克:是的。正如我一开始所说的,从出生起,婴儿就表现出对人脸的特殊关注与解读能力,且以其他灵长类动物所不具备的方式进行模仿,这表明理解他人确实很重要。9个月大的婴儿已会通过指物进行交流,如果你没有回应他们的指示,他们会焦躁地重复“啊!那里!”这表明他们意识到他人可能与自己共享视觉焦点。
传统观点认为“心智理论”到4-5岁才形成,但这并不准确。儿童只是在不同领域构建了不同的认知框架,就如同物理学体系一样。值得注意的是,你可以在特定年龄点观察到这些变化,例如在约9个月时出现的认知革命,可能与生理的成熟有关。但更关键的是,我们还没有充分认识到,即使是婴幼儿,也是积极、主动的学习者。他们的行为不仅是观察统计规律,更是通过实验探索世界。
你想一下,即使是新生儿,他们也会看着你,会微笑,会观察他们的行为产生的影响,而当婴幼儿成长至蹒跚学步阶段时,这种探索行为已然构成了他们完整的生命体验。他们一直在不断地探索,尽管我们常称之为“到处捣乱”。而当物理学家做这些事情时,就叫作是一名“优秀的实验物理学家”。
我们近年尝试将儿童学习与AI(如大语言模型)对比。AI和这些小孩子所做的事情之间有什么关系呢?
我认为关键区别在于,儿童主动探索世界以获取信息,并根据新知动态更新认知体系;而不是像大模型一样,只是进行模仿。我曾经论证过,大语言模型本质上只是从人类既有知识中提取模式(其本质是文明传承的模仿环节),而儿童却能突破既有框架,通过主动实验发现新规律、验证新假设。我们认为,这才是真正重要的东西,这导致孩子们学得更多、学得更快,且相比AI消耗卡路里更少。
肖恩·卡罗尔:这有点像因果推理中“简单地寻找相关性”与“对事物进行干预”之间的区别。跳脱出数据集,“如果我这样做,接下来会发生什么?”
艾莉森·高普尼克:确实如此。我们与科学哲学家及计算机科学家展开了长达二十年的合作,试图破解科学领域的因果推断难题。核心洞见就是:单纯依赖统计相关性是无法实现真正的因果推理的。
▷大卫·休谟(David Hume,1711—1776)是18世纪苏格兰启蒙运动时期的著名哲学家、经济学家和历史学家。他是一位经验主义者,认为所有知识都源于感官经验,并提出了著名的“休谟叉”(Hume's Fork),将知识分为“观念的关系”(a priori)和“实际的事实”(a posteriori)。休谟对因果关系的分析尤为著名,他认为我们无法直接感知因果关系,而是基于习惯和联想推断出因果联系。此外,他还探讨了自我意识,认为自我是不断变化的感知集合,而非固定实体。图源:digital.nls.uk
那么,因果推理与相关性有什么不同呢?这是休谟(Hume)*时代的一个传统哲学问题。当前学界的共识是:要建立可靠的因果关系,必须通过主动干预实验。唯有在现实世界中施加变量、观测结果差异,才能确定事件之间的因果。
事实上我们在这方面已经做了一些工作。我认为,即便是婴幼儿,当他们接触“百宝箱”(busy box)这类装置时,便能通过自主操作建立对物理世界的认知。百宝箱中存在很多因果可能性,可以用来做不同的实验。它远比标准回旋加速器便宜得多,但对于婴幼儿而言却能发挥相同的作用。这种实验方式可以让你真正地在实验中弄清楚世界是如何运作的。
正如我们所说的,心理理论与直觉心理学在认知发展中极其重要,照料者实际上充当了婴儿的“实验对象”。从某种意义上说,这些蹒跚学步的“小心理学家”正以照顾者为观察样本,持续进行着社会性认知实验。例如“可怕的两岁”(the terrible twos)阶段,婴幼儿通过主动行为引发照料者反应,然后进行观察。
04 儿童认知模式与因果革命
肖恩·卡罗尔:我们播客曾邀请过朱迪亚·珀尔(Judea Pearl)*,当时他直言不讳道:“婴儿就是通过触摸物体并绘制因果图谱。”我当时并没有意识到这就是字面上的意思。
艾莉森·高普尼克:完全正确。我们的研究工作建立在珀尔开发的形式化框架之上,比如将因果贝叶斯网络与儿童解决因果问题的方式相对照。我们发现儿童构建因果模型的过程与因果图模型(causal graphical models)的理论预测高度吻合。具体而言,他们通过观察数据构建因果图模型,并基于此干预决策。
但无论是珀尔还是科学界,仍有一个未解难题:如何确定“最有价值的实验”?
朱迪亚的理论框架能告诉你:“当获得某个实验结果时,对应的因果图应该是什么样”。但如何决定最初该测试什么?我们发现许多传统实验的金科玉律(比如必须保持其他变量恒定、每次只能改变一个变量)对婴幼儿并不适用,甚至可能并非最优科学范式。
这引出了一个很棒的开放性问题:实验设计的元规则究竟是什么?
▷比较成人、儿童和强化学习代理在类似Minecraft的Crafter环境中的探索行为,分析了熵、信息增益和赋权等内在目标与人类探索行为的关系。arXiv:2503.23631v1 [cs.AI] 31 Mar 2025
我们已开始将儿童与AI置于相同实验环境进行观察。我们所做的是将孩子们和AI智能体分别放置在《我的世界》(Minecraft)这个环境中,然后让他们“弄清楚发生了什么”。即使是相对年幼的孩子也会以理性的方式探索那个环境,而不仅仅是随便尝试。他们以一种让他们能够弄清楚环境如何运作的方式做事,而且他们比AI更擅长这一点。
肖恩·卡罗尔:有意思。传统科研范式要求保持其他变量恒定、仅改变单一变量,这是有道理的。但这仅仅是因为改变单一变量更简单吗?实际上它是否不如协同干预更有效?
艾莉森·高普尼克:是的。这其实是个非常有趣的技术性问题——关于何时应当遵循某种规范性准则(即每次仅改变一个变量进行实验)。虽然传统方法认为这是真理,但事实上同时改变多个变量有时能获得更大信息量的结果。毕竟要保持其他变量恒定而只改变一个变量,操作难度极大。想想看,孩子们摆弄着忙碌盒子,却能通过各种不同方式的探索高效学习,这对AI、科学、发展心理学来说都是一个很有趣的问题,而他们究竟是如何做到的?
肖恩·卡罗尔:把这些非常年幼的孩子描述成贝叶斯主义的良好遵从者,有多大准确度呢?
艾莉森·高普尼克:我们所做的本质上是将贝叶斯推断的各种理论框架转化为实践,例如向儿童提供信息、假设基线概率,再给予新数据使其更新假设,而他们总能以恰当方式进行正确更新。
另外,无论是我的实验室还是理查德·阿斯林(Richard Aslin)、珍妮·萨弗兰(Jenny Saffran)团队在九十年代的研究都指出:儿童非常擅长做统计。这令人惊讶,毕竟成年人普遍不擅长概率计算。举例来说,当展示两个装置——A装置十次中有八次有效,B装置十次中四次有效——18个月大的婴儿会选择有效概率更高的A装置。即便将概率调整为三分之二与十分之八的对比,他们仍能做出相同选择。他们似乎能够下意识地、自然而然地进行数学运算,不知不觉中弄清楚概率是如何运作的。
就这样,引出了一个难题——儿童的行为模式看似符合贝叶斯推断机制,但理论上这种计算是不可行的。当面对海量假设时,贝叶斯方法要求逐一验证每个假设与数据的匹配度,当你假设很多时,这就会花费无数时间。这一问题被称为搜索问题,没有人真正解决了这个问题,无论是在统计学、AI还是童年时期。
但孩子们似乎确实能解决这个难题——他们最终成功理解了世界运作规律。他们是如何做到的,这是一个非常有趣的问题。目前我的推测是,主动推断机制可能是关键要素。这不仅仅是被动接收数据并更新假设的过程,而是通过主动实验探索来构建认知模型。在物理学界,理论家与实验学家之间总是有一些紧张。从发展的角度来看,我们是团队实验者。
05 神经科学与生命周期视角
肖恩·卡罗尔:关于这种认知机制的神经科学基础,我们目前了解多少?儿童认知能力的提升,是否与其大脑神经网络发育存在对应关系?
艾莉森·高普尼克:确实如此。最有趣的是,早期的发育神经科学所发现的与我们今天看到的一致:在发育初期,大脑会生成大量新突触,形成新的连接;随后通过髓鞘化加强联系、强化传导效率,未使用的连接则被删减。因此,早期大脑具有超强可塑性,能快速适应新经验,但功能效率低下,而后期大脑虽执行高效,但不太擅长改变,可塑性也小得多。这种模式就像是“探索-利用”权衡的另一种表现。从经验上讲,观察大脑发育,有的区域会看到这种非常早期的增殖,有的则是处于后期修剪模式。
肖恩·卡罗尔:视觉系统发育的关键转折期出现在约18个月大时。此时视觉系统完成初步架构搭建,进入稳定阶段——这也是为何婴幼儿视力问题需尽早矫正。而语言区的发展转折点则延迟至5-6岁,表现为掌握一门语言后,第二语言习得效率显著下降。前额叶执行功能区的成熟最晚,它在青少年时期还没有完全定型。这种发育轨迹印证了普遍规律:所有脑区一开始都会产生很多的连接,然后在某个时间点进行加强和修剪。
把话题扯回学术圈,这确实印证了一个现象——那些充满活力的思想创造者往往是年轻的教职员工和博士后,而非已功成名就数十年的资深教授。
艾莉森·高普尼克:是的。我想很多人都会问的一个问题是,“成年人能否像儿童一样保持创造力?”现实情况是,即便抛开科研基金不谈,实验室运作确实需要深谙体系规则、经验丰富的研究者来争取资助。
以物理学家为例,光实验就是项庞大工程,需要高度专注力和执行力。因此我们不希望系主任是那种整天迸发奇思妙想的狂人,而需要他们保持专注。但有趣的是,成年人已发展出社会机制来平衡探索与利用,我认为休假制度正是典型案例。我们不会要求科学家闭门造车,我们认为静休、休假、参加学术会议等事情可以把自己从现有环境中拉出来,进行更大范围的探索。作为科学家,我们花了很多时间在旅途中,这确实辛苦,但能够在不同的地方,在不同的环境下,做跨学科工作,以不同的方式思考问题,所有这些似乎都是成年人让自己变得更有创造力的方式。
06 AI开发的认知启示
肖恩·卡罗尔:我们能否将我们从发育中学到的经验用来构建更好的AI模型?可操作性如何?
艾莉森·高普尼克:这正是我们伯克利AI研究组正在推进的方向。我们尝试将主动学习、社会学习、因果模型构建等核心理念融入AI系统设计。由于当前大型模型在很多方面都非常有效,因此倾向于认为“只要持续增加算力投入,他们就会更加强大,消耗更多能量,他们会变得越来越好。我们将拥有一个名为‘通用性人工智能’(AGI)的神话”。
但我在与AI研究组交流时发现,每次谈到"不存在所谓的通用智能(General Intelligence),无论人工还是自然"时,总能引发听众强烈反应。他们认为存在一种单一维度、可以量化的智能,有些人天生具备更多智能,有些人则相对匮乏,并相信智能储备的持续积累将直接使得其效力增强。
这根本不是正确的认知科学理论或模型。认知科学中的真相其实是:人类认知系统存在不同能力间的权衡机制,而当前的大语言模型(LLM)恰恰缺乏这些核心能力。它们不会主动开展实验探索世界,无法构建抽象因果模型以生成内容。差别显而易见,儿童仅凭微量数据即可实现跨情景应用,而LLM需要海量训练数据却仍难以实现。
所以,问题在于:孩子们做了什么?这能否用于AI使其更有效?目前情况是,AI与儿童认知水平存在很大的差距,孩子比我们现今拥有的任何AI系统都要强出好几个数量级。但这正是我们应该探索的方向。
肖恩·卡罗尔:确实如此。对于那些AI乐观主义者而言,他们只会看到AI在围棋或游戏中碾压人类顶尖选手,与他们对话优势确实很难。我们试着像你刚才那样说明AI在智能方面的局限性,但这一点似乎有点模糊,很难给它设定一个基准。
艾莉森·高普尼克:机器人领域为例,众所周知,AI在下棋方面表现出色,但在实际抓取棋子上却糟糕透顶。如果设计一个游戏环节B,要求AI从地板上捡起散落的棋子并精准归位,它们的表现依然令人失望。尤其当使用一套全新设计的棋盘(比如《爱丽丝镜中奇遇记》(Through the Looking Glass)中的棋局*)时,这些棋子无法通过既有训练数据识别它们。
▷在《爱丽丝镜中奇遇记》中的棋盘是一个巨大的、由田野、河流和森林构成的奇幻世界,整个镜中世界被设计成一个国际象棋棋盘,棋格由自然景观划分,棋子则是故事中的角色。爱丽丝作为白棋卒,从第二格开始,经历各种奇妙的冒险,最终到达第八格成为王后。这个棋盘不仅是一个游戏场景,还象征着爱丽丝的成长旅程和对规则的探索。插图:John Tenniel
这正是著名的“莫拉莱斯悖论”(Moravec's Paradox)。这一悖论贯穿AI发展史:那些对人类来说很难的事情对AI来说却相对容易,而对人类轻而易举的感知、行动、运动能力,以及儿童探索“布克特探测器”时的因果推理,对AI来说却很难。
我认为,关于AI智能的所有讨论,根本上都存在误导。这些系统之所以如此有效,根本原因在于它们利用了网络上数十万人类为其贡献文本,并通过某种强化学习机制,从人类的反馈中学习,最终训练出了这些系统。
你们知道《石汤》(Stone Soup)这个经典儿童故事吗?故事是这样的:从前有几位访客来到村庄,他们说:“我们想要些食物。”村民回答:“抱歉,我们没有多余的食物可以分享。”访客说:“没关系,我们要煮石头汤。我们有神奇的石头。”于是他们架起大锅,放进几块石头开始煮。访客说:“看,我们要煮石头汤了。虽然美味,但如果有洋葱和胡萝卜就更好了。不过没有也没关系。”这时有村民说:“我家好像有洋葱和胡萝卜。”他们就去取来放进去。访客赞叹:“看,我们的汤因此变得更棒了!就像当年给国王煮汤时加了鸡肉效果特别好。您能不能……?”当然,你肯定能猜到后来发生了什么。村民们纷纷贡献出自己的食物。最终村民感叹:“太神奇了!我们仅凭一块石头就熬出了这么美味的汤。”
如果把这个故事改编成计算机科学的版本可能是:“我们要开发AGI,只需要三个算法——梯度(gradient)、下降(descent)和变换器(transformers),我们马上就能实现AGI,不过需要大量数据支撑。”用户回应:“没问题!我们在网上发布的所有文字、图片、书籍和报纸都可以贡献出来。”技术专家又说:“这真的很棒,但现在我们的AGI还是会说蠢话。要是能通过人类反馈强化学习,让大家评估AGI的表现并给出反馈,效果会更好。”人们回应道:“好吧,肯尼亚的整个村庄都可以这样做。”最后技术专家说:“虽然现在我们的智能水平已经很不错了,但如果能做好提示工程,找到那个能让系统更聪明的黄金提示词,你们觉得能实现吗?”用户们表示:“我们可以对此进行很多思考。”于是到最后,技术专家宣称:“看吧,我们早就说过只需几个算法就能造出AGI。”
但这种做法却刻意忽视了系统有效运转的真正原因——并非算法本身,而是背后海量的人类数据。这些数据来自一群人,他们正在进行四岁孩子所做的那种探索性创造性智能。
▷儿童绘本《石汤》 Nelson Price Milburn出版社出版 图源:Amazon
肖恩·卡罗尔:我认为还有其他构建AI系统的角度,这些角度更侧重于建立世界因果模型,甚至进行干预并将其部署到AI中。
艾莉森·高普尼克:确实如此。这也是研究方向之一,但正如我所说的,这非常困难。贝叶斯推断的尝试之所以艰难,是因为搜索问题的复杂性。此外,所谓的强化学习,其实就是一个古老的心理学概念“通过行动验证效果”。
就像实验室里的小鼠在迷宫中奔跑,有时获得奶酪奖励,有时遭受电击惩罚,最终学会趋利避害。这种技术在棋类AI中发挥了重要作用,系统通过大量自我对弈探索最优策略。但强化学习的致命缺陷,在于其视野过于狭隘。当智能体仅关注“当前行动是否带来即时收益”时,就永远无法真正探索世界运行的深层规律。
因此,我认为我们正在探索的最有前景的理念,其实与科学方法高度契合,即学习过程中不应仅计算“效用是否提升”或“能否获得更多奶酪”,更应该聚焦“此次行动是否比上次获得更多信息?是否加深了对世界或者系统的认知?”
这意味着我们必须选择那些能揭示世界运行规律的行为,即便短期内无法获得直接收益。我们一直在努力地构建一种内在奖励机制,就像科学家沉浸于探索的纯粹乐趣。
这个问题的解决方案是拥有一种强化学习的智能体,但奖励不是奶酪、效用或赢得游戏,而是发现了新的东西,更多地了解世界是如何运作的。
在开发和AI,我们尝试了诸多有趣的方法来探索如何实现这一目标。我们目前正在研究一个非常有趣的构想叫做“赋能”(Empowerment),其核心理念在于:当你的行为对世界产生可预测的影响时,就会获得奖励。
为此,你会尽可能多地尝试各种行动,通过改变具体操作来观察世界的不同变化。这种过程充满惊喜与趣味,自然会激发重复探索的欲望,也会希望尽可能多地进行不同类型的行动,尽可能多地建立类似的关系。如果过了一段时间你感到无聊,就会尝试去寻找新的目标。
这与我之前提到的因果学习密切相关。所谓赋能奖励的本质,就是让你学会如何干预世界,理解自身行为如何引发连锁反应。一些证据显示,即使是两个月大的婴儿,当你在他们的脚和手机之间放一条丝带,以便他们控制手机,他们会坐在那里,尝试各种不同的踢腿方式,看看对手机有什么影响。就像小小的科学家,他们会咯咯笑,然后继续重复实验。这种探索行为对他们而言似乎十分有满足感。当然,他们也会模仿妈妈做同样的事情,他们做各种鬼脸,然后看妈妈是否会对他们回以鬼脸。
我认为这是解决方案的很重要的一部分。我想再次说明,这与科学研究有关。回到我们之前所说实验的系统性上,我注意到,当权者总是说,“你不能只是漫无目的地钓鱼式调查(fishing expedition,指缺乏明确目标的调查或信息搜集行为,靠碰运气解决问题)。”通过尝试某种方法,意外发现了某种系统性的规律——这才是真正的价值所在,远比那些已知因果关系更有意义。而“赋能”的理念会鼓励你继续进行钓鱼式调查。
07 哲学追问与未来研究方向
肖恩·卡罗尔:卡尔·弗里斯顿(Karl Friston)提出的“自由能原理”和“贝叶斯大脑”理论主张,“大脑的本质是尽可能减少意外感”。如果按照这个逻辑,人类就应该蜷缩在黑暗房间里,什么都不要做。但他的观点其实是,为了我们最小化生命中的意外感,我们必须立即开始积极探索、尝试各种非常规行为,这样才能预判未来会发生什么。
艾莉森·高普尼克:没错,这正是我之前提到的探索与利用的权衡。关键在于你需要构建对周遭世界的连贯认知框架,既不能只关注随机发生的新奇事物,也不能不断重复旧有的事情。我们发现,当给孩子一个随机行为的“布克特探测器”时,与那些行为结果具备系统性关联的设备相比,孩子们更倾向与“布克特探测器”互动。这种对系统性惊喜的偏爱,同样适用于科学家群体。
肖恩·卡罗尔:对于世界存在的某种固有结构,虽然我们在着手利用它,但无论是哲学家、物理学家、AI研究者都尚未完全掌握将其系统化的方法。
艾莉森·高普尼克:是的。有一件事总会让我感到震憾,这也是我当年作为哲学系学生开启这项研究的初心——知识的本质,这源于对柏拉图与亚里士多德所探讨的深层哲学问题的思考。
我们如何确知外部世界的存在?它不仅包含某种结构,还包含夸克、心智和各种各样无法被直接观测的东西。然而,从世界传达到我们的只是一堆干扰我们耳膜的空气和我们眼睛的光子。
我们是如何从这些数据中重建那个世界的呢?我想回到柏拉图和亚里士多德的理论。“我们似乎是通过数据来理解这个世界。它一直都在那里。”这本质上源于某种先天进化结构——这正是柏拉图的哲学路径。而亚里士多德的理论则对应着当代大型语言模型的范式,“我们看似是理解了世界结构,实则只是提取光子与耳膜声波间的统计关联。我们错误地将数据相关性等同于结构认知,却缺乏充分理由支撑这种推断。”
发育的奇妙之处在于:真实婴儿的学习过程,似乎并不符合上述两种情况。我们似乎能够从根本上了解这个世界的新事物,无论是了解我可能喜欢西兰花而你不喜欢,还是了解夸克和轻子。但人类认知不仅仅是在数据中的统计相关性。
虽然看起来我们确实能发展出超越数据关联性的理论,但一千年来,我们仍未能建立有效的计算模型来解释这种能力。我认为,观察儿童如何实现这种学习过程,正是破解这一哲学难题的关键路径。这正是我毕生研究的课题。
肖恩·卡罗尔:有时候观察现实世界的实际运作确实能帮助我们更好地理解它。
08 译者后记
翻译这篇对话的过程,既是对认知科学前沿的一次沉浸式学习,也引发了我对人类智能本质的深刻反思。艾莉森·高普尼克将儿童比作“进化设计的探索者”,其认知模式犹如“模拟退火”中的高温搜索,以无序尝试构建世界模型。这种视角颠覆了传统教育中对“专注力不足”的负面评价,反而将其视为文明进步的原始动力。反观当前AI领域,大型语言模型虽能复刻人类知识的表象,却缺乏儿童般主动干预世界、验证因果的创造力。
翻译时,如何精准传递“赋能”(Empowerment)等跨学科概念成为挑战——它们既是技术术语,又隐喻着人类认知与机器逻辑的分野。高普尼克提到“祖母与虎鲸的文化传递”,更令人深思:智能不仅是算法优化,更是代际间经验与创新的动态平衡。
或许,在追求通用人工智能的路上,我们更需要向婴儿学习:放下对“效率”的执念,重拾探索的纯粹乐趣。毕竟,文明的火种,始于混沌中的第一粒星火。
*为保证阅读体验,本文对听稿进行了适当地编辑。
- 原对话指路:https://www.thetransmitter.org/brain-inspired/dmitri-chklovskii-outlines-how-single-neurons-may-act-as-their-own-optimal-feedback-controllers/