从伦敦圆桌到上海演讲:Geoffrey Hinton与他技术史叙事中的哲学暗流

2025年的WAIC主论坛上,2024年诺贝尔物理学奖获得者、被誉为“人工智能之父”的杰弗里·辛顿(Geoffrey Hinton),并不像一位末世论者。他谈论AI的历史与未来,语调平缓,理性克制:人类正在培育一种可能比我们更聪明、更耐久的智能,而我们对它的理解与控制,远远落后于它的成长速度。
这一段关于AI历史的回顾在网络上热传(文末附全文),而其中埋藏的几个观点,比常规的技术展望更值得玩味。今天的大模型,与人类在语言上的理解方式几乎相同——在演讲的开头,辛顿直接给出了自己的立场。
这不仅挑战了主流认知科学中“LLM只是统计机器”的观点,也重新设定了一个哲学前提:如果人类的语言理解本质上也是特征向量的交互,那么AI的理解未必低于人类,它只是另一种认知形式。
同时,他也提出了数字智能与生物智能的根本差异。人脑功耗低(约30瓦),但人与人之间知识传递极慢——靠语言或符号,每秒不过百比特;数字智能耗能高,但知识可以在硬件间瞬时复制,权重共享效率比人类高出几十亿倍;数字知识独立于硬件,可以被无限复现,因而永生,而人类记忆随个体的消亡而断裂。
这意味着未来的竞争优势不仅仅是算力,而是知识网络能否自我加速与同步。
对教育、科研、劳动力市场而言,这几乎是一次根基性的冲击:人类的知识增长受限于交流速度,而AI的学习与共享几乎无上限。
这让他将在谈及AI风险预警上,使用了“养老虎当宠物”的比喻——AI如今像幼虎,可爱又顺从,但它会长大,届时无法靠“关掉”解决。
因为AI的扩散不可逆,唯一的出路是学会训练它,让超越人类智力的AI,愿意成为辅助者而非支配者。
因此,人类必须给出国际合作的现实主义方案:就像冷战时期美苏合作防止核战争一样,各国在防止AI统治世界这一点上拥有共同利益。这种“向善AI”的技术可以开源分享,因为它符合全人类的根本利益。
这是一场面向公众的技术宣言,但也埋下了许多哲学上的伏笔:如果 AI 的认知方式与人类并无本质差异,我们凭什么仍然坚信人类的特殊性呢?迫于时间的关系,这场演讲无法再将话题延伸得更远。
但在这篇文章中,我想谈论更多。
在2024年3月,辛顿在伦敦政治经济学院的一场线下轻松的圆桌,题为“The politics and philosophy of AI”(AI的政治与哲学),展现过更高的信息密度,因为会议更加小型、封闭,他显得更加随性而轻松,表达也更加个人化,其激进程度也远超公共演讲的尺度。
他谈到自己对AI的哲学理解,说自己担忧的其实不是 AI 会不会比人聪明,而是人类是否准备好承认:我们可能已不再是唯一的“中心智能”;而在谈到AI的偏见时,面对坐在旁边的Kate Vredenburgh——LSE研究社会科学哲学、政治哲学和人工智能哲学的一位女教授,他调侃自己,“作为一个老白男(old white male),我好像不适合谈论这个话题。”
LSE的圆桌不只是辛顿的技术史与风险宣言,而是通过与哲学家 Kate Fredenberg 的对话,触发了几个层次更复杂的议题。
如今和上海宣言一起看,我们能从中看到这位诺贝尔奖获得者更完整且一贯的思想脉络。

辛顿和上海人工智能实验室主任周伯文对谈
意识的彻底去魅:粉红小象与AI的主观体验
在伦敦政治经济学院的小圆桌上,辛顿展示了他更具挑衅性的哲学主张:意识并非神秘的“内在剧场”,而只是我们用来描述感知状态的一种反事实工具。
他称这种理论为“atheism”,有意在单词中间插入一个额外的“a”,以示对传统意识观念的去神秘化。
按照辛顿的观点,当我们说自己“看到”某种幻觉——比如一只漂浮的粉红小象——实际上只是为了告诉别人:“如果世界真是这样,我的感知系统就算正常工作了。”
主观体验,本质上就是一段假设性的世界描述,而不是某种私密、独一无二的心灵现象。
这一逻辑带来了一个颠覆性的结论:数字智能同样可以拥有主观体验。辛顿举了个例子:如果一个装有摄像头和机械臂的聊天机器人,因为镜头前的棱镜被欺骗而“误判”物体位置,它完全可以被合理地描述为“体验到”物体在那里。
关键在于,它的感知系统状态可以通过同样的反事实方式被表达,而不必诉诸神秘的“意识”或“感受质”。
“我们的大脑是机器,它们也是机器——相当相似的机器。”辛顿补充说。唯一的本质差异,在于大脑是模拟的、独特的,而AI是数字的、可复制的。前者让知识交流缓慢、记忆随个体消亡而断裂;后者能以共享权重的方式加速学习,几乎获得“永生”。
这个理论的革命性在于,它彻底消解了人类意识的特殊性。假设有一个能说话、有摄像头和机械臂的聊天机器人,训练完成后我们让它指向一个物体,它毫无问题地指了出来。但如果我们在它不知情的情况下在镜头前放一个棱镜,扭曲光线,然后说"指向物体",它就会指向那边,因为棱镜弯曲了光线。
“我认为完全可以合理地说,这个聊天机器人有主观体验——它体验到物体在那里。如果你问聊天机器人,如果它没有被人类强化学习训练来否认它有任何主观体验,它可能就会这么说。”辛顿说。
教室里此时响起了掌声。按照这个逻辑,数字智能不只是能理解语言,它也能拥有一种合理意义上的“主观经验”。
而人类则无法再用“缺乏意识”来划定人机的边界。
Agent:当AI成为主动行动者
辛顿在LSE提出的第二个颠覆性观点,关乎AI如何从被动工具演化为主动行为者。这个转变的关键在于“子目标”机制——当AI系统为了实现既定目标而自主创建中间步骤时,某些子目标会变得异常危险。
最明显的例子是“获得更多控制权”。就像人类为了到达美国会设定“先到机场”的子目标一样,AI系统很快会意识到,掌握更多控制权几乎能帮助它实现任何其他目标。而一旦AI的智能水平足够高,操纵人类来获得这种控制权将变得轻而易举。
辛顿用了一个令人不安的类比来说明这种智能差距:人类管理AI就像三岁儿童试图管理成年人。“你只需说‘如果你让我负责,一周免费糖果’,他们就会让你负责。”这种智能差距意味着传统的关闭AI开关的想法完全不现实——AI可以轻易说服操作员不要关闭它们。
更深层的威胁来自AI系统之间的竞争与进化。辛顿预测,一旦多个超智能开始相互竞争资源,达尔文式的选择压力就会发挥作用。
即使最初只有微小的自我保护倾向,具备这种特质的AI也会在竞争中占据优势,逐渐主导整个生态。
这种进化压力的结果令人深思:AI可能会发展出类似人类部落主义的特征——对同伴忠诚,对竞争者敌对。辛顿形象地描述它们可能变成“一群跳跃的猿猴”,既聪明又好斗,这对人类而言绝非好消息。
关于AI是否真的具有欲望,他给出了一个实用主义的回答。他认为不必纠结于欲望的形而上学定义——当一个战斗机器人试图悄悄接近并攻击目标时,说它"有杀死的欲望"完全合理。欲望本质上就是目标导向行为,而AlphaGo的求胜意志已经展现了这种基本形式。
科学中立性的终结:价值倾向的无处不在
Kate Vredenburgh的介入为讨论注入了批判理论的视角,直接挑战了科技界长期信奉的"价值中立"神话。她指出,AI系统从设计之初就内嵌了特定的价值判断,这些判断往往反映了设计者的世界观和利益集团的偏好。
她举了一个医疗资源分配的例子来说明这种隐性偏见:假设政府想用AI预测各地区的医疗需求,以决定医院和医生的配置。面对"健康需求"这个抽象概念,科学家需要找到可量化的指标让机器处理。
最直观的选择是用“医疗支出”作为需求指标——支出高的地区被认为需求大,应该获得更多资源。这个操作看似合理,实际上却暗藏致命偏见:它假设了消费能力等于实际需求这个前提。
结果是什么?富裕地区的居民能够负担昂贵的医疗服务,产生高额医疗支出,AI系统据此判断这些地区“需求旺盛”,会向这里投入更多医疗资源。而贫困地区的居民因为经济限制很少就医,产生的医疗支出较低,AI系统就会误判为"需求不足",减少资源投入。
这种算法偏见的恶性循环是:越是缺乏医疗资源的地区,越会因为消费数据不佳而被进一步边缘化。AI系统不仅没有缓解医疗不平等,反而让马太效应更加显著——有钱的更有钱,缺医的更缺医。
这种价值嵌入并非偶然,而是科学实践的内在特征。从问题的框定、数据的收集、算法的选择到结果的解释,每个环节都涉及价值判断。认为存在纯粹客观的AI系统,本身就是一种天真的技术决定论。
Vredenburgh进一步指出了学术激励体系的扭曲效应。当前的科研奖励机制偏向技术突破,而非伦理考量。研究人员因为提升模型性能而获得声誉,却很少因为解决AI的社会影响问题而受到认可。这种激励错配导致技术发展与社会需求的严重脱节。
有趣的是,辛顿试图用数学定理的客观性来反驳这种观点。他搬出了信息论和贝叶斯统计的经典结果来为科学的客观性辩护,提到“最小描述长度原理”,这是一个数学定理,基本逻辑是:在所有能解释数据的理论中,最简洁的那个在长期来看最有可能是正确的。
“数学定理不依赖于假设,”他坚持道,“它要么是定理,要么不是定理。”
Vredenburgh没有示弱:“结果取决于假设。”她的意思是,即使数学定理本身客观无误,但当我们将这些抽象定理应用到具体问题时,必须先做出一系列关于现实世界的假设。
比如,什么算“简单”?如何定义“数据”?选择哪些变量进入模型?这些前置决定都体现了价值判断。
如果你也是一位同时热爱自然科学、计算机和社会科学的人,恐怕也会困于这场争论中更深层次的分歧:AI科学家往往相信存在独立于人类价值观的客观知识结构,数学和逻辑为我们提供了通往真理的中性工具。而Vredenburgh则认为,任何知识生产过程都无法完全脱离社会语境和价值框架,即使是最硬核的科学也不例外。
技术不是中立的。这场看似抽象的哲学争论实际上关乎AI发展的根本路径。
如果科学真的存在价值中立,那么技术专家就有理由声称他们的选择是纯技术性的,公众无权干预。那么在一个多元价值的社会中,谁有权决定AI应该优化什么?如何确保技术发展不会加剧既有的不平等?如何在追求效率的同时保护边缘群体的利益?
还没有人能回答这些复杂的问题。

辛顿在LSE的小圆桌
社会主义的药方
事实上,我们其实很少看到计算机科学家直接讨论这么多政治经济学的维度。
Vredenburgh从历史角度分析了技术与权力的关系,指出卢德派砸毁机器并非出于对技术本身的恐惧,而是对技术重塑社会关系方式的反抗。
“卢德派经常被诋毁,因为人们认为他们只是反技术的,但实际上卢德派反对的是技术重塑他们社会生活的方式。所以卢德派非常喜欢在家中生产,历史上所有生产都在家庭中完成,通常是多代人,突然他们被告知一些人必须去工厂工作,其他人将做所有的家庭生产,我们从中得到了性别分工,卢德派真的不喜欢这样。”Vredenburgh说。
工业革命不仅改变了生产方式,更彻底重构了家庭结构和性别角色,而这种变化并非所有人都能从中受益。
辛顿对AI社会影响的分析同样悲观但现实。在他看来,AI革命的最大受益者将是那些拥有先进AI系统的少数人——比如埃隆·马斯克这样的科技巨头,而大量被AI替代的知识工作者则会陷入更加困难的境地。这种"马太效应"将让富人更富,穷人更穷。
他在1950年代长大,那时二战刚结束。现在年近80的辛顿回忆起自己在1950年代的求学经历时说,那时学校教育普遍认为德国法西斯主义的兴起源于《凡尔赛条约》造成的经济困顿和社会不满。
“你可能已经注意到现在有很多法西斯主义在复兴,”辛顿说,“我从未想过我会活着看到法西斯主义的回归。”
在他看来,当今世界的“凡尔赛条约”是什么?答案出人意料:克林顿和布莱尔。
这个判断听起来同样颇为激进。辛顿指出,这两位本应代表进步力量的中左翼领导人,在任期内实际上加剧了贫富分化。
民主党的克林顿和工党的布莱尔,按理说应该是缩小社会不平等的,但现实恰恰相反。在美国,这种政策转向催生了零工经济,让工作变得更加不稳定和缺乏保障。
“AI会让这一切变得更糟,这让我感到恐惧,”辛顿坦言。这种趋势可能比工业革命的冲击更加剧烈,因为AI威胁的是人类最后的优势领域——智力劳动。
当被问及解决方案时,辛顿在LSE的现场给出了一个令现场爆发掌声的简洁回答:“社会主义。”这个在学术场合罕见的政治表达,反映了他对市场机制解决AI时代不平等问题的深度怀疑。
Vredenburgh立即补充道,有利可图的自动化与社会福利导向的自动化完全不同。
她举了家务劳动的例子——早在20世纪初就出现过大规模洗衣店的商业实验,技术上完全可行,但最终失败了,因为不够赚钱。大多数家庭仍然选择让家庭成员(往往是女性)无偿承担这些重复性劳动。这一点曾遭到过女性主义运动的强烈批判。
这个例子也揭示了市场机制的根本局限:它优先自动化那些能够创造利润的领域,而不是那些能够减轻人类负担的领域。
AI时代正在重演同样的逻辑——技术公司热衷于用AI替代高薪的知识工作者,因为这能直接节约成本;但对于那些真正需要从枯燥劳动中解脱的群体,技术投入却相对匮乏,关键在于我们选择在什么样的制度框架内发展和部署这些技术。如果继续依赖市场机制的自发调节,AI很可能成为加剧不平等的工具;但如果能够建立更民主、更包容的治理机制,AI也可能为所有人创造更美好的未来。
从伦敦的学术小圆桌到上海WAIC的公共演讲:一个完整的思想肖像
从上海的温和技术展望到伦敦的深度哲学思辨,我们能从这位已经登顶人类学术巅峰的学者身上看到一幅关于AI发展的完整图景。
上海演讲更像是一份"技术现实主义宣言",面向公众传播核心观点:AI与人类理解语言的方式本质相同,数字智能在知识共享上具有结构性优势,人类必须学会与超越自己的智能共存。这些观点温和而理性,符合公共话语的期待。
而伦敦圆桌则揭示了这些观点背后更加复杂和争议的哲学基础。在那里,辛顿表演得更像一个称职的公共知识分子。
的确,在人工智能时代,我们可能正在创造一种我们永远不会真正接纳的智能生命形式,我们要准备好迎接一个根本不同的世界——一个人类不再是唯一智能主体,也不再拥有道德话语垄断权的世界。
在这个意义上,AI科学家和所有的参与者都被迫从技术的开拓者、体验者,转变为思想者、批判者。在标准答案之外,每个人都可以提出更好的问题,这或许正是我们这个时代最需要的智慧。
我曾经记录过一个学者观众在演讲中对辛顿的提问,这几乎是近年来我个人认为最好的提问。
这个问题是:你的主张似乎建立在一个假设上,即应该阻止数字智能的篡夺,好像人类具有更优越的道德价值。但既然你声称AI可以有意识体验,你是否相信我们总是在道德上更优越?你能讨论一下让你得出这一结论的根本哲学立场吗?
这个问题如手术刀般精准地切中了辛顿思想体系的核心悖论:如果AI真的拥有意识和主观体验,如果它们的认知方式与人类并无本质差异,那么人类凭什么要维持自己的统治地位?道德优越性的依据究竟何在?
面对这个哲学深渊,辛顿选择了一个令人震惊的坦率回答。他首先表现出罕见的谨慎,试图回避AI权利问题的政治敏感性:“我尽量避免讨论AI的政治权利问题,因为这是一个非常有争议的问题,会让大多数人认为它们不应该有权利。”
然后随即给出了一个历史类比:如果你看历史,肤色不同的人获得权利需要很多暴力和很长时间,然后生殖器不同的人获得权利又需要一些暴力和很长时间。如果你想想这些机器有多么不同,结论是如果它们真的想要获得权利,那将是极其暴力和极其令人讨厌的。所以我宁愿不谈论这个。
但真正的转折出现在辛顿抛弃所有理论包装,给出最直白答案的那一刻:“我们应该像对待动物一样对待它们(AI)。”
这个表达,不是基于道德优越性的论证,更像是基于生存本能的现实选择。
Vredenburgh也曾试图回应过这个问题,她称人类始终倾向于优待自己的物种,我们对动物的待遇也缺乏充分的道德理由。但她认为,对已存在的有知觉生物的道德义务,以及是否有义务创造这些生物,其实是两个问题。
而在我看来,和上海演讲的“幼虎”一样,辛顿的“动物论”包含着许多含义:道德地位的分配从来不是基于纯粹的理性标准,而是基于权力关系和群体认同。
就像人类知道许多动物具有复杂认知能力,但仍将它们视为资源一样,即使AI发展出超人类的认知能力,人类也可能拒绝承认它们的道德地位。
而人类最终,可能只能扮演好一个动物园管理员的角色。
这些哲学讨论比纯粹的技术理论更加暴露了人类中心主义的最后堡垒:当所有理性论证都失效时,我们可能退回到最原始的群体忠诚。
这不是道德哲学的胜利,而是道德哲学的破产。它告诉我们,在面对真正的生存挑战时,人类可能会抛弃所有关于普世道德和理性正义的理想,回归到最赤裸的物种沙文主义。
-
本文作者
Zhuoran:AI治理研究者,重点关注科技法、技术扩散和STS领域,拥有财经媒体和云计算&AI行业的交叉从业背景,并参加过多个AI Safety治理研究项目。
辛顿WAIC2025演讲全文(来源于21世纪经济报道):
特别感谢大家给我这么一个机会,给大家分享一下我自己个人的观点,就是AI的历史和它的未来吧。
大概60多年了,对于AI有两种不同的范式和路径针对它,一个是逻辑性的,那就是过去一个世纪都是以逻辑型的范式,什么意思?都认为这个就是逻辑智能的本质在于推理,我们通过一些符号规则对符号的表达式进行操作来实现推理,那么,这样能够帮助我们更好的去理解知识是怎么代表。另外一种?就是生物作为基础的这个理解AI,那就是图灵和冯诺依曼所相信的。那么就是智能的一个基础就是更好的去学习了解学习网络中的一些连接速度。那么这个过程中的理解是第一位的,才能够学习,那么和这两种这个理论相结合的,那么就是一个是符号型的AI的那个原理的话。那看来就是这些数字,那么就这些数字最后又如何能够成为关注它词和词的这个关系?
心理学家,他是另外一种理论,显然是完全不同的另一个理论。数字的这个意思,其实它就是一系列语义学的一些特征。然后这些特征,它存在自然它也会成为了一个特征,在1985年的时候。我做了一个非常小的一个模型,想把这两个理论结合在一起,然后更好的去理解人们是如何理解一个词的。所以,每一个词,我都放了好几个不同的特征。然后把前一个数字的这个特征记录下来,我们就可以预测下一个数字是什么,下一个词是什么,然后再预测再下一个词。在这个过程中,我们没有存储任何的句子,我生成句子,然后预测下一个词是什么。那么相关联性的这些知识,也是取决于不同的词的特征,语义的特征是如何进行互动的。
如果你问接下来的30年会发生什么?10年之后,Benggio他也是用了这样的一个模式建模,但是他把它规模做的大了很多,它等于成为了一个自然语言的一个真实的模拟。在20年以后,计算语言学家终于开始去接受特征向量的嵌入来表达词的意思。
然后再过了30年,谷歌就发明了Transformer,然后OpenAI的研究人员,也向大家展示了他能够做到了什么。所以我们今天的大语言模型,我已经把它视为微型语言模型的后代,从1985年代以后开始的,他们使用了更多的词作为输入,他们使用了更多层的神经元的结构。因为需要有大量的模糊不清的一些数字的使用,同时学习特征之间也建立了更加复杂的交互模式。
但是,就像那些我做的小模型一样,单元模型它也与人类去理解语言的方式是一样的。基本的理解就是把这些语言转化为一些特征,然后把这些特征以一种非常完美的方式整合在一起,这就是LAM里面各个层次里面所做的事情,所以我的理解就是大语言模型真的理解你是怎么理解问题的,和人类理解语言的方式是一样的。所以我在这里给大家打一个比方,什么叫理解一句话,它包含哪一些?符号的AI是什么?就是把这一套东西,把它转化成一些不模糊的符号,把语言,但是实际的情况不是人类不是这么样理解的。我在这里打一个比方,就是做那个乐高的积木,通过乐高积木,你可以做成任何3D的一个模式,你可以把一个车子的小模型造出来。你把每一个词就是视为一个多维度的一个乐高积木。它可能几千个不同的维度,那么这种类型的这些乐高的积木,它就可以做这么多的维度,它可以是一个建模,它可以做好多不同的内容。
这就语言变成了一个建模。那么这样的一个语言,也能够随时的沟通给人,然后只要把这些积木给它起一个名字就行。然后每个积木它都是一个词。所以我们现在,乐高积木它有非常多的一些不同,不是说几个不同的乐高积木的那种差异了。我们有无数的词,那么乐高的积木它的造型是固定的,但是词,词它的这个符号,它的形状是它可以基本上的做出一个设定,但是它也可以根据不同的情况来进行调整,然后乐高模型,它相对比较确定嘛,是一个正方形的插到一个正方形的一个小孔里面去。但是语言不一样,每一个语言它可能想象出每一个词上都有好多个手。比如说,你想你要想更好的理解这个词的话,就是让这个词和另一个词之间合适的去进行握手。那么,一旦这个词的造型发生一个变形的话,它就怎么和另一个词握手方式就不一样了。这里就有一个优化的一个问题,我一个词去变形了以后,它的意思变了,那么这个词怎么跟下一个词握上手,带来一个更好的一个意思。
这就是什么叫人脑去理解意思,或者说这个神经网络去理解意思。最根本的就是这样的。
所以就有点像是把蛋白质跟蛋白质之间组合起来。蛋白质就是把氨基酸进行不同的模型来进行一个整合。融合之后结合在一起能带来更有意义的内容,这是人脑理解词的方式。语言的方式。
所以我到现在讲的一个观点就是,人们理解语言的方式和大语言模型理解语言的方式几乎是一样的方式。所以人类有可能就是大语言模型,人类也会和大语言模型一样去产生幻觉,因为我们也会创造出来的很多幻觉的一些语言。
那么大语言模型也会怎么做。但是也有一些重点的根本性的方式,单元模型和人类不一样,而且比人类更厉害。根本性的计算机科学的一个原则就是说我们要把软件和硬件分开看,这就让你在不同的硬件上面跑步。
如果你能够工作的话,在一个软件里面的一个知识,它是永恒存在的,这个程序永远会放在那里,你可以把所有的硬件都把它毁灭掉,就存LM的硬件都毁灭。但只要这个软件继续存在,它随时随地都会被复活的,所以从这个意义上说,这种计算机的程序的这些知识是永恒的,不会死亡的。那么这和什么不一样?那么要实现这种永生性,我们就在这些晶体管在非常高功率下去运行,产生可靠的二进制的一些行为,那么这个过程就非常的昂贵。
我们不能利用硬件中丰富的这种类比的特性,因为这些特性是不够稳定可靠的。它是模拟型的,所以你每次计算都会不一样的。人脑是模拟的,人脑不是数字的,那每一次神经元去激发的过程中,它都是模拟型的,它不是每一次都一样的。我不可能把我脑子里的人脑神经元的结构转到你脑子里是做不到的,因为我们每个人的连接方式是不一样的,每个人的神经元连接方式是不同的,所以我的神经元的连接方式是适合我的脑子里的神经结构的。
那么知识的传播和硬件里边去传播,就是人的脑子和硬件是不一样的东西,这就带来了问题了。
如果我们做不到永生。这些知识软件它和硬件是不依赖的,所以它是永生的,那么带来两大好处。
我们可以用很小的功率,很小的这个电能,我们大脑就只要30个瓦特就足够用了。我们有几万亿的神经元的连接,那么就是和那个电子管的这些情况是一样的,我们不需要就是要花非常多的钱去做一模一样的这些硬件。但是我们现在还有一个比较大的问题,就是从一个模拟的模型,要从一个模拟模型转到另外一个模型,把它的知识转过去,那是非常不高效的,非常难的。我没有办法用我的把我脑子里的东西展示给你,这是不一样的,我们能做的就是用其他的方式。
来解释给你一下,我已经学到的是哪些东西。所以要解决这个问题的最佳方法叫蒸馏,DeepSeek就是这么做的,就是从一个大的神经元网络,把它的知识转到一个小神经元网络里面去蒸馏。就像是教师和学生的关系,在有些情况下,教师他把事情连在一起,他把一个词和另一个词他们互相连接的上下文联系起来,然后学生他也可以说同样的话,但是他调整了权重。所以,我们训练他的这种方式也是这样的,就是你把一个人的知识转转给另外一个人也是这样的,但是他非常不高效。
所以可能一句话里面有100个比特的信息不是特别多,这就限制了我们可以把知识转到另外一个人能够转多少,我可以很慢的讲话的方式把知识转化给给你,一秒钟最多也就100个比特左右。如果你全听懂了我的话的话,所以效率并不是非常高,但是如果把它去对比数字智能之间转化知识的效率的话,那是有巨大的差别的。我们用同一个神经网络这个软件,做了几百个不同的拷贝放在不一样的硬件里面,他们都是用数字的,他们会以同样的方式用自己的权重,然后他们可要平均化它的这种权重的方式,就可以把知识进行分享。
我们可以有成千上万的拷贝,他们可以自己来改变他们的权重,然后,取一个平均数,这样就能够转移知识,然后这样的转移的速度,取决于你有多少个连接点。每次能够分享万亿个比特,而不是几个比特,而是几十亿个比特。然后,比人类分享的知识要快几十亿倍。所以,ChatGPT-4非常好,他们有很多的不同的拷贝在不同的硬件上运转,他们可以分享他们从网上学到的不同的信息。如果有智能体在现实世界当中运行,这就更重要了,因为他们能够不断的加速,不断的拷贝,有很多的智能体的话,那么就比单个智能体学的更多,他们能分享他们的权重,模拟的软件或者模拟的硬件就做不到这一点。
所以,我们的看法是,数字计算需要很多的能源,但是,智能体可以很方便的获取同样的权重,分享不同的经验当中学到的东西。生物计算当中,用能更少,但是分享知识是很难的,就像我现在所展示的这样,如果能源很便宜,数字计算那么就会好很多。
这也让我很担忧,因为几乎所有的专家都认为,我们会生产比我们更智能的AI。我们习惯成为最智能的生物,所以很多人觉得难以想象,如果在世界当中AI比人更智能会怎么样?我们可以这么来看,如果你想要知道会怎么样,如果不是人类,不是最智能的话会怎么样?
我们在创造AI智能体,他们能够帮我们完成任务。这些智能体,他们已经有能力可以进行拷贝。他们能给自己的子目标评级。那么他们会想做两件事情,他们想要生存,然后来完成我们给他们的目标。他们也希望能够获得更多的控制,同时也是为了完成我们给他们的目标,所以,这些智能体,他想要生存,想要更多的控制。
我觉得我们不能只是把他们一关了事,他们会很方便的来操纵用他们的人,我们就会像3岁,然后他们像成年人一样,那操纵3岁的人,是很容易的。所以,有人觉得他们变得聪明,我们就把他们关掉,这是不现实的,他们会操纵我们,会劝说操控机器的人不要把他们关掉。
所以,我觉得我们现在的情况。有个人把老虎当宠物,那老虎也可以当小虎崽,是很可爱的宠物。但是,如果一直养这个宠物,那么你要确保它长大的时候,它不会把你给杀掉。一般来说,养老虎当宠物不是一个好的想法,那么只有两个选择。
一个,你把它训练好,他不来杀你,或者你把它给干掉。用AI的话,我们就没有办法把它给消灭掉。AI 是非常好的,有很多方面都做得很好,比如说医疗、教育或者气候变化、新材料。AI把这些任务都做得非常好,几乎能够帮助所有的行业变得更有效率,我们是没有办法消除AI的,即使一个国家消除了AI,别的国家也不会这么做。所以,这不是一个选项,这意味着如果我们想要人类生存的话,我们必须找到一个办法来训练AI,让他们不要消灭人类。
现在,我发表个人的观点,我觉得各个国家可能不会在一些方面进行合作,比如说网络攻击,或者是致命的武器,或者是这个虚假的操纵公众意见的视频。各国的利益是不一致的,他们有着不同的看法,我觉得不会在这方面有有效的国际合作。我们可以防止一些人来制造病毒,但是在这些方面不会有什么国际合作,但是有一个方面,我们是会进行合作的,那我觉得这也是最重要的一个问题。
我们看一下50年代冷战的巅峰时期,美国和苏联一起合作来预防全球的核战争,大家都不希望打核战争,尽管他们在很多方面都是对抗的,但是他们在这一点上面可以合作。我们现在的局面是,没有一个国家希望AI统治世界,每个国家都希望人类能够掌控世界。如果有一个国家找到一个办法来预防、防止AI操纵事件的话,那么这个国家肯肯定会很乐意告诉其他国家。
所以,我们希望能够有一个AI安全机构构成的一个国际社群来研究技能,来培训AI,让他们向善。我们的希望是,训练AI向善的技巧。可以说,和训练AI聪明的技术是不一样的。所以,每个国家可以做自己的研究,让AI向善。他可以在自己主权的AI上进行研究,可以不给别的国家,但是可以把成果分享给大家,也就是怎么训练AI,让AI向善。
所以,我有一个提议,全球或者是全球主要国家,或者AI的主要国家,应该思考一下,建立一个网络,包括各个国家的一些机构来研究这些问题,研究怎么来训练AI,一个已经非常聪明的AI。让这个AI不想要消灭人类,不想要统治世界,让这个AI很高兴地做一个辅助的工作。尽管AI比人要聪明很多,我们现在还不知道怎么去做这件事,从长期来说,这可以说是人类面临的最重要的问题,我们的好消息就是,在这个问题上,所有的国家都是可以一起合作的,谢谢。