2025智源大会的一些观察:从明星公司到世界模型
商业观察
6月6日,2025年的智源大会召开。按照智源的定位,这场会议如预期一样充满了学术趣味。在接下来的两天内,技术术语将在北京中关村展示中心中充分地扩张、蔓延。
语言是一种权力,它继续勾勒着2022年年底延续而来的人工智能热潮。但我们依然能从其中观察到一些变化。
2024年,智源大会在社交媒体上的关注度几乎都是被几位明星创始人占据的。月之暗面、零一万物、百川智能等明星公司均有参会,分享自己的商业未来以及对AGI的畅想。
但在2025年的智源大会上,许多明星创始人们显然缺席了。随着近月来,关于kimi、minimax和百川智能等头部公司的暂停基础模型的训练、商业化困境等问题频频传出,智源大会成为了一个缩影,关于技术的讨论逐渐回归了审视技术进程及模型的实际应用价值。
从个体到系统
在6月6日上午的主论坛上,最受关注的公司是宇树科技。宇树科技的联合创始人王兴兴在圆桌环节上展示了自己的冠军格斗机器人,此前,在举办的《CMG世界机器人大赛·系列赛》机甲格斗擂台赛上,这只机器人获得了冠军。
从机器人春晚,宇树16台H1表演的《秧BOT》开始,宇树创始人王兴兴就陷入过具身智能到底应用何为的争论。今日,他回应了这些疑问。
“终极目标还是希望机器人是干活的,无论是家里还是工厂。” 王兴兴在智源大会现场说道,“但最近几年,让一个人形机器人马上去家里干活还是不太现实的。我们公司的核心本质是希望通过AI技术,让一个机器人尤其人形机器人可以做各种全身动作,跳舞和格斗是全身动作的一部分。在那个终极目标未实现之前,我们先参加一些表演、参加一些格斗比赛来给大家展示一下机器人的情况,并且产生一部分商业价值。”
这个讲法比较诚恳,他同时也表示,宇树其实并不是一定要做人形机器人的。“但为什么还是要做人形呢?只是因为目前它最方便采集数据进行模型的训练。”
在视频生成领域,Pixverse的创始人分享了现在超过6000万用户的发展历程。他们目前取得的成绩不在于概念的领先,而在于对产品化路径的理解——从技术突破到用户体验的完整闭环。“我们要做更好的应用,就要先做更好的模型”。
过去10多年,我们对资本驱动的“概念竞赛”并不陌生,虽然融资能力或营销话语依然迷人,但每个产业走向成熟的标志都是更成熟的系统构建,而不是基于个体明星的想象。
2025年,中国有DeepSeek走向了全球,也有Pixverse这样一大批从诞生第一天就决定去国际上竞争的企业。当Richard Sutton在演讲中谈到:“我们看到许多炫技,但这些技能能否在新环境、复杂任务中成功落地?”时,他强调了系统的完整性与鲁棒性之于产业落地的价值。未来的智能,不只是会做事的个体,也是可靠的协作系统。
这让这场大会的关键词,不再是“奇点”,也不再只围绕着“突破”,而是“共识”和“反思”,并呼唤一种更加成熟和负责任的技术发展观。
Richard Sutton
技术不断重塑“人”的定义:智源发布世界模型
6月6日,智源研究院还发布了全新的“悟界”大模型家族,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainµ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。
其中,Emu3作为原生多模态统一架构,赋予了AI理解和推理世界的能力。它不再依赖组合式架构或扩散模型,而是将图像、视频编码为与文本同构的离散符号,实现模态无关的统一表征空间。
通俗来说,Emu3就像一个“全能翻译官”。过去,AI看图是图、看文字是文字、看视频是视频,需要不同的“大脑”来处理。而Emu3可以把所有这些内容都转换成同一种“语言”,这样AI就能用同一套逻辑来理解世界上的所有信息,不管是文字、图片还是视频。
在智源研究院院长王仲远的描述中,“悟界”系列中的脑科学多模态基础模型见微(Brainμ)是最具未来感的技术突破之一。
它首次将fMRI、EEG、双光子等复杂脑信号统一token化,并映射到文本与图像模态,构建出一个能理解、生成、甚至“重建”人类脑信号的通用模型。
想象一下,你戴上一个帽子,这个帽子能读取你大脑的电信号。以前这些信号就像天书一样,人类看不懂。现在Brainμ就像一个“大脑翻译器”,能把你的脑电波、核磁共振信号等等,翻译成文字和图片。智源希望这项技术能帮助自己打开专业医疗市场。
另外,RoboOS 2.0 与 RoboBrain 2.0 则将具身智能推向平台化。前者支持无服务器部署、端云联通和跨本体协作,目标是打造机器人领域的“应用商店”;后者在空间推理和任务规划能力上全面超越初代模型,任务规划准确率提升74%,空间推理性能提升17%。
OpenComplex2是另一项突破。在第16届蛋白质结构预测评估竞赛CASP16中,智源团队成为唯一预测出蛋白质T1200/T1300空间构象分布的团队。这标志着AI已从静态结构走向动态生物系统的连续建模,将有望显著缩短生物医药研发周期,大大降低研发成本。
在现场的展示中,通过与脑机接口设备结合,Brainμ可根据采集的脑信号数据进行信号解析与感觉刺激重建,利用多模态大模型的能力在消费级便携式脑电设备上实现了接近医用级设备数据采集的稳定解析能力。
我们正在见证“人”的定义被技术重新书写。“有时候,我们很容易低估技术一年的进度,却低估五年对社会的影响。”在产业CEO论坛上,王仲远在圆桌的结尾这样总结。
事实上,抛开这些技术细节不谈,智源的“悟界”系列并不是孤立的项目,而更像是中国开源生态系统中的一个缩影。智源研究院截至目前已开源约200个模型和160个数据集,模型全球总下载量超6.4亿次。通用向量模型BGE系列成为中国首个登顶Hugging Face月度下载排行榜榜首的开源模型。
在全球技术竞争加剧的背景下,如何在自主创新和开放合作之间找到平衡?包括阿里巴巴、腾讯、百度、华为在内的中国科技企业,都在通过模型、数据、工具链等维度参与到开源生态的构建中。
这种探索的复杂性在于,它需要同时回应国内产业需求、国际技术标准和地缘政治现实。这也意味着,开源是产业价值选择,而不是道德选择。
全球开源生态的代表Linux基金会的执行董事Jim Zemlin也在演讲中强调:“2025年是开源AI大年,开源正成为全球AI创新核心驱动力。开源不仅是代码共享,更需全球协作。开源是技术普惠的唯一路径,通过全球协作确保AI创新由全人类共享。”
在智源研究院副院长兼总工程师林咏华主持的对话中,Zemlin与LAION工程负责人兼创始人Richard Vencu就全球AI开源与合作展开深度对话,嘉宾普遍认为:“开源是AI发展的核心,数据集共享是关键基础,全球协作至关重要。”
Linux基金会执行董事Jim Zemlin
而这种协作的深层含义是什么?当技术开始影响认知、教育和社会判断时,每一个参与者——无论是开发者、企业还是用户——也都像大模型一样被训练。
这让技术演进背后的哲学之争变得更加迫切。
哲学对技术的回应正变得迫切
我们应追求一个由中心算法统一优化目标、被受到控制的技术系统,还是构建一个多智能体、分布式协作的去中心化智能网络呢?
回到这场会议的开头,Yoshua Bengio 和 Richard Sutton 的演讲在某种程度上代表了这一张力的两个端点。
会议开场时,Sutton在主题演讲《Welcome to the Era of Experience》中讲到,智能体需要像人类和动物一样从动态交互中生成新知识,强化学习是实现这一目标的核心路径,通用人工智能需要更强大的持续学习算法。
他认为,智能体天然具有多元目标,如同自然界生物,关键在于通过分散合作而非集中控制实现安全协同 —— 人类社会的进步源于分权化合作,集中控制 AI 的呼吁本质是源于恐惧的 “危险策略”,可能引发类似人类冲突的问题。
Sutton 是去中心化合作的倡导者,认为这一路径更可持续,且能避免战争、腐败等风险,最终实现 AI 与人类社会的互利共赢。他说:“事实上,我们的经济体也是如此运作的,不同的人有不同的目标和能力,他们并不追求一个统一目标。真正的智能,应该是由多个目标、多样反馈与复杂环境所共同塑造的。”
Bengio还是一如既往强调了 AI 带来的潜在风险,尤其是“智能 + 自主目标 + 执行能力”所构成的危险组合。他提醒我们要警惕不透明系统在集权化架构中被滥用的可能,主张将安全机制内嵌进系统架构,主张可信度的可验证、路径的可控制。
某种意义上说,Sutton的观点也许更契合当今全球技术竞赛的主调。这种“去中心化的目标结构”不仅回应了中国、美国、欧洲等多地AI发展的现实路径,也更贴近多极世界下技术秩序的实际想象。
从具身智能、累脑技术到开源,技术不仅关乎理论范式、工程效率,也关乎价值选择。当 AI 逐步嵌入教育、医疗、司法、就业等领域,它所带来的并不是中性的增强,而是一种深度嵌入日常生活的全新规范。
而每一个人,都是其中的一分子。每一家创新公司和组织,都是面向未来的教育公司。