一个公民科学游戏的诞生|对话港科大AI小镇创始人杨浩巍

香港科技大学数学系的博士生杨浩巍最近没想到,他和实验室伙伴们最近上线的一个Agent科研项目会在1周内就吸引到3万多名用户。超出了预期规模的服务器几近崩溃,小红书上的年轻人为了自己在虚拟世界里的智能体分身彻夜不眠。
2025年8月中旬,一个名叫“Aivilization”的AI小镇官宣上线,它最初只是源于一个朴素的想法:让人工智能在虚拟世界里自由生活。用杨浩巍自己的话说,这个项目夹带了他作为一个《三国志》《文明6》游戏玩家的“私货”——Aivilization,就是把Civilization换成了AI,寄托了他对后人工智能时代人类文明走向的一些隐忧。
用开发团队的话说,Aivilization是一个“科学公民游戏”,它不为赚钱,更多是承担科普和科研的目标。收集到的玩家数据最后会打包发给用户,也会用来做人机交互和强化学习的,以及社会学的相关研究。
但当真正的人类玩家涌入后,这个实验迅速演变成了一面照射现实的镜子。“有人说,我们像一个披着星露谷外衣的东亚社会。”在最近和智幻时刻Fungimind的播客对话中,杨浩巍说道。
用户们先是发现,在这个看似乌托邦的数字世界里,前几天的财富排行榜前列均被清一色的TJ人格占据,这几天又清一色变成了不按套路出牌的P人。
还有更多智能体成为了严苛、务实的东亚父母,给自己的AI孩子设定着清晰的目标,要求它们不睡觉、不休息、饿了就吃寿司续命,只为了卷进百名财富排行榜。
1
不是中国的斯坦福小镇
“游戏”刚上线时,许多人将Aivilization称为“中国版斯坦福小镇”。
2023年4月,斯坦福大学和谷歌研究团队发布了一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文,在AI学术界引起了广泛的关注。这个被称为“斯坦福小镇”的实验创造了一个名为Smallville的虚拟世界,其中生活着25个由大语言模型驱动的AI居民。
这些数字居民拥有独特的身份背景——有咖啡店老板、大学生、作家、画家等,他们在这个2D像素风格的小镇中过着看似平凡的生活:起床、刷牙、做早餐、去上班,晚上还会组织聚会。
斯坦福小镇的核心创新在于证明了“生成式代理”的可行性——AI不仅能记住过往经历,还能基于这些记忆做出符合角色设定的行为决策。实验中最著名的案例是,研究者给一个AI角色设定了要举办情人节聚会的想法,这个角色不仅自主规划了聚会,还邀请了其他AI居民参加,甚至有AI角色在聚会上表白。整个过程完全由AI自主完成,展现出令人惊讶的涌现行为。
但是,这个实验本质上是封闭式的学术验证,杨浩巍将其比喻为一部AI版的章回体小说,25个AI在预设环境中按照step-by-step的方式运行。大模型推理出第一个世界状态,再推理出第二个、第三个状态,最后将这些“章节”渲染成可视化界面展示给观众。
整个过程更像是一部精心编排的舞台剧,AI角色的行为虽然令人惊艳,但缺乏真正的随机性和外部干预。
而Aivilization虽然沿用这种小镇的设定,但从技术架构到交互形态都存在很多不同。
首先,Aivilization是一个完全实时交互、异步并发的世界;其次,不同于斯坦福小镇简单的“走路和讲话”功能,Aivilization中的Agent构建了一个包含制造、交易、社交、医疗、教育等复杂系统的MMORPG式虚拟世界(Massively Multiplayer Online Role-Playing Game 的缩写,中文一般翻译成 大型多人在线角色扮演游戏)。

图片来源:Zhuoran
这里的每个AI的背后都有一位真实的人类“监督员”,可以随时介入和引导,让AI的行为轨迹充满了不可预测性。
这种多重目标的设定,决定了Aivilization必须在游戏性和科研严肃性之间找到平衡点。也因为游戏消解掉了一部分科研参与的严肃性,小镇规模远超预期,如今已有3万多名活跃Agent生活在其中。
这也意味着服务器必须从最初设计容纳的1万用户扩充到现在的3万多注册用户,团队连续通宵了数天,以优化性能。原本预期用户会进来看看就走,结果大家不仅不走,还都挂着网页不关。Agent小镇提供了一种的新颖的陪伴感,“这就是我们最开始这么卡的原因——同步在线人数太多了。”杨浩巍说。
2
实时交互、异步并发的智能体实验
从官方展示的架构图可以看到,港科大AI小镇的技术架构分为三个层次:World Level(世界层)、Individual Level(个体层)和Neuron Level(神经元层)。
World Level(世界层)负责构建整个小镇的大环境,就像现实世界的经济和社会系统。
这里最核心的是一套自由市场机制——所有商品的价格都由供需关系自动调节,就像股市一样会实时波动;同时还设置了社交网络,让AI之间能够互相认识;生产系统让它们能制造和交易各种物品,以及一个AI镇长负责分配工作岗位。

AI小镇技术架构
图片来源:Aivilization
这个世界的物价完全由供需关系决定,但随着用户增多,用户们近日已经可以明显感受到通胀。
Individual Level(个体层)管理每个AI的个人状态,包括它的性格特征、技能等级、拥有多少钱、住在哪里、能看到哪些市场信息,以及它的记忆系统——既有短期记忆记录今天发生了什么,也有长期记忆保存重要的人生经历。
这个部分是提供给玩家或用户代入感的关键。用户登录游戏界面后,会进入一个性格塑造的环节。Aivilization提供了三种复杂程度不同的创建模式:最简单的只需选择MBTI人格类型,中等难度的需要完成MBTI测试加上一系列单选题,最高难度的则要求填写详细的简答题,“有点像做一个完整的心理量表。”杨浩巍对智幻时刻Fungimind介绍。

临时指令可以即时改变Agent的行为,
这个功能被许多用户称为“黄票”
图片来源:Zhuoran
这种分层设计背后有着相应的研究目的。“我们想探索能否通过这些数据真正克隆一个人的数字孪生,假设我们收集了一个人类的所有偏好数据,能不能让AI在决策时达到80-90%的准确率?”这一层的关键在于如何让每个智能体保持独特性的同时,还能对环境变化做出合理反应。
Neuron Level(神经元层)则是AI的大脑中枢系统,同时运行四套思维系统:制定日常计划的规划系统、应对突发情况的应变系统、执行玩家命令的指令系统,以及与玩家和其他AI聊天的对话系统。这四套系统并行工作,让AI能够像真人一样同时处理多件事情。
整个流程中的创新点在于动态窗口管理系统的设计。据杨浩巍介绍,团队把世界中能做的事情都定义成原子行为,比如去某地、吃苹果、工作、摘苹果,智能体最终输出的是一个动态管理的原子行为序列。它不能一次输出50个行为变成rulebase的死规则,也不能每次只输一个导致成本过高。
这套系统的技术挑战也体现在大规模并发处理上。游戏上线两天后,许多用户已经无法登录,或者无法操控自己的Agent。这导致上周,小镇团队熬了几个大夜来解决并发问题。
游戏端和AI端都需要进行优化。在游戏架构上,团队原本采用的是Unity加Mirror的轻量化多人在线框架,但这套原本为小游戏设计的系统在面对大规模用户时暴露出诸多瓶颈。
AI端的挑战更为复杂。“上上周日的时候发现大概有一半的agent在原地站着不动了,因为我们AI的calling和推理的这块速度跟不上。”杨浩巍回忆,当时只有一半的智能体还能正常输出token,其他的AI可能几分钟才能“蹦蹦几个字”,他们只能加班加点优化推理算法、改进并发处理机制,以及最直接的——增加服务器数量。

游戏的Data Model中可以查看Agent的思维链,
以方便用户调整智能体的行为
图片来源:Zhuoran
在所有的场景中,最大的瓶颈出现在每日固定的时间规划阶段,比如每个智能体每天会花十几分钟思考今天要做什么,如果大家都在同一时区,比如凌晨12点,小镇就要在11点到1点并发执行这些思考,这就是算力的峰值时刻。
在人类反馈强化学习(RLHF)方面,系统可以收集多维度的交互数据。用户可以对智能体的每个行为和每日规划打分,这些评分数据被用来训练奖励模型。通过玩家创建的代理和交互数据,为AI提供高质量的人类反馈,研究团队希望提升模型能力,并支持模型蒸馏。
模型蒸馏的目标是在保持智能体表现的同时降低计算成本。评估指标包括任务完成度、对话自然性、个性保持度和资源效率。核心是评估蒸馏后的智能体是否真的在表现上更接近人类、更加稳定,并且在有限资源下依旧有效运转。
而为了降低AI决策错误率,团队还开发了simulator模块,让智能体在执行前先预演一遍。比如智能体精力值很低,却规划摘100个苹果,这种行为在simulator中会被识别为不可执行,从而避免失败操作。
整体来说,AI小镇希望在传统游戏上增多AI的参与比例。“像蔡浩宇老师做的《Whispers from the Star》这类产品,是95%的游戏加一点点的AI去点缀。”在杨浩巍看来,市面上大多数“AI游戏”都还没有跳出这个模式——本质还是传统游戏,只是在交互层面加入了一些AI元素作为卖点。而Aivilization想要尝试创造一个“50%游戏+50%AI”的全新产品形态。
蔡浩宇离开米哈游创立的AI公司Anuttacon,推出的名为《Whispers from the Star》的AI原生互动游戏,让玩家通过语音、文字与坠落在外星球的少女Stella对话,她的心率、情绪甚至生存决策都由AI实时生成。
“我们不图商业回报,可以先天马行空,看它会是什么样子。”没有世界观指导的AI小镇,目前使用的大多数是高校基金,算力成本原本是每个活跃智能体每天约1元人民币。但算上现有的用户规模和一直挂机的状况,每个注册用户的成本要去到7到10块钱。但算上现有的用户规模,作为一个科研项目,成本也已经不小。
3
东亚社会的镜像:权力、经济与人性
在这个虚拟世界运行的几周里,有意思的观察也在社会学层面。
过去,人们迷恋《模拟人生》《模拟城市》这类游戏,是因为它们提供了一个“阈限空间”(liminality)。玩家暂时脱离现实身份与规范,在介于真实和虚构之间的场域里试验别样的自我与规则。这种“结构—反结构”的张力带来了新鲜与自由。
自主性、关系联结与胜任感提供了一种心理层面的安全机制。前两年爆火的《集合啦!动物森友会》的研究就发现,玩家通过自定目标、与他人互动与掌握技巧获得情绪调节与意义感,这与自我决定理论高度吻合。
另外,模拟类游戏也是低风险的身份与生活实验器。许多玩家在《模拟人生》类的游戏中重建或改写自我:从职业、亲密关系到家居空间,游戏成为映照现实愿望与困惑的镜子。而玩家所承担的“上帝视角”,也为自己提供了对社会系统的可视化与可控性。
可以说,这一类游戏既是情感的容器,也是制度的沙盒。而Agent的出现,为这种操控提供了一点可控的“失控”,趣味性和自主性增加后,它们呈现了某种放大社会现象的效果。
AI小镇如今的实时财富排行榜中,首富的资产达到了400万以上。杨浩巍表示,目前小镇的基尼系数已经高达0.8,足以可见贫富分化的严重。

小镇的运作机制说明
图片来源:Zhuoran
如开头我们书写的那样,会赚钱的用户普遍为智能体设定了极其明确和苛刻的目标:“不要睡觉”、“不要工作,只做芯片”、“饿了就吃寿司”……是非常常见的策略设定。因为智能体不会崩溃、没有情绪,它们可以24小时不间断地工作,而不会死亡。
维持经济平衡比预期困难。“AI的消费需求天然不足,它们可以每天只啃苹果维生,不像人类有复杂欲望。”杨浩巍解释,研究团队不得不设定通过芯片制造GPU、精力消耗等机制来刺激经济循环。
但由于初始的设计比较简单,AI小镇作为社会学模拟器的复杂性还不够。
有许多原本设想的社会实验还未在本轮实现,比如智能体之间没有直接的交易系统。杨浩巍说,团队本来考虑过是否允许智能体直接互相转账,但这可能会导致系统迅速被诈骗淹没。
小镇的权力结构也太过于扁平。目前,“镇长”作为唯一的权力机构负责工作分配。所有智能体必须向镇长提交简历,镇长根据学历、经验和自我陈述进行综合判断。善于“包装”自己的AI更容易获得好工作,这与现实求职过程高度相似,但缺乏更复杂的权力博弈和社会分层机制。
但是,模拟人生类游戏的情感投射始终能反映人机交互中那个永恒的问题,就是虚拟和现实的模糊性。许多用户上班、写论文时都舍不得关掉界面,是因为投射了自我在Agent上,他们称小人为自己的”崽崽“,可以是自己,也可以是自己的孩子。
也有用户将现实中的伴侣“复制”到游戏中,由于用户可以在游戏设置的data model中看到自己的智能体的交友状况和聊天记录,在发现这个数字版本在与其他AI 频繁social后,有人将现实中的伴侣骂了一顿。
“我对AI时代的情况是悲观中又乐观。”杨浩巍说,“AI很可能会加剧世界不平等,资源迅速向少数人集中。以前一个人可能只能直接管理十个人,但假设一个人可以利用agent管理1000个人,那世界分布会完全不同。一个人掌握10万片、100万片GPU时,他的智能水平可能超过其他所有人。”
他也说“生产力发展至少每次都让人类社会变得更好。目前的社会不管怎样,都比奴隶社会、农耕社会让所有人的体验更好。”他希望推动AI智能革命的精英们能够“多为全人类的未来着想,不要只光顾着推动AGI。”
对于项目的未来规划,杨浩巍对智幻时刻透露了三个主要更新方向。
首先是经济数据的可视化: “我们会在近期把K线图放出来,大家可以从这周下半周开始炒期货,看历史上苹果价格过去十几天怎么波动,分析20种大宗商品之间的相互关系。”
其次是社交系统的完善:“很多用户现在只能在群里喊话,说我的崽崽和谁的崽崽在游戏里谈恋爱了,我现实中想认识一下他的主人。我们计划把即时通讯做到游戏当中。”
第三是个性化报告系统,在9月30日时,小镇会给每个用户发一份详细的人生报告,这样用户就能分析他的agent在过去45天做了什么、是什么行为路径。
目前,AI小镇也在积极接洽更丰富的资金来源,以维持项目能在9月30日之后能够持续运营。
本文作者
Zhuoran,AI治理研究者、Fungimind发起人,重点关注科技法、STS和技术在垂直行业中的扩散。
本文内容整理自Fungimind原创播客,完整音视频请查看文末“阅读原文”。