哈佛毕业做教育AI:到底什么样的产品,才配说是为学生好?| 智幻播客E04

本期播客聊聊到底什么是”好“的教育科技?教育中有哪些东西是无法被计算的?
1920年,心理学大家斯金纳将用以训练动物的教学机引入孩子们的课堂,自此,技术成为了教育体系的新信仰。我们相信科技可以提升效率、扩大普惠,也能实现真正的个性化。
但技术是解药,还是会继续拉大数字鸿沟?这期节目中,我们不断追问一位在学习系统上登上过巅峰的教育科技实践者——陈双乐,他曾是浙江大学的工科生,创业入局教育行业,又一路卷进哈佛大学。
本期讨论试着超越商业、产品和技术,去定义什么是好的教育科技,进而聊到优绩主义之困、人类老师的稀缺价值、以及对教育公平的终极信仰。

播客文稿
(文字内容经过重新整合,有部分删减)
1.介绍一位教育实践者
Zhuoran(智幻时刻主播):大家好,欢迎来到智幻时刻,我是Zhuoran,是节目的常驻主播。今天很高兴邀请到双乐。
双乐(智幻时刻嘉宾):大家好,我是双乐。今天很高兴接受Zhuoran的邀请,来跟大家聊一聊AI和教育相关的事情。
Zhuoran:双乐是我的前同事,我们曾一起参与过乡村教育的公益项目。我认识的人中,他是对教育最有热情的人之一。当然他也是一个充分在教育系统中取得了成绩的人,本科毕业于浙江大学,研究生毕业于哈佛大学,现在在头部大厂做教育科技相关的产品,同时坚持做自己的教育项目"卷笔刀学社"。
这是一个怎样的项目?和你的经历有怎样的关系?
双乐:这是我在哈佛毕业后创建的。在学校里有一门令我印象深刻的课程叫"how to be an expert learner"(如何成为学习专家)。这让我思考什么样的核心能力是面向未来最重要的。世界变化太快,学校教育跟不上发展。所以我把那门课的精华,加上我从小到大的学习经验,做成了音频课程,希望能帮助别人更好地学习。
我是工作了五年之后才去哈佛念书的。真正笃定教育科技会是我想追求的职业方向,是在我第一段工作经历——一次创业。我在大学尚未毕业时,和几个同学一起创办了一家教育科技公司,做商业模拟教学。我们看到大学生毕业后与企业实际能力要求不匹配的问题,想用游戏式的体验学习来连接大学生和企业。
我们创建了模拟企业经营环境,让学生们在解决真实复杂问题中锻炼综合能力。这段经历给了我很多正反馈,让我意识到这是我非常有热情、想长期追求的方向。
Zhuoran:我经常看到你分享一些和小朋友儿语相关的工作,这是一个什么样的教育专业概念?
双乐:儿语是这样,现在有越来越多的小朋友,尤其是2到8岁的小朋友,他会遇到一些说话的问题,说话说不清楚。或者到一个年纪了,2到3岁了只会叫爸爸妈妈,3到4岁了只会叫短句,不符合语言发展的规律。针对这样的小朋友,我们在杭州有线下的一个中心,去教小朋友说话。
Zhuoran:你的自我认同是什么?是教育产品经理还是老师?
双乐:现实中确实还蛮多人叫我老师的。一方面因为我们做过乡村教育的公益项目,我自己也会做志愿者,去给孩子们上课。小朋友们叫我陈老师,在那个过程中我还蛮享受的,因为那是我把外面的世界、科技世界带给他们的过程。
但是工作中,现在很多人相互都叫某某老师。一旦有人这样叫,我有时会想可能要叫我干什么事了。
我原本有个社交媒体账号叫"哈佛陈老师",后来改成了"哈佛小陈"。这两个区别挺大的,一个是自称为老师,一个是小陈。我对"老师"这个称谓有敬畏感,你要教人时,就要对你教的东西负责。所以我希望不要总觉得自己是个老师,而是把自己定位成一个小陈的状态。当我有东西跟大家分享,大家觉得好、认可我,那就很好。
从职业定位来看,我更认同自己是一个AI加教育的产品经理。
2.头部AI公司都先瞄准的是大学市场,而不是K12?
Zhuoran:教育科技这个领域这两年正在迎来新一轮热潮。像Claude近月刚推出了教育产品,OpenAI去年也已经开始做教育项目了,除此以外,还有许多专门做教育AI的公司。你如何看待这个市场?
双乐:从市场规模来看,教育绝对是个好生意,它是一个万亿级的市场。这也是为什么几乎所有大型互联网公司都有教育业务。但教育又非常受政策影响,尤其在中国。从商业角度看,可能会有很多挑战,但我个人仍然对教育科技这个行业充满热情。
教育的需求是非常刚性的,它的基数也非常大。在中国家庭中,教育支出占总支出的比例可能还在上升,甚至有越来越"卷"的趋势。
Zhuoran:很多科技公司做教育时,都倾向于先面向高等教育,比如OpenAI和Anthropic都是面向大学。为什么不先做K12呢?
双乐:最近有小道消息,说Google的Gemini也要出Kid的版本。我觉得主要是面向K12的,还是会有一定的不可控性。在未成年人里面,对内容还是相对来说要求会更高一些。所以各个大厂在的时候,它的产品设计上面,市场推广、产品设计上面会相对来说会更保守一点。
另外,Amazon它们都会有很多面向大学生的举措。即使没有大模型的时候,他们的云服务都会面向大学生,有优惠,有课程,有更高效的合作。这是因为他们要从最开始的阶段去为他们去塑造一些品牌,或者为他们未来的潜在用户去建立这个市场的基石。
大学生都是一批最高知的人。如果从大学的时候他就产生了这样的使用习惯,他更有可能在进入社会,未来成为一个企业的企业主、管理者,或者自己有付费能力,他可以成为这些企业工具的用户。
用互联网黑话叫做打标杆。
Zhuoran:中国的教育市场K12是更大的吗?前两天我和一些教育公司聊了聊他们做的一些教师批改机这样的产品,几分钟就可以改8000张试卷。那个试卷上还有红色的勾和叉,和传统人改的卷子一样的笔记,你会觉得中外的市场是有比较大的差异的。
双乐:你刚才提到中国的K12规模可能是更大的,从绝对值上来说肯定是这样的。中国的人口基数,以及整个应试、家庭对基础教育的整个重视,家庭支出里面教育的占比等等,都决定了它K12的整个市场规模绝对值是更大的。
但是我觉得从另一方面来说,学校里面对AI这种新技术的一个开放的程度,那是不一定的。ChatGPT刚出来的时候,美国很多的中小学生就跟进了,就在学校里面去尝试开放使用。早期的时候,美国是绝对比中国走在前面很多的。
在国内,最早比如说云谷学校,类似这样的创新学校,可能才会去跟进。直接学校里付费,老师可以去调用ChatGPT,给学生开放了类似涂鸦画板一样的AI绘画的能力。但是大部分公立学校在早期的时候,其实学生是很难去应用这些AI工具的。学生有一个巨大的问题,他没有账号,他在学校里面是没有办法很好的去使用的,一是账号的问题,二是设备的问题。
大部分中国的学校它就是一个计算机教室,有一个以前大概的数据,中国的学生的生机比大概是7比1,平均每7个学生有一台电脑。但是在美国可能是不到1比2。那在这样的情况下,学生接触这些数字科技、AI科技,有硬件条件的限制。
所以相对来说,我觉得我可能没有那个结论说教育科技或者AI这件事情在中国的K12里面可能更受关注。我觉得可能是一个绝对和相对的一个关系。
Zhuoran:中国学校普遍采用大班制,这在一定程度上影响了教育产品的设计,比如AI辅助批改。我最近与教育科技公司交流时,他们提到一个办公室4-5位老师共用一台机器就能完成所有学科的批改工作。因为如果完全依靠老师人工批改,工作量太大,会占用大量时间。
另外,大班教学很难实现个性化教育。今年教育部发布了新文件,明确提出要促进AI助力教育变革。
从产品角度看,您认为这些政策可以如何落实到具体的产品设计中?
双乐:这份文件是2024年教育部办公厅发布的《关于加强中小学人工智能教育的通》,规格相当高。这个文件下发后,各省教育厅正在制定各自的落地计划。在中国教育体系中,学校的具体行动最终由区县决定,所以这是一个从省市到区县再到学校的逐级落实过程。
我很期待这项政策真正落地。据我所知,浙江省走在前列,正在制定相关规则,去年已发布了一些具体行动计划。具体实施情况还需要看各省市的计划。
Zhuoran:如果落实到产品上,Anthropic这次推出的Claude for Education有几个重要功能值得关注:
一是引导学生思考而非直接给答案。
二是个性化教学。
你认为AI向学生提问与老师向学生提问有差异吗?
双乐:这叫做苏格拉底式的提问。从这个名称我们能明白,一些核心教育理论几千年来基本不变。ChatGPT刚出现时,可汗学院率先推出Khanmigo,强调教练式引导而非提供答案。教育产品的垂直应用适配是首要考虑。
我们开发的AI教育产品也包含类似的师生互动问答功能。引导比直接给答案更有效,但实践中有个难点:AI的引导与人不同。对具体问题的引导,如数学题的解题步骤,可以设计为"第一步思考什么?第二步思考什么?"等循序渐进的模式。但教育中的"先验知识"问题,AI无法全面了解学生是否具备,这就回到个性化教学的核心难题:如何掌握学生的完整学情数据。
更深层次的挑战是情感支持。现实中,老师的一个微笑或轻拍肩膀就可能激发学生灵感,你会发现一个孩子受到鼓励后看忽然变灵光了。但AI在这方面的能力还不够。
更高阶的教育目标是培养学生提出问题的能力。AI教育产品设计的挑战在于如何引导学生发现并提出问题,而非仅找到特定答案。
Zhuoran:生成式AI刚出现时,人们认为它会引导用户更善于提问,因为提示词直接影响输出结果。你认为这与培养孩子提问能力相同吗?
双乐:我认为AI本身的交互无法训练孩子提问能力。这不能让孩子真正成为更会提问的人。
比如即使是打字很慢的乡村孩子和城市孩子在与AI互动时,他们提出问题的方式和内容差异很大。
Zhuoran:什么叫会提问?
双乐:最重要的是开放性,不局限于框架内,能跳出课堂教授范围提出问题。
3. AI如何重塑教育模式?
Zhuoran:这可能需要老师引导。无论是联合国教科文组织还是世界经济论坛的教育4.0框架,各方对科技改善教育已形成共识。推动力来自全球教师资源短缺,难以引导每个孩子发展提问和思辨能力。
但AI帮老师改卷真能增强教学效果吗?我在思考,虽然提高效率,但改卷过程本身不正是老师反思教学的机会吗?
双乐:新技术可以承担日常重复性工作,虽然并非完全重复,因为每个学生答案不同,老师确实能通过批改了解学情。
客观题批改早已实现机械化,以前用答题卡,现在有识别技术可直接识别学生笔迹。主观题批改则是大模型带来的新可能。现有产品已经能批改作文,直接在纸上标注错别字、语法错误、好词好句并给出评语。这种方式既减轻教师负担,又保留了传统纸笔反馈体验,是交互形式的巨大进步。
但也带来问题:第一,学生能感知到是机器批改,会否重视这种反馈?会否感觉缺乏温度?
第二,批改效果存在挑战,如学生笔迹潦草、答题顺序混乱等实际情况如何处理。
我之前就AI作文跟一个特级老师去聊,他就说我们怎么样去判定AI产品做得好。一般来说我去比较同一篇作文两个产品,A产品能改出更多的错别字,能改出更多的语法错误,能改出更多的前后语言逻辑的错误,它就是一个更好的AI产品。那可能学校去招标或者选择产品的时候倾向于选择它。
但是那个特级老师就告诉我说,他在思考一个问题,你给小朋友改出更多的一定是最好的吗?他说如果我有一个小朋友,他本身的基础语言能力不是特别好,满面都是错别字,他可能不会选择把他的四五十个错别字都圈出来,他可能只会圈出,比如说十个、15个他觉得最常见的,这个最应该小朋友去学习和改正的。因为四五十个小朋友不可能全改正得过来,而且他一拿到那个卷子,看到全部都是圈出来的红笔会是什么心情呢?
Zhuoran:这个观点很有启发性。现在从大数据开始就有一种"一切可量化"的趋势,但教育场景中有些部分很难量化,比如师生间微妙的情感流动。想象一下,如果我是个花了很多心思写作文的小朋友,发现老师用机器批改,我会很失望。
双乐:这正是我提到的"温度"问题。联合国教科文组织强调教育必须"以人为本"(human-centric),确保"人在环节中"(human in the loop)。
在关键环节,人是不可替代的。比如对特别需要关注的学生,老师的手写评语或表扬是必不可少的。
Zhuoran:会不会出现这种情况:算法发现某些学生错误最少或作品最好,老师就会更关注这些孩子?
双乐:产品的设计上涉及效率与质量的平衡。如果老师完全靠自己批改,能了解所有学生情况但耗时巨大;使用AI提高效率,必然有所取舍。
另外还需考虑教师能力差异——对能力相对较弱的老师,AI可能能补充一部分有价值的教学内容。
Zhuoran:上周我与一位社会学教授交流,她说自从生成式AI出现后,每个学生写文章时水平都获得了巨大的提升。这让她不知如何评判。AI似乎正在给教学提出新的标准?
双乐:这个问题在ChatGPT刚出现时讨论更激烈。现在各大学都有应对政策:有些明令禁止使用AI,有些要求学生申报使用情况,也有创业公司开发AI检测工具。但这是个技术竞赛——今天能检测的内容,明天更先进的模型可能就无法检测了。
我认为更本质的是大学需要改变评价方式。如果学生能用AI完成得很好,可能说明题目设计不够有挑战性,缺乏对批判性思考、创意思考或复杂开放性问题的要求。
从伦理角度看,这涉及诚信问题。但从社会生产角度,今天的程序员使用AI编程工具,公司关注的是最终产品质量而非代码来源。
Zhuoran:我认为这涉及到教育科技是否被视作是一种效率工具。
双乐:从科技角度看,它推动生产力发展,确实能提高效率。在应试教育环境下,我们有明确的量化标准和学习目标,追求效率是合理的——大多数人会喜欢能让他们更快达成学业目标的方法。
但如果教育目标是培养独立思考或获得幸福的能力,那"效率"就很难定义了。我们无法简单地说"三年教会你追求幸福"或"两年培养你独立思考"。
4. 个性化学习的100年历史和它的未来
Zhuoran: 你认为教育的目标应该帮助人追求自身能力的极限吗?
双乐: ChatGPT等大模型出现后,教育界非常兴奋,因为它可能实现教育个性化。过去一百多年,教育都是班级制规模化的,成本问题使个性化教育难以实现。AI出现可能改变这一点,让每个学生都有一个一对一的辅导。
我们说教育存在一个"不可能的三角":规模、质量、个性化,三者无法同时实现。但AI可能帮我们打破这个限制。从社会和国家角度看,教育规模很重要,因为这关系到教育公平。
Zhuoran: 这种改变"不可能三角"的AI产品具体是什么样子?
双乐: 核心是让每个学生有适合自己的学习节奏、路径和个性化反馈。我们需要区分两个概念:自适应学习(adaptive learning)和个性化学习(personal learning)。
自适应学习是为了同一目标(如考高分),每个人有不同学习路径;而真正的个性化学习是每个学生有不同的目标,为了那个目标有个性化路径。我们现在讨论的多是自适应学习,真正的个性化学习是更难实现的教育更高阶的目标。
Zhuoran: 个性化教育的概念已有近百年历史,最早是心理学家斯金纳通过训练动物的机器引入教育的,你如何看待这种教育理论近百年来的发展?
双乐: 斯金纳属于行为主义教育理论,类似巴甫洛夫条件反射。从狭义角度看,它是一种自适应学习,为特定目标使用自动化方式实现教学。
它产生于工业化背景,目的是服务社会生产需要。现在随着重复性劳动被技术替代,人的培养标准在变化,这些教育机器的内涵也需要变化。
教育有不同的理论。现在比较主流的是建构主义,认为知识不是通过训练反射获得,而是通过自己的经验与环境互动后自主构建认知体系。
Zhuoran: 有位教育技术作家叫Audrey Waters认为,我们引入技术改造教育的前提是学校很失败且无力自我改变。你如何看待这个判断?为什么学校改变这么难?
双乐: 教育作为公共服务,成效需要长时间才能体现,难以像企业那样快速评估投资回报,我们更愿意投入短期见效的事情。所以新技术进入学校总是较晚,因为学校体系相对保守。
Zhuoran: 教育科技很喜欢强调随时可学习或24小时陪伴的优势,但我担心这同时会强化对学生的控制权,为什么要让孩子24小时都在吸收知识?
双乐: 从建构主义角度,重要的是学生想完成什么,通过人机协同实现目标。AI应该在学生有好奇心和驱动力时随时帮助他,而不是单纯教授知识。
我认为教育有三个层次:K12阶段学习标准答案,大学阶段探索未知并学习研究方法,社会阶段则需要寻找问题的热情和好奇心。
当人有好奇心和自驱力时,AI价值就能发挥到最大,它能帮助找寻答案或提供方法。
5. AI会跨越还是制造更大的数字鸿沟?
Zhuoran:在AI时代,教育资源的不平等会不会进一步加剧?尤其是城乡之间的差距。
双乐:在AI时代,教育差距可能会越来越大。原先90年代的"希望工程"解决的是有没有学上的问题。我们现在去乡村学校,基础条件问题已经解决,但科技教育的差距正在扩大。城里孩子在学AI是什么、体验AI绘画,农村还在学如何创建文件夹、使用Word。科技发展那么快,老师素养的差距也会导致学生接触数字世界的机会不同。
Zhuoran:还有一种新的数字鸿沟形式,Andrej Karpathy前阵子提到,未来可能存在一种情况是优质教育资源的孩子用最新的模型,而贫困地区的孩子用旧模型。
双乐:很有可能。我认为更大的原因是AI改变了对人能力的要求。原先可能是知识维度上的差距,现在更需要知识以上的能力。当大模型能做到大部分知识性工作时,高阶思维能力的差距会更明显。
我想到我们去了一个偏远边境地区,那里的家庭大多靠低保生活。我们问小朋友的人生目标,他们说"将来能拿个低保就好了"。这是他们的父母灌输的,因为在他们看来,低保意味着基础的衣食无忧。对他们来说,读书有什么用呢?
这种状况的原因一方面是他们没有看到更大的世界,另一方面是身边的人、家庭环境和周围人的思维模式就是这样。从小在这种环境长大,能期待孩子有什么样的跳脱呢?
Zhuoran:科技真的可能解决这个问题吗?
双乐:我认为教育科技化是大的趋势,它确实也能实现一定的普惠。教育可能是能够推动阶层流动的少数几个途径之一。如果这条路不存在了,很多人的希望和社会稳定因素都不存在了。从这个角度说,这个希望是一定不能崩塌的。
6. 教育能帮我们对抗优绩主义之困吗?
Zhuoran: 在通过教育实现人生目标的道路上,你认为自己是"优绩主义获利者"吗?你如何看待不断追求更高教育成就的路径?
双乐: 这是我在反思的问题。我算是从小我成绩就比较优秀,后来又去了哈佛。这些成就变成了标签,有时会成为压力和枷锁。
在学校有明确目标和评价标准,但进入社会后发现没有那么清晰的标准了。哈佛这种标签背后是更高的期望。上了哈佛后发现周围的人条件更好、更聪明、更努力,我会出现"冒充者综合症"。有时候在社交场合介绍自己是哈佛毕业,有人会质疑"哈佛毕业只是来大厂打工啊",好像哈佛的都应该创业、上福布斯才符合期望。
所以优绩主义就是登上了一座山,发现还有无数座山,但实际上,我们每个人是不是应该有不同的"山峰"呢?否则人生只为攀登而活,太累了。
Zhuoran: 你现在放弃攀登这座山了吗?
双乐: 有些自我和解的部分,但还不敢说完全放弃。这需要调整过程。所谓"看开"不是放弃更高目标,而是建立自己的评价标准,这是我下一阶段成长过程。意识到问题,但无法迅速解决。
Zhuoran: 我觉得这是我们今天最有价值的部分。感谢双乐的真诚分享。