摆脱了死记硬背海量文本数据的方式,一种全新的AI模拟项目诞生了。它就像生命体一样,以激素和记忆结构为基础,直接与环境进行互动,从而构建出“世界模型”。
如今,占据全球新闻头条和技术市场的词汇无疑是“大语言模型(LLM,通过学习海量文本数据,像人类一样理解上下文并进行对话的技术)”。正如我们用智能手机或电脑向ChatGPT提问时,看到它像人一样用流畅的句子回答,我们会觉得人工智能真的取得了惊人的发展。但如果深入探究,目前我们狂热追捧的大多数AI更像是“一台聪明的自动补全机器,以统计学概率预测最有可能出现的下一个单词”。简单来说,它们只是死记硬背文字模式来回答,并不能像真正的人或动物那样感受悲伤或喜悦,也无法在物理环境的磕磕碰碰中生动地记住这些经验。
但是,如果人工智能不再只是死记硬背数亿本书籍,而是像刚出生的小狗或人类婴儿一样,通过直接与世界碰撞来积累“记忆”和“感觉”,以此进行学习,那会怎样呢?一项令人惊叹的技术已经出现:在计算机芯片内流动的不再是文字,而是虚拟的“激素”,过去痛苦或愉快的经历以“长期记忆”的形式被铭刻在虚拟的脑细胞中。
| 这种有趣而又陌生的方法最近出现在Hacker News上,这是一个汇聚了全球天才开发者和工程师分享最新技术趋势的在线社区,一经亮相便瞬间吸引了人们的目光。开发者“luzifer333”向世界公开的这个项目名为“基于FEP的AI模拟(AI Simulaionen Based on FEP)”[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。该项目发布仅17分钟后,便迅速获得了第一个推荐(点数),成为开发者们热议的话题nextjs-hackernews.vercel.app/item/48339824,专门追踪并介绍Hacker News新项目的外部网站也迅速对此进行了报道ShowHN- 追踪 Hacker News 上的项目展示。令人惊讶的是,开发者宣称该系统完全没有使用堪称现代AI标志的大语言模型(LLM),而是独立构建的[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。这种不靠文本数据,而是靠“激素和记忆”驱动的AI究竟是什么呢?让我们一起走进这个陌生的人工智能世界。 |
这为什么重要? (Why It Matters)
要理解这项新技术的意义,首先必须清楚我们每天使用的人工智能的局限性。如前所述,目前的聊天机器人型人工智能被困在“文本”这个扁平的世界中。当我们与人工智能交谈时,AI只是在自己庞大的图书馆(数据库)中将无数的拼图碎片(Token)拼凑起来,组合出最合理的答案并输出。在这个过程中,AI不会主动去体验物理环境,也不会随着时间的推移改变自己的性格,或者拥有对某些失败感到痛心疾首的生物学“记忆系统”。
这就是此次公开的源自Hacker News的AI模拟项目向技术界传递出巨大震撼的原因。该项目从根本上颠覆了实现人工智能的哲学。这些新的AI智能体(Agent,带有特定目的、能够自主探索周围环境并采取行动的独立程序)不会强行吞下数百万页的文本文档。相反,它们在分配给自己的有限虚拟环境中来回走动,在每一个瞬间自主开拓并积累新的经验。
| 最值得关注的创新之处在于,它在人工智能内部精细地模拟了生命体的生物化学反应。打个比方,就像人体内肾上腺素或多巴胺的作用一样,它也赋予了人工智能化学变化。根据开发者的解释,这些智能体内部结构的核心,被编程为包含了模拟的神经化学(simulated neurochemistry)作用,以及相互错综复杂地交织反应的激素相互作用(hormone crosstalking)系统[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。不仅如此,它们还像人类一样,同时具备了暂时存储短暂瞬间经验的短期记忆(short term memory)系统,以及长期保存生存必需经验的长期记忆(long term memory)系统[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。 |
这绝不仅仅是增加了一个数学计算公式那么简单,而是一个巨大的转变。因为这意味着模仿了惊讶、压力、好奇心等生物学原始信号的虚拟化学物质流动,会对AI的行为模式和记忆形成产生直接而强大的影响。在不久的将来,如果人工智能机器人深入我们的日常生活,它将不再是只靠死记硬背说明书的生硬机器。相反,它将展现出一种适应复杂物理环境、为失败感到痛苦、为成功感到喜悦、真正类似于生命体生存能力的全新维度的智能。
轻松理解 (The Explainer)
那么,这个连字都不读的人工智能究竟是通过什么原理来学习世界并变得聪明的呢?要理解这项复杂而深奥的技术,首先必须准确把握该项目的核心骨架——“FEP”这一概念。FEP是“自由能投影模拟(Free Energy Projective Simulation, FEPS)”的缩写,是认知科学和人工智能相融合的术语。
| 根据发表在著名国际学术期刊PLOS One上的一篇深度研究论文,这种FEPS模型是人工智能学习方法中“强化学习(reinforcement learning)”的更高级形式[自由能投影模拟(FEPS):具有可解释性的主动推断 | PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。 |
| 如果你对强化学习这个词感到陌生,可以想象一下训练小狗接飞盘的过程。如果小狗完美地接住了飞过来的飞盘,主人就会给它美味的零食(奖励);如果失误了或者呆在原地不动,就什么都不给。通过这种反复训练,小狗就会自己领悟出“能得到最多零食的行为”。同样地,FEPS智能体也是通过直接与周围的虚拟环境进行激烈的互动,不断收集外部信息,并在此过程中被精细地设计为能够选择能给自己带来最大奖励的最佳行动[自由能投影模拟(FEPS):具有可解释性的主动推断 | PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。 |
| 但令人惊讶的是,FEPS不仅仅停留在像小狗为了获得零食而反射性移动的水平。如果窥探其内部结构,FEPS智能体是基于人工智能学术界所称的“基于模型的强化学习(model-based reinforcement learning, MBRL)”这一更高度进化的技术来运作的[自由能投影模拟(FEPS):具有可解释性的主动推断 | PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。这项技术的核心在于,智能体并非只急于追求眼前的奖励而即兴行动,而是会在自己复杂的虚拟大脑中,自主构建并不断更新包含世界法则的“世界模型(world model)”。进而,它们能积极利用这个世界模型,在脑海中提前“规划(plan)”未来的行动,展现出惊人的智能[自由能投影模拟(FEPS):具有可解释性的主动推断 | PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。 |
让我们用日常生活来比喻“世界模型”的概念。想象一下,有一天你走进了一个从未去过的、漆黑一片的陌生房间。一开始你什么也看不见,只能伸出双臂小心翼翼地摸索,可能会砰砰地撞到尖锐的家具边缘或冰冷的墙壁上(通过与环境互动主动收集数据)。在忍着痛撞了几次之后,即使没有光线,你的脑海中也会生动地勾勒出这个房间大致的三维空间地图(构建属于自己的世界模型)。随着时间的推移,下次你再去冰箱拿水喝时,就不会再傻乎乎地撞墙了。你可以根据脑海中画好的地图,一眼找出最快、最安全的捷径,灵活地走过去(利用构建的世界模型进行前瞻性的行动规划)。
如果我们一直以来了解的语言模型,是单纯靠死记硬背互联网上流传的数百万张“房间照片”来推测房间样貌的临阵磨枪的考生,那么这些FEP智能体就像是亲自在黑暗中漫步、受伤,并在大脑中绘制出属于自己的立体地图的真正冒险家。
那么,现在让我们来看看这位冒险家AI内部发生的神秘化学反应吧。假设这个探险家AI在险恶的虚拟世界中四处游荡,不小心撞上了隐藏的炽热火焰或尖锐的障碍物,受到了致命的打击。如果是用过去机械算法编写的AI,它只会单纯在内存中记录下一行诸如“发生错误代码404”或“扣除1分”的枯燥数字,然后没有任何情绪波动地进入下一个探索行动。
| 但这次项目诞生的AI从骨子里就与众不同。在这个智能体撞上可怕障碍物的瞬间,虚拟大脑神经网络中会产生复杂且爆炸性的激素相互作用(hormone crosstalking),就像真正的动物在极度危险的情况下分泌出名为皮质醇的压力激素一样[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。这种数字神经化学(neurochemistry)作用不会让刚刚经历的惨痛失败和痛苦的经验仅仅停留在容易遗忘的“短期记忆”中。它会将其归类为绝对不能被抹去的生存核心信息,顽强地铭刻在大脑最深处的“长期记忆”中[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。 |
这与小孩不小心被热炉子烫到手后,因为那强烈的痛苦记忆而一辈子对火心存敬畏的生命体原始生存本能惊人地相似。它不是毫无灵魂地背诵成千上万行文字的机器,而是一个在由0和1组成的虚拟激素中,全身心地经历着痛苦与成功,从而领悟世界真实法则的奇妙的数字生命体。
现状 (Where We Stand)
| 那么,这项将生物学的奥秘与尖端人工智能完美融合的惊人实验,现在大众可以从哪里、以何种方式接触到呢?正如前言中所提到的,这个创新项目是由一位使用神秘ID“luzifer333”的先驱开发者,在Hacker News这个全球社区舞台上首次亮相的nextjs-hackernews.vercel.app/item/48339824。为了不依附于掌握巨额资本的科技巨头的平台,打造一个独立呼吸的生态系统,该项目坚定地扎根于专属网站“aic-ai-lab.site”这个独立域名上进行运营[VueHN2.0 | ShowHN:AISimulaionenBasedonFEP](https://vue-hackernews-ssr-5cavbdjcta-ew.a.run.app/item/48339824)。 |
| 最令人高兴的消息是,这项似乎只存在于大型IT企业紧闭的实验室或艰涩学术论文中的复杂技术,只要有互联网浏览器,全世界的任何人都可以直接一探究竟。开发者在介绍帖子中表示,为了让充满好奇心的大众和工程师能够直接访问,并自由测试智能体千变万化的行为和进化过程,将全面进行“公测(Open Beta,即在正式发布前向大众公开以收集反馈的体验阶段)”。官方明确公告,这项令人激动的公测服务将于协调世界时(UTC+2)周一20点整正式向公众开放[ShowHN:AISimulaionenBasedonFEP | Hacker News](https://news.ycombinator.com/item?id=48339824)。一个绝佳的机会已经开启,让我们可以在眼前的显示器上,直接观察这些连一行字都不读、却在与陌生世界的物理法则不断碰撞的神奇虚拟生命体的动作。 |
未来展望 (What’s Next)
回想一下当今的景象,像微软、OpenAI、谷歌等庞大的IT巨头企业每天都投入天文数字的资金建设数据中心,只顾着盲目扩大AI的规模(参数)。当所有人都在执着于扁平的文本海洋时,这种完全背道而驰、细致模拟原始激素和生物神经网络的尝试,预示着技术界将迎来一场极其沉重的地震。全球人工智能专家预测,当现有的语言模型因信息不足或谎言(幻觉)问题而遭遇瓶颈时,这种自主探索世界的技术将成为下一代的强大突破口。
| 特别是正如我们深入了解过的这种独创的FEP模型,内部牢固地具备“世界模型(World Model)”,能够在瞬息万变的复杂环境中敏锐地提前规划自己行动的聪明的AI,蕴藏着超乎想象的潜力[自由能投影模拟(FEPS):具有可解释性的主动推断 | PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047)。这不仅仅超越了计算机屏幕上的对话,还将为所有必须在不可预测的物理现实世界中做到分毫不差、安全运行的尖端产业领域(如即将到来的下一代机器人工程、在复杂的市中心行驶的完全无人驾驶汽车等),提供巨大的灵感和切实可行的解决方案。 |
静下心来想一想,聪明的宠物狗能够一眼读懂主人的眼神,并摇着尾巴适应陌生的散步环境,并不是因为它死记硬背了厚厚的百科全书。这是因为它对表扬和零食满怀激动的期待(激素的作用),以及在无数次跌倒中悟出的痛苦的试错(通过互动获得的经验),是通过自己立体地与世界碰撞,用身体学习得来的。像这样,未来将出现在我们面前的人工智能,将远远超越屏幕里那个只能聪明地回答文本问题的百科全书的形态。这些已经准备好向真正意义上的“数字生命体”进化的神秘虚拟智能体,究竟会向我们展现出怎样令人不寒而栗的环境适应能力,正吸引着全世界无数技术爱好者和未来学家的目光。
AI的观点 (AI’s Take)
通过精密计算单词概率来生成流畅句子的方式,仅仅是庞大智能众多面孔中的一面。如果说迄今为止人工智能的发展历史一直都集中在表面复制人类的“语言能力”上,那么此次登场的基于FEP的AI模拟项目,则出色地模拟了人类和动物在这个世界上生存的最深层的根基——“生存本能与经验的内化”,这一点具有非常重大的意义。
人工智能开始模仿生命体特有的化学激素反应甚至脑细胞的长期记忆结构,直接与虚拟环境进行交流,这意味着什么呢?这清楚地证明了我们习以为常的“智能”概念本身,正从扁平的知识灌输,向立体的经验成熟这一全新维度进化。未来的AI将不再是只会死记硬背书本文字的知识机器,而是将给定环境中的痛苦与喜悦转化为数据,成为像真正的生命体一样与人类共存的伙伴。
参考资料
-
[自由能投影模拟(FEPS):具有可解释性的主动推断 PLOS One](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0331047) -
[VueHN2.0 ShowHN:AISimulaionenBasedonFEP](https://vue-hackernews-ssr-5cavbdjcta-ew.a.run.app/item/48339824) - ShowHN- 追踪 Hacker News 上的项目展示
-
[ShowHN:AISimulaionenBasedonFEP Hacker News](https://news.ycombinator.com/item?id=48339824) - nextjs-hackernews.vercel.app/item/48339824
- 连接了超过10万个最新的大语言模型(LLM)。
- 完全没有使用大语言模型(LLM),而是模拟了生物学机制。
- 被设计为仅凭文本数据来感知环境。
- 世界模型 (world model)
- 海量文本词典
- 搜索引擎索引
- 模拟的神经化学作用
- 短期和长期记忆系统
- 基因改造操作功能