巴西里约热内卢市政府雄心勃勃公开的大型人工智能模型被曝并非自主研发,而是现有模型的拼凑之作。这一事件让开发真正“本地AI(Local AI)”所面临的现实困境浮出水面。
引言:华丽首秀背后隐藏的真相
想象一下,一位世界著名的魔术师经过数年刻苦训练,宣布发明了世界上独一无二的悬浮魔术。在华丽的灯光下,无数观众起立鼓掌欢呼。然而,一个偶然瞥见舞台后方的小男孩却大喊:“咦?那不过是把两根绳子巧妙地绑在一起,然后吊在天花板上而已嘛!”
这个有趣的故事最近在全球顶尖技术的角斗场——人工智能(AI)领域真实上演了。巴西的标志性城市里约热内卢市政府曾自豪地宣布,他们从头到尾完全自主研发了一个大型人工智能模型。然而事实证明,这其实是巧妙混合了他人技术的“拼凑”产物。
如今,为了不依附于外国科技巨头,许多国家和城市都在为拥有自己的AI而努力奋斗。那么,里约热内卢到底发生了什么?为什么人们确信这项技术是假的?这件事又给我们的未来传达了什么信息?我们将像一位聪明的朋友喝着热咖啡给你讲故事一样,用轻松有趣的方式为您揭开这起事件的始末。
为什么重要:“国产AI”的梦想与3970亿颗星
我们每天使用的智能手机语音助手或ChatGPT等服务,都是基于庞大的“大型语言模型(LLM,一种通过学习海量文本来理解人类语言并生成句子的AI系统)”运行的。最近,世界各国为了保护本国的数据主权和独特的文化特性,纷纷投入大量资源开发被称为“本地AI(Local AI)”或“主权AI(Sovereign AI)”的自主人工智能。
上周,里约热内卢的IT专门机构“IplanRIO”宣布了一项历史性的壮举。他们在全球AI开发者共享代码的“图书馆”级平台Hugging Face上,理直气壮地公开了一个名为“Rio-3.5-Open-397B”的大型模型 来源:里约热内卢的“自主研发”AI是换了名字的他人模型…。
我们必须注意名字后面的“397B”这个数字。这意味着该人工智能拥有3970亿个参数(Parameter)。简单来说,参数就像照片应用中微调色彩或亮度的“刻度盘”。在人工智能模型内部,这些刻度盘为了记忆海量知识和做出判断而一刻不停地运转。3970亿这个数字,不仅超越了晴朗夜空中的繁星,甚至能与我们整个银河系中的恒星数量相媲美,规模极其惊人。这种体量意味着它可以与谷歌、微软等全球顶尖科技巨头斥资天文数字打造的最尖端模型并驾齐驱 来源:里约热内卢的“自主研发”AI是换了名字的他人模型…。
如果一个城市的政府机构能够完全“自主研发”出如此庞大的人工智能,那将是人类技术史上的一项伟大成就。然而,这场伟大的狂欢很快就陷入了致命的质疑之中。
通俗解析:“自主研发”与“模型合并”的决定性差异
要切中这一事件的要害,我们必须理解“独立训练(Train)”人工智能与单纯“合并(Merge)”它的本质区别。
打个比方,想象一下您要向世人推出一种世界上前所未见的全新口味特制咖喱。 “自主研发(自我训练)”是一段艰难的旅程:你需要亲自在田里种植土豆和洋葱,从印度的贫瘠土地上进口香料,测试数千次配比,最终调配出只属于你自己的完美咖喱粉。这需要耗费大量的时间、巨额的金钱以及无数专家的汗水。在AI领域,这就相当于让数千台极其昂贵的计算机(GPU)夜以继日地连续运转数月,从零开始一点一点地“喂食”并教授海量数据,这是一个孤独而残酷的过程。
相比之下,“模型合并(Model Merge)”则是完全不同的概念。这就像是你去小区的大型超市,买来已经在热销的“A品牌块状咖喱”和“B品牌辣味咖喱”,然后放进一个大锅里一起煮。两种咖喱混合后,可能会产生相当不错且美味的结果。但如果你把这道混合菜品端到大众面前,并宣传说:“这是我们市政府经过多年研究,从零开始自主研发的创新型新产品咖喱!”那会怎样?这显然是一种欺骗行为。
令人遗憾的是,里约热内卢宣布的“自主研发”AI模型,并非基于全新基础独立训练的系统 来源:里约热内卢的“自主研发”LLM似乎是一个现有模型的合并产物… (Deep Intellica)。
现状:GitHub名侦探的活跃与牵强的解释
令人惊讶的是,最先揭穿这场巨大技术骗局的,既不是大型媒体,也不是政府审计机构,而是活跃在全球千万程序员聚集的软件开发平台GitHub上的普通开发者们。有人在GitHub的错误报告空间“Issue”论坛上提出了尖锐的问题,真相的潘多拉魔盒由此被打开 来源:Cosmic简报:十亿美元的论文、里约的LLM闹剧、上下文窗口限制。
根据社区的分析结果,这个所谓的“自主研发模型”实际上是被精心混合(Merge)而成的,其原料是互联网上已经免费公开、任何人都可以下载的“Nex-AGI”模型和“Qwen3”模型,这一事实被毫无保留地曝光出来 来源:里约LLM曝光:大型模型合并,而非原创AI, 来源:里约热内卢的“自主研发”LLM似乎是一个现有模型的合并产物… (Deep Intellica)。
剖析由计算机代码和数学数值组成的AI模型内部“大脑”结构后,没有发现任何从头开始重新学习的证据。涌现出的全是物理混合他人模型的明确物证 来源:里约LLM曝光:大型模型合并,而非原创AI。开发者的游乐场GitHub,仿佛变成了一个揭露腐败的鸣冤鼓或犀利的调查报道博客 来源:Hacker News 20 在 X 平台:“里约热内卢的‘自主研发’LLM似乎是一个现有模型的合并产物 https://t.co/G1dBFWiQcO (https://t.co/Uht1ZUEPrL)” / X, 来源:里约热内卢的“自主研发”LLM似乎是一个现有模型的合并产物… (Deep Intellica)。
随着批评声如野火般蔓延,主导开发的IplanRIO方面急忙发表了解释声明。他们道歉称:“我们在上传旧版本的过程中犯了一个错误,传错了文件。我们本来应该上传最终完成的‘蒸馏模型(Distilled model)’,却不小心错传了处于工作中间阶段的‘基础合并版本(Base merged version)’” 来源:里约热内卢的“自主研发”LLM似乎是一个现有模型的合并产物… (Hacker News 讨论)。
这里提到的“蒸馏(Distillation)”又是什么呢?想象一下,大型咖啡机通过高压对大量咖啡豆进行萃取,压榨出一杯极其浓郁香醇的浓缩咖啡原液。在AI领域,蒸馏技术是指从体积庞大难以驾驭的天才AI(教师模型)中提取出核心知识,将其压缩成在智能手机等小型设备上也能快速运行的轻量级AI(学生模型)的高级技术。
也就是说,市政府的辩解意味着:“我们确实是将其他模型放进锅里一起煮了(Merge),但我们原本打算向大众公开的是将其精美压缩后的最终版浓缩咖啡(蒸馏模型)。”然而,即使我们退一万步,承认这只是一个单纯的上传失误,投入了市民税金的公共人工智能的骨架终究是“混合他人模型而成”的,这一本质并没有丝毫改变。
未来展望:重新包装的时代,如何辨别真正的创新
这次“里约热内卢丑闻”让全球众多试图构建自身独立AI生态系统的地方政府和企业,意识到了一道沉重的现实之墙。
活跃在社交媒体X(前Twitter)上的一位著名技术专家在目睹这场闹剧后,尖锐地评论道:“里约热内卢所谓的自主研发模型?结果被证实只是现有模型的拼凑而已。围绕‘本地AI’的狂热期待(Hype)总是会撞上同一堵巨大的高墙:真正创造出一种世所罕见的全新事物极其残酷和困难,而将现成的东西像模像样地重新包装(Repackaging)则要容易得多。” 来源:Anto Patrex 在 X 平台:“里约热内卢所谓的自主研发LLM?结果证明是现有模型的合并。围绕‘本地AI’的炒作总是撞上同一堵墙:真正从零构建新事物很难。而重新包装要容易得多。” / X
随着未来人工智能技术深度融入我们的生活,将会有无数机构争先恐后地吹响华丽的号角:“我们终于完成了独家的人工智能!”然而,从今以后,我们必须用非常谨慎和批判的眼光去审视那层华丽的包装纸内部。因为即使表面上看起来像是一个拥有数千亿参数的伟大发明,它的内核可能仅仅是别人流血流汗做出来的免费开源模型的随手缝合而已。
AI视角:透明度即是最强的技术实力
人工智能模型的庞大体量或天文数字般的参数已经成为代表城市或国家技术自尊的时代标志。我们不能无条件地指责里约热内卢试图获取自身技术实力的这种渴望本身。为了克服庞大资本实力的限制,聪明地结合和利用现有的开源技术,也是现代软件开发自然而高效的趋势。
但是,我们绝不能忘记,在全球众多天才开发者密切关注的透明开源生态面前,拙劣的重新包装和虚假宣传反而会严重削弱信任。真正的技术独立和获取主权,并不来自于按照互联网上流传的食谱混合调料并贴上一个浮夸的名字。只有在贫瘠的环境中也诚实地收集高质量本地数据,透明地分享自身的局限性,并耐心地一步一个脚印向前迈进,才能绽放出真正的创新之花。里约热内卢那短暂而虚妄的“黄粱一梦”,为生活在AI时代的我们所有人留下了最惨痛却也最宝贵的教训。
参考资料
- 里约热内卢的“自主研发”AI是换了名字的他人模型…
- 里约热内卢的“自主研发”LLM似乎是一个现有模型的合并产物… (Deep Intellica)
- 里约LLM曝光:大型模型合并,而非原创AI
- Cosmic简报:十亿美元的论文、里约的LLM闹剧、上下文窗口限制
- Hacker News 20 在 X 平台:“里约热内卢的‘自主研发’LLM似乎是一个现有模型的合并产物 https://t.co/G1dBFWiQcO (https://t.co/Uht1ZUEPrL)” / X
- 里约热内卢的“自主研发”LLM似乎是一个现有模型的合并产物… (Hacker News 讨论)
- Anto Patrex 在 X 平台:“里约热内卢所谓的自主研发LLM?结果证明是现有模型的合并。围绕‘本地AI’的炒作总是撞上同一堵墙:真正从零构建新事物很难。而重新包装要容易得多。” / X
- 被证实是全球首个完美理解人类情感的模型。
- 只是将已公开的其他人工智能模型进行简单混合的拼凑模型。
- 因透明公开所有开发过程而受到赞誉。
- 遭到黑客攻击,原始文件被篡改。
- 因数据不足而做出的无奈之举。
- 失误上传了中间阶段的合并版本,而非最终版本(蒸馏模型)。
- 从零开始创造出一个世所罕见的全新人工智能实在是太困难了。
- 缺乏AI开发所需的电力。
- 相关的法律监管过于严格。