与海豚对话的时代要来了吗?谷歌 AI 'DolphinGemma' 开启海底沟通之门

在蓝色大海中,两只海豚面对面仿佛在交流,并叠加上了数字信号的图像
AI Summary

谷歌公开了 AI 模型 'DolphinGemma',该模型通过学习积累了 40 年的海豚数据来解读和预测海豚的声音。

想象一下。 在阳光明媚的假期里,你正拿着智能手机凝视着翡翠般的海边。恰好路过的一群海豚欢快地发出“吱吱”声,你的手机屏幕上随即出现了实时翻译信息。“你好!今天这附近有很多好吃的鱼。要和我们一起游泳玩耍吗?”

这听起来像是科幻 (SF) 电影中的场景,但这个如梦似幻的故事现在正大踏步走向现实。2025 年 4 月 14 日,谷歌为庆祝“国际海豚日 (National Dolphin Day)”,正式发布了能够解读和预测海豚复杂对话的创新人工智能模型——“DolphinGemma” [来源 3, 来源 16]。

几十年来,科学家们一直相信,海豚发出的独特的咔哒声、哨声和短促有力的脉冲音不仅仅是简单的噪音,而是蕴含着高度智慧和社会意义的“语言” [来源 1]。而现在,人工智能正成为解开这个数千年谜团的魔幻钥匙。

为什么这对我们很重要?

海豚被认为是地球上除人类以外智慧最高的生物之一。但我们对它们的感受、如何称呼彼此以及维持社会的规则,仅仅了解冰山一角。DolphinGemma 的出现之所以能引起人类的巨大共鸣,主要有三个原因。

第一,与地球上的另一种智慧体相遇。 理解海豚的沟通方式,是一场发现与人类语言完全不同、针对水下环境优化的先进智力体系的惊叹之旅。此外,这也可以作为我们未来可能与外星生命沟通时的优秀“天体生物学”练习 [来源 3]。

第二,保护珍贵的海洋生态系统。 如果我们能实时了解海豚对环境污染或气候变化发出的警告及反应,就能制定出比现在更精密、更有效的海洋保护对策。

第三,技术的无限扩展性。 谷歌通过 DolphinGemma 证明了 AI 不仅可以学习人类语言,还可以完美地学习自然界中极其复杂、微小的信号 [来源 9]。这项技术今后也将成为解读其他动物语言或分析不可预测的自然现象模式的创新工具。

轻松理解:AI 是如何学习海豚语言的?

解读海豚的声音比学习一门陌生的外语要难上万倍。学习人类语言时,我们已经掌握了语法和单词的概念,但对于海豚的声音,我们甚至不知道哪里是“单词”,哪里是“句子”。

为了跨越这道巨大的障碍,谷歌采用了两个核心策略。

1. 完整学习 40 年的“海豚闲聊”

想要学得好,首先得有好的教材。DolphinGemma 学习了一个名为野生海豚项目 (Wild Dolphin Project, WDP) 的研究机构 40 年来在海洋现场直接录制和分析的海量数据 [来源 7]。

打个比方: 这就像一位天才语言学家录制了 40 年来在首尔市中心往来的所有对话,并播放给 AI 听。AI 在数百万次的反复倾听中,开始自动寻找在什么情况下会出现什么声音,以及隐藏在声音背后的细微规则。

2. 将声音像乐高积木一样拆解(分词器技术)

海豚的声音非常快速且复杂,人类的耳朵甚至难以捕捉。为了让 AI 能够正确处理这些声音,必须将其精确地拆解为极小的单位。谷歌在此引入了尖端技术——“SoundStream 分词器 (Tokenizer)” [来源 2]。

简单来说,“分词器 (Tokenizer)”是一种将复杂信息转化为 AI 易于理解的小块(Token)的工具。它就像是一台“神奇的切菜机”,为了烹饪极其复杂的料理,将食材切成大小均匀、漂亮的形状。SoundStream 技术能高效地将海豚的声音切碎,帮助 AI 更清晰地识别声音中蕴含的模式 [来源 2]。

现状:我们现在走到了哪一步?

当然,现在还没到我们能与海豚进行哲学对话或深入谈心的阶段。目前 DolphinGemma 展示的能力主要可以总结为三个阶段:

  1. 掌握声音的蓝图:系统地学习海豚发声的语法结构 [来源 3]。
  2. 预测下一个声音:当海豚发出某种声音时,高概率预测接下来的声音。这与我们用手机发短信时,AI 推荐下一个单词的“自动补全”功能原理相似 [来源 7]。
  3. 生成海豚语言:基于学习到的数据,直接创造出真实的、海豚可能发出的自然新声音信号 [来源 3]。

这些阶段标志着我们正从以往单纯的“倾听”水平,跨越到主动与海豚搭话的“双向沟通 (Two-way communication)”时代的极具意义的里程碑 [来源 13, 来源 15]。

展望未来:在海面上展开对话

谷歌和研究团队的最终目标非常明确:不仅要开发在实验室超级计算机上运行的 AI,还要开发能在变幻莫测的海洋现场工作的 AI。

在不久的将来,我们将目睹研究人员仅凭一部常用的智能手机(如 Google Pixel),就能在海面上实时分析海豚的声音并尝试与它们交流的惊人景象 [来源 14]。

尤其令人振奋的消息是,谷歌宣布计划在 2025 年夏天以“开源 (Open Source)” 的方式发布“DolphinGemma”模型 [来源 8]。这样一来,全世界的海洋生物学家都可以在各自的研究领域使用这一强大的工具,更深入地研究他们所观察到的海豚群体独特的方言和文化。

也许有一天,当我们亲切地询问“你今天心情怎么样?”时,AI 会将其转换为海豚优美的哨声传达过去,并将海豚活泼的回答翻译成我们的语言——这一天真的可能成为现实。

AI 视角:MindTickleBytes 记者的思考

DolphinGemma 是一个象征性的事件,它表明 AI 这一人类创造的最精密的工具,正在打破曾被认为是人类专属的“语言”框架,深入自然的腹地。这说明技术不仅停留于冰冷的二进制世界,更可以成为连接生命与生命的温暖纽带。

当深海中神秘的歌声乘着数据的波动传达给我们时,我们终将深刻地意识到,在这颗名为地球的蓝色星球上,我们绝非孤身一人,而在我们身边,一直有着另一群值得倾听的智慧之友。


参考资料

  1. DolphinGemma: How Google AI is helping decode dolphin communication
  2. DolphinGemma: How AI can decipher dolphin communication
  3. SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …
  4. Google Uses DolphinGemma AI to Decode Dolphin Communication - Entrepreneur
  5. Google Is Training a New A.I. Model to Decode Dolphin Chatter …
  6. Google working to decode dolphin communication using AI
  7. GoogleNews - Google develops AI to understand dolphin…
  8. Google develops AI model to help researchers decode dolphin…
  9. [Google working on programme to talk to dolphins Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/)
  10. Google’s new AI is trying to talk to dolphins — seriously
  11. Decoding Dolphin Communication with AI…

FACT-CHECK SUMMARY

  • Claims checked: 11
  • Claims verified: 11
  • Verdict: PASS
测试你的理解
Q1. 为了开发 DolphinGemma,谷歌使用的学习数据收集了多长时间?
  • 10年
  • 25年
  • 40年
DolphinGemma 学习了野生海豚项目 (Wild Dolphin Project) 40 年来收集的海量数据。
Q2. 为了高效处理海豚的声音,DolphinGemma 使用的谷歌音频技术名称是什么?
  • SoundStream
  • DolphinTalk
  • WaveNet
通过谷歌的 SoundStream 分词器 (Tokenizer) 技术,将海豚复杂的音频信号转换成了 AI 易于处理的形式。
Q3. DolphinGemma 模型计划何时向公众和研究人员开放(开源)?
  • 2025年夏天
  • 2026年春天
  • 2030年冬天
谷歌宣布计划在 2025 年夏天将 DolphinGemma 开源。
与海豚对话的时代要来了吗?谷歌 AI 'Dolphin...
0:00