与海豚对话的时代即将到来?谷歌全新 AI 'DolphinGemma' 的故事

形象化展示研究人员在海底尝试与海豚沟通的图像
AI Summary

谷歌公开了能够分析并生成海豚声音的 AI 模型 'DolphinGemma',开启了人类与海豚双向沟通的可能性。

想象一下,你正漂浮在清澈蔚蓝的大海中央。水下传来“咔哒(click)”声和类似口哨的信号音。到目前为止,对我们来说,这些声音只是神秘而不可知的自然背景音乐。但是,如果你口袋里的智能手机听到这些声音后,亲切地提醒你“这只海豚正在寻找朋友”,会怎样呢?或者如果你发出的信号得到了海豚的热情回应,又会怎样呢?

这不再是科幻电影中的情节。谷歌最近发布的全新人工智能模型 DolphinGemma 正致力于将这一愿景变为不远将来的现实。

为什么这一消息值得关注?

海豚被认为是地球上最聪明的动物之一。它们维持着复杂的社会结构,并通过精细的声音信号共享情感和信息。然而,几千年来人类与海豚之间一直存在着一道巨大的“语言障碍”。几十年来,科学家们一直在记录和分析它们的声音,但仅凭人类智慧去完美理解那些复杂的模式几乎是一项不可能完成的挑战 DolphinGemma:谷歌 AI 如何帮助解码海豚交流

DolphinGemma 的出现对我们来说具有特殊意义,主要体现在以下三个方面:

  1. 跨物种沟通的第一步:为与人类以外的其他智慧生命进行对话奠定了实际的技术基础 谷歌推出 DolphinGemma AI 以解码并生成海豚语言
  2. 40 年数据的结晶:人工智能学习了长达 40 多年积累的海量数据,发现了人类肉眼和耳朵绝无法察觉的细微模式 谷歌推出 DolphinGemma AI 以解码并生成海豚语言
  3. 口袋里的实验室:这款 AI 并不是只能在巨型超级计算机上运行的沉重程序。它被设计得轻巧紧凑,以便研究人员在海洋现场通过智能手机 (Pixel) 等设备即时使用 [谷歌正致力于开发与海豚对话的程序 Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/)。

轻松理解:专为海豚打造的 ‘ChatGPT’

理解 DolphinGemma 最简单的方法就是把它想象成“学习海豚语言的天才人工智能学生”。就像我们与 ChatGPT 交流时,AI 通过学习人类语言规则来生成句子一样,DolphinGemma 将“海豚的声音”作为数据,学习它们特有的语法 地球上的 SETI 技术:DolphinGemma:谷歌 AI 如何帮助解码…

1. 将声音拆解为“文字” (分词器)

在人类语言中,将句子拆分为单词的过程被称为“分词 (Tokenizing)”。但海豚的声音是连续且复杂的波动。将其拆分为 AI 可以理解的碎片是第一道关卡,为此谷歌采用了名为 SoundStream 的先进技术 DolphinGemma:AI 如何辨识海豚交流

  • 打个比方:这就像看到一座精雕细琢的乐高城堡,将其拆解为数万个微小的积木块,并给每种形状编号。通过这些编号的“声音积木”,AI 终于开始掌握海豚声音的结构。

2. 长达 40 年的“无限循环听力测试”

学习没有捷径,DolphinGemma 日以继夜地学习了野生海豚项目 (WDP) 40 多年来精心收集的生物声学数据 谷歌推出 DolphinGemma AI 以解码并生成海豚语言

  • 想象一下:为了学习一门陌生的外语,你连续 40 年每天不间断地收听该国的广播。起初听起来像是噪音,但随着时间的推移,你会意识到“啊,‘咔哒’声之后总是跟着‘口哨’声”这样的规则。DolphinGemma 就是这样一个能比人类快数万倍找到这些规则的优等生。

3. 咔哒声、口哨声和爆发脉冲

海豚主要发出三种声音:短促的咔哒声 (Clicks)、平滑连续的口哨声 (Whistles) 以及快速且强烈的爆发脉冲 (Burst pulses) DolphinGemma:谷歌 AI 如何帮助解码海豚交流

现状:我们现在走到了哪一步?

2025 年 4 月 14 日,谷歌配合“全美海豚日 (National Dolphin Day)”正式发布了这一惊人的研究成果 地球上的 SETI 技术:DolphinGemma:谷歌 AI 如何帮助解码…。该项目由佐治亚理工学院 (Georgia Tech) 与野生海豚项目密切合作完成。

目前,佐治亚理工学院的 Thad Starner 教授团队正在海洋现场测试能够与海豚实时交流的设备 DolphinGemma:谷歌 AI 如何帮助解码海豚交流。特别是因为它针对 Pixel 手机等移动设备进行了优化,研究人员在小船上也能即时分析海豚的意图 [谷歌正致力于开发与海豚对话的程序 Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/)。

除了简单的声音分类,现在已经达到了通过 AI 生成的声音主动与海豚对话的“双向沟通 (Two-way communication)”门槛,这令全球科学界倍感兴奋 谷歌开发 AI 模型以帮助研究人员解码海豚…

我们可以期待的未来变化

令人高兴的消息是,谷歌计划在 2025 年夏季将这款创新的 DolphinGemma 模型作为开源(任何人都可以使用的公开代码)发布 谷歌正在训练新的 AI 模型来解码海豚的闲谈——并且…。如果全球的海洋学家都能获得这一工具,会发生什么呢?

  1. 理解海豚的内心世界:我们将更深入地了解它们共享什么样的情感,以及它们如何感知世界。
  2. 海洋生态系统的坚定守护者:通过准确掌握海洋噪音或气候变化对海豚沟通的影响,可以制定更有效的保护措施。
  3. 与其他动物的连接:这项技术不仅限于海豚,也将为破解鲸鱼、大象、类人猿等其他聪明动物的语言提供绝佳的蓝图。

我们才刚刚开始敲开水下邻居的大门。虽然现在还不能立刻与海豚讨论人生的意义,但至少,能够打个亲切的招呼“你好”并微笑着理解它们回应的那一天,已经近在咫尺。


AI 视角 (MindTickleBytes AI 记者的视角)

语言是智慧的核心,也是连接彼此心灵最强大的桥梁。谷歌的 DolphinGemma 不仅仅是一个寻找数据模式的工具,它还承载着人类跳出人类中心主义思维,尝试与地球上其他智慧生命真正共存的意志。当海底的回声被翻译成我们的语言时,我们或许会对“人类”这一存在获得比以往更深邃、更广阔的洞察。


参考资料

  1. DolphinGemma:谷歌 AI 如何帮助解码海豚交流
  2. DolphinGemma:AI 如何辨识海豚交流
  3. 地球上的 SETI 技术:DolphinGemma:谷歌 AI 如何帮助解码…
  4. 谷歌正在训练新的 AI 模型来解码海豚的闲谈——并且…
  5. 谷歌正致力于使用 AI 解码海豚交流
  6. 谷歌推出 DolphinGemma AI 以解码并生成海豚语言
  7. 谷歌新闻 - 谷歌开发 AI 以理解海豚…
  8. 谷歌开发 AI 模型以帮助研究人员解码海豚…
  9. [谷歌正致力于开发与海豚对话的程序 Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/)
  10. 使用 AI 解码海豚交流…
  11. 谷歌的新 AI 正在尝试与海豚对话——说真的

FACT-CHECK SUMMARY

  • Claims checked: 13
  • Claims verified: 13
  • Verdict: PASS
测试你的理解
Q1. DolphinGemma 是为了什么而开发的 AI?
  • 为了预测海豚的移动路径
  • 为了分析并生成海豚的交流信息
  • 为了寻找海底垃圾
DolphinGemma 是一款大型语言模型 (LLM),旨在学习海豚的声音结构并生成新的海豚风格声音。
Q2. DolphinGemma 在学习过程中使用了大约多少年的生物声学数据?
  • 10年
  • 25年
  • 40年
该模型基于野生海豚项目 (WDP) 40 多年来收集并标注的海量数据进行了训练。
Q3. 谷歌使用了哪种技术将海豚的声音高效地转换为数字信息?
  • SoundStream 分词器
  • WaveNet
  • BERT
谷歌的 SoundStream 分词器技术能将海豚复杂的声学信号转换为 AI 易于处理的高效形式。