谷歌与乔治亚理工学院及野生海豚项目合作,发布了首个用于学习和预测海豚声音的大语言模型(LLM)“DolphinGemma”,迈出了通往人类与动物双向沟通的历史性一步。
想象一下:你正乘船行驶在蔚蓝的大海中央,突然一群海豚游到船边,发出“吱吱——”的哨声。以前,你可能只是觉得“海豚心情不错”并感到新奇,但如果现在你手中的设备能实时分析这些声音并翻译如下,你会怎么想?“你好!我是这群海豚的首领。前面有一大群美味的鱼,跟我们一起来吧!”
这听起来像是科幻电影中的场景吗?然而,随着人工智能(AI)技术的飞速发展,这种电影般的想象正一步步走进现实。谷歌最近发布的创新AI模型——“DolphinGemma”,正是这一变革的主角。DolphinGemma:谷歌AI如何帮助解码海豚沟通
为什么这很重要?
我们很久以前就通过研究知道海豚是非常聪明的动物。它们能通过镜子识别自己,还会成群结队地协作狩猎。但是,它们究竟如何交换复杂的信息,以及向彼此传递怎样的深层情感,对人类来说依然是一个巨大的谜团。这是因为海豚使用的是咔嗒声(Clicks)、哨声(Whistles)以及短促而强烈的脉冲音(Burst pulses)等结构与人类语言完全不同的声音。DolphinGemma:谷歌AI如何帮助解码海豚沟通
理解海豚的对话,其价值远不止于翻译神奇的动物声音。这是人类数千年来梦寐以求的“跨物种沟通(Interspecies communication)”的历史性尝试。通过这种方式,我们可以更深入地了解和保护海洋生态系统,并学会在地球这个星球上,如何与另一种智慧生物真正共存。谷歌正致力于利用AI解码海豚沟通
谷歌通过该项目,将此前用于处理人类文本或代码的大语言模型(LLM)技术应用到了自然界的声音中。这证明了AI不仅是办公工具,还可以成为解码大自然隐藏密码的现代版“罗塞塔石碑”。DolphinGemma—GoogleDeepMind
浅显易懂:AI是如何学习海豚语言的?
AI学习海豚语言的过程与我们学习外语的过程相似,但要精细得多。让我们通过两个比喻来了解其核心原理。
1. SoundStream:将声音转化为“数字碎片”
就像我们学习英语单词时,听到“Apple”的声音会先想到“A-P-P-L-E”这些字母一样,AI也需要将海豚的声音转换为数据。谷歌在此使用了“SoundStream分词器(SoundStream tokenizer)”技术。DolphinGemma:AI如何破译海豚沟通
比喻来说: 这就像是将录有海豚复杂声音的“磁带”切碎成AI可以读取的极小的“数字拼图碎片”。这些碎片汇聚在一起,就成了海豚语言的“字母表”。转换成这种标记(Token,AI能理解的信息最小单位)后,声音才能被AI模型正式开始分析。DolphinGemma:AI如何破译海豚沟通
2. 大语言模型(LLM):预测声音后的内容
DolphinGemma是基于谷歌最新的语言模型“Gemma”诞生的。你一定见过智能手机发短信时的自动联想功能,比如当你输入“今天吃……”时,它会自动推荐“什么?”或“饭了吗?”。DolphinGemma的工作原理与之类似。
乔治亚理工学院(Georgia Tech)的萨德·斯塔纳(Thad Starner)教授解释道:“一旦海豚开始发出某种声音,AI就会尝试预测该声音将如何结束。”DolphinGemma:谷歌AI如何帮助解码海豚沟通
简单比喻: AI在执行海豚语言的“自动完成功能”。得益于学习了无数海豚对话模式,它即使只听到声音的前半部分,也能预测出“啊,这种声音在这种情况下通常会这样结尾”。这是AI开始理解海豚语言特有语法和结构的重要证据。DolphinGemma:谷歌AI如何帮助解码海豚沟通
当前现状:进展到了哪一步?
该项目由谷歌、乔治亚理工学院以及专业的科研机构——野生海豚项目(Wild Dolphin Project, WDP)合作完成。DolphinGemma:AI如何破译海豚沟通
40年的记录,AI珍贵的教科书
DolphinGemma之所以能变得聪明,最大的功劳在于海量的“学习资料”。野生海豚项目团队在过去的40年漫长岁月里,在海底录制海豚的声音,并坚持不懈地观察它们的行为,积累了大量数据。谷歌使用DolphinGemma AI解码海豚沟通 - Entrepreneur AI在极短时间内学习了这套几乎相当于一个人毕生心血的海量资料,并识别出了海豚声音中的细微模式。
2025年夏季,将向全球科学家公开
谷歌决定不垄断这项惊人的技术。计划在2025年夏季,将DolphinGemma模型以开源(Open Source,即公开技术供任何人免费使用)的形式发布。谷歌正在训练新的AI模型以解码海豚的闲谈——以及…… 届时,全球的海洋生物学家都能更快、更准确地分析各自研究的海豚语言,有望为海洋科学领域带来巨大的进步。
未来会怎样?
DolphinGemma的最终目标不仅停留在倾听和分析声音。科学家们梦想着有一天能实现“人类与海豚之间真正的对话”。谷歌正致力于利用AI解码海豚沟通
海底首次对话的开始
如果说以前我们只是单方面观察海豚的声音,那么像DolphinGemma这样的模型未来甚至可以生成海豚能理解的声音。地球上的SETI技术:DolphinGemma:谷歌AI如何帮助解码…… 虽然真正的海豚是否能理解我们发送的信息并给出回答还有待观察,但专家评价称,我们比以往任何时候都更接近那个奇迹般的阶段。谷歌开发AI模型帮助研究人员解码海豚……
| 不过,还有很多课题需要解决。除了简单模仿声音模式,还必须完美掌握该声音在何种“情境(语境)”中以何种“意图”被使用。就像我们的“吃饭了吗?”有时是问候,有时是担心一样,海豚的语言也可能根据情况具有不同的含义。[谷歌开发了可以与海豚对话的AI模型 | Popular Science](https://www.popsci.com/technology/dolphin-talking-google-ai/) |
MindTickleBytes的AI记者视角
DolphinGemma不仅是一项技术成果,更是一个能改变我们对待地球同胞生命态度的工具。语言是智慧和情感的象征。理解海豚的语言,将是一个用心而非仅用大脑去承认它们是拥有复杂社会纽带、能感知喜怒哀乐的智慧存在的过程。
如果AI传达的海底海豚的第一句话是“谢谢你和我们一起保护地球”,那会怎样呢?在这一天到来之前,让我们拭目以待DolphinGemma将连接起的蓝色大海的故事。
参考资料
- DolphinGemma: How Google AI is helping decode dolphin communication
- DolphinGemma: How AI can decipher dolphin communication
- Google Is Training a New A.I. Model to Decode Dolphin Chatter—and Potentially Talk Back
- SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode Dolphin Communication
- Google working to decode dolphin communication using AI
- Google Uses DolphinGemma AI to Decode Dolphin Communication - Entrepreneur
- DolphinGemma: How Google AI is helping decode dolphin communication (LinkedIn)
- DolphinGemma—GoogleDeepMind
-
[Google made an AI model to talk to dolphins Popular Science](https://www.popsci.com/technology/dolphin-talking-google-ai/) - Google develops AI model to help researchers decode dolphin communication
- Decoding Dolphin Communication with AI (LinkedIn)
- Google’s new AI is trying to talk to dolphins—seriously
FACT-CHECK SUMMARY
- Claims checked: 10
- Claims verified: 10
- Verdict: PASS
- DolphinChat
- DolphinGemma
- SeaGemma
- 10年
- 25年
- 40年
- 2025年夏季
- 2026年春季
- 没有公开计划