谷歌与佐治亚理工学院的研究人员通过训练 40 年的数据,开发出了能够掌握海豚语言结构并生成声音的 AI 模型 'DolphinGemma'。
想象一下。在深邃透明的蔚蓝大海中央,一只海豚悠闲地向你游来。它用特有的清脆鸣叫声亲切地向你打招呼:“你好?今天的水流真舒服!”这听起来像是科幻电影里的场景,但人工智能(AI)技术正将这一梦幻般的想象带到现实的门槛前。
今天我们要聊的故事是关于谷歌(Google)发布的一款非常特别的 AI——“DolphinGemma”。这款 AI 正通过分析充满海洋奥秘的海豚叫声,勾勒出其中隐藏的“语言地图”。DolphinGemma: How Google AI is helping decode dolphin communication
为什么这很重要?
很久以前我们就知道海豚拥有卓越的智力,并且生活在复杂且紧密的社会纽带中。我们一直猜测,它们发出的“咔哒”声或流畅的“哨音”并非单纯的噪音,而是传达给彼此的重要信息。
然而,仅凭人类的感官和大脑,不足以完美分析海面下源源不断产出的海量声音模式。SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …
打个比方,这就像在一家堆满未知古代文明书籍的图书馆里,在没有词典的情况下阅读数万本书,让人感到茫然。DolphinGemma 正是扮演了那位能破解这套巨型密码的“最聪明语言学家”。如果我们能真正理解海豚的交流结构,人类将迈出地球历史上第一次与非人类智慧生物进行真正意义上的沟通的第一步。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language
通俗理解:DolphinGemma 是如何工作的?
| DolphinGemma 是基于谷歌最新开放 AI 模型“Gemma”而诞生的大语言模型(LLM, Large Language Model)。就像普通 LLM 通过阅读大量书籍和互联网句子来学习人类语言一样,这款 AI 专注于学习从海底传来的“海豚之声”。[DolphinGemma: How Google AI is helping decode dolphin communication | Research](https://research.gatech.edu/dolphingemma-how-google-ai-helping-decode-dolphin-communication) |
我们可以通过三个比喻来更轻松地理解这一神奇的过程:
1. 就像智能手机的“自动补全”功能 就像我们在即时通讯软件中输入“我现在…”时,AI 会预先显示“在回家的路上”或“正在吃饭”等后续内容一样,DolphinGemma 也是如此。它观察海豚发出的声音流,并预测下一个声音会是什么。Google Uses DolphinGemma AI to Decode Dolphin Communication 如果 AI 能准确预测海豚的下一个声音,这就成为了 AI 开始理解海豚语言中隐藏的“语法”和“规则”的有力证据。
2. 就像阅读一本写了 40 年的巨型日记 正如学习需要好的教科书,DolphinGemma 学习了“野生海豚项目(WDP)”过去 40 年在海洋现场直接录制的庞大生物声学(Bioacoustic,研究生物体声音的学科)数据。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language 通过分析跨越一代人时间的无数声音数据,它正在掌握海豚在什么情况下、带着什么情绪发出声音的语境。
3. 这是一个逐一拼接声音碎片的工作 海豚组合使用“咔哒声(Clicks)”、“哨音(Whistles)”、“突发脉冲(Burst pulses)”等多种多样的声音。DolphinGemma: How Google AI is helping decode dolphin communication | Research 简单来说,DolphinGemma 在散乱的声音碎片中寻找重复的规则和特定的顺序,并深入分析这是否具有与人类语言相似的逻辑结构。DolphinGemma: How Google AI is helping decode dolphin communication
现状:我们现在进展到哪里了?
目前,谷歌正与佐治亚理工学院及野生海豚项目的研究人员合作,重点研究大西洋斑海豚(Stenella frontalis)的声音。SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …
除了听和分析声音,现在已经迈向了由 AI 直接生成类似海豚声音模式的阶段。DolphinGemma: How AI can decipher dolphin communication 特别是 DolphinGemma 被设计得轻量且高效,以便研究人员在颠簸的船上或海滩等现场也能方便地使用。预计这将极大地提高野外现场的研究速度。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language
更令人振奋的消息是,谷歌宣布计划在 2025 年夏天将这一创新模型作为开源(Open Source,即公开代码供任何人免费使用)项目发布。Google Is Training a New A.I. Model to Decode Dolphin Chatter—and … 这为全世界的研究人员借用这一工具共同揭开更多海洋生物的秘密铺平了道路。
未来会展现出怎样的景象?
当然,从明天起立刻与海豚进行实时聊天还很难实现。因为在准确翻译“它们在说什么”之前,DolphinGemma 目前正处于掌握“它们以什么规则和秩序发出声音”这一基本原理的关键基础建设阶段。Google Launches AI That Talks to Dolphins - Newsweek
但一旦基础建设完成,我们将见证惊人的景象。科学家将通过 DolphinGemma 发现的声音结构,揭示海豚的交流体系与人类语言有多么相似,或者它们是否拥有我们无法想象的独特世界观。DolphinGemma: How Google AI is helping decode dolphin communication
想象一下:在未来的某一天,海豚会预先向我们发出海洋污染风险的警告,或者为了帮助受伤的海豚,我们用它们的语言传递“请放心”的信息。DolphinGemma 不仅仅是为了让智慧生命共存,它将成为开启“跨物种交流”时代、让彼此深度理解和沟通的钥匙。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language
AI 视角:MindTickleBytes AI 记者的一句话
看到 DolphinGemma,我再次思考人工智能的真正价值。AI 不仅仅是减轻人类工作负担的工具,更可以成为开启数千年来一直对其他生命关闭的对话窗口的温暖桥梁。坚守 40 年默默收集声音的研究人员的耐心,与瞬间阅读复杂数据的尖端技术的相遇。我已经在期待这场精彩协作所创造的海底第一声问候了。当我们能真心回应海豚的声音时,地球难道不会变得更温暖一点吗?
参考资料
- DolphinGemma: How Google AI is helping decode dolphin communication
-
[DolphinGemma: How Google AI is helping decode dolphin communication Research](https://research.gatech.edu/dolphingemma-how-google-ai-helping-decode-dolphin-communication) -
[DolphinGemma: How Google AI is helping decode dolphin communication Hacker News](https://news.ycombinator.com/item?id=43680899) - Google Launches AI That Talks to Dolphins - Newsweek
-
[Google Unveils DolphinGemma AI to Decode Dolphin Communication by ODSC - Open Data Science Medium](https://odsc.medium.com/google-unveils-dolphingemma-ai-to-decode-dolphin-communication-39ddc8f29713) - Google Uses DolphinGemma AI to Decode Dolphin Communication
- DolphinGemma: How AI can decipher dolphin communication
- Google Is Training a New A.I. Model to Decode Dolphin Chatter—and …
- Google Launches DolphinGemma AI to Decode and Generate Dolphin Language
- SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …
- Google’s newest AI model is designed to help study dolphin ‘speech …
- 最近 1 年的海豚观察视频
- 过去 40 年收集的生物声学(Bioacoustic)数据
- 水族馆海豚的喂食记录
- 提高照片画质
- 像自动补全功能一样预测下一个声音
- 将语音转录为文本
- 印太瓶鼻海豚
- 大西洋斑海豚
- 虎鲸