Google 公開了能分析並生成海豚聲音的 AI 模型 'DolphinGemma',開啟了人類與海豚雙向溝通的可能性。
想像一下。您現在正漂浮在清澈湛藍的大海中央。從水中傳來陣陣「喀噠 (click)」聲和類似哨聲的信號音。直到現在,這些聲音對我們來說,不過是神祕卻無法理解的大自然背景音樂。但如果,您口袋裡的智慧型手機聽到了這些聲音,並親切地告訴您:「這隻海豚正在找朋友」,那會是怎樣的感覺?或者,如果您發出的信號得到了海豚熱情的回應呢?
這不再只是科幻電影裡的故事。Google 最近發佈的全新人工智慧模型 DolphinGemma,正試圖將這個不久後的未來變為現實。
為什麼這則消息值得關注?
海豚被認為是地球上智慧最高的動物之一。牠們維持著複雜的社會結構,並透過精密的聲音信號分享彼此的情感和資訊。然而,在人類與海豚之間,存在著數千年來無法逾越的巨大「語言障礙」。雖然科學家們幾十年來一直在記錄和分析牠們的聲音,但僅憑人類的智慧要完美理解那些複雜的模式,幾乎是一項不可能的挑戰 DolphinGemma: Google AI 如何協助解碼海豚通訊。
DolphinGemma 的出現對我們而言具有特殊意義,主要在於以下三個方面:
- 跨物種溝通的第一步:為人類與非人類智慧體進行對話奠定了實質的技術基礎 Google 推出 DolphinGemma AI 以解碼並生成海豚語言。
- 40 年數據的結晶:AI 學習了累積超過 40 年的龐大數據,發現了人類肉眼和耳朵絕對無法察覺的細微模式 Google 推出 DolphinGemma AI 以解碼並生成海豚語言。
-
手掌中的實驗室:這款 AI 並非只能在大型超級電腦上運行的沉重程式。它被設計得小巧輕便,研究人員可以在海上現場透過智慧型手機 (Pixel) 等設備立即使用 [Google 研發與海豚交談的程式 Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/)。
輕鬆理解:專為海豚打造的「ChatGPT」
理解 DolphinGemma 最簡單的方法,就是將它視為「學習海豚語的天才 AI 學生」。正如我們與 ChatGPT 對話時,AI 學習人類語言規則來組成句子一樣,DolphinGemma 將「海豚的聲音」作為數據,學習牠們獨有的語法 SETI 地球技術:DolphinGemma:Google AI 如何協助解碼…。
1. 將聲音拆解成「文字」(分詞器 Tokenizer)
在人類語言中,將句子拆解成單位的過程在專業術語中稱為「分詞 (Tokenizing)」。但海豚的聲音是連續不斷的複雜波動。將其分割成 AI 能夠理解的碎片是第一道難關,為此 Google 使用了名為 SoundStream 的高度技術 DolphinGemma:AI 如何辨識海豚通訊。
- 比喻來說:就像是看到一座構造精巧的樂高城堡,將其拆解成數萬個組成它的小積木,並為每個形狀編號。透過這些編號的「聲音積木」,AI 終於開始掌握海豚聲音的結構。
2. 40 年份的「無限重複聽力測驗」
學習沒有捷徑,DolphinGemma 日以繼夜地學習了野生海豚計畫 (WDP) 40 多年來精心收集的生物聲學數據 Google 推出 DolphinGemma AI 以解碼並生成海豚語言。
- 想像一下:為了學習某種陌生的外語,您每天不間斷地聽那個國家的廣播電台聽了 40 年。起初聽起來像是噪音,但隨著時間流逝,您會意識到「啊,在『喀噠』聲之後總是會出現『哨聲』」這樣的規則。DolphinGemma 就是那個能比人類快上數萬倍找到這些規則的優等生。
3. 喀噠聲、哨聲以及脈衝群
海豚主要發出三種聲音:短促的 喀噠聲 (Clicks)、平滑銜接的 哨聲 (Whistles),以及非常快速且強烈的 脈衝群 (Burst pulses) DolphinGemma: Google AI 如何協助解碼海豚通訊。
- 簡單來說:如果喀噠聲和哨聲是海豚語言中像「ㄅ、ㄆ」或「ㄚ、ㄛ」一樣的子音和母音,那麼 DolphinGemma 已經掌握了將它們組合成海豚能聽懂的「單字和句子」的方法。事實上,DolphinGemma 甚至可以親自創造出與海豚非常相似的新聲音 SETI 地球技術:DolphinGemma:Google AI 如何協助解碼…。
目前現狀:我們現在進展到哪裡了?
Google 於 2025 年 4 月 14 日,配合「國家海豚日 (National Dolphin Day)」正式發佈了這項驚人的研究成果 SETI 地球技術:DolphinGemma:Google AI 如何協助解碼…。該項目是透過佐治亞理工學院 (Georgia Tech) 與野生海豚計畫的緊密合作完成的。
| 目前,佐治亞理工學院的 Thad Starner 教授團隊正在測試一種能在海上現場與海豚進行實時溝通的裝置 DolphinGemma: Google AI 如何協助解碼海豚通訊。特別是它已針對 Pixel 手機等行動裝置進行了優化,讓研究人員即使在小船上也能立即分析海豚的意圖 [Google 研發與海豚交談的程式 | Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/)。 |
超越了單純的聲音分類階段,現在已經到達了可以用 AI 製作的聲音主動向海豚搭話的「雙向溝通 (Two-way communication)」門檻,這點令全世界科學界感到興奮 Google 開發 AI 模型協助研究人員解碼海豚…。
我們可以期待的未來變化
令人欣喜的消息是,Google 計劃在 2025 年夏天將這款創新的 DolphinGemma 模型以開源 (任何人都可以使用的公開代碼) 形式發佈 Google 正在訓練全新的 A.I. 模型以解碼海豚對話—以及…。如果全世界的海洋學者都能獲得這項工具,會發生什麼事呢?
- 理解海豚的內心:我們將能更深入地了解牠們分享著什麼樣的情感,以及如何感知世界。
- 海洋生態系的可靠守護者:透過精確掌握海洋噪音或氣候變遷對海豚溝通的影響,可以制定更有效的保護對策。
- 與其他動物的連結:這項技術將成為解碼海豚以外,如鯨魚、大象、靈長類等其他聰明動物語言的優秀藍圖。
我們才剛剛開始敲響海底鄰居的大門。雖然現在還無法立即與海豚討論人生的意義,但至少,能夠傳遞一句溫暖的「你好」,並帶著微笑理解牠們回應的那一天,已經近在眼前了。
AI 的視角 (MindTickleBytes AI 記者觀點)
語言是智慧的核心,也是連結彼此心靈最強大的橋樑。Google 的 DolphinGemma 不僅僅是一個尋找數據模式的工具,更是一項蘊含著人類意欲擺脫以自我為中心的思考,並與地球上其他智慧生命體真正共存的技術。當海底的迴響被翻譯成我們的語言時,我們或許會對「人類」這個存在獲得比以往更深、更廣的洞察。
參考資料
- DolphinGemma: Google AI 如何協助解碼海豚通訊
- DolphinGemma:AI 如何辨識海豚通訊
- SETI 地球技術:DolphinGemma:Google AI 如何協助解碼…
- Google 正在訓練全新的 A.I. 模型以解碼海豚對話—以及…
- Google 正致力於使用 AI 解碼海豚通訊
- Google 推出 DolphinGemma AI 以解碼並生成海豚語言
- Google 新聞 - Google 開發 AI 以理解海豚…
- Google 開發 AI 模型協助研究人員解碼海豚…
-
[Google 研發與海豚交談的程式 Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/) - 使用 AI 解碼海豚通訊…
- Google 的全新 AI 正在嘗試與海豚交談—說真的
FACT-CHECK SUMMARY
- Claims checked: 13
- Claims verified: 13
- Verdict: PASS
- 預測海豚的移動路徑
- 分析並生成海豚的溝通語言
- 尋找海底垃圾
- 10年
- 25年
- 40年
- SoundStream 分詞器
- WaveNet
- BERT