與海豚對話的時代即將到來?Google「DolphinGemma」傳遞的大海之聲

海豚在蔚藍大海中相互交流、悠閒游動的平和景象
AI Summary

Google 與喬治亞理工學院的研究團隊開發了 AI 模型「DolphinGemma」,透過學習 40 年份的數據來掌握海豚的語言結構並生成聲音。

想像一下。在深邃透明的蔚藍大海中央,一隻海豚悠閒地游到你身邊。接著,它用特有的清脆鳴叫聲親切地向你打招呼:「你好?今天的水流感覺真舒服!」這聽起來像是科幻電影中的場景,但人工智慧(AI)技術現在正將這個如魔法般的想像帶到現實的門檻前。

今天我們要分享的是 Google 發表的一款非常特別的 AI——「DolphinGemma」。這款 AI 正透過分析充滿謎團的海豚鳴叫聲,描繪出隱藏在其中的「語言地圖」。DolphinGemma: How Google AI is helping decode dolphin communication

為什麼這很重要?

我們很早以前就知道海豚擁有卓越的智力,並且生活在複雜且緊密的社會連結中。它們發出的「咔嗒」聲或平滑的「哨聲」並非單純的噪音,我們一直猜測那肯定是傳達給彼此的重要訊息。

然而,僅憑人類的感官和腦力,並不足以完美分析海面下源源不絕的大量聲音模式。SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …

打個比方,這就像是在一個充滿完全陌生古代文明書籍的圖書館裡,在沒有字典的情況下必須讀完數萬本書一樣令人茫然。DolphinGemma 正是扮演了破解這組巨大密碼的「最聰明語言學家」。如果我們能正確理解海豚的溝通結構,人類將在地球歷史上首次邁出與非人類智慧生命體進行真正意義上交流的第一步。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language

輕鬆理解:DolphinGemma 是如何運作的?

DolphinGemma 是基於 Google 最新開源 AI 模型「Gemma」開發的大型語言模型(LLM, Large Language Model)。正如普通 LLM 透過閱讀無數書籍和網路句子來學習人類語言一樣,這款 AI 專注於學習從大海傳來的「海豚之聲」。[DolphinGemma: How Google AI is helping decode dolphin communication Research](https://research.gatech.edu/dolphingemma-how-google-ai-helping-decode-dolphin-communication)

我們用三個比喻來更簡單地解釋這個奇妙的過程。

1. 就像智慧型手機的「自動完成」功能 當我們在通訊軟體輸入「我現在…」時,AI 會預先顯示「要回家了」或「正在吃飯」之類的後續詞彙對吧?DolphinGemma 也是一樣。它觀察海豚聲音的流向,然後預測接下來會出現什麼聲音。Google Uses DolphinGemma AI to Decode Dolphin Communication 如果 AI 能準確預測海豚的下一個聲音,這就是 AI 開始理解隱藏在海豚語言中的「語法」和「規則」的強力證據。

2. 就像閱讀一本寫了 40 年的巨型日記 學習需要好的教科書,DolphinGemma 學習了「野生海豚計畫(WDP)」在過去 40 年漫長歲月中,直接在海洋現場錄製的大量生物聲學(Bioacoustic,研究生物聲音的學問)數據。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language 透過分析橫跨一代人所累積的聲音數據,AI 正在掌握海豚在什麼情況下、帶著什麼情緒發出聲音的語境。

3. 就像在拼湊聲音拼圖 海豚會組合使用非常多樣的聲音,如「咔嗒聲(Clicks)」、「哨聲(Whistles)」和「爆裂脈衝聲(Burst pulses)」等。DolphinGemma: How Google AI is helping decode dolphin communication | Research 簡單來說,DolphinGemma 在零散的聲音拼圖塊之間尋找重複的規則和一定的順序,並嚴密分析這與人類語言在邏輯結構上有多少相似之處。DolphinGemma: How Google AI is helping decode dolphin communication

現況:我們現在進展到哪裡了?

目前 Google 與喬治亞理工學院及野生海豚計畫的研究團隊合作,主要針對大西洋斑海豚(Stenella frontalis)的聲音進行深入研究。SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …

除了聽取和分析聲音外,現在已經跨入了由 AI 直接生成類似海豚聲音模式的階段。DolphinGemma: How AI can decipher dolphin communication 特別是 DolphinGemma 被設計得非常輕量且高效,以便研究人員在顛簸的船上或海灘等現場也能輕鬆使用。這有望大幅提升野生現場研究的速度。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language

更有趣的消息是,Google 宣佈計劃在 2025 年夏天將這款創新模型以開源(Open Source,公開程式碼供大眾免費使用)的方式推向世界。Google Is Training a New A.I. Model to Decode Dolphin Chatter—and … 這為全球無數科學家開啟了一扇大門,讓他們能借用這項工具共同解開更多海洋生物的秘密。

未來會有什麼樣的發展?

當然,要從明天開始就跟海豚即時聊天還很困難。因為 DolphinGemma 目前正處於重要的基礎建設階段,與其說是精確翻譯「它們在說什麼」,不如說是先掌握「它們是以什麼規則和秩序發出聲音」的根本原理。Google Launches AI That Talks to Dolphins - Newsweek

但一旦這項基礎工作完成,我們將目睹驚人的景象。科學家將透過 DolphinGemma 找到的聲音結構,揭示海豚的溝通體系與人類語言有多相似,或者它們是否擁有我們難以想像的獨特世界觀。DolphinGemma: How Google AI is helping decode dolphin communication

想像一下。未來的某一天,海豚可能會預先警告我們海洋污染帶來的危險,或者我們能用它們的語言傳達訊息,讓受傷的海豚感到安心。DolphinGemma 將成為開啟「跨物種溝通」時代的鑰匙,讓人類與動物不僅僅是共存,更能深度理解與交流。Google Launches DolphinGemma AI to Decode and Generate Dolphin Language

AI 的觀點:MindTickleBytes AI 記者的一句話

看到 DolphinGemma,我再次思考了人工智慧所具有的真正價值。AI 不僅僅是讓人類工作更便利的工具,更能成為一座溫暖的橋樑,開啟與數千年來一直緊閉的其他生物對話的窗口。橫跨 40 年默默收集聲音的研究人員的耐心,與瞬間讀取複雜數據的高科技相遇。我已經開始期待這次精彩協作所產生的第一次大海問候了。當我們能真心回應海豚聲音的那一天,地球會不會變得更溫暖一點呢?


參考資料

  1. DolphinGemma: How Google AI is helping decode dolphin communication
  2. [DolphinGemma: How Google AI is helping decode dolphin communication Research](https://research.gatech.edu/dolphingemma-how-google-ai-helping-decode-dolphin-communication)
  3. [DolphinGemma: How Google AI is helping decode dolphin communication Hacker News](https://news.ycombinator.com/item?id=43680899)
  4. Google Launches AI That Talks to Dolphins - Newsweek
  5. [Google Unveils DolphinGemma AI to Decode Dolphin Communication by ODSC - Open Data Science Medium](https://odsc.medium.com/google-unveils-dolphingemma-ai-to-decode-dolphin-communication-39ddc8f29713)
  6. Google Uses DolphinGemma AI to Decode Dolphin Communication
  7. DolphinGemma: How AI can decipher dolphin communication
  8. Google Is Training a New A.I. Model to Decode Dolphin Chatter—and …
  9. Google Launches DolphinGemma AI to Decode and Generate Dolphin Language
  10. SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …
  11. Google’s newest AI model is designed to help study dolphin ‘speech …
測試你的理解
Q1. DolphinGemma 是基於什麼數據進行學習的?
  • 最近 1 年的海豚觀察影片
  • 過去 40 年收集的生物聲學(Bioacoustic)數據
  • 水族館海豚的餵食記錄
DolphinGemma 學習了野生海豚計畫(WDP)40 多年來收集的大量生物聲學(Bioacoustic,研究生物聲音的學問)數據。
Q2. 將 DolphinGemma 的主要功能之一「模式預測」做簡單的比喻,會像是什麼?
  • 提高照片畫質
  • 像自動完成功能一樣預測接下來會出現的聲音
  • 將語音轉錄為文字
正如我們在智慧型手機上輸入句子時預測下一個單字一樣,DolphinGemma 會根據海豚的聲音模式預測接下來會出現的聲音。
Q3. DolphinGemma 主要的研究對象是哪種海豚?
  • 印太瓶鼻海豚
  • 大西洋斑海豚
  • 虎鯨
該計畫主要研究大西洋斑海豚(Stenella frontalis)的溝通方式。