Google 公佈了學習 40 年累積的海豚數據、用於解析和預測海豚聲音的 AI 模型 'DolphinGemma'。
想像一下。 在陽光明媚的假期裡,你正拿著智慧型手機看著翠綠的海面。剛好經過的一群海豚發出活潑的「咔嗒」聲時,你的智慧型手機螢幕上出現了即時翻譯訊息:「你好!今天這附近有很多好吃的魚。要和我們一起游泳玩耍嗎?」
這聽起來像是科幻 (SF) 電影中的場景,但這個夢幻般的故事現在正大步邁向現實。Google 在 2025 年 4 月 14 日慶祝「國際海豚日 (National Dolphin Day)」之際,正式發佈了可以解析並預測海豚複雜對話的創新人工智慧模型 「DolphinGemma」 [來源 3, 來源 16]。
數十年來,科學家們一直相信海豚發出的獨特咔嗒聲、哨聲以及短促有力的脈衝音,不僅僅是雜訊,而是包含高度智慧與社會意義的「語言」 [來源 1]。而現在,人工智慧正成為解開這個千年謎團的神奇鑰匙。
為什麼這對我們很重要?
海豚被認為是除人類之外,地球上智慧最高的生物之一。但我們對於它們的感受、如何互相呼喚以及透過什麼規則維持社會,僅了解極少一部分。DolphinGemma 的出現之所以能引起人類的巨大共鳴,主要有三個原因。
第一,與地球上的另一種智慧生物相遇。 理解海豚的溝通方式,是一場發現與人類語言完全不同、且針對水下環境高度優化的智慧體系的驚奇之旅。這也為我們未來可能遇到的外星生命溝通做好了極佳的「天體生物學」練習 [來源 3]。
第二,保護珍貴海洋生態系統的途徑。 如果我們能即時瞭解海豚對環境污染或氣候變遷發出的警告以及它們的反應,我們就能制定比現在更精確、更有效的海洋保護對策。
第三,技術的無限擴展性。 Google 透過 DolphinGemma 證明了 AI 不僅能學習人類語言,還能完美學習自然界中極其複雜且細微的訊號 [來源 9]。這項技術未來將成為解析其他動物語言,或分析不可預測自然現象模式的創新工具。
輕鬆理解:AI 是如何學習海豚語言的?
解析海豚聲音比學習一門陌生的外語難上萬倍。人類語言在學習之初就已經知道語法和單詞的概念,但海豚的聲音甚至無法確定從哪裡開始到哪裡結束才是一個「單詞」或一個「句子」。
為了跨越這座巨大的牆壁,Google 採用了兩個核心策略。
1. 全面研究 40 年份的「海豚閒聊」
要學得好,首先需要大量優質教材。DolphinGemma 學習了名為 野生海豚項目 (Wild Dolphin Project, WDP) 的研究機構在過去 40 年的漫長歲月中,於海洋現場直接錄製並分析的龐大數據 [來源 7]。
舉例來說, 這就像是一位天才語言學家錄製了 40 年間在首爾市中心發生的所有對話,並播放給 AI 聽。AI 反覆聆聽這海量的數據數百萬次,開始自行尋找在什麼情況下經常出現什麼聲音,以及聲音之間隱藏的微小規則。
2. 像樂高積木一樣拆解聲音 (分詞器技術)
海豚的聲音非常快速且複雜,人類的耳朵甚至難以完整捕捉。為了讓 AI 正確處理,必須將聲音精確地拆解成極小的單位。Google 在此引入了名為 「SoundStream 分詞器 (Tokenizer)」 的尖端技術 [來源 2]。
簡單來說, 「分詞器 (Tokenizer)」是一種將複雜資訊轉化為 AI 易於理解的小片段(標記,Token)的工具。這就像為了製作複雜的料理,將材料切成統一大小、精緻形狀的「神奇蔬菜切片機」。SoundStream 技術能高效地將海豚的聲音切細,幫助 AI 更清晰地識別聲音中包含的模式 [來源 2]。
現狀:我們目前進展到哪裡了?
當然,我們現在還沒到可以立即與海豚進行哲學對話或深度諮詢的階段。目前 DolphinGemma 展示的能力主要可歸納為三個階段:
- 掌握聲音的藍圖:系統地學習海豚聲音的語法結構 [來源 3]。
- 預測下一個聲音:當海豚發出某種聲音時,以高機率預測接下來會出現什麼聲音。這與我們用智慧型手機發簡訊時,AI 推薦下一個單詞的「自動完成」功能原理相似 [來源 7]。
- 生成海豚語言:基於學習到的數據,可以直接生成海豚可能發出的、自然的全新聲音訊號 [來源 3]。
這些階段是擺脫以往單方面「傾聽」水平,邁向由我們主動與海豚對話的「雙向溝通 (Two-way communication)」時代的重要基石 [來源 13, 來源 15]。
未來:在海上進行的對話
Google 和研究團隊的最終目標非常明確。不是隻在實驗室超級電腦中運行的 AI,而是要創造能在真實、波濤洶湧的海面上運作的人工智慧。
在不久的將來,我們將目睹研究人員在海上僅憑一支像 Google Pixel 手機 這樣常用的智慧型手機,就能即時分析海豚的聲音並嘗試與它們交流的驚人景象 [來源 14]。
特別令人振奮的消息是,Google 宣佈計劃在 2025 年夏季將此 ‘DolphinGemma’ 模型以「開源 (Open Source,公開技術讓任何人都能使用的方式)」 發佈 [來源 8]。屆時,全球的海洋生物學家都能在各自的研究領域使用這款強大的工具,深入研究他們觀察的海豚群體所特有的方言和文化。
也許有一天,當我們親切地問「你今天心情如何?」時,AI 會將其轉化為海豚優美的哨聲傳達出去,並將海豚活潑的回答翻譯成我們的語言,那一刻將真正成為現實。
AI 的觀點:MindTickleBytes 記者的想法
DolphinGemma 是一個象徵性的事件,代表人類創造的最精密的工具 —— AI,正打破曾被視為人類專屬的「語言」框架,走進自然的中心。這展示了技術不僅僅停留在冰冷的二進位世界中,更可以成為連結生命與生命的溫暖紐帶。
當海底神秘的歌聲搭乘數據的波動傳遞給我們時,我們終將深刻體會到,在地球這顆蔚藍星球上,我們從不孤單,而且在我們身邊,一直有著值得我們傾聽的其他智慧夥伴。
參考資料
- DolphinGemma: How Google AI is helping decode dolphin communication
- DolphinGemma: How AI can decipher dolphin communication
- SETI Tech On Earth: DolphinGemma: How Google AI Is Helping Decode …
- Google Uses DolphinGemma AI to Decode Dolphin Communication - Entrepreneur
- Google Is Training a New A.I. Model to Decode Dolphin Chatter …
- Google working to decode dolphin communication using AI
- GoogleNews - Google develops AI to understand dolphin…
- Google develops AI model to help researchers decode dolphin…
-
[Google working on programme to talk to dolphins Metro News](https://metro.co.uk/2025/04/14/soon-talk-dolphins-will-like-tell-us-22907662/) - Google’s new AI is trying to talk to dolphins — seriously
- Decoding Dolphin Communication with AI…
FACT-CHECK SUMMARY
- Claims checked: 11
- Claims verified: 11
- Verdict: PASS
- 10年
- 25年
- 40年
- SoundStream
- DolphinTalk
- WaveNet
- 2025年夏季
- 2026年春季
- 2030年冬季