海豚語言被谷歌大模型破譯！跨物種交流大門打開，哈薩克斯：下一個是狗_港資訊

海豚語言被谷歌大模型破譯！跨物種交流大門打開，哈薩克斯：下一個是狗

科技互聯網知乎

更新于：2025-04-16 14:15:09

神奇！人類和海豚真的能實現跨物種交流了？！

當地時間4月14日（也是世界海豚日），谷歌CEO皮猜激動官宣：

隆重推出DolphinGemma，基於多年積累的海豚聲音數據訓練而成，有助於實現跨物種交流。

劃重點，這個海豚模型參數僅400M，小到能直接在谷歌Pixel 9手機上運行。

而且皮猜還說了，預計今年夏天會將其開源以促進科學合作。

這一消息也迅速引來大量網友圍觀，評論區一整個“哇聲一片”：

更有意思的是，谷歌和OpenAI這對老冤家這一次又雙叒對上了，OpenAI那邊發佈了GPT 4.1。

有網友直接辣評：GPT 4.1很好，但我對DolphinGemma更感興趣。（你是懂拉踩的doge）

谷歌大模型破解海豚叫聲

谷歌這次發佈的AI基礎模型DolphinGemma，經過訓練可以學習海豚的發聲結構，並生成類似的聲音序列。

這和大語言模型中的預測下一個token類似，通過識別輸入的海豚音訊，來預測後續可能出現的聲音，並最終解鎖這些聲音隱藏的潛在含義。

根據介紹，這一模型使用了谷歌獨特的音訊技術。

其中，SoundStream分詞器能快速把海豚聲音變成計算機能理解的信號，隨後由適合處理複雜序列的模型架構進行處理。

當然，除了訓練技術，最重要的環節還是在於獲取數據。

谷歌這次找了WDP（ Wild Dolphin Project）合作，這家機構研究海豚社會數十年，擁有極為豐富的數據集。

具體而言，自1985年以來，WDP研究了巴哈馬群島中一個跨世代的野生大西洋斑點海豚（Stenella frontalis）群落。

通過這一“世界上持續時間最長的水下海豚研究專案”，最終積攢了數十年的水下視頻和音訊，並且每個海豚的身份、生活史和觀察到的行為擁有細緻匹配。

比如下面這些能夠將海豚聲音和行為聯繫起來的例子：

標誌性的口哨聲，一般出現在母子相遇的場景
打鬥時經常會聽到脈衝“尖叫聲”
求偶或追逐鯊魚時常用“嗡嗡”聲

下圖展示了第一種情形。

左圖：一隻斑點海豚媽媽在幼崽覓食時觀察著它，等幼崽覓食完畢後，它會用自己獨特的口哨聲呼喚它回來。

右圖：聲譜圖顯示的口哨聲。

因此最終，DolphinGemma是基於WDP的野生大西洋斑點海豚聲學資料庫進行廣泛訓練。

另一方面，除了研究海豚的交流方式，WDP還進一步探索了“人機交互”方式。

該機構與喬治亞理工學院合作，開發了CHAT(Cetacean Hearing Augmentation Telemetry) 這款水下應用，其設計目的並非直接解讀海豚複雜的自然語言，而是建立一套更簡單的共用詞彙。

具體來說，CHAT會將生成的合成哨聲與海豚喜歡的特定物體聯繫起來，比如海藻、海草或研究人員使用的圍巾。

然後通過人類教導，讓天生好奇的海豚學會模仿這些哨聲來請求這些物品。

最終，隨著對海豚更多自然聲音的理解，這些聲音也可以被加入到系統中。

△CHAT示意圖

概括而言，CHAT設備通過水下揚聲器和麥克風實現聲音的發送和接收，通過嘗試模仿海豚發出的哨聲來建立一種基本的溝通橋樑。

谷歌表示，Pixel 6（谷歌2021年10月發佈）已經能夠即時處理高保真海豚聲音分析，而即將發佈的Pixel 9（計劃於2025年夏季投入使用）將在此基礎上進行升級。

Pixel 9將集成揚聲器和麥克風功能，並利用手機強大的處理能力同時運行深度學習模型和範本匹配演算法。
這將使研究人員能夠更高效地分析海豚的聲音，並與海豚進行更複雜的互動。

One More Thing

也有人好奇，為什麼谷歌選了海豚而非更常見的貓狗來研究？

雖然官方這次未明確提及背後原因，但查閱廣泛研究資料后可以得出一個結論：

這是因為海豚的“語言”和人類語言高度接近。

一項發表在《皇家社會生物學通訊》的研究表明，海豚相互間交流的方式近乎於人類。

當一些海豚發出像吹口哨一樣的聲音時，這些聲音是由特定組織震動發出的，其運作原理類似於人類和許多陸生生物的聲帶振動。

論文一作彼得·麥德森曾表示：

實際上，它們是通過鼻腔中結締組織的共振頻率來發聲的，而且它們能隨意調節肌肉緊張度和通過的氣流。這和人類用聲帶說話時做的一模一樣。

和海豚類似，事實上谷歌2024年9月還推出了一款鯨魚聲音識別模型，它能夠識別出八種鯨魚的獨特叫聲，並精細區分其中兩種鯨魚的不同發聲類型。

而鯨魚也和海豚一樣，其語言和人類語言也具有相似性。

今年年初發表在《科學》雜誌上的一項研究驚奇地發現，通過模仿兒童學習語言的過程，鯨魚的歌聲與人類使用的語言存在統計相似性。

這一發現不僅揭開了鯨歌的部分秘密，還為理解跨物種交流乃至AI語言模型提供了全新視角。

可以看到，谷歌首先考慮的還是這些與人類語言更接近的物種。

不過別著急，從DeepMind聯創兼CEO哈薩克斯透露的想法來看，沒準下一個就是狗了。(doge）

—完—

@量子位 · 追蹤AI技術和產品新動態

深有感觸的朋友，歡迎贊同、關注、分享三連վ'ᴗ' ի ❤

北魏分裂后的皇室及宗室在東魏+北齊和西魏+北周的待遇哪個最差？

北魏分裂后的皇室及宗室在東魏+北齊和西魏+北周的待遇哪個最差？

2025-03-26 00:18:19

金庸先生為何寫完《鹿鼎記》之後就停止了武俠小說的創作?

金庸先生為何寫完《鹿鼎記》之後就停止了武俠小說的創作?

2025-03-26 00:18:20

北周比北齊面積大了好幾倍，為什麼北周大臣說北齊佔了一半天下？

北周比北齊面積大了好幾倍，為什麼北周大臣說北齊佔了一半天下？

2025-03-26 00:18:22

為什麼伊爾汗國沒有攻打俾路支地方作為自己的臣屬?

為什麼伊爾汗國沒有攻打俾路支地方作為自己的臣屬?

2025-03-26 00:19:56

為什麼同樣是初到榮國府，幼年喪母的黛玉只能睡碧紗櫥，而即將嫁人的薛寶琴卻直接跟賈母一起睡了？

為什麼同樣是初到榮國府，幼年喪母的黛玉只能睡碧紗櫥，而即將嫁人的薛寶琴卻直接跟賈母一起睡了？

2025-03-26 00:22:30

城市的哪個角落，讓你覺得既有歷史的厚重氣息，又有春天的生命活力？可以分享你拍下的這個瞬間嗎？

城市的哪個角落，讓你覺得既有歷史的厚重氣息，又有春天的生命活力？可以分享你拍下的這個瞬間嗎？

2025-03-26 00:24:16

何愷明帶隊新作「分形生成模型」：逐圖元建模高解析度圖像、效率提升4000倍

何愷明帶隊新作「分形生成模型」：逐圖元建模高解析度圖像、效率提升4000倍

2025-03-26 00:24:19

如何看待美食博主大祥哥自曝投資被騙千萬？

如何看待美食博主大祥哥自曝投資被騙千萬？

2025-03-26 00:24:24

為什麼生日蛋糕上的那種紅色、綠色的櫻桃味道與新鮮櫻桃的味道完全不一樣，且很難吃，是什麼原因讓美味的櫻桃變成了這種噁心的味道？

為什麼生日蛋糕上的那種紅色、綠色的櫻桃味道與新鮮櫻桃的味道完全不一樣，且很難吃，是什麼原因讓美味的櫻桃變成了這種噁心的味道？

2025-03-26 01:37:24

前端面試被問「你在未來 5 年的職業目標是什麼」，但前端都快死了，我該如何回答職業規劃的問題？

前端面試被問「你在未來 5 年的職業目標是什麼」，但前端都快死了，我該如何回答職業規劃的問題？

2025-03-26 01:45:07

為什麼可以把線性空間 V 看成是它對偶空間 V* 的對偶空間？

為什麼可以把線性空間 V 看成是它對偶空間 V* 的對偶空間？

2025-03-26 01:45:09

既然解開bitlocker需要金鑰，那Windows正常啟動（無用戶輸入）時是從哪裡獲取到金鑰的？

既然解開bitlocker需要金鑰，那Windows正常啟動（無用戶輸入）時是從哪裡獲取到金鑰的？

2025-03-26 01:45:38

如果類似余華這種傳統文學大師真去認真瞭解網文的技法和節奏安排，然後去寫網文是會降維打擊還是水土不服呢？

如果類似余華這種傳統文學大師真去認真瞭解網文的技法和節奏安排，然後去寫網文是會降維打擊還是水土不服呢？

2025-03-26 01:56:49

13年之後，如何看待第14屆年度人物頒獎盛典當中馬雲、董明珠對雷軍的“拷問”？

13年之後，如何看待第14屆年度人物頒獎盛典當中馬雲、董明珠對雷軍的“拷問”？

2025-03-26 02:10:16

Manus發佈一天后迅速出現OpenManus、OWL 等複刻專案，怎麼做到的？

Manus發佈一天后迅速出現OpenManus、OWL 等複刻專案，怎麼做到的？

2025-03-26 02:10:19

你可以介紹一個冷門但改變世界的數學模型嗎？

你可以介紹一個冷門但改變世界的數學模型嗎？

2025-03-26 02:10:49

一些猴子已經進化到可以使用工具甚至進入石器時代似乎威脅到了人類的地位，為什麼人類不阻止它們繼續進化?

一些猴子已經進化到可以使用工具甚至進入石器時代似乎威脅到了人類的地位，為什麼人類不阻止它們繼續進化?

2025-03-26 02:11:20

數學中，有哪些常數被發現時被認為是超越數，結果最後被證實是個代數數，只不過它的次數很高？

數學中，有哪些常數被發現時被認為是超越數，結果最後被證實是個代數數，只不過它的次數很高？

2025-03-26 02:11:22

騰訊控股 2024 年凈利潤 1940.7 億元，比上年增長 68%，如何評價該業績？

騰訊控股 2024 年凈利潤 1940.7 億元，比上年增長 68%，如何評價該業績？

2025-03-26 02:11:23

漢桓帝真的連立一個平民宮女做皇后，也不能自己做主嗎？

漢桓帝真的連立一個平民宮女做皇后，也不能自己做主嗎？

2025-03-26 02:12:01

為什麼明朝能恢復唐代的服飾，而太平天國無法恢復明代的服飾？

為什麼明朝能恢復唐代的服飾，而太平天國無法恢復明代的服飾？

2025-03-26 02:12:06

雷軍從 6 樓扔塗有防彈塗層西瓜，西瓜完好無損，這種防彈塗層是什麼材質？用在車上效果怎麼樣？

雷軍從 6 樓扔塗有防彈塗層西瓜，西瓜完好無損，這種防彈塗層是什麼材質？用在車上效果怎麼樣？

2025-03-26 02:12:09

假如在諸葛亮北伐的時候，東吳再次偷襲蜀漢，並殺了諸葛亮，把屍首寄給劉禪會發生什麼?

假如在諸葛亮北伐的時候，東吳再次偷襲蜀漢，並殺了諸葛亮，把屍首寄給劉禪會發生什麼?

2025-03-26 02:12:45

如何評價義大利科研團隊在《自然》發表的論文中，首次在光子晶體極化激元系統中實現超固體？

如何評價義大利科研團隊在《自然》發表的論文中，首次在光子晶體極化激元系統中實現超固體？

2025-03-26 02:13:28