谷歌AI助解碼海豚音 開啟(人類)對話契機
在4月14日「全美海豚日」當天,Google宣布一項結合人工智慧(AI)與長期生態研究的創新計畫「DolphinGemma」,正逐步揭開海豚語言的奧祕,並朝著人類與海洋哺乳動物溝通的目標邁進。
此計畫由Google、喬治亞理工學院(Georgia Tech)與野生海豚計畫(Wild Dolphin Project, WDP)合作進行。WDP自1985年起即在巴哈馬進行全球最長期的水下海豚研究,累積大量錄音與影像資料,並詳細標註每隻大西洋斑點海豚的身分、行為與聲音,例如母海豚用「招牌哨音」呼喚幼崽,打鬥時出現「爆發音」,求偶或追逐鯊魚時則用「點擊音」。
這些資料成為訓練AI的基礎。Google開發的DolphinGemma語音模型約有4億個參數,使用SoundStream技術將海豚聲音數位化,並參考人類語言模型的架構來預測下一個可能的聲音單位,嘗試解構海豚的語言結構與規律。該模型可直接運行於Pixel手機,便於研究人員在海上即時分析與辨識聲音模式,大幅提升效率。
除了被動解碼,團隊也在實驗主動溝通的可能性。他們開發了一套名為CHAT(Cetacean Hearing Augmentation Telemetry)的系統,利用機器合成哨音與特定物品(如海草或圍巾)建立連結,並希望透過示範讓好奇的海豚模仿哨音,以「請求」物品,實現初步人機互動。
新一代CHAT系統預計於2025年夏季實地測試,採用Pixel 9手機作為運算核心,整合錄音、播放與AI分析功能,不僅降低硬體成本與耗能,也提升反應速度與準確率,讓研究人員能即時回應海豚的「請求」,強化雙向溝通的可能性。
Google計畫在今年夏季將DolphinGemma模型開放共享,供全球研究人員針對不同海豚物種如寬吻海豚、旋轉海豚等進行調整與應用,推動跨領域合作。
「這是一條艱難但值得的旅程。我們不僅在傾聽海豚,現在也開始理解它們的語音規律。」WDP創辦人何經博士(Dr. Denise Herzing)表示。Google DeepMind研究員斯塔內博士(Dr. Thad Starner)則認為,AI讓我們首次有機會系統性掌握這些海洋哺乳類的複雜聲音模式,是人類與自然互動方式的一大進展。

FB留言