我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

川普P圖在格陵蘭插旗 指示牌寫著「2026成為美國領土」

富豪搬離加州遷往邁阿密 買房、成交7天搞定

谷歌AI助解碼海豚音 開啟(人類)對話契機

母斑點海豚在覓食時觀察著她的幼崽。當幼崽覓食結束後,她會用自己獨特的招牌哨音將牠召回。右圖為用聲波圖來視覺化該哨音。(谷歌提供)
母斑點海豚在覓食時觀察著她的幼崽。當幼崽覓食結束後,她會用自己獨特的招牌哨音將牠召回。右圖為用聲波圖來視覺化該哨音。(谷歌提供)

在4月14日「全美海豚日」當天,Google宣布一項結合人工智慧(AI)與長期生態研究的創新計畫「DolphinGemma」,正逐步揭開海豚語言的奧祕,並朝著人類與海洋哺乳動物溝通的目標邁進。

此計畫由Google、喬治亞理工學院(Georgia Tech)與野生海豚計畫(Wild Dolphin Project, WDP)合作進行。WDP自1985年起即在巴哈馬進行全球最長期的水下海豚研究,累積大量錄音與影像資料,並詳細標註每隻大西洋斑點海豚的身分、行為與聲音,例如母海豚用「招牌哨音」呼喚幼崽,打鬥時出現「爆發音」,求偶或追逐鯊魚時則用「點擊音」。

這些資料成為訓練AI的基礎。Google開發的DolphinGemma語音模型約有4億個參數,使用SoundStream技術將海豚聲音數位化,並參考人類語言模型的架構來預測下一個可能的聲音單位,嘗試解構海豚的語言結構與規律。該模型可直接運行於Pixel手機,便於研究人員在海上即時分析與辨識聲音模式,大幅提升效率。

除了被動解碼,團隊也在實驗主動溝通的可能性。他們開發了一套名為CHAT(Cetacean Hearing Augmentation Telemetry)的系統,利用機器合成哨音與特定物品(如海草或圍巾)建立連結,並希望透過示範讓好奇的海豚模仿哨音,以「請求」物品,實現初步人機互動。

新一代CHAT系統預計於2025年夏季實地測試,採用Pixel 9手機作為運算核心,整合錄音、播放與AI分析功能,不僅降低硬體成本與耗能,也提升反應速度與準確率,讓研究人員能即時回應海豚的「請求」,強化雙向溝通的可能性。

Google計畫在今年夏季將DolphinGemma模型開放共享,供全球研究人員針對不同海豚物種如寬吻海豚、旋轉海豚等進行調整與應用,推動跨領域合作。

「這是一條艱難但值得的旅程。我們不僅在傾聽海豚,現在也開始理解它們的語音規律。」WDP創辦人何經博士(Dr. Denise Herzing)表示。Google DeepMind研究員斯塔內博士(Dr. Thad Starner)則認為,AI讓我們首次有機會系統性掌握這些海洋哺乳類的複雜聲音模式,是人類與自然互動方式的一大進展。

CHAT系統硬體中Google Pixel 9手機。(谷歌提供)
CHAT系統硬體中Google Pixel 9手機。(谷歌提供)

Google AI 人工智慧

上一則

關稅與政策逆風 麥曉彤與Jilly Bing娃娃的新挑戰

下一則

矽谷30歲華女郭如意 全球最年輕白手起家女富豪

超人氣

更多 >