Google AI 解碼海豚的溝通模式
海豚以其智慧、複雜的社會結構和精密的溝通而聞名。數十年來,一個引人注目的問題一直吸引著科學家和愛好者:海豚是否擁有與我們相媲美的語言?最近人工智慧 (AI) 的進展提供了強大的新工具來研究這個謎團。谷歌與野生海豚計畫 (Wild Dolphin Project, WDP) 合作創造了 DolphinGemma,專門用於解碼海豚發聲的人工智能模型,是這一領域的一項開創性發展。這項創新不僅有望解讀海豚的溝通,更有可能為與這些非凡的海洋哺乳類動物進行雙向對話奠定基礎。
人工智能如何解讀海豚的聲音
海豚透過豐富的點擊、口哨和身體姿勢進行溝通。這些聲音的音調和強度各不相同,在狩獵、求偶或群體互動等社會情境中,似乎傳達著不同的意義。儘管經過廣泛的研究,這些訊號的完整詞彙仍然難以釐清。傳統的觀察和分析技術往往被大量的聲學資料所淹沒,限制了更深入的了解。
AI 應用機器學習和自然語言處理 (NLP) 來篩選大量的海豚聲音資料集,以解決這個瓶頸問題。這些演算法可以偵測到人類聽不到的細微發聲模式與關聯性。AI 系統可以將不同的聲音類型分類、分析其聲學特性,並將特定的叫聲與行為或情緒情境聯繫起來。例如,研究表明某些口哨聲與社交聯繫有關,而咔嗒聲則主要用於導航和回聲定位。
雖然人工智慧的潛力非常龐大,但從野生海豚群中收集和處理足夠的資料,以及訓練如此規模的模型,仍存在重大的障礙。為了解決這些問題,Google 和 WDP 共同開發了 DolphinGemma,一個專門用於海豚溝通分析的 AI 模型。經過大量資料集的訓練,這個模型能夠辨識海豚發聲中的複雜結構。
DolphinGemma 模型的內部結構
DolphinGemma 建立在 Google 的 Gemma 之上,Gemma 是一個開放源碼的生成式人工智能框架,擁有大約 4 億個參數。其目的是學習海豚聲音的結構,並產生新穎、可信的序列。該模型是與 WDP 和喬治亞理工學院合作開發的,在自 1985 年以來記錄的大西洋斑點海豚發聲的長期資料集上進行訓練。DolphinGemma 利用 Google 的 SoundStream 技術來標記音訊,預測序列中下一個可能的聲音。類似於語言模型產生文字的方式,DolphinGemma 可以預測海豚可能發出的聲音,協助識別可能反映語法規則或句法的模式。
這個模型甚至可以合成新的、類似海豚的聲音,類似於完成句子的預測文字。這種能力可能有助於揭示海豚溝通的管理規則,並提供線索,說明它們的叫聲是否構成一種結構化的語言。
DolphinGemma 的實際應用
DolphinGemma 的主要優勢在於其效率,可在 Google Pixel 智慧型手機等裝置上進行即時操作。其輕巧的設計省去了昂貴的專用硬體。研究人員現在可以直接在現場錄製海豚的聲音,並使用手機即時進行分析,大幅提高可及性並降低研究費用。
此外,DolphinGemma 已整合至 CHAT (Cetacean Hearing Augmentation Telemetry) 系統。這可讓科學家播放 AI 產生的類似海豚的聲音,並觀察動物的反應。這個互動迴圈是發展共同詞彙的關鍵一步,讓人類與海豚之間能夠進行真正的雙向溝通。
更廣泛的影響與 Google 的發展藍圖
DolphinGemma 的創造意義重大,它超越了海豚溝通的範疇,推動了更廣泛的動物認知研究。對海豚的發聲進行解碼,可以深入瞭解海豚的社會動態、優先次序和內部思考過程。這樣的理解可以澄清海豚的需求和關注,從而加強保護策略,同時也擴大了我們對動物智慧和知覺的認識。
DolphinGemma 是運用人工智慧探索動物溝通的趨勢之一,同時也是烏鴉、鯨魚和狐獴等物種研究的重點。Google 打算在 2025 年夏季將 DolphinGemma 作為開放模型發佈給全球研究社群,目標是透過進一步的微調,將 DolphinGemma 適用於其他鯨豚,例如瓶鼻海豚或飛旋海豚。這項開放源碼策略將促進全球合作。Google 也計劃在即將到來的研究季節進行實地測試,希望藉此加深我們對大西洋斑海豚的了解。
障礙與科學爭論
儘管 DolphinGemma 前景可期,但仍面臨多項挑戰。海洋錄音經常受到環境噪音的污染,使得聲音分析變得複雜。喬治亞理工學院的 Thad Starner 是該專案的研究人員,他指出,大部分的資料都包含了海洋背景音,因此需要先進的過濾技術。有些科學家也在爭論海豚的溝通是否稱得上是一種真正的語言。例如,動物學家 Arik Kershenbaum 提出,海豚的發聲可能構成較簡單的信號系統,缺乏人類語言的複雜性。蘇塞克斯海豚項目主任泰勒(Thea Taylor)則提醒人們,不慎訓練海豚人工模仿聲音的風險。這些觀點強調了對人工智能研究結果進行嚴格驗證和審慎詮釋的必要性。
結論
谷歌的人工智能驅動的海豚溝通探索代表了一個轉變性的一步,揭示這些智能生物如何與彼此和他們的世界互動。透過人工智慧的運用,研究人員發現了海豚聲音中隱藏的模式,對海豚的溝通世界提供了前所未有的洞察力。儘管問題和技術挑戰仍然存在,但所取得的進展突顯了人工智能在動物行為科學中的巨大潛力。隨著這項研究的持續發展,它可能會為保育、認知研究以及未來的種間互動開闢新的領域。
相關文章
雷軍證實小米正在開發桌面 AI 助手 MiClaw,MiMo-V2-Pro 已於所有平台正式推出
在 2026 年中國發展高層論壇上,小米集團的雷軍證實,眾所期待的 AI 助手「MiClaw」(螃蟹)桌面版現已列入開發路線圖。 小米已於3月6日針對行動版MiClaw展開限量封閉測試,並在3月19日的春季新品發布會上,預告了其跨裝置協作功能。 繼上週小米自主研發的大型模型 MiMo-V2-Pro 全面上線後,MiClaw 的功能已全面升級,現已開放給用戶測試。MiClaw 是一款專為執行現實世界
OpenAI 重啟機器人業務,Automan 招募基礎設施研發工程師
6月1日,OpenAI 執行長山姆·奧特曼(Sam Altman)在社群媒體上宣布,該公司將重返機器人領域,並發布了 OpenAI 機器人團隊的職缺。 該公司正招募全端硬體、營運、系統及機器學習工程師。此舉標誌著在關閉早期機器人業務後,再度回歸實體世界的具身智能領域,旨在將其領先的大型模型能力從數位世界延伸至真實的實體環境中。奧特曼強調,人工智慧的真正價值在於提供實質的現實世界協助。在發展策略方面
貝恩公司預測,基於代理式人工智慧的自動化SaaS市場規模將達1,000億美元
貝恩公司估計,在美國,運用代理式人工智慧的 SaaS 企業市場規模可達 1,000 億美元。該公司表示,此市場源於企業系統內協調任務的自動化。此預測源自貝恩公司關於「AI時代軟體產業」五部曲系列的第二篇報告。該報告探討了代理式AI可能開拓哪些新的軟體市場,以及SaaS供應商如何搶佔這些市場。企業系統中的協調工作根據貝恩公司的分析,該市場源於員工在不同企業應用程式間執行的人工任務。這些工作流程通常涉
相關專題推薦
評論 (1)
0/500
海豚以其智慧、複雜的社會結構和精密的溝通而聞名。數十年來,一個引人注目的問題一直吸引著科學家和愛好者:海豚是否擁有與我們相媲美的語言?最近人工智慧 (AI) 的進展提供了強大的新工具來研究這個謎團。谷歌與野生海豚計畫 (Wild Dolphin Project, WDP) 合作創造了 DolphinGemma,專門用於解碼海豚發聲的人工智能模型,是這一領域的一項開創性發展。這項創新不僅有望解讀海豚的溝通,更有可能為與這些非凡的海洋哺乳類動物進行雙向對話奠定基礎。
人工智能如何解讀海豚的聲音
海豚透過豐富的點擊、口哨和身體姿勢進行溝通。這些聲音的音調和強度各不相同,在狩獵、求偶或群體互動等社會情境中,似乎傳達著不同的意義。儘管經過廣泛的研究,這些訊號的完整詞彙仍然難以釐清。傳統的觀察和分析技術往往被大量的聲學資料所淹沒,限制了更深入的了解。
AI 應用機器學習和自然語言處理 (NLP) 來篩選大量的海豚聲音資料集,以解決這個瓶頸問題。這些演算法可以偵測到人類聽不到的細微發聲模式與關聯性。AI 系統可以將不同的聲音類型分類、分析其聲學特性,並將特定的叫聲與行為或情緒情境聯繫起來。例如,研究表明某些口哨聲與社交聯繫有關,而咔嗒聲則主要用於導航和回聲定位。
雖然人工智慧的潛力非常龐大,但從野生海豚群中收集和處理足夠的資料,以及訓練如此規模的模型,仍存在重大的障礙。為了解決這些問題,Google 和 WDP 共同開發了 DolphinGemma,一個專門用於海豚溝通分析的 AI 模型。經過大量資料集的訓練,這個模型能夠辨識海豚發聲中的複雜結構。
DolphinGemma 模型的內部結構
DolphinGemma 建立在 Google 的 Gemma 之上,Gemma 是一個開放源碼的生成式人工智能框架,擁有大約 4 億個參數。其目的是學習海豚聲音的結構,並產生新穎、可信的序列。該模型是與 WDP 和喬治亞理工學院合作開發的,在自 1985 年以來記錄的大西洋斑點海豚發聲的長期資料集上進行訓練。DolphinGemma 利用 Google 的 SoundStream 技術來標記音訊,預測序列中下一個可能的聲音。類似於語言模型產生文字的方式,DolphinGemma 可以預測海豚可能發出的聲音,協助識別可能反映語法規則或句法的模式。
這個模型甚至可以合成新的、類似海豚的聲音,類似於完成句子的預測文字。這種能力可能有助於揭示海豚溝通的管理規則,並提供線索,說明它們的叫聲是否構成一種結構化的語言。
DolphinGemma 的實際應用
DolphinGemma 的主要優勢在於其效率,可在 Google Pixel 智慧型手機等裝置上進行即時操作。其輕巧的設計省去了昂貴的專用硬體。研究人員現在可以直接在現場錄製海豚的聲音,並使用手機即時進行分析,大幅提高可及性並降低研究費用。
此外,DolphinGemma 已整合至 CHAT (Cetacean Hearing Augmentation Telemetry) 系統。這可讓科學家播放 AI 產生的類似海豚的聲音,並觀察動物的反應。這個互動迴圈是發展共同詞彙的關鍵一步,讓人類與海豚之間能夠進行真正的雙向溝通。
更廣泛的影響與 Google 的發展藍圖
DolphinGemma 的創造意義重大,它超越了海豚溝通的範疇,推動了更廣泛的動物認知研究。對海豚的發聲進行解碼,可以深入瞭解海豚的社會動態、優先次序和內部思考過程。這樣的理解可以澄清海豚的需求和關注,從而加強保護策略,同時也擴大了我們對動物智慧和知覺的認識。
DolphinGemma 是運用人工智慧探索動物溝通的趨勢之一,同時也是烏鴉、鯨魚和狐獴等物種研究的重點。Google 打算在 2025 年夏季將 DolphinGemma 作為開放模型發佈給全球研究社群,目標是透過進一步的微調,將 DolphinGemma 適用於其他鯨豚,例如瓶鼻海豚或飛旋海豚。這項開放源碼策略將促進全球合作。Google 也計劃在即將到來的研究季節進行實地測試,希望藉此加深我們對大西洋斑海豚的了解。
障礙與科學爭論
儘管 DolphinGemma 前景可期,但仍面臨多項挑戰。海洋錄音經常受到環境噪音的污染,使得聲音分析變得複雜。喬治亞理工學院的 Thad Starner 是該專案的研究人員,他指出,大部分的資料都包含了海洋背景音,因此需要先進的過濾技術。有些科學家也在爭論海豚的溝通是否稱得上是一種真正的語言。例如,動物學家 Arik Kershenbaum 提出,海豚的發聲可能構成較簡單的信號系統,缺乏人類語言的複雜性。蘇塞克斯海豚項目主任泰勒(Thea Taylor)則提醒人們,不慎訓練海豚人工模仿聲音的風險。這些觀點強調了對人工智能研究結果進行嚴格驗證和審慎詮釋的必要性。
結論
谷歌的人工智能驅動的海豚溝通探索代表了一個轉變性的一步,揭示這些智能生物如何與彼此和他們的世界互動。透過人工智慧的運用,研究人員發現了海豚聲音中隱藏的模式,對海豚的溝通世界提供了前所未有的洞察力。儘管問題和技術挑戰仍然存在,但所取得的進展突顯了人工智能在動物行為科學中的巨大潛力。隨著這項研究的持續發展,它可能會為保育、認知研究以及未來的種間互動開闢新的領域。
雷軍證實小米正在開發桌面 AI 助手 MiClaw,MiMo-V2-Pro 已於所有平台正式推出
在 2026 年中國發展高層論壇上,小米集團的雷軍證實,眾所期待的 AI 助手「MiClaw」(螃蟹)桌面版現已列入開發路線圖。 小米已於3月6日針對行動版MiClaw展開限量封閉測試,並在3月19日的春季新品發布會上,預告了其跨裝置協作功能。 繼上週小米自主研發的大型模型 MiMo-V2-Pro 全面上線後,MiClaw 的功能已全面升級,現已開放給用戶測試。MiClaw 是一款專為執行現實世界
OpenAI 重啟機器人業務,Automan 招募基礎設施研發工程師
6月1日,OpenAI 執行長山姆·奧特曼(Sam Altman)在社群媒體上宣布,該公司將重返機器人領域,並發布了 OpenAI 機器人團隊的職缺。 該公司正招募全端硬體、營運、系統及機器學習工程師。此舉標誌著在關閉早期機器人業務後,再度回歸實體世界的具身智能領域,旨在將其領先的大型模型能力從數位世界延伸至真實的實體環境中。奧特曼強調,人工智慧的真正價值在於提供實質的現實世界協助。在發展策略方面





首頁






