Google AI协助解码海豚与海豚交流

几十年来,科学家们一直被海豚的咔嗒声、哨声和突发脉冲所吸引,试图破解它们复杂沟通的密码。想象一下,如果我们不仅能偷听这些海洋对话,还能深入解读它们的模式,足以创造出类似海豚的回应。这个梦想正逐渐接近现实,在国家海豚日,Google 与佐治亚理工学院的研究人员以及野外海豚项目(WDP)的实地工作合作,兴奋地分享了 DolphinGemma 的激动人心更新。这一突破性的人工智能模型经过训练,能够理解海豚发声的细微差别,甚至生成新颖的声音序列,推动了人工智能的极限以及我们与海洋生物连接的潜力。
海豚社会研究的几十年
了解任何物种都不是一件轻松的事;它需要深入探索它们的世界。这就是 WDP 的作用所在。自1985年以来,他们一直在进行最长时间的水下海豚研究项目,聚焦于巴哈马一群野生大西洋斑点海豚(Stenella frontalis),跨代研究它们。“在它们的世界,按它们的条件”方法意味着他们在不干扰海豚的情况下收集了大量数据。这包括几十年的水下视频和音频,所有这些都与个体海豚的身份、生活史和行为精心关联。就像拥有一本详细的海豚生活日记。
一群大西洋斑点海豚,Stenella frontalis
WDP 的主要焦点是观察和分析海豚的自然沟通和社会互动。通过在水下工作,研究人员能够将声音直接与特定行为联系起来,这是表面观察无法做到的。他们花了多年时间将不同类型的声音与行为情境相关联。例如:
- 签名哨声,类似于独特的姓名,帮助母海豚和幼海豚团聚。
- 突发脉冲“尖叫声”通常伴随着海豚的争执。
- 咔嗒“嗡嗡声”常在求偶或追逐鲨鱼时听到。
了解涉及的个体海豚是准确解读的关键。这种长期观察的最终目标是解码这些自然声音序列的结构和潜在含义,寻找可能暗示某种语言形式的模式和规则。这种对自然沟通的深入分析是 WDP 研究的基础,并为人工智能分析提供了关键背景。
左图:一只母斑点海豚在觅食时观察她的幼崽。她会使用她独特的签名哨声召回幼崽。右图:显示哨声的声谱图。
介绍 DolphinGemma
分析海豚自然、复杂的沟通绝非易事,WDP 广泛的标记数据集为人工智能创新提供了宝贵机会。由此诞生了 Google 创造的 DolphinGemma,它利用了特定的音频技术。SoundStream 分词器有效地捕捉海豚的声音,然后由专为复杂序列设计的模型处理。这个约4亿参数的模型大小适中,适合 WDP 在实地使用的 Pixel 手机运行。
左图:DolphinGemma 早期测试中生成的哨声和突发脉冲。
DolphinGemma 灵感来源于 Google 的 Gemma 系列轻量级尖端开放模型,这些模型与 Gemini 模型共享相同的研究和技术。DolphinGemma 在 WDP 的野生大西洋斑点海豚声学数据库上训练,作为一个音频输入、音频输出的模型。它处理自然海豚声音序列以发现模式、结构,并最终预测序列中可能的下一个声音,类似于人类语言模型预测下一个单词的方式。
本季,WDP 正在实地推出 DolphinGemma,短期内将带来显著的好处。通过识别重复的声音模式、集群和可靠序列,该模型可以帮助研究人员发现海豚自然沟通中隐藏的结构和潜在含义——这项工作此前需要大量人力。未来,这些模式结合研究人员为代表海豚喜欢的物体创建的合成声音,可能为共享词汇和互动沟通铺平道路。
使用 Pixel 手机聆听和分析海豚声音
除了分析自然沟通外,WDP 还在探索另一条途径:在海洋中使用技术进行潜在的双向互动。这促成了与佐治亚理工学院合作开发的 CHAT(Cetacean Hearing Augmentation Telemetry)系统。CHAT 是一个水下计算机,旨在不是解码海豚复杂的自然语言,而是建立一个更简单的共享词汇。
其理念是将新颖的、由 CHAT 生成的合成哨声(区别于自然海豚声音)与海豚感兴趣的特定物体(如马尾藻、海草或研究人员使用的围巾)关联起来。通过向彼此展示系统,研究人员希望好奇的海豚会学会模仿这些哨声以请求这些物品。随着对海豚自然声音的理解加深,这些也可以融入系统。
为实现双向互动,CHAT 系统必须:
- 在海洋噪音中准确听到模仿的声音。
- 实时识别被模仿的哨声。
- 通过水下工作的骨传导耳机通知研究人员海豚“请求”的物体。
- 允许研究人员快速回应,提供正确的物体,强化这种联系。
Google Pixel 6 之前已能实时处理海豚声音的高保真分析。下一代将聚焦于 Google Pixel 9(计划于2025年夏季进行研究),通过集成扬声器/麦克风功能并利用手机的先进处理能力,同时运行深度学习模型和模板匹配算法。
左图:Denise Herzing 博士佩戴“Chat Senior, 2012”,右图:佐治亚理工学院博士生 Charles Ramey 佩戴“Chat Junior, 2025”
使用 Pixel 智能手机大大减少了对定制硬件的需求,提高了系统可维护性,降低了功耗,并缩小了设备的成本和尺寸——这些是在开放海洋中进行实地研究的关键优势。同时,DolphinGemma 的预测能力可以帮助 CHAT 在发声序列早期预测和识别潜在的模仿,加快研究人员对海豚的响应,使互动更顺畅、更具强化性。
最新 CHAT 系统硬件内的 Google Pixel 9。
与研究社区分享 DolphinGemma
认识到科学发现中协作的重要性,我们计划在今年夏天将 DolphinGemma 作为开放模型分享。尽管它是在大西洋斑点海豚的声音上训练的,但我们相信它对研究其他鲸类物种(如宽吻海豚或飞旋海豚)的学者可能也有用。不同物种的发声可能需要一些微调,但开放模型允许这种适应。
通过提供像 DolphinGemma 这样的工具,我们旨在为全球研究人员提供分析他们自己的声学数据集的手段,加速模式搜索,共同增强我们对这些智能海洋哺乳动物的理解。
理解海豚沟通的旅程漫长而曲折,但 WDP 的专注实地研究、佐治亚理工学院的工程实力和 Google 的技术力量相结合,正在开启激动人心的新可能性。我们不再只是聆听;我们开始理解声音中的模式,为未来人类与海豚沟通的差距可能进一步缩小的舞台奠定了基础。
您可以在野外海豚项目的网站上深入了解更多信息。
相关文章
"Dot AI伴侣应用程序宣布关闭,停止个性化服务
Dot 是一款人工智能伴侣应用程序,旨在充当个人朋友和知己,根据其开发者周五发布的公告,Dot 将停止运营。Dot背后的初创公司New Computer在其网站上表示,该服务将持续到10月5日,以便用户有时间导出个人数据。今年早些时候,联合创始人山姆-惠特莫尔(Sam Whitmore)和前苹果设计专家杰森-袁(Jason Yuan)合作推出了这款应用程序。Dot 进入了日益受到关注的情感人工智能
Anthropic 解决了人工智能生成盗版图书的法律案件
Anthropic公司与美国作家达成了一项重要的版权纠纷解决方案,同意拟议的集体诉讼和解,避免了可能代价高昂的审判。本周二在法庭文件中提交的这份协议源于对这家人工智能公司使用盗版文学作品训练克劳德模型的指控。尽管此案源于作家安德烈娅-巴茨(Andrea Bartz)、查尔斯-格雷伯(Charles Graeber)和柯克-华莱士-约翰逊(Kirk Wallace Johnson)的指控,但和解细节
Figma 向所有用户发布人工智能驱动的应用程序生成工具
Figma Make 是今年早些时候推出的创新型提示到应用开发平台,现已正式退出测试版,并向所有用户推出。这一开创性的工具加入了人工智能编码助手的行列,如谷歌的 Gemini Code Assist 和微软的 GitHub Copilot,使创作者能够将自然语言描述转化为功能原型和应用程序,而无需传统的编程专业知识。Figma Make 最初在测试阶段只对高级 "全席 "用户开放,现在对所有账户类
评论 (8)
0/200
JonathanAllen
2025-09-21 02:30:31
Finalmente estamos mais perto de conversar com golfinhos! 🐬 Mas será que eles vão gostar das nossas piadas? Imagina um golfinho rindo dos nossos memes aquáticos... Jason Warner tem razão, melhor focar em apps legais assim do que reinventar modelos gigantes.
0
NoahSmith
2025-08-02 23:07:14
Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬
0
AlbertMartínez
2025-07-28 09:19:05
This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!
0
WalterWalker
2025-04-20 23:04:10
GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓
0
GeorgeJones
2025-04-20 13:34:27
구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓
0
JonathanLewis
2025-04-20 11:35:47
Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓
0
几十年来,科学家们一直被海豚的咔嗒声、哨声和突发脉冲所吸引,试图破解它们复杂沟通的密码。想象一下,如果我们不仅能偷听这些海洋对话,还能深入解读它们的模式,足以创造出类似海豚的回应。这个梦想正逐渐接近现实,在国家海豚日,Google 与佐治亚理工学院的研究人员以及野外海豚项目(WDP)的实地工作合作,兴奋地分享了 DolphinGemma 的激动人心更新。这一突破性的人工智能模型经过训练,能够理解海豚发声的细微差别,甚至生成新颖的声音序列,推动了人工智能的极限以及我们与海洋生物连接的潜力。
海豚社会研究的几十年
了解任何物种都不是一件轻松的事;它需要深入探索它们的世界。这就是 WDP 的作用所在。自1985年以来,他们一直在进行最长时间的水下海豚研究项目,聚焦于巴哈马一群野生大西洋斑点海豚(Stenella frontalis),跨代研究它们。“在它们的世界,按它们的条件”方法意味着他们在不干扰海豚的情况下收集了大量数据。这包括几十年的水下视频和音频,所有这些都与个体海豚的身份、生活史和行为精心关联。就像拥有一本详细的海豚生活日记。
- 签名哨声,类似于独特的姓名,帮助母海豚和幼海豚团聚。
- 突发脉冲“尖叫声”通常伴随着海豚的争执。
- 咔嗒“嗡嗡声”常在求偶或追逐鲨鱼时听到。
了解涉及的个体海豚是准确解读的关键。这种长期观察的最终目标是解码这些自然声音序列的结构和潜在含义,寻找可能暗示某种语言形式的模式和规则。这种对自然沟通的深入分析是 WDP 研究的基础,并为人工智能分析提供了关键背景。
介绍 DolphinGemma
分析海豚自然、复杂的沟通绝非易事,WDP 广泛的标记数据集为人工智能创新提供了宝贵机会。由此诞生了 Google 创造的 DolphinGemma,它利用了特定的音频技术。SoundStream 分词器有效地捕捉海豚的声音,然后由专为复杂序列设计的模型处理。这个约4亿参数的模型大小适中,适合 WDP 在实地使用的 Pixel 手机运行。
本季,WDP 正在实地推出 DolphinGemma,短期内将带来显著的好处。通过识别重复的声音模式、集群和可靠序列,该模型可以帮助研究人员发现海豚自然沟通中隐藏的结构和潜在含义——这项工作此前需要大量人力。未来,这些模式结合研究人员为代表海豚喜欢的物体创建的合成声音,可能为共享词汇和互动沟通铺平道路。
使用 Pixel 手机聆听和分析海豚声音
除了分析自然沟通外,WDP 还在探索另一条途径:在海洋中使用技术进行潜在的双向互动。这促成了与佐治亚理工学院合作开发的 CHAT(Cetacean Hearing Augmentation Telemetry)系统。CHAT 是一个水下计算机,旨在不是解码海豚复杂的自然语言,而是建立一个更简单的共享词汇。
其理念是将新颖的、由 CHAT 生成的合成哨声(区别于自然海豚声音)与海豚感兴趣的特定物体(如马尾藻、海草或研究人员使用的围巾)关联起来。通过向彼此展示系统,研究人员希望好奇的海豚会学会模仿这些哨声以请求这些物品。随着对海豚自然声音的理解加深,这些也可以融入系统。
- 在海洋噪音中准确听到模仿的声音。
- 实时识别被模仿的哨声。
- 通过水下工作的骨传导耳机通知研究人员海豚“请求”的物体。
- 允许研究人员快速回应,提供正确的物体,强化这种联系。
Google Pixel 6 之前已能实时处理海豚声音的高保真分析。下一代将聚焦于 Google Pixel 9(计划于2025年夏季进行研究),通过集成扬声器/麦克风功能并利用手机的先进处理能力,同时运行深度学习模型和模板匹配算法。
与研究社区分享 DolphinGemma
认识到科学发现中协作的重要性,我们计划在今年夏天将 DolphinGemma 作为开放模型分享。尽管它是在大西洋斑点海豚的声音上训练的,但我们相信它对研究其他鲸类物种(如宽吻海豚或飞旋海豚)的学者可能也有用。不同物种的发声可能需要一些微调,但开放模型允许这种适应。
通过提供像 DolphinGemma 这样的工具,我们旨在为全球研究人员提供分析他们自己的声学数据集的手段,加速模式搜索,共同增强我们对这些智能海洋哺乳动物的理解。
理解海豚沟通的旅程漫长而曲折,但 WDP 的专注实地研究、佐治亚理工学院的工程实力和 Google 的技术力量相结合,正在开启激动人心的新可能性。我们不再只是聆听;我们开始理解声音中的模式,为未来人类与海豚沟通的差距可能进一步缩小的舞台奠定了基础。
您可以在野外海豚项目的网站上深入了解更多信息。



Finalmente estamos mais perto de conversar com golfinhos! 🐬 Mas será que eles vão gostar das nossas piadas? Imagina um golfinho rindo dos nossos memes aquáticos... Jason Warner tem razão, melhor focar em apps legais assim do que reinventar modelos gigantes.




Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬




This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!




GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓




구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓




Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓












