选项
首页
新闻
Google AI协助解码海豚与海豚交流

Google AI协助解码海豚与海豚交流

2025-04-19
114

Google AI协助解码海豚与海豚交流

几十年来,科学家们一直被海豚的咔嗒声、哨声和突发脉冲所吸引,试图破解它们复杂沟通的密码。想象一下,如果我们不仅能偷听这些海洋对话,还能深入解读它们的模式,足以创造出类似海豚的回应。这个梦想正逐渐接近现实,在国家海豚日,Google 与佐治亚理工学院的研究人员以及野外海豚项目(WDP)的实地工作合作,兴奋地分享了 DolphinGemma 的激动人心更新。这一突破性的人工智能模型经过训练,能够理解海豚发声的细微差别,甚至生成新颖的声音序列,推动了人工智能的极限以及我们与海洋生物连接的潜力。

海豚社会研究的几十年

了解任何物种都不是一件轻松的事;它需要深入探索它们的世界。这就是 WDP 的作用所在。自1985年以来,他们一直在进行最长时间的水下海豚研究项目,聚焦于巴哈马一群野生大西洋斑点海豚(Stenella frontalis),跨代研究它们。“在它们的世界,按它们的条件”方法意味着他们在不干扰海豚的情况下收集了大量数据。这包括几十年的水下视频和音频,所有这些都与个体海豚的身份、生活史和行为精心关联。就像拥有一本详细的海豚生活日记。

一群大西洋斑点海豚,Stenella frontalis

WDP 的主要焦点是观察和分析海豚的自然沟通和社会互动。通过在水下工作,研究人员能够将声音直接与特定行为联系起来,这是表面观察无法做到的。他们花了多年时间将不同类型的声音与行为情境相关联。例如:

  • 签名哨声,类似于独特的姓名,帮助母海豚和幼海豚团聚。
  • 突发脉冲“尖叫声”通常伴随着海豚的争执。
  • 咔嗒“嗡嗡声”常在求偶或追逐鲨鱼时听到。

了解涉及的个体海豚是准确解读的关键。这种长期观察的最终目标是解码这些自然声音序列的结构和潜在含义,寻找可能暗示某种语言形式的模式和规则。这种对自然沟通的深入分析是 WDP 研究的基础,并为人工智能分析提供了关键背景。

左图:一只母斑点海豚在觅食时观察她的幼崽。她会使用她独特的签名哨声召回幼崽。右图:显示哨声的声谱图。

介绍 DolphinGemma

分析海豚自然、复杂的沟通绝非易事,WDP 广泛的标记数据集为人工智能创新提供了宝贵机会。由此诞生了 Google 创造的 DolphinGemma,它利用了特定的音频技术。SoundStream 分词器有效地捕捉海豚的声音,然后由专为复杂序列设计的模型处理。这个约4亿参数的模型大小适中,适合 WDP 在实地使用的 Pixel 手机运行。

左图:DolphinGemma 早期测试中生成的哨声和突发脉冲。

DolphinGemma 灵感来源于 Google 的 Gemma 系列轻量级尖端开放模型,这些模型与 Gemini 模型共享相同的研究和技术。DolphinGemma 在 WDP 的野生大西洋斑点海豚声学数据库上训练,作为一个音频输入、音频输出的模型。它处理自然海豚声音序列以发现模式、结构,并最终预测序列中可能的下一个声音,类似于人类语言模型预测下一个单词的方式。

本季,WDP 正在实地推出 DolphinGemma,短期内将带来显著的好处。通过识别重复的声音模式、集群和可靠序列,该模型可以帮助研究人员发现海豚自然沟通中隐藏的结构和潜在含义——这项工作此前需要大量人力。未来,这些模式结合研究人员为代表海豚喜欢的物体创建的合成声音,可能为共享词汇和互动沟通铺平道路。

使用 Pixel 手机聆听和分析海豚声音

除了分析自然沟通外,WDP 还在探索另一条途径:在海洋中使用技术进行潜在的双向互动。这促成了与佐治亚理工学院合作开发的 CHAT(Cetacean Hearing Augmentation Telemetry)系统。CHAT 是一个水下计算机,旨在不是解码海豚复杂的自然语言,而是建立一个更简单的共享词汇。

其理念是将新颖的、由 CHAT 生成的合成哨声(区别于自然海豚声音)与海豚感兴趣的特定物体(如马尾藻、海草或研究人员使用的围巾)关联起来。通过向彼此展示系统,研究人员希望好奇的海豚会学会模仿这些哨声以请求这些物品。随着对海豚自然声音的理解加深,这些也可以融入系统。

为实现双向互动,CHAT 系统必须:

  1. 在海洋噪音中准确听到模仿的声音。
  2. 实时识别被模仿的哨声。
  3. 通过水下工作的骨传导耳机通知研究人员海豚“请求”的物体。
  4. 允许研究人员快速回应,提供正确的物体,强化这种联系。

Google Pixel 6 之前已能实时处理海豚声音的高保真分析。下一代将聚焦于 Google Pixel 9(计划于2025年夏季进行研究),通过集成扬声器/麦克风功能并利用手机的先进处理能力,同时运行深度学习模型和模板匹配算法。

左图:Denise Herzing 博士佩戴“Chat Senior, 2012”,右图:佐治亚理工学院博士生 Charles Ramey 佩戴“Chat Junior, 2025”

使用 Pixel 智能手机大大减少了对定制硬件的需求,提高了系统可维护性,降低了功耗,并缩小了设备的成本和尺寸——这些是在开放海洋中进行实地研究的关键优势。同时,DolphinGemma 的预测能力可以帮助 CHAT 在发声序列早期预测和识别潜在的模仿,加快研究人员对海豚的响应,使互动更顺畅、更具强化性。

最新 CHAT 系统硬件内的 Google Pixel 9。

与研究社区分享 DolphinGemma

认识到科学发现中协作的重要性,我们计划在今年夏天将 DolphinGemma 作为开放模型分享。尽管它是在大西洋斑点海豚的声音上训练的,但我们相信它对研究其他鲸类物种(如宽吻海豚或飞旋海豚)的学者可能也有用。不同物种的发声可能需要一些微调,但开放模型允许这种适应。

通过提供像 DolphinGemma 这样的工具,我们旨在为全球研究人员提供分析他们自己的声学数据集的手段,加速模式搜索,共同增强我们对这些智能海洋哺乳动物的理解。

理解海豚沟通的旅程漫长而曲折,但 WDP 的专注实地研究、佐治亚理工学院的工程实力和 Google 的技术力量相结合,正在开启激动人心的新可能性。我们不再只是聆听;我们开始理解声音中的模式,为未来人类与海豚沟通的差距可能进一步缩小的舞台奠定了基础。

您可以在野外海豚项目的网站上深入了解更多信息。

相关文章
Salesforce发布Slack AI数字队友对抗Microsoft Copilot Salesforce发布Slack AI数字队友对抗Microsoft Copilot Salesforce推出全新职场AI策略,在Slack对话中引入专业“数字队友”,公司于周一公布。新工具Agentforce in Slack使企业能够创建和部署任务特定AI代理,搜索职场聊天,访问公司数据,并在员工日常使用的消息平台内执行操作。“正如专业员工协作解决问题,我们的客户需要AI代理协同工作,为客户和员工解决问题,”Salesforce Slack首席产品官Rob Seaman在Ven
甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 据《金融时报》报道,甲骨文计划投资约400亿美元购买英伟达芯片,为OpenAI在德克萨斯州开发的大型新数据中心提供动力。这是迄今为止最大的芯片收购交易之一,凸显了对AI计算资源激增的需求。该设施位于德克萨斯州阿比林,是美国首个“星门”数据中心。由OpenAI和软银支持,这是构建大规模AI基础设施的更广泛计划的一部分。该德克萨斯中心计划于明年完工,将提供1.2吉瓦的计算能力,使其跻身全球最大数据中心
Meta AI应用将引入高级订阅和广告 Meta AI应用将引入高级订阅和广告 Meta的AI应用可能很快推出付费订阅服务,效仿OpenAI、Google和Microsoft等竞争对手的做法。在2025年第一季度财报电话会议上,Meta首席执行官马克·扎克伯格概述了高级服务的计划,使用户能够访问增强的计算能力或Meta AI的额外功能。为了与ChatGPT竞争,Meta本周推出了一款独立AI应用,允许用户直接与聊天机器人互动并进行图像生成。该聊天机器人目前拥有近10亿用户,此
评论 (7)
0/200
NoahSmith
NoahSmith 2025-08-02 23:07:14

Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬

AlbertMartínez
AlbertMartínez 2025-07-28 09:19:05

This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!

WalterWalker
WalterWalker 2025-04-20 23:04:10

GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓

GeorgeJones
GeorgeJones 2025-04-20 13:34:27

구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓

JonathanLewis
JonathanLewis 2025-04-20 11:35:47

Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓

JackPerez
JackPerez 2025-04-20 09:33:15

A inteligência artificial do Google ajudando na comunicação dos golfinhos? Isso é loucura! Estou totalmente a favor de entender melhor essas criaturas inteligentes. Mas será que podemos realmente criar nossas próprias mensagens semelhantes às dos golfinhos? Parece ficção científica, mas estou dentro. 🐬🤓

返回顶部
OR