谷歌人工智能解码海豚的交流模式
海豚因其智慧、复杂的社会结构和复杂的交流方式而闻名于世。几十年来,一个引人入胜的问题一直吸引着科学家和爱好者:海豚是否拥有与人类相媲美的语言?人工智能(AI)的最新进展为研究这一谜团提供了强大的新工具。谷歌与野生海豚项目(WDP)合作创建了 DolphinGemma,这是一个专门用于解码海豚发声的人工智能模型。这项创新不仅有望解读海豚的交流,还有可能为与这些非凡的海洋哺乳动物进行双向对话奠定基础。
人工智能如何解译海豚发声
海豚通过 "咔嗒"、"口哨 "和肢体动作等丰富的声音进行交流。这些声音的音调和强度各不相同,在狩猎、求偶或群体互动等社会环境中似乎传达着不同的含义。尽管进行了广泛的研究,但这些信号的完整词汇仍然难以捉摸。传统的观察和分析技术往往被大量的声学数据所淹没,从而限制了更深入的理解。
人工智能通过应用机器学习和自然语言处理(NLP)来筛选大量的海豚声音数据集,从而解决了这一瓶颈问题。这些算法可以检测出人类听不到的发声中的微妙模式和关联。人工智能系统可以对不同的声音类型进行分类,分析它们的声学特性,并将特定的叫声与行为或情感背景联系起来。例如,研究表明,某些口哨声与社交关系有关,而点击声则主要用于导航和回声定位。
虽然人工智能潜力巨大,但从野生海豚群中收集和处理足够的数据以及训练如此大规模的模型仍存在巨大障碍。为了解决这些问题,谷歌和世界海豚研究计划共同开发了 DolphinGemma,这是一种专门用于海豚交流分析的人工智能模型。经过大量数据集的训练,该模型能够识别海豚发声中的复杂结构。
DolphinGemma 模型的内部结构
DolphinGemma 建立在谷歌 Gemma 的基础上,Gemma 是一个开源的生成式人工智能框架,拥有大约 4 亿个参数。其目的是学习海豚声音的结构,并生成新颖、合理的序列。该模型是与世界海豚研究计划(WDP)和佐治亚理工学院(Georgia Tech)合作开发的,以 1985 年以来记录的大西洋斑纹海豚发声的长期数据集为基础进行训练。利用谷歌的 SoundStream 技术对音频进行标记,DolphinGemma 可以预测序列中下一个可能的声音。与语言模型生成文本的方式类似,它可以预测海豚可能发出的声音,帮助识别可能反映语法规则或句法的模式。
该模型甚至可以合成新的、类似海豚音的音频,类似于完成一个句子的预测文本。这种能力可能有助于揭示海豚交流的管理规则,并为海豚的叫声是否构成结构化语言提供线索。
DolphinGemma 的实际应用
DolphinGemma 的一个主要优势是高效,可以在谷歌 Pixel 智能手机等设备上实时运行。其轻巧的设计无需昂贵的专用硬件。研究人员现在可以直接在现场录制海豚的声音,并使用手机即时分析,从而大大提高了可访问性,降低了研究费用。
此外,DolphinGemma 还集成到了 CHAT(鲸类听力增强遥测)系统中。这样,科学家就可以播放人工智能生成的类似海豚的声音,并观察动物的反应。这一互动环路是开发共享词汇、实现人类与海豚之间真正双向交流的关键一步。
更广泛的影响和谷歌的路线图
DolphinGemma 的诞生意义重大,它超越了海豚交流的范畴,推动了更广泛的动物认知研究。对发声进行解码可以深入了解海豚的社会动态、优先事项和内部思维过程。这种了解可以通过明确海豚的需求和关注点来加强保护策略,同时还能扩大我们对动物智力和知觉的了解。
DolphinGemma 是利用人工智能探索动物交流这一日益增长的趋势的一部分,与此同时,研究重点还包括乌鸦、鲸鱼和猫鼬等物种。谷歌打算在 2025 年夏季将 DolphinGemma 作为一个开放模型向全球研究界发布,旨在通过进一步的微调,使其适用于其他鲸目动物,例如瓶鼻海豚或飞旋海豚。这一开源战略将促进全球范围内的合作。谷歌还计划在即将到来的研究季节进行实地测试,这有望加深我们对大西洋斑纹海豚的了解。
障碍与科学争论
尽管 DolphinGemma 前景广阔,但它也面临着一些挑战。海洋录音经常受到环境噪音的污染,使声音分析变得复杂。项目研究员、佐治亚理工学院的泰德-斯塔纳(Thad Starner)指出,大部分数据包括海洋背景声音,因此需要先进的过滤技术。一些科学家还在争论海豚的交流是否称得上是一种真正的语言。例如,动物学家阿里克-克申鲍姆(Arik Kershenbaum)提出,海豚的发声可能是一种较简单的信号系统,缺乏人类语言的复杂性。苏塞克斯海豚项目主任西娅-泰勒(Thea Taylor)则提醒人们注意无意中训练海豚人工模仿声音的风险。这些观点强调了对人工智能研究结果进行严格验证和仔细解释的必要性。
结论
谷歌对海豚交流的人工智能驱动探索是朝着揭示这些智能生物如何与彼此和它们的世界互动迈出的变革性一步。通过利用人工智能,研究人员发现了海豚声音中隐藏的模式,为了解海豚的交流世界提供了前所未有的见解。尽管问题和技术挑战依然存在,但所取得的进展凸显了人工智能在动物行为科学领域的巨大潜力。随着这项研究的不断发展,它可能会开启保护、认知研究和未来物种间互动的新领域。
相关文章
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
Suno领投方:删除帖子无法填补版权诉讼的漏洞
备受瞩目的AI音乐生成平台Suno正面临一场艰难的版权诉讼,而其领投投资人的坦率言论,可能恰恰为对方提供了他们梦寐以求的证据。 Menlo Ventures(Suno的核心投资者)合伙人C.C. Gong近日删除了一个推文,该推文与公司当前的法律辩护策略直接相悖。在之前的版权诉讼中,Suno的辩护主要依赖“合理使用”的论点,声称AI生成的音乐仅仅是一种“工具”,既不会直接与受版权保护的原创作品竞争
Claude Opus 4.7 正式发布,将可靠性置于智能之上
Anthropic 今年保持着激进的开发节奏,几乎每隔一天就会推出新功能。备受期待的 Claude Opus 4.7 刚刚正式发布,有趣的是,Anthropic 在公告中直言不讳地表示:“这并非我们最强大的模型。” 传闻中更强大的 Claude Mythos Preview 仍处于待命状态。尽管如此,Opus 4.7 依然引发了广泛关注,因为它致力于解决“更可靠”而非“更智能”的问题。基准测试结果
相关专题推荐
评论 (1)
0/500
海豚因其智慧、复杂的社会结构和复杂的交流方式而闻名于世。几十年来,一个引人入胜的问题一直吸引着科学家和爱好者:海豚是否拥有与人类相媲美的语言?人工智能(AI)的最新进展为研究这一谜团提供了强大的新工具。谷歌与野生海豚项目(WDP)合作创建了 DolphinGemma,这是一个专门用于解码海豚发声的人工智能模型。这项创新不仅有望解读海豚的交流,还有可能为与这些非凡的海洋哺乳动物进行双向对话奠定基础。
人工智能如何解译海豚发声
海豚通过 "咔嗒"、"口哨 "和肢体动作等丰富的声音进行交流。这些声音的音调和强度各不相同,在狩猎、求偶或群体互动等社会环境中似乎传达着不同的含义。尽管进行了广泛的研究,但这些信号的完整词汇仍然难以捉摸。传统的观察和分析技术往往被大量的声学数据所淹没,从而限制了更深入的理解。
人工智能通过应用机器学习和自然语言处理(NLP)来筛选大量的海豚声音数据集,从而解决了这一瓶颈问题。这些算法可以检测出人类听不到的发声中的微妙模式和关联。人工智能系统可以对不同的声音类型进行分类,分析它们的声学特性,并将特定的叫声与行为或情感背景联系起来。例如,研究表明,某些口哨声与社交关系有关,而点击声则主要用于导航和回声定位。
虽然人工智能潜力巨大,但从野生海豚群中收集和处理足够的数据以及训练如此大规模的模型仍存在巨大障碍。为了解决这些问题,谷歌和世界海豚研究计划共同开发了 DolphinGemma,这是一种专门用于海豚交流分析的人工智能模型。经过大量数据集的训练,该模型能够识别海豚发声中的复杂结构。
DolphinGemma 模型的内部结构
DolphinGemma 建立在谷歌 Gemma 的基础上,Gemma 是一个开源的生成式人工智能框架,拥有大约 4 亿个参数。其目的是学习海豚声音的结构,并生成新颖、合理的序列。该模型是与世界海豚研究计划(WDP)和佐治亚理工学院(Georgia Tech)合作开发的,以 1985 年以来记录的大西洋斑纹海豚发声的长期数据集为基础进行训练。利用谷歌的 SoundStream 技术对音频进行标记,DolphinGemma 可以预测序列中下一个可能的声音。与语言模型生成文本的方式类似,它可以预测海豚可能发出的声音,帮助识别可能反映语法规则或句法的模式。
该模型甚至可以合成新的、类似海豚音的音频,类似于完成一个句子的预测文本。这种能力可能有助于揭示海豚交流的管理规则,并为海豚的叫声是否构成结构化语言提供线索。
DolphinGemma 的实际应用
DolphinGemma 的一个主要优势是高效,可以在谷歌 Pixel 智能手机等设备上实时运行。其轻巧的设计无需昂贵的专用硬件。研究人员现在可以直接在现场录制海豚的声音,并使用手机即时分析,从而大大提高了可访问性,降低了研究费用。
此外,DolphinGemma 还集成到了 CHAT(鲸类听力增强遥测)系统中。这样,科学家就可以播放人工智能生成的类似海豚的声音,并观察动物的反应。这一互动环路是开发共享词汇、实现人类与海豚之间真正双向交流的关键一步。
更广泛的影响和谷歌的路线图
DolphinGemma 的诞生意义重大,它超越了海豚交流的范畴,推动了更广泛的动物认知研究。对发声进行解码可以深入了解海豚的社会动态、优先事项和内部思维过程。这种了解可以通过明确海豚的需求和关注点来加强保护策略,同时还能扩大我们对动物智力和知觉的了解。
DolphinGemma 是利用人工智能探索动物交流这一日益增长的趋势的一部分,与此同时,研究重点还包括乌鸦、鲸鱼和猫鼬等物种。谷歌打算在 2025 年夏季将 DolphinGemma 作为一个开放模型向全球研究界发布,旨在通过进一步的微调,使其适用于其他鲸目动物,例如瓶鼻海豚或飞旋海豚。这一开源战略将促进全球范围内的合作。谷歌还计划在即将到来的研究季节进行实地测试,这有望加深我们对大西洋斑纹海豚的了解。
障碍与科学争论
尽管 DolphinGemma 前景广阔,但它也面临着一些挑战。海洋录音经常受到环境噪音的污染,使声音分析变得复杂。项目研究员、佐治亚理工学院的泰德-斯塔纳(Thad Starner)指出,大部分数据包括海洋背景声音,因此需要先进的过滤技术。一些科学家还在争论海豚的交流是否称得上是一种真正的语言。例如,动物学家阿里克-克申鲍姆(Arik Kershenbaum)提出,海豚的发声可能是一种较简单的信号系统,缺乏人类语言的复杂性。苏塞克斯海豚项目主任西娅-泰勒(Thea Taylor)则提醒人们注意无意中训练海豚人工模仿声音的风险。这些观点强调了对人工智能研究结果进行严格验证和仔细解释的必要性。
结论
谷歌对海豚交流的人工智能驱动探索是朝着揭示这些智能生物如何与彼此和它们的世界互动迈出的变革性一步。通过利用人工智能,研究人员发现了海豚声音中隐藏的模式,为了解海豚的交流世界提供了前所未有的见解。尽管问题和技术挑战依然存在,但所取得的进展凸显了人工智能在动物行为科学领域的巨大潜力。随着这项研究的不断发展,它可能会开启保护、认知研究和未来物种间互动的新领域。
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
Suno领投方:删除帖子无法填补版权诉讼的漏洞
备受瞩目的AI音乐生成平台Suno正面临一场艰难的版权诉讼,而其领投投资人的坦率言论,可能恰恰为对方提供了他们梦寐以求的证据。 Menlo Ventures(Suno的核心投资者)合伙人C.C. Gong近日删除了一个推文,该推文与公司当前的法律辩护策略直接相悖。在之前的版权诉讼中,Suno的辩护主要依赖“合理使用”的论点,声称AI生成的音乐仅仅是一种“工具”,既不会直接与受版权保护的原创作品竞争
Claude Opus 4.7 正式发布,将可靠性置于智能之上
Anthropic 今年保持着激进的开发节奏,几乎每隔一天就会推出新功能。备受期待的 Claude Opus 4.7 刚刚正式发布,有趣的是,Anthropic 在公告中直言不讳地表示:“这并非我们最强大的模型。” 传闻中更强大的 Claude Mythos Preview 仍处于待命状态。尽管如此,Opus 4.7 依然引发了广泛关注,因为它致力于解决“更可靠”而非“更智能”的问题。基准测试结果





首页






