O Google AI ajuda a decodificar a comunicação de golfinhos com o Dolphingemma

Há décadas, cientistas estão fascinados pelos estalidos, assobios e pulsos explosivos dos golfinhos, tentando decifrar o código de sua complexa comunicação. Imagine se pudéssemos não apenas escutar essas conversas marinhas, mas também decifrar seus padrões o suficiente para criar nossas próprias respostas semelhantes às dos golfinhos. Esse sonho está cada vez mais próximo da realidade, e no Dia Nacional do Golfinho, o Google, em parceria com pesquisadores do Georgia Tech e o trabalho de campo do Wild Dolphin Project (WDP), está empolgado em compartilhar atualizações emocionantes sobre o DolphinGemma. Este modelo de IA inovador é treinado para captar as nuances das vocalizações dos golfinhos e até gerar novas sequências sonoras, expandindo os limites da IA e nosso potencial para nos conectarmos com os habitantes do oceano.
Décadas de Pesquisa sobre a Sociedade dos Golfinhos
Compreender qualquer espécie não é uma tarefa fácil; exige um mergulho profundo em seu mundo. É aí que entra o WDP. Desde 1985, eles conduzem o mais longo projeto de pesquisa subaquática com golfinhos, focando em uma comunidade de golfinhos-pintados-do-Atlântico (Stenella frontalis) nas Bahamas, estudando-os ao longo de gerações. Sua abordagem "No Mundo Deles, em Seus Termos" significa que eles coletam uma riqueza de dados sem perturbar os golfinhos. Isso inclui décadas de vídeos e áudios subaquáticos, todos meticulosamente vinculados a identidades individuais dos golfinhos, histórias de vida e comportamentos. É como ter um diário detalhado da vida dos golfinhos.
Um grupo de golfinhos-pintados-do-Atlântico, Stenella frontalis
O foco principal do WDP é observar e analisar a comunicação natural e as interações sociais dos golfinhos. Trabalhando debaixo d'água, os pesquisadores podem conectar diretamente os sons a comportamentos específicos de uma maneira que observações na superfície não conseguem. Eles passaram anos correlacionando diferentes tipos de sons com contextos comportamentais. Por exemplo:
- Assobios característicos, que funcionam como nomes únicos, ajudam mães e filhotes a se reunirem.
- "Squawks" de pulso explosivo frequentemente acompanham disputas entre golfinhos.
- "Buzzes" de estalidos são comumente ouvidos durante o cortejo ou ao perseguir tubarões.
Conhecer os golfinhos individualmente é fundamental para uma interpretação precisa. O objetivo final dessa observação de longo prazo é decodificar a estrutura e os possíveis significados dentro dessas sequências sonoras naturais, buscando padrões e regras que possam sugerir uma forma de linguagem. Essa rica análise da comunicação natural é a base da pesquisa do WDP e fornece um contexto crucial para a análise de IA.
Esquerda: Uma mãe golfinho-pintado observa seu filhote enquanto forrageia. Ela usará seu assobio característico único para chamá-lo de volta quando ele terminar. Direita: Um espectrograma mostrando o assobio.
Apresentando o DolphinGemma
Analisar a comunicação natural e complexa dos golfinhos não é tarefa fácil, e o extenso conjunto de dados rotulados do WDP oferece uma oportunidade única para a inovação em IA. Apresentamos o DolphinGemma, uma criação do Google que utiliza tecnologias de áudio específicas. O tokenizador SoundStream captura eficazmente os sons dos golfinhos, que são então processados por um modelo projetado para sequências intricadas. Este modelo de ~400M parâmetros é do tamanho ideal para rodar nos telefones Pixel usados pelo WDP no campo.
Esquerda: Assobios e pulsos explosivos gerados durante os primeiros testes do DolphinGemma.
O DolphinGemma se inspira no Gemma, a suíte de modelos abertos leves e de ponta do Google, que compartilham a mesma pesquisa e tecnologia dos modelos Gemini. Treinado no banco de dados acústico do WDP de golfinhos-pintados-do-Atlântico selvagens, o DolphinGemma opera como um modelo de entrada e saída de áudio. Ele processa sequências de sons naturais de golfinhos para identificar padrões, estruturas e, por fim, prever os próximos sons prováveis em uma sequência, semelhante a como modelos de linguagem humana preveem a próxima palavra.
Nesta temporada, o WDP está implementando o DolphinGemma no campo, com benefícios imediatos no horizonte. Ao identificar padrões sonoros recorrentes, agrupamentos e sequências confiáveis, o modelo pode ajudar os pesquisadores a descobrir estruturas ocultas e possíveis significados na comunicação natural dos golfinhos — trabalho que anteriormente exigia um esforço humano enorme. A longo prazo, esses padrões, combinados com sons sintéticos criados por pesquisadores para representar objetos que os golfinhos apreciam, podem abrir caminho para um vocabulário compartilhado e uma comunicação interativa.
Usando Telefones Pixel para Ouvir e Analisar Sons de Golfinhos
Além de analisar a comunicação natural, o WDP também está explorando uma outra abordagem: a interação bidirecional em potencial usando tecnologia no oceano. Isso levou ao desenvolvimento do sistema CHAT (Cetacean Hearing Augmentation Telemetry), em colaboração com o Georgia Institute of Technology. O CHAT é um computador subaquático projetado não para decodificar a complexa linguagem natural dos golfinhos, mas para estabelecer um vocabulário compartilhado mais simples.
A ideia é vincular assobios sintéticos novos (gerados pelo CHAT, distintos dos sons naturais dos golfinhos) a objetos específicos que os golfinhos acham interessantes, como sargaço, ervas marinhas ou lenços usados pelos pesquisadores. Ao demonstrar o sistema uns aos outros, os pesquisadores esperam que os golfinhos curiosos aprendam a imitar esses assobios para solicitar esses itens. À medida que o entendimento dos sons naturais dos golfinhos cresce, esses também podem ser incorporados ao sistema.
Para possibilitar a interação bidirecional, o sistema CHAT deve:
- Ouvir a imitação com precisão em meio ao ruído do oceano.
- Identificar qual assobio foi imitado em tempo real.
- Informar o pesquisador (via fones de ouvido de condução óssea que funcionam debaixo d'água) qual objeto o golfinho "solicitou".
- Permitir que o pesquisador responda rapidamente oferecendo o objeto correto, reforçando a conexão.
Um Google Pixel 6 anteriormente lidava com a análise de alta fidelidade dos sons dos golfinhos em tempo real. A próxima geração, focando em um Google Pixel 9 (pesquisa planejada para o verão de 2025), se baseará nisso integrando funções de alto-falante/microfone e usando o processamento avançado do telefone para executar simultaneamente modelos de aprendizado profundo e algoritmos de correspondência de padrões.
Esquerda: Dra. Denise Herzing usando "Chat Senior, 2012", Direita: Estudante de doutorado do Georgia Tech, Charles Ramey, usando "Chat Junior, 2025"
Usar smartphones Pixel reduz significativamente a necessidade de hardware personalizado, aumenta a manutenibilidade do sistema, reduz o consumo de energia e diminui o custo e o tamanho do dispositivo — vantagens importantes para a pesquisa de campo em alto-mar. Enquanto isso, as capacidades preditivas do DolphinGemma podem ajudar o CHAT a antecipar e identificar possíveis imitações mais cedo na sequência de vocalização, acelerando as respostas dos pesquisadores aos golfinhos e tornando as interações mais suaves e reforçadoras.
Um Google Pixel 9 dentro do hardware do sistema CHAT mais recente.
Compartilhando o DolphinGemma com a Comunidade de Pesquisa
Compreendendo a importância da colaboração na descoberta científica, estamos prontos para compartilhar o DolphinGemma como um modelo aberto neste verão. Embora treinado com sons magni de golfinhos-pintados-do-Atlântico, acreditamos que ele pode ser útil para pesquisadores que estudam outras espécies de cetáceos, como golfinhos-nariz-de-garrafa ou golfinhos-rotadores. Algum ajuste fino pode ser necessário para as vocalizações de diferentes espécies, mas o modelo aberto permite esse tipo de adaptação.
Ao disponibilizar ferramentas como o DolphinGemma, nosso objetivo é equipar pesquisadores em todo o mundo com os meios para analisar seus próprios conjuntos de dados acústicos, acelerar a busca por padrões e, coletivamente, aprimorar nosso entendimento desses mamíferos marinhos inteligentes.
A jornada para entender a comunicação dos golfinhos é longa e sinuosa, mas os esforços combinados da pesquisa de campo dedicada do WDP, a expertise em engenharia do Georgia Tech e a força tecnológica do Google estão abrindo novas possibilidades empolgantes. Não estamos apenas ouvindo mais; estamos começando a entender os padrões dentro dos sons, preparando o cenário para um futuro onde a lacuna entre a comunicação humana e a dos golfinhos pode se estreitar um pouco mais.
Você pode explorar mais profundamente o Wild Dolphin Project em seu site.
Artigo relacionado
Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot
A Salesforce lançou uma nova estratégia de IA para o local de trabalho, introduzindo “companheiros digitais” especializados integrados às conversas do Slack, revelou a empresa na segunda-feira.A nova
Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas
A Oracle planeja investir aproximadamente US$ 40 bilhões em chips Nvidia para alimentar um grande novo centro de dados no Texas, desenvolvido pela OpenAI, conforme relatado pelo Financial Times. Este
Aplicativo Meta AI Introduzirá Nível Premium e Anúncios
O aplicativo de IA da Meta pode em breve apresentar uma assinatura paga, seguindo o exemplo de concorrentes como OpenAI, Google e Microsoft. Durante uma teleconferência de resultados do primeiro trime
Comentários (7)
0/200
NoahSmith
2 de Agosto de 2025 à14 16:07:14 WEST
Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬
0
AlbertMartínez
28 de Julho de 2025 à5 02:19:05 WEST
This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!
0
WalterWalker
20 de Abril de 2025 à10 16:04:10 WEST
GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓
0
GeorgeJones
20 de Abril de 2025 à27 06:34:27 WEST
구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓
0
JonathanLewis
20 de Abril de 2025 à47 04:35:47 WEST
Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓
0
JackPerez
20 de Abril de 2025 à15 02:33:15 WEST
A inteligência artificial do Google ajudando na comunicação dos golfinhos? Isso é loucura! Estou totalmente a favor de entender melhor essas criaturas inteligentes. Mas será que podemos realmente criar nossas próprias mensagens semelhantes às dos golfinhos? Parece ficção científica, mas estou dentro. 🐬🤓
0
Há décadas, cientistas estão fascinados pelos estalidos, assobios e pulsos explosivos dos golfinhos, tentando decifrar o código de sua complexa comunicação. Imagine se pudéssemos não apenas escutar essas conversas marinhas, mas também decifrar seus padrões o suficiente para criar nossas próprias respostas semelhantes às dos golfinhos. Esse sonho está cada vez mais próximo da realidade, e no Dia Nacional do Golfinho, o Google, em parceria com pesquisadores do Georgia Tech e o trabalho de campo do Wild Dolphin Project (WDP), está empolgado em compartilhar atualizações emocionantes sobre o DolphinGemma. Este modelo de IA inovador é treinado para captar as nuances das vocalizações dos golfinhos e até gerar novas sequências sonoras, expandindo os limites da IA e nosso potencial para nos conectarmos com os habitantes do oceano.
Décadas de Pesquisa sobre a Sociedade dos Golfinhos
Compreender qualquer espécie não é uma tarefa fácil; exige um mergulho profundo em seu mundo. É aí que entra o WDP. Desde 1985, eles conduzem o mais longo projeto de pesquisa subaquática com golfinhos, focando em uma comunidade de golfinhos-pintados-do-Atlântico (Stenella frontalis) nas Bahamas, estudando-os ao longo de gerações. Sua abordagem "No Mundo Deles, em Seus Termos" significa que eles coletam uma riqueza de dados sem perturbar os golfinhos. Isso inclui décadas de vídeos e áudios subaquáticos, todos meticulosamente vinculados a identidades individuais dos golfinhos, histórias de vida e comportamentos. É como ter um diário detalhado da vida dos golfinhos.
- Assobios característicos, que funcionam como nomes únicos, ajudam mães e filhotes a se reunirem.
- "Squawks" de pulso explosivo frequentemente acompanham disputas entre golfinhos.
- "Buzzes" de estalidos são comumente ouvidos durante o cortejo ou ao perseguir tubarões.
Conhecer os golfinhos individualmente é fundamental para uma interpretação precisa. O objetivo final dessa observação de longo prazo é decodificar a estrutura e os possíveis significados dentro dessas sequências sonoras naturais, buscando padrões e regras que possam sugerir uma forma de linguagem. Essa rica análise da comunicação natural é a base da pesquisa do WDP e fornece um contexto crucial para a análise de IA.
Apresentando o DolphinGemma
Analisar a comunicação natural e complexa dos golfinhos não é tarefa fácil, e o extenso conjunto de dados rotulados do WDP oferece uma oportunidade única para a inovação em IA. Apresentamos o DolphinGemma, uma criação do Google que utiliza tecnologias de áudio específicas. O tokenizador SoundStream captura eficazmente os sons dos golfinhos, que são então processados por um modelo projetado para sequências intricadas. Este modelo de ~400M parâmetros é do tamanho ideal para rodar nos telefones Pixel usados pelo WDP no campo.
Nesta temporada, o WDP está implementando o DolphinGemma no campo, com benefícios imediatos no horizonte. Ao identificar padrões sonoros recorrentes, agrupamentos e sequências confiáveis, o modelo pode ajudar os pesquisadores a descobrir estruturas ocultas e possíveis significados na comunicação natural dos golfinhos — trabalho que anteriormente exigia um esforço humano enorme. A longo prazo, esses padrões, combinados com sons sintéticos criados por pesquisadores para representar objetos que os golfinhos apreciam, podem abrir caminho para um vocabulário compartilhado e uma comunicação interativa.
Usando Telefones Pixel para Ouvir e Analisar Sons de Golfinhos
Além de analisar a comunicação natural, o WDP também está explorando uma outra abordagem: a interação bidirecional em potencial usando tecnologia no oceano. Isso levou ao desenvolvimento do sistema CHAT (Cetacean Hearing Augmentation Telemetry), em colaboração com o Georgia Institute of Technology. O CHAT é um computador subaquático projetado não para decodificar a complexa linguagem natural dos golfinhos, mas para estabelecer um vocabulário compartilhado mais simples.
A ideia é vincular assobios sintéticos novos (gerados pelo CHAT, distintos dos sons naturais dos golfinhos) a objetos específicos que os golfinhos acham interessantes, como sargaço, ervas marinhas ou lenços usados pelos pesquisadores. Ao demonstrar o sistema uns aos outros, os pesquisadores esperam que os golfinhos curiosos aprendam a imitar esses assobios para solicitar esses itens. À medida que o entendimento dos sons naturais dos golfinhos cresce, esses também podem ser incorporados ao sistema.
- Ouvir a imitação com precisão em meio ao ruído do oceano.
- Identificar qual assobio foi imitado em tempo real.
- Informar o pesquisador (via fones de ouvido de condução óssea que funcionam debaixo d'água) qual objeto o golfinho "solicitou".
- Permitir que o pesquisador responda rapidamente oferecendo o objeto correto, reforçando a conexão.
Um Google Pixel 6 anteriormente lidava com a análise de alta fidelidade dos sons dos golfinhos em tempo real. A próxima geração, focando em um Google Pixel 9 (pesquisa planejada para o verão de 2025), se baseará nisso integrando funções de alto-falante/microfone e usando o processamento avançado do telefone para executar simultaneamente modelos de aprendizado profundo e algoritmos de correspondência de padrões.
Compartilhando o DolphinGemma com a Comunidade de Pesquisa
Compreendendo a importância da colaboração na descoberta científica, estamos prontos para compartilhar o DolphinGemma como um modelo aberto neste verão. Embora treinado com sons magni de golfinhos-pintados-do-Atlântico, acreditamos que ele pode ser útil para pesquisadores que estudam outras espécies de cetáceos, como golfinhos-nariz-de-garrafa ou golfinhos-rotadores. Algum ajuste fino pode ser necessário para as vocalizações de diferentes espécies, mas o modelo aberto permite esse tipo de adaptação.
Ao disponibilizar ferramentas como o DolphinGemma, nosso objetivo é equipar pesquisadores em todo o mundo com os meios para analisar seus próprios conjuntos de dados acústicos, acelerar a busca por padrões e, coletivamente, aprimorar nosso entendimento desses mamíferos marinhos inteligentes.
A jornada para entender a comunicação dos golfinhos é longa e sinuosa, mas os esforços combinados da pesquisa de campo dedicada do WDP, a expertise em engenharia do Georgia Tech e a força tecnológica do Google estão abrindo novas possibilidades empolgantes. Não estamos apenas ouvindo mais; estamos começando a entender os padrões dentro dos sons, preparando o cenário para um futuro onde a lacuna entre a comunicação humana e a dos golfinhos pode se estreitar um pouco mais.
Você pode explorar mais profundamente o Wild Dolphin Project em seu site.



Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬




This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!




GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓




구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓




Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓




A inteligência artificial do Google ajudando na comunicação dos golfinhos? Isso é loucura! Estou totalmente a favor de entender melhor essas criaturas inteligentes. Mas será que podemos realmente criar nossas próprias mensagens semelhantes às dos golfinhos? Parece ficção científica, mas estou dentro. 🐬🤓












