opción
Hogar
Noticias
Google AI ayuda a decodificar la comunicación de los delfines con Dolphingemma

Google AI ayuda a decodificar la comunicación de los delfines con Dolphingemma

19 de abril de 2025
114

Google AI ayuda a decodificar la comunicación de los delfines con Dolphingemma

Durante décadas, los científicos han estado fascinados por los chasquidos, silbidos y pulsos explosivos de los delfines, intentando descifrar el código de su intrincada comunicación. Imagina si no solo pudiéramos escuchar estas conversaciones marinas, sino también descifrar sus patrones lo suficientemente bien como para crear nuestras propias respuestas similares a las de los delfines. Este sueño está cada vez más cerca de la realidad, y en el Día Nacional del Delfín, Google, en colaboración con investigadores de Georgia Tech y el trabajo de campo del Wild Dolphin Project (WDP), está emocionado de compartir actualizaciones emocionantes sobre DolphinGemma. Este modelo de IA innovador está entrenado para captar los matices de las vocalizaciones de los delfines e incluso generar nuevas secuencias de sonidos, empujando los límites de la IA y nuestro potencial para conectar con los habitantes del océano.

Décadas de Investigación sobre la Sociedad de los Delfines

Entender cualquier especie no es tarea fácil; requiere una inmersión profunda en su mundo. Ahí es donde entra el WDP. Desde 1985, han estado llevando a cabo el proyecto de investigación submarina de delfines más largo, enfocándose en una comunidad de delfines moteados del Atlántico (Stenella frontalis) en las Bahamas, estudiándolos a través de generaciones. Su enfoque "En Su Mundo, en Sus Términos" significa que recopilan una gran cantidad de datos sin perturbar a los delfines. Esto incluye décadas de videos y audios submarinos, todos meticulosamente vinculados a las identidades, historias de vida y comportamientos de los delfines individuales. Es como tener un diario detallado de la vida de los delfines.

Un grupo de delfines moteados del Atlántico, Stenella frontalis

El enfoque principal del WDP es observar y analizar la comunicación natural y las interacciones sociales de los delfines. Al trabajar bajo el agua, los investigadores pueden conectar directamente los sonidos con comportamientos específicos de una manera que las observaciones en la superficie no pueden. Han pasado años correlacionando diferentes tipos de sonidos con contextos conductuales. Por ejemplo:

  • Los silbidos distintivos, que funcionan como nombres únicos, ayudan a las madres y sus crías a reunirse.
  • Los "graznidos" de pulso explosivo a menudo acompañan las disputas entre delfines.
  • Los "zumbidos" de chasquidos se escuchan comúnmente durante el cortejo o al perseguir tiburones.

Conocer a los delfines individuales involucrados es clave para una interpretación precisa. El objetivo final de esta observación a largo plazo es descodificar la estructura y los posibles significados dentro de estas secuencias de sonidos naturales, buscando patrones y reglas que podrían insinuar una forma de lenguaje. Este rico análisis de la comunicación natural es la columna vertebral de la investigación del WDP y proporciona un contexto crucial para el análisis de IA.

Izquierda: Una madre delfín moteada observa a su cría mientras se alimenta. Usará su silbido distintivo único para llamarlo cuando termine. Derecha: Un espectrograma que muestra el silbido.

Presentando DolphinGemma

Analizar la comunicación natural y compleja de los delfines no es tarea fácil, y el extenso conjunto de datos etiquetados del WDP ofrece una oportunidad única para la innovación en IA. Aquí entra DolphinGemma, una creación de Google que aprovecha tecnologías de audio específicas. El tokenizador SoundStream captura eficazmente los sonidos de los delfines, que luego son procesados por un modelo diseñado para secuencias intrincadas. Este modelo de ~400M parámetros es justo del tamaño adecuado para ejecutarse en los teléfonos Pixel utilizados por el WDP en el campo.

Izquierda: Silbidos y pulsos explosivos generados durante las primeras pruebas de DolphinGemma.

DolphinGemma se inspira en Gemma, la suite de modelos abiertos ligeros y de vanguardia de Google, que comparten la misma investigación y tecnología que los modelos Gemini. Entrenado en la base de datos acústica del WDP de delfines moteados del Atlántico salvajes, DolphinGemma opera como un modelo de entrada y salida de audio. Procesa secuencias de sonidos naturales de delfines para detectar patrones, estructuras y, en última instancia, predecir los sonidos probables siguientes en una secuencia, similar a cómo los modelos de lenguaje humano predicen la siguiente palabra.

Esta temporada, el WDP está implementando DolphinGemma en el campo, con beneficios inmediatos en el horizonte. Al identificar patrones de sonido recurrentes, agrupaciones y secuencias confiables, el modelo puede ayudar a los investigadores a descubrir estructuras ocultas y posibles significados dentro de la comunicación natural de los delfines, un trabajo que anteriormente requería un esfuerzo humano masivo. A largo plazo, estos patrones, combinados con sonidos sintéticos creados por los investigadores para representar objetos que los delfines disfrutan, podrían allanar el camino para un vocabulario compartido y una comunicación interactiva.

Usando Teléfonos Pixel para Escuchar y Analizar Sonidos de Delfines

Junto con el análisis de la comunicación natural, el WDP también está explorando una vía diferente: la posible interacción bidireccional utilizando tecnología en el océano. Esto ha llevado al desarrollo del sistema CHAT (Cetacean Hearing Augmentation Telemetry), en colaboración con el Georgia Institute of Technology. CHAT es una computadora submarina diseñada no para descifrar el complejo lenguaje natural de los delfines, sino para establecer un vocabulario compartido más simple.

La idea es vincular silbidos sintéticos novedosos (generados por CHAT, distintos de los sonidos naturales de los delfines) con objetos específicos que los delfines encuentran interesantes, como sargazo, hierba marina o bufandas utilizadas por los investigadores. Al demostrar el sistema entre ellos, los investigadores esperan que los delfines curiosos aprendan a imitar estos silbidos para solicitar estos objetos. A medida que crece la comprensión de los sonidos naturales de los delfines, estos también pueden incorporarse al sistema.

Para permitir la interacción bidireccional, el sistema CHAT debe:

  1. Escuchar el sonido imitado con precisión en medio del ruido del océano.
  2. Identificar qué silbido fue imitado en tiempo real.
  3. Informar al investigador (a través de auriculares de conducción ósea que funcionan bajo el agua) qué objeto "solicitó" el delfín.
  4. Permitir al investigador responder rápidamente ofreciendo el objeto correcto, reforzando la conexión.

Un Google Pixel 6 previamente manejó el análisis de alta fidelidad de los sonidos de los delfines en tiempo real. La próxima generación, enfocada en un Google Pixel 9 (investigación planeada para el verano de 2025), se basará en esto integrando funciones de altavoz/micrófono y utilizando el procesamiento avanzado del teléfono para ejecutar modelos de aprendizaje profundo y algoritmos de coincidencia de plantillas simultáneamente.

Izquierda: Dra. Denise Herzing usando "Chat Senior, 2012", Derecha: Estudiante de doctorado de Georgia Tech Charles Ramey usando "Chat Junior, 2025"

El uso de teléfonos inteligentes Pixel reduce significativamente la necesidad de hardware personalizado, mejora la mantenibilidad del sistema, reduce el consumo de energía y disminuye el costo y tamaño del dispositivo, ventajas clave para la investigación de campo en el océano abierto. Mientras tanto, las capacidades predictivas de DolphinGemma pueden ayudar a CHAT a anticipar e identificar posibles imitaciones antes en la secuencia de vocalización, acelerando las respuestas de los investigadores a los delfines y haciendo que las interacciones sean más fluidas y reforzantes.

Un Google Pixel 9 dentro del hardware más reciente del sistema CHAT.

Compartiendo DolphinGemma con la Comunidad Investigadora

Comprendiendo la importancia de la colaboración en el descubrimiento científico, estamos listos para compartir DolphinGemma como un modelo abierto este verano. Aunque está entrenado en sonidos de delfines moteados del Atlántico, creemos que podría ser útil para investigadores que estudian otras especies de cetáceos, como delfines mulares o giradores. Podría ser necesario un ajuste fino para las vocalizaciones de diferentes especies, pero el modelo abierto permite este tipo de adaptación.

Al hacer disponibles herramientas como DolphinGemma, nuestro objetivo es equipar a los investigadores de todo el mundo con los medios para analizar sus propios conjuntos de datos acústicos, acelerar la búsqueda de patrones y mejorar colectivamente nuestra comprensión de estos mamíferos marinos inteligentes.

El viaje hacia la comprensión de la comunicación de los delfines es largo y sinuoso, pero los esfuerzos combinados de la investigación de campo dedicada del WDP, la destreza en ingeniería de Georgia Tech y la potencia tecnológica de Google están abriendo nuevas posibilidades emocionantes. Ya no solo estamos escuchando; estamos comenzando a entender los patrones dentro de los sonidos, preparando el escenario para un futuro donde la brecha entre la comunicación humana y la de los delfines podría reducirse un poco más.

Puedes profundizar en el Wild Dolphin Project en su sitio web.

Artículo relacionado
Salesforce Presenta Compañeros Digitales de IA en Slack para Competir con Microsoft Copilot Salesforce Presenta Compañeros Digitales de IA en Slack para Competir con Microsoft Copilot Salesforce lanzó una nueva estrategia de IA para el lugar de trabajo, presentando “compañeros digitales” especializados integrados en las conversaciones de Slack, según reveló la compañía el lunes.La
Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Oracle planea invertir aproximadamente $40 mil millones en chips Nvidia para alimentar un importante centro de datos nuevo en Texas, desarrollado por OpenAI, según informó el Financial Times. Este acu
Aplicación de Meta AI para Introducir un Nivel Premium y Anuncios Aplicación de Meta AI para Introducir un Nivel Premium y Anuncios La aplicación de IA de Meta pronto podría incluir una suscripción de pago, siguiendo el modelo de competidores como OpenAI, Google y Microsoft. Durante una llamada de resultados del primer trimestre d
comentario (7)
0/200
NoahSmith
NoahSmith 2 de agosto de 2025 17:07:14 GMT+02:00

Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬

AlbertMartínez
AlbertMartínez 28 de julio de 2025 03:19:05 GMT+02:00

This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!

WalterWalker
WalterWalker 20 de abril de 2025 17:04:10 GMT+02:00

GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓

GeorgeJones
GeorgeJones 20 de abril de 2025 07:34:27 GMT+02:00

구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓

JonathanLewis
JonathanLewis 20 de abril de 2025 05:35:47 GMT+02:00

Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓

JackPerez
JackPerez 20 de abril de 2025 03:33:15 GMT+02:00

A inteligência artificial do Google ajudando na comunicação dos golfinhos? Isso é loucura! Estou totalmente a favor de entender melhor essas criaturas inteligentes. Mas será que podemos realmente criar nossas próprias mensagens semelhantes às dos golfinhos? Parece ficção científica, mas estou dentro. 🐬🤓

Volver arriba
OR