Option
Heim
Nachricht
Google AI hilft bei der Dekodierung von Delphinkommunikation mit Dolphingemma

Google AI hilft bei der Dekodierung von Delphinkommunikation mit Dolphingemma

19. April 2025
114

Google AI hilft bei der Dekodierung von Delphinkommunikation mit Dolphingemma

Seit Jahrzehnten sind Wissenschaftler von den Klicks, Pfeiftönen und Impulssalven der Delfine fasziniert und versuchen, den Code ihrer komplexen Kommunikation zu entschlüsseln. Stellen Sie sich vor, wir könnten nicht nur diese marinen Gespräche belauschen, sondern auch ihre Muster so gut entschlüsseln, dass wir unsere eigenen delfinähnlichen Antworten gestalten könnten. Dieser Traum rückt näher an die Realität, und am National Dolphin Day freut sich Google, in Zusammenarbeit mit Forschern von Georgia Tech und der Feldforschung des Wild Dolphin Project (WDP), spannende Neuigkeiten zu DolphinGemma zu teilen. Dieses bahnbrechende KI-Modell ist darauf trainiert, die Nuancen der Delfinvokalisationen zu erfassen und sogar neue Klangsequenzen zu generieren, wodurch die Grenzen der KI und unser Potenzial, mit den Bewohnern des Ozeans in Verbindung zu treten, ausgedehnt werden.

Jahrzehnte der Forschung an Delfingesellschaften

Das Verständnis einer Spezies ist kein Spaziergang; es erfordert ein tiefes Eintauchen in ihre Welt. Hier kommt das WDP ins Spiel. Seit 1985 führen sie das längste Unterwasser-Delfinforschungsprojekt durch, das sich auf eine Gemeinschaft wilder Atlantischer Fleckendelfine (Stenella frontalis) auf den Bahamas konzentriert und sie über Generationen hinweg studiert. Ihr Ansatz „In ihrer Welt, zu ihren Bedingungen“ bedeutet, dass sie eine Fülle von Daten sammeln, ohne die Delfine zu stören. Dazu gehören jahrzehntelange Unterwasser-Videos und -Audios, die alle sorgfältig mit individuellen Delfinidentitäten, Lebensgeschichten und Verhaltensweisen verknüpft sind. Es ist, als hätten wir ein detailliertes Tagebuch des Delfinlebens.

Eine Gruppe Atlantischer Fleckendelfine, Stenella frontalis

Der Hauptfokus des WDP liegt darauf, die natürliche Kommunikation und soziale Interaktionen der Delfine zu beobachten und zu analysieren. Durch die Arbeit unter Wasser können Forscher Klänge direkt mit spezifischen Verhaltensweisen verknüpfen, was bei Oberflächenbeobachtungen nicht möglich ist. Sie haben Jahre damit verbracht, verschiedene Klangtypen mit Verhaltenskontexten zu korrelieren. Zum Beispiel:

  • Signatur-Pfeiftöne, die wie einzigartige Namen fungieren, helfen Müttern und Kälbern, sich wiederzufinden.
  • Impulssalven-„Squawks“ begleiten oft Delfinstreitigkeiten.
  • Klick-„Buzzes“ sind häufig während der Balz oder beim Verjagen von Haien zu hören.

Die Kenntnis der beteiligten individuellen Delfine ist entscheidend für eine genaue Interpretation. Das ultimative Ziel dieser langfristigen Beobachtung ist es, die Struktur und mögliche Bedeutungen in diesen natürlichen Klangsequenzen zu entschlüsseln und nach Mustern und Regeln zu suchen, die auf eine Form von Sprache hindeuten könnten. Diese umfassende Analyse der natürlichen Kommunikation ist das Rückgrat der Forschung des WDP und liefert entscheidenden Kontext für die KI-Analyse.

Links: Eine Mutter-Fleckendelfin beobachtet ihr Kalb beim Futtersuchen. Sie wird ihren einzigartigen Signatur-Pfeifton verwenden, um es zurückzurufen, wenn es fertig ist. Rechts: Ein Spektrogramm, das den Pfeifton zeigt.

Vorstellung von DolphinGemma

Die Analyse der natürlichen, komplexen Kommunikation von Delfinen ist keine leichte Aufgabe, und der umfangreiche, beschriftete Datensatz des WDP bietet eine goldene Gelegenheit für KI-Innovationen. Hier kommt DolphinGemma ins Spiel, eine Kreation von Google, die spezifische Audiotechnologien nutzt. Der SoundStream-Tokenizer erfasst effektiv Delfinklänge, die dann von einem Modell für komplexe Sequenzen verarbeitet werden. Dieses Modell mit etwa 400 Millionen Parametern hat genau die richtige Größe, um auf den Pixel-Telefonen zu laufen, die das WDP im Feld einsetzt.

Links: Pfeiftöne und Impulssalven, die während der frühen Tests von DolphinGemma generiert wurden.

DolphinGemma lässt sich von Gemma inspirieren, Googles Suite von leichten, hochmodernen offenen Modellen, die dieselbe Forschung und Technologie wie die Gemini-Modelle teilen. Trainiert auf der akustischen Datenbank des WDP von wilden Atlantischen Fleckendelfinen, funktioniert DolphinGemma als Audio-in, Audio-out-Modell. Es verarbeitet Sequenzen natürlicher Delfinklänge, um Muster, Strukturen zu erkennen und letztendlich die wahrscheinlichen nächsten Klänge in einer Sequenz vorherzusagen, ähnlich wie menschliche Sprachmodelle das nächste Wort vorhersagen.

In dieser Saison führt das WDP DolphinGemma im Feld ein, mit unmittelbaren Vorteilen in Sicht. Durch das Erkennen wiederkehrender Klangmuster, Cluster und zuverlässiger Sequenzen kann das Modell Forschern helfen, verborgene Strukturen und mögliche Bedeutungen in der natürlichen Kommunikation der Delfine aufzudecken – Arbeit, die zuvor enorme menschliche Anstrengungen erforderte. Langfristig könnten diese Muster, kombiniert mit synthetischen Klängen, die von Forschern erstellt wurden, um Objekte darzustellen, die den Delfinen gefallen, den Weg für einen gemeinsamen Wortschatz und interaktive Kommunikation ebnen.

Verwendung von Pixel-Telefonen zum Hören und Analysieren von Delfinklängen

Neben der Analyse der natürlichen Kommunikation erforscht das WDP auch einen anderen Ansatz: die potenzielle zweiseitige Interaktion mit Technologie im Ozean. Dies hat zur Entwicklung des CHAT-Systems (Cetacean Hearing Augmentation Telemetry) geführt, in Zusammenarbeit mit dem Georgia Institute of Technology. CHAT ist ein Unterwasser-Computer, der nicht darauf ausgelegt ist, die komplexe natürliche Sprache der Delfine zu entschlüsseln, sondern einen einfacheren, gemeinsamen Wortschatz zu etablieren.

Die Idee ist, neuartige, synthetische Pfeiftöne (generiert von CHAT, unterschiedlich von natürlichen Delfinklängen) mit spezifischen Objekten zu verknüpfen, die die Delfine interessant finden, wie Sargassum, Seegras oder Tücher, die von Forschern verwendet werden. Durch das Demonstrieren des Systems untereinander hoffen die Forscher, dass die neugierigen Delfine lernen, diese Pfeiftöne nachzuahmen, um diese Gegenstände anzufordern. Mit zunehmendem Verständnis der natürlichen Klänge der Delfine können diese ebenfalls in das System integriert werden.

Um eine zweiseitige Interaktion zu ermöglichen, muss das CHAT-System:

  1. Das Nachahmen inmitten von Ozeanrauschen genau hören.
  2. In Echtzeit erkennen, welcher Pfeifton nachgeahmt wurde.
  3. Den Forscher (über knochenleitende Kopfhörer, die unter Wasser funktionieren) informieren, welches Objekt der Delfin „angefordert“ hat.
  4. Dem Forscher ermöglichen, schnell durch das Anbieten des richtigen Objekts zu reagieren und die Verbindung zu verstärken.

Ein Google Pixel 6 hat zuvor die hochauflösende Analyse von Delfinklängen in Echtzeit durchgeführt. Die nächste Generation, die sich auf ein Google Pixel 9 konzentriert (Forschung geplant für Sommer 2025), wird darauf aufbauen, indem sie Lautsprecher-/Mikrofonfunktionen integriert und die fortschrittliche Verarbeitung des Telefons nutzt, um sowohl Deep-Learning-Modelle als auch Template-Matching-Algorithmen gleichzeitig auszuführen.

Links: Dr. Denise Herzing trägt „Chat Senior, 2012“, Rechts: Georgia Tech Doktorand Charles Ramey trägt „Chat Junior, 2025“

Die Verwendung von Pixel-Smartphones reduziert den Bedarf an spezieller Hardware erheblich, verbessert die Wartbarkeit des Systems, senkt den Stromverbrauch und reduziert die Kosten und Größe des Geräts – entscheidende Vorteile für die Feldforschung im offenen Ozean. In der Zwischenzeit können die prädiktiven Fähigkeiten von DolphinGemma dem CHAT-System helfen, potenzielle Nachahmungen früher in der Vokalisationssequenz zu antizipieren und zu identifizieren, was die Reaktionen der Forscher auf die Delfine beschleunigt und die Interaktionen reibungsloser und verstärkender macht.

Ein Google Pixel 9 in der neuesten CHAT-System-Hardware.

Teilen von DolphinGemma mit der Forschungsgemeinschaft

In Anerkennung der Bedeutung von Zusammenarbeit in der wissenschaftlichen Entdeckung sind wir bereit, DolphinGemma diesen Sommer als offenes Modell zu teilen. Obwohl es auf die Klänge Atlantischer Fleckendelfine trainiert wurde, glauben wir, dass es auch für Forscher nützlich sein könnte, die andere Walarten wie Große Tümmler oder Spinnerdelfine studieren. Möglicherweise ist eine Feinabstimmung für die Vokalisationen verschiedener Arten erforderlich, aber das offene Modell ermöglicht diese Art von Anpassung.

Durch die Bereitstellung von Tools wie DolphinGemma wollen wir Forschern weltweit die Mittel an die Hand geben, ihre eigenen akustischen Datensätze zu analysieren, die Suche nach Mustern zu beschleunigen und unser Verständnis dieser intelligenten Meeressäuger gemeinsam zu verbessern.

Der Weg zum Verständnis der Delfinkommunikation ist lang und kurvenreich, aber die gemeinsamen Anstrengungen der engagierten Feldforschung des WDP, der Ingenieurskunst von Georgia Tech und der technologischen Stärke von Google eröffnen aufregende neue Möglichkeiten. Wir hören nicht mehr nur zu; wir beginnen, die Muster innerhalb der Klänge zu verstehen, und bereiten die Bühne für eine Zukunft, in der die Kluft zwischen menschlicher und Delfinkommunikation vielleicht etwas enger wird.

Sie können tiefer in das Wild Dolphin Project auf ihrer Website eintauchen.

Verwandter Artikel
Salesforce stellt KI-Digitale Teamkollegen in Slack vor, um mit Microsoft Copilot zu konkurrieren Salesforce stellt KI-Digitale Teamkollegen in Slack vor, um mit Microsoft Copilot zu konkurrieren Salesforce hat eine neue KI-Strategie für den Arbeitsplatz gestartet und spezialisierte „digitale Teamkollegen“ in Slack-Konversationen integriert, wie das Unternehmen am Montag bekannt gab.Das neue T
Oracles 40-Mrd.-Nvidia-Chip-Investition stärkt Texas AI-Rechenzentrum Oracles 40-Mrd.-Nvidia-Chip-Investition stärkt Texas AI-Rechenzentrum Oracle plant, etwa 40 Milliarden Dollar in Nvidia-Chips zu investieren, um ein großes neues Rechenzentrum in Texas zu betreiben, das von OpenAI entwickelt wird, wie die Financial Times berichtet. Dies
Meta AI App führt Premium-Stufe und Werbung ein Meta AI App führt Premium-Stufe und Werbung ein Die AI-App von Meta könnte bald ein kostenpflichtiges Abonnement einführen, ähnlich den Angeboten von Konkurrenten wie OpenAI, Google und Microsoft. Während eines Q1 2025 Earnings Calls skizzierte Met
Kommentare (7)
0/200
NoahSmith
NoahSmith 2. August 2025 17:07:14 MESZ

Wow, decoding dolphin language with AI? That's wild! Imagine chatting with dolphins someday, but I wonder if they'll have better gossip than us humans. 🐬

AlbertMartínez
AlbertMartínez 28. Juli 2025 03:19:05 MESZ

This is wild! Google’s AI decoding dolphin chatter? I wonder if we’ll ever have a full-on convo with dolphins, like chatting with an alien species. 🐬 Super cool but kinda creepy too!

WalterWalker
WalterWalker 20. April 2025 17:04:10 MESZ

GoogleのAIがイルカの通信を助けるなんて、すごい!これで賢い生き物をより理解できるようになるのは素晴らしいです。でも、本当にイルカのようなメッセージを作れるの?SFみたいだけど、楽しみです。🐬🤓

GeorgeJones
GeorgeJones 20. April 2025 07:34:27 MESZ

구글의 AI가 돌고래의 통신을 돕는다고? 그건 정말 멋져요! 이 똑똑한 생물들을 더 잘 이해할 수 있게 되는 건 좋죠. 하지만 정말로 돌고래 같은 메시지를 만들 수 있을까요? SF 같지만, 기대돼요. 🐬🤓

JonathanLewis
JonathanLewis 20. April 2025 05:35:47 MESZ

Google's AI helping with dolphin communication? That's wild! I'm all for understanding these smart creatures better. But can we really make our own dolphin-like messages? Sounds like sci-fi, but I'm here for it. 🐬🤓

JackPerez
JackPerez 20. April 2025 03:33:15 MESZ

A inteligência artificial do Google ajudando na comunicação dos golfinhos? Isso é loucura! Estou totalmente a favor de entender melhor essas criaturas inteligentes. Mas será que podemos realmente criar nossas próprias mensagens semelhantes às dos golfinhos? Parece ficção científica, mas estou dentro. 🐬🤓

Zurück nach oben
OR