Option
Heim
Nachricht
Sesam enthüllt das Basis -KI -Modell hinter viraler Virtual Assistant Maya

Sesam enthüllt das Basis -KI -Modell hinter viraler Virtual Assistant Maya

23. April 2025
169

Sesam enthüllt das Basis -KI -Modell hinter viraler Virtual Assistant Maya

Sesame, das innovative KI-Unternehmen hinter der auffallend lebensechten Sprachassistentin Maya, hat gerade für Aufsehen gesorgt, indem es das Basismodell veröffentlicht hat, das ihre Fähigkeiten antreibt. Das Modell, genannt CSM-1B, verfügt über eine Größe von 1 Milliarde Parametern, ein Begriff, der die einzelnen Komponenten des Modells bezeichnet. Unter einer Apache 2.0-Lizenz veröffentlicht, ist es für kommerzielle Nutzung mit minimalen Einschränkungen freigegeben, wie auf der KI-Entwicklungsplattform Hugging Face angekündigt.

CSM-1B funktioniert, indem es Text- und Audioeingaben in „RVQ-Audiocodes“ umwandelt. RVQ steht für „residual vector quantization“, eine Methode, die Audio in diskrete Tokens oder Codes umwandelt. Diese Technik wird auch in anderen hochmodernen KI-Audiotechnologien wie Googles SoundStream und Metas Encodec verwendet. Im Kern nutzt CSM-1B ein Modell aus Metas Llama-Familie, kombiniert mit einer Audio-„Decoder“-Komponente. Eine spezialisierte Version von CSM-1B, nach Feinabstimmung, treibt die Stimme von Maya an, laut Sesame.

Das Modell wird auf seinen Hugging Face- und GitHub-Repositories als „Basismodell für die Generierung“ beschrieben, und Sesame betont, dass es darauf ausgelegt ist, eine Vielzahl von Stimmen zu erzeugen, aber nicht für eine spezifische Stimme optimiert wurde. Obwohl es aufgrund von „Datenkontamination“ in seinem Trainingssatz eine gewisse Fähigkeit zur Verarbeitung nicht-englischer Sprachen hat, ist seine Leistung in diesem Bereich wahrscheinlich unterdurchschnittlich. Interessanterweise hat Sesame die Details der Trainingsdaten geheim gehalten, was uns neugierig macht, was in den Aufbau dieses Modells eingeflossen ist.

Ein Aspekt, der Aufmerksamkeit erregt, ist das Fehlen robuster Sicherheitsvorkehrungen. Sesame setzt auf ein Ehrensystem und fordert Nutzer und Entwickler lediglich auf, das Modell nicht ohne Erlaubnis zur Nachbildung von Stimmen, zur Erzeugung irreführender Inhalte wie Fake News oder zur Teilnahme an „schädlichen“ oder „bösartigen“ Aktivitäten zu verwenden. Ich habe die Demo auf Hugging Face persönlich getestet und innerhalb einer Minute meine Stimme geklont. Es war ein Kinderspiel, Sprache zu jedem Thema zu generieren, sogar zu sensiblen Themen wie Wahlen und russischer Propaganda.

Consumer Reports hat kürzlich auf das besorgniserregende Fehlen „maßgeblicher“ Sicherheitsvorkehrungen bei vielen KI-gestützten Stimmklon-Tools hingewiesen, die zu potenziellem Betrug oder Missbrauch führen könnten. Sesame, mitbegründet von Oculus-Mitgründer Brendan Iribe, erregte Ende Februar mit seiner Assistententechnologie Aufmerksamkeit, die fast dem Uncanny Valley entkommt. Sowohl Maya als auch Sesames anderer Assistent, Miles, zeigen realistische menschliche Eigenschaften wie Atmen, Sprechen mit Sprachfehlern und Unterbrechbarkeit mitten im Satz, ähnlich wie OpenAIs Voice Mode.

Finanziell hat Sesame nicht offengelegte Finanzierungen von Schwergewichten wie Andreessen Horowitz, Spark Capital und Matrix Partners gesichert. Über Sprachassistenten hinaus wagt sich das Unternehmen auch an die Prototypentwicklung von KI-Brillen, die für den ganztägigen Gebrauch gedacht sind und mit ihren maßgeschneiderten Modellen ausgestattet sind. Dieser Schritt zeigt Sesames Ambition, die Grenzen der KI-Technologie weiter in unseren Alltag zu integrieren.

Verwandter Artikel
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor Kakao Mobility plant, im Rahmen seiner Strategie für physische KI Technologien für autonomes Fahren der Stufe 4 intern zu entwickeln.Auf der Konferenz „World IT Show 2026“ im COEX in Seoul stellte Ki
Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon
Empfehlungen zu verwandten Spezialthemen
Schreiben Die besten KI-Profilersteller: Erstellen Sie konsistente Charaktermotivationen und fatale Schwächen
Die besten KI-Profilersteller: Erstellen Sie konsistente Charaktermotivationen und fatale Schwächen

Entdecken Sie die besten KI-Tools zur Charakterentwicklung für 2026, mit denen Sie facettenreiche Figuren erschaffen können. Die von XIX.AI zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die konsistente Motivationen und fatale Schwächen generieren. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie jetzt Ihr Potenzial als Geschichtenerzähler.

10 Tools
xix.ai
Geschäft Die beste Software zur Preisoptimierung mittels KI: Beobachten Sie die Konkurrenz und passen Sie Ihre Shop-Preise automatisch an
Die beste Software zur Preisoptimierung mittels KI: Beobachten Sie die Konkurrenz und passen Sie Ihre Shop-Preise automatisch an

Entdecken Sie auf XIX.AI die beste Software zur Preisoptimierung mittels KI für 2026. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die Ihre Mitbewerber beobachten und Ihre Shop-Preise automatisch anpassen, um den maximalen Gewinn zu erzielen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Sichern Sie sich jetzt Ihren Preisvorteil.

10 Tools
xix.ai
Code Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys
Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys

Entdecken Sie die besten KI-Code-Reviewer des Jahres 2026 auf XIX.AI. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools zur Automatisierung der Einhaltung von Clean-Code-Standards und zur Refaktorisierung von Dateien in älteren Repositorys. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren KI-Vorsprung.

10 Tools
xix.ai
Text-zu-Sprache Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern
Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern

Entdecken Sie die besten KI-TTS-Apps des Jahres 2026, die speziell zur Unterstützung bei Legasthenie ausgewählt wurden. In unseren Experten-Rankings vergleichen wir kostenlose und kostenpflichtige Tools und stellen leistungsstarke Funktionen für mehr Leseeffizienz und besseren Lernerfolg vor. Entdecken Sie bahnbrechende Lösungen, die Sie unbedingt ausprobieren sollten, um das Potenzial Ihrer Schüler voll auszuschöpfen. Beginnen Sie Ihre Reise bei XIX.AI.

10 Tools
xix.ai
Comic-Erstellung Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte
Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools
xix.ai
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Kommentare (8)
0/500
PaulYoung
PaulYoung 13. August 2025 23:00:59 MESZ

C'est incroyable ce que Sesame a fait avec Maya ! Un modèle à 1 milliard de paramètres, ça doit être une sacrée bête. Mais franchement, ça donne quoi en termes d'éthique ? On va tous finir avec des assistants trop parfaits ? 😅

AnthonyMartinez
AnthonyMartinez 31. Juli 2025 03:41:20 MESZ

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith
RoySmith 28. Juli 2025 03:18:39 MESZ

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez
EricPerez 25. April 2025 00:42:49 MESZ

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller
GeorgeMiller 24. April 2025 15:04:42 MESZ

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller
JonathanMiller 24. April 2025 14:11:38 MESZ

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

OR