Sesame открывает модель AI Base, стоящая за вирусным виртуальным помощником Maya

Sesame, инновационная компания ИИ, стоящая за поразительно жизненным голосовым помощником Maya, только что подняла волны, выпустив базовую модель, которая управляет ее возможностями. Эта модель, получившая название CSM-1B, может похвастаться размером 1 миллиарда параметров, термин, который относится к отдельным компонентам, составляющим модель. Выпущенный под лицензией Apache 2.0, он открыт для коммерческого использования с минимальными ограничениями, как было объявлено на платформе AI Development Platform.
Функции CSM-1B путем преобразования текстовых и аудио входов в «RVQ Audio-коды». RVQ означает «квантование остаточного вектора», метод, который преобразует аудио в дискретные токены или коды. Этот метод также используется в других передовых аудиотехнологиях ИИ, таких как Soundstream Google и Meta. По своей сути, CSM-1B использует модель из семейства LlaMa Meta, в сочетании с компонентом аудио «декодера». По словам SESAME, специализированная версия CSM-1B, после точной настройки, способствует голосу Maya.
Описывая модель как «модель базового поколения» на своей обнимающей лице и репозиториях GitHub, Sesame отмечает, что она предназначена для создания разнообразных голосов, но не было уточнено для какого -либо конкретного голоса. Несмотря на то, что он обладает некоторой способностью обрабатывать неанглийские языки благодаря «загрязнению данных» в своем учебном наборе, его производительность в этой области, вероятно, является невыполненным. Интересно, что Sesame сохранил детали учебных данных под обертыванием, оставив нам любопытно, что пошло на создание этой модели.
Одним из аспектов, который поднимает брови, является отсутствие надежных гарантий. Sesame работает на системе чести, просто поощряя пользователей и разработчиков избегать использования модели для воспроизведения чьего -либо голоса без разрешения, создавать вводящий в заблуждение контент, такой как поддельные новости, или принять участие в любых «вредных» или «вредоносных» действиях. Я лично проверил демонстрацию на обтягивающем лицо, и через минуту я клонировал свой голос. Это был ветерок, чтобы генерировать речь по любой теме, даже чувствительные, такие как выборы и российская пропаганда.
Consumer Reports недавно подчеркнула отсутствие «значимых» гарантий во многих инструментах клонирования голоса с помощью AI, которые могут привести к потенциальному мошенничеству или злоупотреблению. Sesame, соучрединный соавтором Oculus Бренданом Ирибе, привлек внимание общественности в конце февраля со своей помощником технологии, которая почти избегает странной долины. И другой помощник Maya и Sesame, Майлз, демонстрируют реалистичные человеческие черты, такие как захватывание вдоха, разговор с недостатками и прерываемые в середине речи, похожие на голосовой режим Openai.
В финансовом отношении Sesame получила нераскрытое финансирование от тяжеловесов, таких как Andreessen Horowitz, Spark Capital и Matrix Partners. Помимо голосовых помощников, компания также встает на прототипирование очков искусственного интеллекта, предназначенных для износа на протяжении всего дня, оснащенных их пользовательскими моделями. Этот шаг показывает амбиции Sesame к тому, чтобы продвигать границы технологии ИИ дальше в нашу повседневную жизнь.
Связанная статья
Alibaba представляет Wan2.1-VACE: Открытое решение для видео с ИИ
Alibaba представила Wan2.1-VACE, модель ИИ с открытым исходным кодом, которая призвана трансформировать процессы создания и редактирования видео.VACE является ключевым компонентом семейства видео моде
IBM Power11 Усиливает Корпоративный ИИ с Непрерывной Производительностью
Серверы IBM Power11 для предприятий решают ключевую проблему корпоративных вычислений: развертывание рабочих нагрузок ИИ при сохранении надежности, необходимой для критически важных приложений. Запуще
AI驱动的零售实验在Anthropic惨败
想象将一家小店交给人工智能,托付从定价到客户互动的一切。会出什么问题?Anthropic最近的一项研究于周五发布,回答了这个问题:几乎一切都出了问题。他们的AI助手Claude在旧金山办公室经营了一家小店一个月,结果堪称商学院学生的警示故事,由一个毫无现实经验的人撰写——在本例中,确实如此。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有自助结账的iPad。(来源:Anthr
Комментарии (7)
AnthonyMartinez
31 июля 2025 г., 4:41:20 GMT+03:00
Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎
0
RoySmith
28 июля 2025 г., 4:18:39 GMT+03:00
Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀
0
EricPerez
25 апреля 2025 г., 1:42:49 GMT+03:00
Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯
0
GeorgeMiller
24 апреля 2025 г., 16:04:42 GMT+03:00
¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯
0
JonathanMiller
24 апреля 2025 г., 15:11:38 GMT+03:00
Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯
0
TimothyMitchell
24 апреля 2025 г., 10:25:54 GMT+03:00
SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯
0
Sesame, инновационная компания ИИ, стоящая за поразительно жизненным голосовым помощником Maya, только что подняла волны, выпустив базовую модель, которая управляет ее возможностями. Эта модель, получившая название CSM-1B, может похвастаться размером 1 миллиарда параметров, термин, который относится к отдельным компонентам, составляющим модель. Выпущенный под лицензией Apache 2.0, он открыт для коммерческого использования с минимальными ограничениями, как было объявлено на платформе AI Development Platform.
Функции CSM-1B путем преобразования текстовых и аудио входов в «RVQ Audio-коды». RVQ означает «квантование остаточного вектора», метод, который преобразует аудио в дискретные токены или коды. Этот метод также используется в других передовых аудиотехнологиях ИИ, таких как Soundstream Google и Meta. По своей сути, CSM-1B использует модель из семейства LlaMa Meta, в сочетании с компонентом аудио «декодера». По словам SESAME, специализированная версия CSM-1B, после точной настройки, способствует голосу Maya.
Описывая модель как «модель базового поколения» на своей обнимающей лице и репозиториях GitHub, Sesame отмечает, что она предназначена для создания разнообразных голосов, но не было уточнено для какого -либо конкретного голоса. Несмотря на то, что он обладает некоторой способностью обрабатывать неанглийские языки благодаря «загрязнению данных» в своем учебном наборе, его производительность в этой области, вероятно, является невыполненным. Интересно, что Sesame сохранил детали учебных данных под обертыванием, оставив нам любопытно, что пошло на создание этой модели.
Одним из аспектов, который поднимает брови, является отсутствие надежных гарантий. Sesame работает на системе чести, просто поощряя пользователей и разработчиков избегать использования модели для воспроизведения чьего -либо голоса без разрешения, создавать вводящий в заблуждение контент, такой как поддельные новости, или принять участие в любых «вредных» или «вредоносных» действиях. Я лично проверил демонстрацию на обтягивающем лицо, и через минуту я клонировал свой голос. Это был ветерок, чтобы генерировать речь по любой теме, даже чувствительные, такие как выборы и российская пропаганда.
Consumer Reports недавно подчеркнула отсутствие «значимых» гарантий во многих инструментах клонирования голоса с помощью AI, которые могут привести к потенциальному мошенничеству или злоупотреблению. Sesame, соучрединный соавтором Oculus Бренданом Ирибе, привлек внимание общественности в конце февраля со своей помощником технологии, которая почти избегает странной долины. И другой помощник Maya и Sesame, Майлз, демонстрируют реалистичные человеческие черты, такие как захватывание вдоха, разговор с недостатками и прерываемые в середине речи, похожие на голосовой режим Openai.
В финансовом отношении Sesame получила нераскрытое финансирование от тяжеловесов, таких как Andreessen Horowitz, Spark Capital и Matrix Partners. Помимо голосовых помощников, компания также встает на прототипирование очков искусственного интеллекта, предназначенных для износа на протяжении всего дня, оснащенных их пользовательскими моделями. Этот шаг показывает амбиции Sesame к тому, чтобы продвигать границы технологии ИИ дальше в нашу повседневную жизнь.




Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎




Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀




Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯




¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯




Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯




SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯












