セサミは、ウイルス仮想アシスタントマヤの背後にあるベースAIモデルを発表します

驚くほどリアルな音声アシスタントマヤの背後にある革新的なAI会社であるSesameは、彼女の能力を促進する基本モデルをリリースすることで波を作ったばかりです。 CSM-1Bと呼ばれるこのモデルは、10億パラメーターのサイズを誇っています。これは、モデルを構成する個々のコンポーネントを指す用語です。 Apache 2.0ライセンスの下でリリースされ、AI開発プラットフォームで発表されているように、最小限の制限で商業用に使用できます。
CSM-1Bは、テキストとオーディオ入力を「RVQオーディオコード」に変換することにより機能します。 RVQは、オーディオを離散トークンまたはコードに変換する方法「残留ベクトル量子化」の略です。この手法は、GoogleのSoundStreamやMetaのEncodecなど、他の最先端のAIオーディオテクノロジーでも利用されています。 CSM-1Bは、そのコアで、メタのラマファミリーのモデルをレバレッジし、オーディオ「デコーダー」コンポーネントと組み合わせています。 SESAMEによれば、微調整後、微調整後、Mayaの声を動かすCSM-1Bの専門的なバージョン。
モデルを抱きしめる顔とGithubのリポジトリの「ベース生成モデル」として説明するSesameは、さまざまな声を生み出すように設計されているが、特定の声では洗練されていないことを指摘しています。トレーニングセットの「データ汚染」のおかげで、英語以外の言語を処理する能力がありますが、この分野でのパフォーマンスはおそらく下位です。興味深いことに、Sesameはトレーニングデータの詳細をラップして保持しており、このモデルの構築に何が入ったのか興味があります。
眉を上げる1つの側面は、堅牢な保護手段がないことです。 Sesameは名誉制度で運営され、ユーザーと開発者がモデルを使用して許可なしに誰かの声を再現することを避け、偽のニュースなどの誤解を招くコンテンツを作成するか、「有害な」または「悪意のある」活動に参加するように奨励するだけです。私は個人的に顔を抱きしめてデモをテストしましたが、すぐに声をクローンしました。選挙やロシアのプロパガンダなど、あらゆるトピックに関するスピーチを生み出すのは簡単でした。
消費者のレポートは最近、多くのAIを搭載した音声クローニングツールにおける「意味のある」セーフガードの欠如に関する強調を強調し、潜在的な詐欺や虐待につながる可能性があります。 Oculusの共同作成者であるBrendan Iribeが共同設立したSesameは、2月下旬にUncanny Valleyを逃れそうになったアシスタントテクノロジーで国民の目を引きました。 MayaとSesameの他のアシスタントであるMilesは、息を吸う、障害と話すこと、Openaiの音声モードと同様に中断可能な中速化など、現実的な人間のような特性を示します。
財政的には、SesameはAndreessen Horowitz、Spark Capital、Matrix Partnersなどのヘビー級から非公開の資金を確保しました。音声アシスタントを超えて、同社はまた、カスタムモデルを装備した終日摩耗を目的としたAIメガネのプロトタイピングにも挑戦しています。この動きは、AIテクノロジーの境界を私たちの日常生活にさらに押し上げるというセサミの野望を示しています。
関連記事
AlibabaがWan2.1-VACEを発表:オープンソースAIビデオソリューション
Alibabaは、ビデオ作成および編集プロセスを革新するオープンソースAIモデル、Wan2.1-VACEを発表しました。VACEは、AlibabaのWan2.1ビデオAIモデルファミリーの主要なコンポーネントであり、同社はこれが「業界初の多様なビデオ生成および編集タスクに対応する包括的なソリューションを提供するオープンソースモデル」だと主張しています。もしAlibabaがビデオ制作プロセスを効率化
IBM Power11が企業のAIを強化し、途切れないパフォーマンスを提供
IBMのPower11エンタープライズサーバーは、エンタープライズコンピューティングにおける重要な課題、つまりミッションクリティカルなアプリケーションに必要な堅牢な信頼性を維持しながらAIワークロードを展開することに対応します。2025年7月8日に発売されたPower11は、IBMが多くの組織が現在直面している専門AIハードウェアと従来のサーバーの断片的な組み合わせから、統一されたソリューションに
AI駆動の小売実験がAnthropicで壮絶に失敗
人工知能に小さな店舗を任せ、価格設定から顧客対応まで全てを委ねると想像してみてください。何が問題になるでしょうか?金曜日に発表されたAnthropicの最近の研究がその答えを示しています:ほぼ全てです。彼らのAIアシスタント、Claudeが、サンフランシスコのオフィスで1か月間小さな店舗を運営し、まるで実際の経験ゼロの誰かが書いたビジネス学生向けの教訓のような結果を生み出しました—まさにその通りで
コメント (7)
0/200
AnthonyMartinez
2025年7月31日 10:41:20 JST
Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎
0
RoySmith
2025年7月28日 10:18:39 JST
Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀
0
EricPerez
2025年4月25日 7:42:49 JST
Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯
0
GeorgeMiller
2025年4月24日 22:04:42 JST
¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯
0
JonathanMiller
2025年4月24日 21:11:38 JST
Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯
0
TimothyMitchell
2025年4月24日 16:25:54 JST
SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯
0
驚くほどリアルな音声アシスタントマヤの背後にある革新的なAI会社であるSesameは、彼女の能力を促進する基本モデルをリリースすることで波を作ったばかりです。 CSM-1Bと呼ばれるこのモデルは、10億パラメーターのサイズを誇っています。これは、モデルを構成する個々のコンポーネントを指す用語です。 Apache 2.0ライセンスの下でリリースされ、AI開発プラットフォームで発表されているように、最小限の制限で商業用に使用できます。
CSM-1Bは、テキストとオーディオ入力を「RVQオーディオコード」に変換することにより機能します。 RVQは、オーディオを離散トークンまたはコードに変換する方法「残留ベクトル量子化」の略です。この手法は、GoogleのSoundStreamやMetaのEncodecなど、他の最先端のAIオーディオテクノロジーでも利用されています。 CSM-1Bは、そのコアで、メタのラマファミリーのモデルをレバレッジし、オーディオ「デコーダー」コンポーネントと組み合わせています。 SESAMEによれば、微調整後、微調整後、Mayaの声を動かすCSM-1Bの専門的なバージョン。
モデルを抱きしめる顔とGithubのリポジトリの「ベース生成モデル」として説明するSesameは、さまざまな声を生み出すように設計されているが、特定の声では洗練されていないことを指摘しています。トレーニングセットの「データ汚染」のおかげで、英語以外の言語を処理する能力がありますが、この分野でのパフォーマンスはおそらく下位です。興味深いことに、Sesameはトレーニングデータの詳細をラップして保持しており、このモデルの構築に何が入ったのか興味があります。
眉を上げる1つの側面は、堅牢な保護手段がないことです。 Sesameは名誉制度で運営され、ユーザーと開発者がモデルを使用して許可なしに誰かの声を再現することを避け、偽のニュースなどの誤解を招くコンテンツを作成するか、「有害な」または「悪意のある」活動に参加するように奨励するだけです。私は個人的に顔を抱きしめてデモをテストしましたが、すぐに声をクローンしました。選挙やロシアのプロパガンダなど、あらゆるトピックに関するスピーチを生み出すのは簡単でした。
消費者のレポートは最近、多くのAIを搭載した音声クローニングツールにおける「意味のある」セーフガードの欠如に関する強調を強調し、潜在的な詐欺や虐待につながる可能性があります。 Oculusの共同作成者であるBrendan Iribeが共同設立したSesameは、2月下旬にUncanny Valleyを逃れそうになったアシスタントテクノロジーで国民の目を引きました。 MayaとSesameの他のアシスタントであるMilesは、息を吸う、障害と話すこと、Openaiの音声モードと同様に中断可能な中速化など、現実的な人間のような特性を示します。
財政的には、SesameはAndreessen Horowitz、Spark Capital、Matrix Partnersなどのヘビー級から非公開の資金を確保しました。音声アシスタントを超えて、同社はまた、カスタムモデルを装備した終日摩耗を目的としたAIメガネのプロトタイピングにも挑戦しています。この動きは、AIテクノロジーの境界を私たちの日常生活にさらに押し上げるというセサミの野望を示しています。




Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎




Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀




Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯




¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯




Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯




SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯












