ElevenLabsは、新しいスピーチツーテキストモデルを発表します
ElevenLabsは、最近1億8000万ドルの資金調達に成功したAIスタートアップで、オーディオ生成技術で知られています。しかし今回、彼らは大胆にも新しい領域に踏み出し、初の独立した音声認識モデル「Scribe」をリリースしました。
33億ドルの評価額を持つElevenLabsは、豊富なボイスコレクションのおかげで、テキスト読み上げサービスを必要とする多くの企業にとって頼りになる存在でした。今、彼らは音声認識に照準を合わせ、Gladia、Speechmatics、AssemblyAI、Deepgram、OpenAIのWhisperモデルといったビッグネームに挑戦しようとしています。
Scribeは本気です。初めから99以上の言語をサポートしています。ElevenLabsによると、25以上の言語で優れた精度を誇り、単語エラー率は5%未満です。具体的には、英語(97%の精度を主張)、フランス語、ドイツ語、ヒンディー語、インドネシア語、日本語、カンナダ語、マラヤーラム語、ポーランド語、ポルトガル語、スペイン語、ベトナム語などが含まれます。その他の言語は、精度のカテゴリーに分けられます:高(単語エラー率5%~10%)、良好(10%~20%)、中程度(25%~50%)。
同社は、ScribeがFLEURSおよびCommon Voiceのベンチマークテストによると、Google Gemini 2.0 FlashやWhisper Large V3を複数の言語で上回っていると主張しています。

画像提供:ElevenLabs ElevenLabsは昨年、AI対話エージェントプラットフォーム用に音声認識部分を構築しましたが、Scribeは独立した音声認識モデルとして初めての試みです。先月TechCrunchとの対談で、CEOのMati Staniszewskiは音声認識技術を強化する計画について明かしました。
「私たちは、会話であなたが何を言っているかをよりよく理解したいと考えています。もうコンテンツ生成だけではありません。音声の理解と書き起こしに進出しているのです」とStaniszewskiは述べました。「音声認識は古い技術だと思う人も多いですが、多くの言語ではまだかなり粗いものです。私たちは、社内にデータラベリングチームがあり、迅速なフィードバックを得られるので、もっと良いものができると考えています。」
Scribeには、話者を識別するスマートスピーカーダイアライゼーション、正確な字幕のための単語レベルのタイムスタンプ、観客の笑い声などの音声イベントの自動タグ付けといったクールな機能もあります。さらに、ElevenLabsは顧客がスタジオでビデオコンテンツを直接書き起こして字幕やキャプションを追加できるようにしています。
現時点では、Scribeは録音済みのオーディオにのみ対応しています。ただし、同社は低遅延のリアルタイムバージョンを近日中に開発中だとしています。そのため、会議の書き起こしやボイスメモの作成にはまだ準備ができていません。
ElevenLabsは、Scribeの書き起こしオーディオ1時間あたり0.40ドルの料金を設定しています。これは競争力のある価格ですが、一部のライバルはオーディオ書き起こしをより安価な料金で提供しており、いくつかの異なる機能も含まれています。
関連記事
Yaoke Media初のAIGCドラマ『秦嶺の青銅の謎』が本日配信開始、AIが演じる主演キャストが登場
本日、Yaoke MediaのAIGCファンタジー・ミステリー短編ドラマ『秦嶺青銅の秘話』が正式に公開されました。同社が初めて契約した2人のAI俳優、秦凌月と林西燕燕が主演を務め、物語は謎に包まれた秦嶺の鉱山地帯を舞台に展開されます。 物語は、引退した諜報員・秦月がチームを率いてその奥深くへと入り込み、長年埋もれていた鉱山事故と、2世代にわたる血の生贄の真実を暴いていく様子を描きます。その真実は、
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
関連特集おすすめ
コメント (29)
0/500
스타트업이 이렇게 빠르게 성장하는 걸 보면 놀랍네요 ㅎㅎ 음성 분야는 경쟁이 심한데, ElevenLabs가 STT 시장에서도 성공할 수 있을까요? 투자금 1억 8천만 달러로 뭔가 특별한 기술을 만들겠죠? 🤔
A ElevenLabs não para de inovar! Esse novo modelo de speech-to-text parece promissor, mas fico pensando... será que vai conseguir competir com gigantes como Google e OpenAI no mercado de transcrição? 🤔 Espero que ofereça algo único pra justificar o hype!
Scribe sounds like a game-changer! I'm curious if it'll handle my thick accent as well as it claims. Excited to try it for podcast transcriptions! 😎
Just saw ElevenLabs' Scribe model news—97% accuracy in English is wild! 😮 I'm curious how it'll handle my thick accent in meetings. Hope they drop that real-time version soon!
¡El Scribe de ElevenLabs es genial! Es increíble cómo han entrado en el mercado de voz a texto con un modelo tan sólido. Mi única queja es que a veces tiene problemas con acentos fuertes. Pero, para ser el primer intento, es bastante impresionante. ¡Sigan así, ElevenLabs! 🚀
ElevenLabsは、最近1億8000万ドルの資金調達に成功したAIスタートアップで、オーディオ生成技術で知られています。しかし今回、彼らは大胆にも新しい領域に踏み出し、初の独立した音声認識モデル「Scribe」をリリースしました。
33億ドルの評価額を持つElevenLabsは、豊富なボイスコレクションのおかげで、テキスト読み上げサービスを必要とする多くの企業にとって頼りになる存在でした。今、彼らは音声認識に照準を合わせ、Gladia、Speechmatics、AssemblyAI、Deepgram、OpenAIのWhisperモデルといったビッグネームに挑戦しようとしています。
Scribeは本気です。初めから99以上の言語をサポートしています。ElevenLabsによると、25以上の言語で優れた精度を誇り、単語エラー率は5%未満です。具体的には、英語(97%の精度を主張)、フランス語、ドイツ語、ヒンディー語、インドネシア語、日本語、カンナダ語、マラヤーラム語、ポーランド語、ポルトガル語、スペイン語、ベトナム語などが含まれます。その他の言語は、精度のカテゴリーに分けられます:高(単語エラー率5%~10%)、良好(10%~20%)、中程度(25%~50%)。
同社は、ScribeがFLEURSおよびCommon Voiceのベンチマークテストによると、Google Gemini 2.0 FlashやWhisper Large V3を複数の言語で上回っていると主張しています。

ElevenLabsは昨年、AI対話エージェントプラットフォーム用に音声認識部分を構築しましたが、Scribeは独立した音声認識モデルとして初めての試みです。先月TechCrunchとの対談で、CEOのMati Staniszewskiは音声認識技術を強化する計画について明かしました。
「私たちは、会話であなたが何を言っているかをよりよく理解したいと考えています。もうコンテンツ生成だけではありません。音声の理解と書き起こしに進出しているのです」とStaniszewskiは述べました。「音声認識は古い技術だと思う人も多いですが、多くの言語ではまだかなり粗いものです。私たちは、社内にデータラベリングチームがあり、迅速なフィードバックを得られるので、もっと良いものができると考えています。」
Scribeには、話者を識別するスマートスピーカーダイアライゼーション、正確な字幕のための単語レベルのタイムスタンプ、観客の笑い声などの音声イベントの自動タグ付けといったクールな機能もあります。さらに、ElevenLabsは顧客がスタジオでビデオコンテンツを直接書き起こして字幕やキャプションを追加できるようにしています。
現時点では、Scribeは録音済みのオーディオにのみ対応しています。ただし、同社は低遅延のリアルタイムバージョンを近日中に開発中だとしています。そのため、会議の書き起こしやボイスメモの作成にはまだ準備ができていません。
ElevenLabsは、Scribeの書き起こしオーディオ1時間あたり0.40ドルの料金を設定しています。これは競争力のある価格ですが、一部のライバルはオーディオ書き起こしをより安価な料金で提供しており、いくつかの異なる機能も含まれています。
Yaoke Media初のAIGCドラマ『秦嶺の青銅の謎』が本日配信開始、AIが演じる主演キャストが登場
本日、Yaoke MediaのAIGCファンタジー・ミステリー短編ドラマ『秦嶺青銅の秘話』が正式に公開されました。同社が初めて契約した2人のAI俳優、秦凌月と林西燕燕が主演を務め、物語は謎に包まれた秦嶺の鉱山地帯を舞台に展開されます。 物語は、引退した諜報員・秦月がチームを率いてその奥深くへと入り込み、長年埋もれていた鉱山事故と、2世代にわたる血の生贄の真実を暴いていく様子を描きます。その真実は、
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
스타트업이 이렇게 빠르게 성장하는 걸 보면 놀랍네요 ㅎㅎ 음성 분야는 경쟁이 심한데, ElevenLabs가 STT 시장에서도 성공할 수 있을까요? 투자금 1억 8천만 달러로 뭔가 특별한 기술을 만들겠죠? 🤔
A ElevenLabs não para de inovar! Esse novo modelo de speech-to-text parece promissor, mas fico pensando... será que vai conseguir competir com gigantes como Google e OpenAI no mercado de transcrição? 🤔 Espero que ofereça algo único pra justificar o hype!
Scribe sounds like a game-changer! I'm curious if it'll handle my thick accent as well as it claims. Excited to try it for podcast transcriptions! 😎
Just saw ElevenLabs' Scribe model news—97% accuracy in English is wild! 😮 I'm curious how it'll handle my thick accent in meetings. Hope they drop that real-time version soon!
¡El Scribe de ElevenLabs es genial! Es increíble cómo han entrado en el mercado de voz a texto con un modelo tan sólido. Mi única queja es que a veces tiene problemas con acentos fuertes. Pero, para ser el primer intento, es bastante impresionante. ¡Sigan así, ElevenLabs! 🚀





家






