GoogleはChirp 3の音声モデルをVertex AIに統合します

生成AIは、主にテキストベースのインターフェースを通じてテキストや画像などを生成することに焦点を当ててきました。しかし今、音声が注目を集めており、勢いを増しています。Googleは大きなニュースを発表しました。来週から、最新の音声認識および高品質テキスト音声変換モデルであるChirp 3を、Vertex AIプラットフォームで展開します。
先週、GoogleはひそかにChirp 3が31言語で8つの新しい音声を導入すると発表しました。この技術は、音声アシスタントの構築、オーディオブックの作成、サポートエージェントやビデオのナレーション作成に最適です。この発表は、ロンドンのGoogle DeepMindオフィスでのイベントで共有されました。
Googleだけが音声AIの波に乗っているわけではありません。先週、超リアルなAI音声「Maya」と「Miles」を提供するSesameが、開発者がその技術を使って独自のカスタムアプリやサービスを構築できるようにすると発表しました。
GoogleはChirp 3に使用制限を設けることで、悪用を防ごうとしています。「私たちは安全チームと一緒にこれらの課題に取り組んでいます」と、Google CloudのCEOであるThomas Kurianは、今日のニュースイベントで述べました。
ElevenLabsもAI音声の分野で大きなプレイヤーであり、音声サービスの拡大のために数百万ドルを調達しています。
Chirp 3により、Googleは現在テスト中の最新のLLM Geminiバージョンや、画像生成モデルのImagen、そして高価なVeo 2ビデオ生成ツールと同じファミリーにこれを統合します。
Chirp 3が他のAI音声(Sesameの成果はかなり印象的です)と同じくらい「リアル」に聞こえるかどうかはまだわかりません。しかし、DeepMindのCEOであるDemis Hassabisが指摘したように、これは短距離走ではなくマラソンです。
「短期的には… [AIが]今後数年ですべてを解決する魔法の弾丸という考えは、まだ実現しないと思います。AGIのようなものが起こるまでには、まだ数年かかると考えています」と彼は述べました。「それは今後10年間で物事を変えるでしょう…中長期的に見て、興味深い時代の瞬間の一つです。」
Googleは2021年にVertex AIを立ち上げ、開発者がクラウドで機械学習サービスを構築できる場所として提供しました。それはAI、特に生成AIが、OpenAIのGPTサービスのおかげで今のようなホットな話題になるずっと前のことでした。
それ以来、GoogleはVertex AIを強く推進し、MicrosoftやAmazonなど、開発者向けの生成AIツールを構築している競合他社に追いつこうとしています。Vertex AIを使えば、開発者はGeminiを基盤に構築するだけでなく、データの分類、モデルのトレーニング、本番環境への準備も行えます。Googleが他のクリエイターのモデルにも門戸を開くかどうかは、興味深いところです。
Googleは「Chirp」という音声技術に何年も取り組んできており、AmazonのAlexaに挑戦するためのコードネームとして使い始めたのはずっと前のことです。
関連記事
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
関連特集おすすめ
コメント (65)
0/500
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎

生成AIは、主にテキストベースのインターフェースを通じてテキストや画像などを生成することに焦点を当ててきました。しかし今、音声が注目を集めており、勢いを増しています。Googleは大きなニュースを発表しました。来週から、最新の音声認識および高品質テキスト音声変換モデルであるChirp 3を、Vertex AIプラットフォームで展開します。
先週、GoogleはひそかにChirp 3が31言語で8つの新しい音声を導入すると発表しました。この技術は、音声アシスタントの構築、オーディオブックの作成、サポートエージェントやビデオのナレーション作成に最適です。この発表は、ロンドンのGoogle DeepMindオフィスでのイベントで共有されました。
Googleだけが音声AIの波に乗っているわけではありません。先週、超リアルなAI音声「Maya」と「Miles」を提供するSesameが、開発者がその技術を使って独自のカスタムアプリやサービスを構築できるようにすると発表しました。
GoogleはChirp 3に使用制限を設けることで、悪用を防ごうとしています。「私たちは安全チームと一緒にこれらの課題に取り組んでいます」と、Google CloudのCEOであるThomas Kurianは、今日のニュースイベントで述べました。
ElevenLabsもAI音声の分野で大きなプレイヤーであり、音声サービスの拡大のために数百万ドルを調達しています。
Chirp 3により、Googleは現在テスト中の最新のLLM Geminiバージョンや、画像生成モデルのImagen、そして高価なVeo 2ビデオ生成ツールと同じファミリーにこれを統合します。
Chirp 3が他のAI音声(Sesameの成果はかなり印象的です)と同じくらい「リアル」に聞こえるかどうかはまだわかりません。しかし、DeepMindのCEOであるDemis Hassabisが指摘したように、これは短距離走ではなくマラソンです。
「短期的には… [AIが]今後数年ですべてを解決する魔法の弾丸という考えは、まだ実現しないと思います。AGIのようなものが起こるまでには、まだ数年かかると考えています」と彼は述べました。「それは今後10年間で物事を変えるでしょう…中長期的に見て、興味深い時代の瞬間の一つです。」
Googleは2021年にVertex AIを立ち上げ、開発者がクラウドで機械学習サービスを構築できる場所として提供しました。それはAI、特に生成AIが、OpenAIのGPTサービスのおかげで今のようなホットな話題になるずっと前のことでした。
それ以来、GoogleはVertex AIを強く推進し、MicrosoftやAmazonなど、開発者向けの生成AIツールを構築している競合他社に追いつこうとしています。Vertex AIを使えば、開発者はGeminiを基盤に構築するだけでなく、データの分類、モデルのトレーニング、本番環境への準備も行えます。Googleが他のクリエイターのモデルにも門戸を開くかどうかは、興味深いところです。
Googleは「Chirp」という音声技術に何年も取り組んできており、AmazonのAlexaに挑戦するためのコードネームとして使い始めたのはずっと前のことです。
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
ミストラル、オープンソースの音声生成モデルを発表
フランスのAI企業Mistralは木曜日、音声AIアシスタントやカスタマーサポートなどの企業向けアプリケーション向けに設計された、新しいオープンソースのテキスト読み上げ(TTS)モデルを発表した。このモデルにより、企業は営業や顧客エンゲージメントのための音声エージェントを構築できるようになり、MistralはElevenLabs、Deepgram、OpenAIの直接的な競合相手としての地位を確立し
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎





家






