1年後に音声クローニングツールをまだリリースしていないOpenai
2025年4月21日
AnthonyHernández
25
Openaiの音声エンジン:待望のリリース?
昨年3月下旬、OpenaiはAIサービスであるVoice Engineの「小規模なプレビュー」を導入しました。これは、わずか15秒の音声を使用して人の音声をクローンすることを約束しました。 1年前に早送りすると、ツールはまだプレビューモードであり、完全な起動のための明確なタイムラインはありません。
音声エンジンを広く展開するのをためらうことは、誤用に関する懸念、あるいはおそらく規制の精査を避けようとする試みに起因する可能性があります。 Openaiは、過去に、安全性よりも派手な製品を優先し、競合他社よりも先にマーケティングすることについて批判に直面してきました。
Openaiの広報担当者は、TechCrunchに、同社は「信頼できるパートナー」の選択グループでVoice Engineをテストしていると語った。 「私たちは、パートナーがテクノロジーを使用してモデルのユーティリティと安全性を高める方法から学んでいます」とスポークスマンは説明しました。 「言語療法や言語学習から顧客サポート、ビデオゲームのキャラクター、AIアバターに至るまで、そのアプリケーションを見るのはエキサイティングでした。」
音声エンジン:これまでの旅
OpenaiのテキストからスピーチへのAPIおよびChatGptの音声モードで声を駆動する音声エンジンは、元のスピーカーを密接に模倣する非常に自然な音を立てるスピーチを作成します。特定のコンテンツガイドラインによってのみ制約されるテキストを音声に変換します。しかし、ロールアウトは、最初から遅延とリリース日を変えることに悩まされています。
2024年6月のブログ投稿で、Openaiは、音声エンジンモデルが、さまざまな声、アクセント、スピーキングスタイルを考慮して、スピーカーが特定のテキストを作成する可能性が高いサウンドを予測することをどのように学習するかを詳述しました。これにより、モデルはテキストからスピーチを生成するだけでなく、異なるスピーカーがテキストを声に出して表明する方法を反映する「話しかけられた発言」を作成することもできます。
当初、TechCrunchが見たブログ投稿のドラフトによると、2024年3月7日にOpenaiのAPIに参加するように設定されていました。計画は、最初に最大100人の「信頼できる開発者」へのアクセスを提供し、社会的利益で開発するアプリに優先順位を付けたり、テクノロジーの革新的で責任ある使用を示したりすることでした。 Openaiはすでにサービスを商標登録しており、「標準」の声で100万ドルあたり15ドル、「HD Quality」声で100万ドルあたり30ドルの価格設定を設定していました。
しかし、最後の瞬間に、発表は遅れました。数週間後、Openaiはサインアップオプションなしで音声エンジンを発表し、2023年後半から一緒に働いていた開発者の小さなグループへのアクセスを制限しました。
「合成声の責任ある展開と、社会がこれらの新しい能力にどのように適応できるかについての対話を開始したいと考えています」とOpenaiは2024年3月下旬の発表ブログ投稿で述べています。 「これらの会話とこれらの小規模なテストの結果に基づいて、この技術を大規模に展開するかどうか、どのように展開するかについて、より多くの情報に基づいた決定を下します。」
長い開発道
Voice Engineは2022年以来開発中であり、Openaiは2023年の夏に世界の政策立案者にその可能性とリスクを示しています。今日、いくつかのパートナーは、障害のある人々がより自然にコミュニケーションをとるのを支援することを目的としたStartup Livoxを含む音声エンジンにアクセスできます。しかし、LivoxのCEO、Carlos Pereiraは、多くの顧客が欠けているインターネット接続が必要であるため、Voice Engineを製品に統合できないと指摘しました。 「声の質と声を異なる言語で話させる能力は、特に障害のある顧客にとってユニークです」とペレイラは電子メールでTechCrunchに語った。 「これは、私が見た声を作成するための最も印象的で使いやすいツールです... Openaiがすぐにオフラインバージョンを開発することを願っています。」
ペレイラは、オープンアライから、潜在的な打ち上げ日またはサービスの請求計画についての兆候を受け取っていません。これまでのところ、リボックスはその使用を支払う必要はありませんでした。
2024年6月の投稿で、Openaiは、音声エンジンを遅らせる理由の1つが、米国の選挙サイクル中に虐待の可能性であると示唆しました。同社は、生成されたオーディオの起源を追跡するための透かしを含む安全対策を実施しています。開発者は、元のスピーカーから「明示的な同意」を取得し、声が生成されているという「明確な開示」を視聴者に作成する必要があります。ただし、Openaiは、これらのポリシーが大規模にどのように実施されるかを詳述していません。これは重要な課題になる可能性があります。
また、Openaiは、スピーカーを検証するための「音声認証エクスペリエンス」と、著名な人物に似た声の作成を防ぐための「ノーゴー」リストを構築することを示唆しました。これらは野心的なプロジェクトであり、あれば、ミスステップは安全イニシアチブに関するオープンの評判をさらに損なう可能性があります。
効果的なフィルタリングとID検証は、音声クローンテクノロジーを責任を持ってリリースするために不可欠になっています。 AI Voice Cloningは、2024年の3番目に急成長している詐欺であり、プライバシーと著作権法がペースを維持するのに苦労して詐欺とバイパスにつながりました。悪意のある俳優は、声のクローニングを使用して、ソーシャルメディアに急速に広がっている有名人や政治家の深い声を作成しました。
Openaiは来週Voice Engineをリリースする可能性があります。同社は、サービスを範囲内に保つことを検討していることに言及しています。しかし、1つ確かなことは、光学、安全性、またはその両方について、Voice Engineの限られたプレビューがOpenaiの歴史の中で最も長いものの1つになっています。
関連記事
Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています
Googleは「AIモード」を検索して、Prplexity AIとChatGptgoogleに対抗し、AIアリーナでゲームを強化し、検索エンジンで実験的な「AIモード」機能を開始します。 Perplexity AIやOpenaiのChatGPT検索などを引き受けることを目的としたこの新しいモードは、水で発表されました
chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします
ChatGPTの一部のユーザーは最近、奇妙な新機能に遭遇しました。チャットボットは、問題を乗り越えながら名前を使用することがあります。これは以前の通常の動作の一部ではなく、多くのユーザーがChatGptが何を呼ぶかを言わずに自分の名前に言及すると報告しています。意見
OpenaiはChatGptを強化して、以前の会話を思い出します
Openaiは木曜日に、「Memory」と呼ばれるChatGptの新鮮な機能を展開することについて大きな発表を行いました。この気の利いたツールは、以前に話したことを思い出すことにより、AIとのチャットをよりパーソナライズするように設計されています。あなたが新しい詐欺を始めるたびに自分自身を繰り返す必要がないと想像してください
コメント (5)
0/200
StephenScott
2025年4月21日 23:54:47 GMT
It's been a year and OpenAI's Voice Engine is still in preview mode? Come on, I was so excited about cloning voices with just 15 seconds of speech! The wait is killing me, but I guess good things take time. Hopefully, it'll be worth it when it finally drops! 🤞
0
WillieHernández
2025年4月21日 23:54:47 GMT
オープンAIのVoice Engine、まだプレビュー版のままなんて信じられない!15秒の音声で声をクローンできるって聞いてすごく期待してたのに。待つのはつらいけど、良いものは時間がかかるってことかな。リリースが楽しみだよ!🤞
0
BillyWilson
2025年4月21日 23:54:47 GMT
오픈AI의 Voice Engine이 아직도 프리뷰 상태라니 믿기지 않아! 15초의 음성으로 목소리를 복제할 수 있다니 기대가 컸는데. 기다리는 게 힘들지만 좋은 건 시간이 걸리는 법이죠. 출시가 기대돼요! 🤞
0
KennethKing
2025年4月21日 23:54:47 GMT
Já faz um ano e o Voice Engine da OpenAI ainda está em modo de pré-visualização? Sério? Estava tão animado para clonar vozes com apenas 15 segundos de fala! A espera está me matando, mas suponho que coisas boas levam tempo. Espero que valha a pena quando finalmente for lançado! 🤞
0
JeffreyThomas
2025年4月21日 23:54:47 GMT
¿Ha pasado un año y el Voice Engine de OpenAI sigue en modo de vista previa? ¡Vamos, estaba tan emocionado de clonar voces con solo 15 segundos de habla! La espera me está matando, pero supongo que las cosas buenas toman tiempo. Espero que valga la pena cuando finalmente se lance! 🤞
0






Openaiの音声エンジン:待望のリリース?
昨年3月下旬、OpenaiはAIサービスであるVoice Engineの「小規模なプレビュー」を導入しました。これは、わずか15秒の音声を使用して人の音声をクローンすることを約束しました。 1年前に早送りすると、ツールはまだプレビューモードであり、完全な起動のための明確なタイムラインはありません。
音声エンジンを広く展開するのをためらうことは、誤用に関する懸念、あるいはおそらく規制の精査を避けようとする試みに起因する可能性があります。 Openaiは、過去に、安全性よりも派手な製品を優先し、競合他社よりも先にマーケティングすることについて批判に直面してきました。
Openaiの広報担当者は、TechCrunchに、同社は「信頼できるパートナー」の選択グループでVoice Engineをテストしていると語った。 「私たちは、パートナーがテクノロジーを使用してモデルのユーティリティと安全性を高める方法から学んでいます」とスポークスマンは説明しました。 「言語療法や言語学習から顧客サポート、ビデオゲームのキャラクター、AIアバターに至るまで、そのアプリケーションを見るのはエキサイティングでした。」
音声エンジン:これまでの旅
OpenaiのテキストからスピーチへのAPIおよびChatGptの音声モードで声を駆動する音声エンジンは、元のスピーカーを密接に模倣する非常に自然な音を立てるスピーチを作成します。特定のコンテンツガイドラインによってのみ制約されるテキストを音声に変換します。しかし、ロールアウトは、最初から遅延とリリース日を変えることに悩まされています。
2024年6月のブログ投稿で、Openaiは、音声エンジンモデルが、さまざまな声、アクセント、スピーキングスタイルを考慮して、スピーカーが特定のテキストを作成する可能性が高いサウンドを予測することをどのように学習するかを詳述しました。これにより、モデルはテキストからスピーチを生成するだけでなく、異なるスピーカーがテキストを声に出して表明する方法を反映する「話しかけられた発言」を作成することもできます。
当初、TechCrunchが見たブログ投稿のドラフトによると、2024年3月7日にOpenaiのAPIに参加するように設定されていました。計画は、最初に最大100人の「信頼できる開発者」へのアクセスを提供し、社会的利益で開発するアプリに優先順位を付けたり、テクノロジーの革新的で責任ある使用を示したりすることでした。 Openaiはすでにサービスを商標登録しており、「標準」の声で100万ドルあたり15ドル、「HD Quality」声で100万ドルあたり30ドルの価格設定を設定していました。
しかし、最後の瞬間に、発表は遅れました。数週間後、Openaiはサインアップオプションなしで音声エンジンを発表し、2023年後半から一緒に働いていた開発者の小さなグループへのアクセスを制限しました。
「合成声の責任ある展開と、社会がこれらの新しい能力にどのように適応できるかについての対話を開始したいと考えています」とOpenaiは2024年3月下旬の発表ブログ投稿で述べています。 「これらの会話とこれらの小規模なテストの結果に基づいて、この技術を大規模に展開するかどうか、どのように展開するかについて、より多くの情報に基づいた決定を下します。」
長い開発道
Voice Engineは2022年以来開発中であり、Openaiは2023年の夏に世界の政策立案者にその可能性とリスクを示しています。今日、いくつかのパートナーは、障害のある人々がより自然にコミュニケーションをとるのを支援することを目的としたStartup Livoxを含む音声エンジンにアクセスできます。しかし、LivoxのCEO、Carlos Pereiraは、多くの顧客が欠けているインターネット接続が必要であるため、Voice Engineを製品に統合できないと指摘しました。 「声の質と声を異なる言語で話させる能力は、特に障害のある顧客にとってユニークです」とペレイラは電子メールでTechCrunchに語った。 「これは、私が見た声を作成するための最も印象的で使いやすいツールです... Openaiがすぐにオフラインバージョンを開発することを願っています。」
ペレイラは、オープンアライから、潜在的な打ち上げ日またはサービスの請求計画についての兆候を受け取っていません。これまでのところ、リボックスはその使用を支払う必要はありませんでした。
2024年6月の投稿で、Openaiは、音声エンジンを遅らせる理由の1つが、米国の選挙サイクル中に虐待の可能性であると示唆しました。同社は、生成されたオーディオの起源を追跡するための透かしを含む安全対策を実施しています。開発者は、元のスピーカーから「明示的な同意」を取得し、声が生成されているという「明確な開示」を視聴者に作成する必要があります。ただし、Openaiは、これらのポリシーが大規模にどのように実施されるかを詳述していません。これは重要な課題になる可能性があります。
また、Openaiは、スピーカーを検証するための「音声認証エクスペリエンス」と、著名な人物に似た声の作成を防ぐための「ノーゴー」リストを構築することを示唆しました。これらは野心的なプロジェクトであり、あれば、ミスステップは安全イニシアチブに関するオープンの評判をさらに損なう可能性があります。
効果的なフィルタリングとID検証は、音声クローンテクノロジーを責任を持ってリリースするために不可欠になっています。 AI Voice Cloningは、2024年の3番目に急成長している詐欺であり、プライバシーと著作権法がペースを維持するのに苦労して詐欺とバイパスにつながりました。悪意のある俳優は、声のクローニングを使用して、ソーシャルメディアに急速に広がっている有名人や政治家の深い声を作成しました。
Openaiは来週Voice Engineをリリースする可能性があります。同社は、サービスを範囲内に保つことを検討していることに言及しています。しかし、1つ確かなことは、光学、安全性、またはその両方について、Voice Engineの限られたプレビューがOpenaiの歴史の中で最も長いものの1つになっています。




It's been a year and OpenAI's Voice Engine is still in preview mode? Come on, I was so excited about cloning voices with just 15 seconds of speech! The wait is killing me, but I guess good things take time. Hopefully, it'll be worth it when it finally drops! 🤞




オープンAIのVoice Engine、まだプレビュー版のままなんて信じられない!15秒の音声で声をクローンできるって聞いてすごく期待してたのに。待つのはつらいけど、良いものは時間がかかるってことかな。リリースが楽しみだよ!🤞




오픈AI의 Voice Engine이 아직도 프리뷰 상태라니 믿기지 않아! 15초의 음성으로 목소리를 복제할 수 있다니 기대가 컸는데. 기다리는 게 힘들지만 좋은 건 시간이 걸리는 법이죠. 출시가 기대돼요! 🤞




Já faz um ano e o Voice Engine da OpenAI ainda está em modo de pré-visualização? Sério? Estava tão animado para clonar vozes com apenas 15 segundos de fala! A espera está me matando, mas suponho que coisas boas levam tempo. Espero que valha a pena quando finalmente for lançado! 🤞




¿Ha pasado un año y el Voice Engine de OpenAI sigue en modo de vista previa? ¡Vamos, estaba tan emocionado de clonar voces con solo 15 segundos de habla! La espera me está matando, pero supongo que las cosas buenas toman tiempo. Espero que valga la pena cuando finalmente se lance! 🤞












