옵션
소식 Openai는 아직 1 년 후 음성 복제 도구를 출시하지 않았습니다.

Openai는 아직 1 년 후 음성 복제 도구를 출시하지 않았습니다.

출시일 출시일 2025년 4월 21일
작가 작가 AnthonyHernández
보기 보기 25

Openai의 음성 엔진 : 오랫동안 기다려온 릴리스?

지난 3 월 말, Openai는 AI 서비스 인 음성 엔진의 "소규모 미리보기"를 도입하여 15 초의 연설을 사용하여 사람의 음성을 복제하겠다고 약속했습니다. 1 년 동안 빨리 감기에 따라 도구는 여전히 미리보기 모드에 있으며, 전체 출시를위한 명확한 타임 라인이 없거나 심지어 하루의 빛을 볼 수 있음을 확인합니다.

음성 엔진을 광범위하게 출시하는 주저는 오용에 대한 우려, 또는 아마도 규제 조사를 측정하려는 시도에서 비롯 될 수 있습니다. Openai는 과거에 안전보다 화려한 제품의 우선 순위를 정하고 경쟁 업체보다 시장에 서두르는 것에 대한 비판에 직면했습니다.

Openai 대변인은 TechCrunch에 회사가 여전히 "신뢰할 수있는 파트너"그룹으로 음성 엔진을 테스트하고 있다고 말했다. 대변인은“우리는 파트너 가이 기술을 사용하여 모델의 유틸리티와 안전을 향상시키는 방법을 배우고 있습니다. "언어 치료 및 언어 학습에서 고객 지원, 비디오 게임 캐릭터 및 AI 아바타에 이르기까지 응용 프로그램을 보는 것은 흥미로 웠습니다."

음성 엔진 : 지금까지의 여행

OpenAi의 텍스트 음성 API 및 Chatgpt의 음성 모드에서 음성을 구동하는 음성 엔진은 원래 스피커를 밀접하게 모방하는 놀랍도록 자연스러운 말을 만듭니다. 특정 콘텐츠 가이드 라인에 의해서만 제한된 텍스트를 음성으로 변환합니다. 그러나 롤아웃은 처음부터 지연 및 시프트 릴리스 날짜로 인해 시행되었습니다.

2024 년 6 월 블로그 게시물에서 Openai는 음성 엔진 모델이 스피커가 다양한 음성, 악센트 및 말하기 스타일을 고려하여 주어진 텍스트를 만들 수있는 소리를 예측하는 방법을 자세히 설명했습니다. 이를 통해 모델은 텍스트에서 음성을 생성 할뿐만 아니라 다른 스피커가 텍스트를 큰 소리로 음성하는 방법을 반영하는 "음성 발화"를 생성 할 수 있습니다.

TechCrunch가 본 블로그 게시물에 따르면 원래 Custom Voices라고 불리는 음성 엔진은 2024 년 3 월 7 일 OpenAi의 API에 합류 할 것으로 예상되었습니다. 이 계획은 처음에 최대 100 명의 "신뢰할 수있는 개발자"에 대한 액세스를 제공하여 사회적 혜택을 가진 앱을 개발하는 사람들을 우선시하거나 기술의 혁신적이고 책임감있는 사용을 보여주는 것이 었습니다. OpenAi는 이미 서비스를 상표로 만들었고 가격 책정은 "표준"목소리에 대해 백만 달러당 $ 15로, "HD 품질"목소리에 대해 $ 30 당 $ 30를 설정했습니다.

그러나 마지막 순간에 발표는 지연되었습니다. 몇 주 후, OpenAi는 가입 옵션없이 음성 엔진을 공개하여 2023 년 후반부터 작업 한 소규모 개발자 그룹에 대한 액세스를 제한했습니다.

Openai는 2024 년 3 월 말 발표 블로그 게시물에서 "합성 목소리의 책임있는 배치와 사회가 이러한 새로운 기능에 어떻게 적응할 수 있는지에 대한 대화를 시작하기를 희망한다"고 말했다. "이러한 대화와 이러한 소규모 테스트의 결과를 바탕 으로이 기술을 규모로 배치할지 여부와 방법에 대한 정보에 대한 결정을 내릴 것입니다."

긴 개발 도로

2023 년 여름 여름 전 세계 정책 입안자들에게 Openai가 잠재력과 위험을 보여 주면서 2022 년 이래로 음성 엔진이 개발 중입니다. 오늘날 몇몇 파트너는 스타트 업 Livox를 포함한 음성 엔진에 액세스 할 수 있습니다. 그러나 Livox CEO Carlos Pereira는 많은 고객이 부족한 인터넷 연결이 필요하기 때문에 음성 엔진을 제품에 통합 할 수 없다고 지적했습니다. Pereira는 TechCrunch에 이메일을 통해 "목소리의 품질과 목소리가 다른 언어로 말할 수있는 능력, 특히 장애가있는 고객에게는 독특하다"고 말했다. "내가 본 목소리를 만드는 것이 가장 인상적이고 사용하기 쉬운 도구입니다 ... OpenAi가 곧 오프라인 버전을 개발하기를 바랍니다."

Pereira는 OpenAI로부터 잠재적 인 출시일 또는 서비스 비용을 청구 할 계획에 대한 표시를받지 못했으며 지금까지 Livox는 사용 비용을 지불 할 필요가 없었습니다.

2024 년 6 월 포스트에서 Openai는 음성 엔진을 지연시키는 한 가지 이유가 미국 선거주기 동안 학대 가능성이라고 제안했습니다. 이 회사는 생성 된 오디오의 원점을 추적하기위한 워터 마킹을 포함하여 안전 조치를 구현했습니다. 개발자는 원래 스피커로부터 "명시 적 동의"를 얻고 목소리가 Ai 생성 된 청중에게 "명확한 공개"를해야합니다. 그러나 OpenAI는 이러한 정책이 규모로 어떻게 시행 될 것인지에 대해 자세히 설명하지 않았으며 이는 중대한 도전이 될 수 있습니다.

Openai는 또한 "음성 인증 경험"을 구축하여 스피커와 "아니오"목록을 확인하여 눈에 띄는 인물과 유사한 목소리의 생성을 방지했습니다. 이들은 야심 찬 프로젝트이며, 모든 실수는 안전 이니셔티브에 대한 OpenAI의 명성을 더욱 손상시킬 수 있습니다.

효과적인 필터링 및 ID 검증은 음성 복제 기술을 책임감있게 공개하는 데 필수적이되고 있습니다. AI Voice Cloning은 2024 년의 세 번째로 빠르게 성장하는 사기로 사기로 이어지고 은행 보안 수표를 우회하여 개인 정보 보호 및 저작권법이 속도를 유지하기 위해 어려움을 겪었습니다. 악의적 인 배우는 음성 복제를 사용하여 소셜 미디어에 빠르게 퍼진 유명 인사와 정치인의 심해를 만들었습니다.

OpenAi는 다음 주에 음성 엔진을 출시 할 수 있습니다. 그렇지 않으면 결코 일어나지 않을 수도 있습니다. 이 회사는 서비스를 소규모로 유지하는 것을 고려했습니다. 그러나 한 가지 확실한 점은 광학, 안전 또는 둘 다에 관계없이 Voice Engine의 제한된 미리보기가 OpenAI의 역사상 가장 긴 미리보기 중 하나가되었습니다.

관련 기사
Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Googleは「AIモード」を検索して、Prplexity AIとChatGptgoogleに対抗し、AIアリーナでゲームを強化し、検索エンジンで実験的な「AIモード」機能を開始します。 Perplexity AIやOpenaiのChatGPT検索などを引き受けることを目的としたこの新しいモードは、水で発表されました
chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします ChatGPTの一部のユーザーは最近、奇妙な新機能に遭遇しました。チャットボットは、問題を乗り越えながら名前を使用することがあります。これは以前の通常の動作の一部ではなく、多くのユーザーがChatGptが何を呼ぶかを言わずに自分の名前に言及すると報告しています。意見
OpenaiはChatGptを強化して、以前の会話を思い出します OpenaiはChatGptを強化して、以前の会話を思い出します Openaiは木曜日に、「Memory」と呼ばれるChatGptの新鮮な機能を展開することについて大きな発表を行いました。この気の利いたツールは、以前に話したことを思い出すことにより、AIとのチャットをよりパーソナライズするように設計されています。あなたが新しい詐欺を始めるたびに自分自身を繰り返す必要がないと想像してください
의견 (5)
0/200
StephenScott
StephenScott 2025년 4월 21일 오후 11시 54분 47초 GMT

It's been a year and OpenAI's Voice Engine is still in preview mode? Come on, I was so excited about cloning voices with just 15 seconds of speech! The wait is killing me, but I guess good things take time. Hopefully, it'll be worth it when it finally drops! 🤞

WillieHernández
WillieHernández 2025년 4월 21일 오후 11시 54분 47초 GMT

オープンAIのVoice Engine、まだプレビュー版のままなんて信じられない!15秒の音声で声をクローンできるって聞いてすごく期待してたのに。待つのはつらいけど、良いものは時間がかかるってことかな。リリースが楽しみだよ!🤞

BillyWilson
BillyWilson 2025년 4월 21일 오후 11시 54분 47초 GMT

오픈AI의 Voice Engine이 아직도 프리뷰 상태라니 믿기지 않아! 15초의 음성으로 목소리를 복제할 수 있다니 기대가 컸는데. 기다리는 게 힘들지만 좋은 건 시간이 걸리는 법이죠. 출시가 기대돼요! 🤞

KennethKing
KennethKing 2025년 4월 21일 오후 11시 54분 47초 GMT

Já faz um ano e o Voice Engine da OpenAI ainda está em modo de pré-visualização? Sério? Estava tão animado para clonar vozes com apenas 15 segundos de fala! A espera está me matando, mas suponho que coisas boas levam tempo. Espero que valha a pena quando finalmente for lançado! 🤞

JeffreyThomas
JeffreyThomas 2025년 4월 21일 오후 11시 54분 47초 GMT

¿Ha pasado un año y el Voice Engine de OpenAI sigue en modo de vista previa? ¡Vamos, estaba tan emocionado de clonar voces con solo 15 segundos de habla! La espera me está matando, pero supongo que las cosas buenas toman tiempo. Espero que valga la pena cuando finalmente se lance! 🤞

위로 돌아갑니다
OR