OpenAI의 AI 전사 도구에 대한 우수한 대안 : 환각이 적고 정확도

htmlOpenAI의 Whisper, 2022년에 출시된 AI 기반 음성 인식 및 전사 도구는 환각 현상을 자주 생성하거나 정보를 날조하는 것으로 밝혀져, 중요한 환경에서 해를 끼칠 가능성에 대한 우려를 불러일으키고 있습니다.
미시간 대학교의 연구자는 그가 검토한 공개 회의의 오디오 전사본에서 80%가 환각 현상을 발견했습니다. 마찬가지로, 100시간 분량의 Whisper 전사본을 분석한 엔지니어는 약 절반에서 환각 현상을 보고했으며, 또 다른 개발자는 그가 만든 거의 모든 전사본에서, 총 26,000건의 사례를 발견했습니다.
전사에서 사소한 오류는 흔하지만, 전문가들은 Whisper의 환각 수준이 AI 전사 도구 중에서 전례가 없다고 지적했습니다. OpenAI는 오픈소스 신경망인 Whisper가 영어 음성 인식에서 인간에 가까운 정확도를 달성했다고 주장합니다. 이 도구는 인터뷰 전사, 콘텐츠 번역, 비디오 자막 생성과 같은 작업을 위해 다양한 산업에서 널리 사용됩니다.
Whisper의 광범위한 사용은 다양한 플랫폼에서 날조된 텍스트, 잘못 귀속된 인용, 기타 오정보의 확산으로 이어질 수 있으며, 이는 원본 콘텐츠의 성격에 따라 영향이 달라집니다. Whisper는 ChatGPT의 일부 버전에 통합되어 있으며, 콜센터, 음성 비서, Oracle 및 Microsoft의 클라우드 플랫폼에서 사용되며, 지난 달 HuggingFace에서 420만 번 이상 다운로드되었습니다.
특히 우려되는 점은 의료 전문가들이 환자 상담을 전사하기 위해 Whisper 기반 도구를 점점 더 많이 사용하고 있다는 것입니다. AP는 12명 이상의 엔지니어, 연구자, 개발자와 대화했으며, 그들은 Whisper가 종종 문구와 전체 문장을 날조하며, 때로는 인종적 논평, 폭력적 수사, 심지어 상상된 의료 치료를 포함한다고 확인했습니다.
“아무도 오진을 원하지 않습니다,”라고 고등연구소의 교수인 Alondra Nelson은 강조했습니다.
OpenAI는 Whisper를 정확도 결함이 심각한 문제를 초래할 수 있는 의사결정 상황과 같은 고위험 영역에서 사용하지 말라고 권고하지만, 이 도구의 마케팅된 정확도는 운영을 간소화하려는 다양한 산업에 매력적으로 다가가며, 잠재적 위험을 간과하는 경우가 많습니다.
이 문제는 길거나 품질이 낮은 오디오에 국한되지 않습니다. 연구자들은 짧고 명확한 오디오 샘플에서도 환각 현상을 발견했습니다. 그들은 수백만 개의 녹음에서 수만 개의 잘못된 전사가 발생할 수 있다고 추정합니다. Gallaudet 대학교의 기술 접근 프로그램 책임자이자 청각 장애인인 Christian Vogler는 청각 장애인이나 난청이 있는 사람들이 “이 모든 텍스트 속에 숨겨진” 환각 현상을 놓칠 수 있다고 지적했습니다.
이러한 발견은 AI 산업의 더 큰 문제를 강조합니다: 미국에 포괄적인 AI 규제가 없는 상황에서 수익을 위해 제품을 서둘러 시장에 출시하는 것입니다. 이는 특히 OpenAI의 영리 vs 비영리 상태에 대한 논쟁과 AI 위험을 경시하는 최근 리더십 발언 속에서 더욱 두드러집니다.
OpenAI 대변인은 AP에 회사가 환각 현상을 줄이기 위해 지속적으로 노력하고 있으며, 연구자들의 발견을 소중히 여겨 모델 업데이트에 피드백을 반영한다고 말했습니다.
그동안 저희는 기자들이 신뢰하는 신뢰할 수 있는 AI 전사 도구인 Otter.ai를 고려할 것을 제안합니다. 이 도구는 최근 6개 신규 언어를 지원하기 시작했습니다. 오랜 사용자는 새로운 AI 요약 기능에서 환각 통계를 보고했지만, 오류는 전사 자체에는 나타나지 않았습니다. Otter.ai는 특히 중요한 작업에서 정확도를 위해 전사를 검토하고 편집할 것을 권고하며, 배경 소음, 억양, 대화의 복잡성과 같은 요인으로 인해 정확도가 달라질 수 있다고 언급했습니다.
iPhone 사용자의 경우, iOS 18.1에 Apple Intelligence가 포함된 AI 기반 통화 녹음 및 전사 기능이 제공되지만, ZDNET의 편집장 Jason Hiner는 이를 “아직 진행 중인 작업”이라고 설명했습니다.
OpenAI는 최근 2억 5천만 명의 ChatGPT Plus 사용자에게 더 많은 도구를 제공할 계획을 발표했습니다.
관련 기사
신성한 헌신 탐구: 신앙, 사랑, 그리고 영적 자유
혼란과 방해로 가득한 세상에서, 영적 연결을 위한 평화로운 순간을 만드는 것은 삶을 변화시킬 수 있습니다. 이 글은 예수님을 숭배하는 심오한 행위를 탐구하며, 신앙, 신성한 사랑, 그리고 영적 해방을 위한 개인적인 여정을 다룹니다. 우리는 이러한 헌신이 삶의 다양한 측면을 어떻게 형성하며, 위안, 회복력, 그리고 새로운 목적을 제공하는지 살펴봅니다. 신앙을
AI로 구동되는 SQL 관리: 2025년 데이터베이스 간소화
인공지능은 SQL을 통해 데이터베이스 관리를 혁신하며, 자동화와 효율성을 강화하는 혁신적인 도구를 도입하고 있습니다. 데이터 컨텍스트를 이해하고, 스마트한 추천을 제공하며, 반복적인 작업을 자동화하고, 문제를 예측함으로써 AI는 SQL 작업을 단순화합니다. 이 가이드는 AI 기반 솔루션이 효율성, 정밀성, 그리고 사전 예방적 데이터베이스 관리를 어떻게 향상
점컴에서 AI까지: 과거 기술 함정을 피하기 위한 교훈
점컴 붐 시기에는 회사 이름에 “.com”을 추가하는 것만으로 고객, 수익, 또는 실행 가능한 비즈니스 모델 없이도 주가가 급등할 수 있었습니다. 오늘날, “AI”라는 단어 주변에서도 같은 열풍이 일어나며, 기업들은 이 유행을 활용하기 위해 앞다퉈 AI라는 라벨을 채택하고 있습니다.기업들은 브랜딩, 제품 설명, 도메인 이름에 “AI”를 통합하기 위해 서두르
의견 (17)
0/200
PaulLewis
2025년 8월 6일 오전 2시 1분 0초 GMT+09:00
This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊
0
FrankSanchez
2025년 8월 4일 오후 3시 48분 52초 GMT+09:00
This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔
0
WalterWhite
2025년 4월 16일 오후 12시 50분 21초 GMT+09:00
このツールは本当に助かる!AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね!😊
0
HaroldLopez
2025년 4월 16일 오전 3시 21분 19초 GMT+09:00
이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊
0
JimmyGarcia
2025년 4월 16일 오전 3시 19분 21초 GMT+09:00
Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊
0
RogerJackson
2025년 4월 15일 오후 11시 28분 5초 GMT+09:00
OpenAI의 Whisper 대체 도구는 정말 구세주네요! 환각이 적고 정확도가 높다니, 가입해야죠! 일에는 완벽하지만 인터페이스가 좀 더 세련되면 좋겠어요. 😅
0
OpenAI의 Whisper, 2022년에 출시된 AI 기반 음성 인식 및 전사 도구는 환각 현상을 자주 생성하거나 정보를 날조하는 것으로 밝혀져, 중요한 환경에서 해를 끼칠 가능성에 대한 우려를 불러일으키고 있습니다.
미시간 대학교의 연구자는 그가 검토한 공개 회의의 오디오 전사본에서 80%가 환각 현상을 발견했습니다. 마찬가지로, 100시간 분량의 Whisper 전사본을 분석한 엔지니어는 약 절반에서 환각 현상을 보고했으며, 또 다른 개발자는 그가 만든 거의 모든 전사본에서, 총 26,000건의 사례를 발견했습니다.
전사에서 사소한 오류는 흔하지만, 전문가들은 Whisper의 환각 수준이 AI 전사 도구 중에서 전례가 없다고 지적했습니다. OpenAI는 오픈소스 신경망인 Whisper가 영어 음성 인식에서 인간에 가까운 정확도를 달성했다고 주장합니다. 이 도구는 인터뷰 전사, 콘텐츠 번역, 비디오 자막 생성과 같은 작업을 위해 다양한 산업에서 널리 사용됩니다.
Whisper의 광범위한 사용은 다양한 플랫폼에서 날조된 텍스트, 잘못 귀속된 인용, 기타 오정보의 확산으로 이어질 수 있으며, 이는 원본 콘텐츠의 성격에 따라 영향이 달라집니다. Whisper는 ChatGPT의 일부 버전에 통합되어 있으며, 콜센터, 음성 비서, Oracle 및 Microsoft의 클라우드 플랫폼에서 사용되며, 지난 달 HuggingFace에서 420만 번 이상 다운로드되었습니다.
특히 우려되는 점은 의료 전문가들이 환자 상담을 전사하기 위해 Whisper 기반 도구를 점점 더 많이 사용하고 있다는 것입니다. AP는 12명 이상의 엔지니어, 연구자, 개발자와 대화했으며, 그들은 Whisper가 종종 문구와 전체 문장을 날조하며, 때로는 인종적 논평, 폭력적 수사, 심지어 상상된 의료 치료를 포함한다고 확인했습니다.
“아무도 오진을 원하지 않습니다,”라고 고등연구소의 교수인 Alondra Nelson은 강조했습니다.
OpenAI는 Whisper를 정확도 결함이 심각한 문제를 초래할 수 있는 의사결정 상황과 같은 고위험 영역에서 사용하지 말라고 권고하지만, 이 도구의 마케팅된 정확도는 운영을 간소화하려는 다양한 산업에 매력적으로 다가가며, 잠재적 위험을 간과하는 경우가 많습니다.
이 문제는 길거나 품질이 낮은 오디오에 국한되지 않습니다. 연구자들은 짧고 명확한 오디오 샘플에서도 환각 현상을 발견했습니다. 그들은 수백만 개의 녹음에서 수만 개의 잘못된 전사가 발생할 수 있다고 추정합니다. Gallaudet 대학교의 기술 접근 프로그램 책임자이자 청각 장애인인 Christian Vogler는 청각 장애인이나 난청이 있는 사람들이 “이 모든 텍스트 속에 숨겨진” 환각 현상을 놓칠 수 있다고 지적했습니다.
이러한 발견은 AI 산업의 더 큰 문제를 강조합니다: 미국에 포괄적인 AI 규제가 없는 상황에서 수익을 위해 제품을 서둘러 시장에 출시하는 것입니다. 이는 특히 OpenAI의 영리 vs 비영리 상태에 대한 논쟁과 AI 위험을 경시하는 최근 리더십 발언 속에서 더욱 두드러집니다.
OpenAI 대변인은 AP에 회사가 환각 현상을 줄이기 위해 지속적으로 노력하고 있으며, 연구자들의 발견을 소중히 여겨 모델 업데이트에 피드백을 반영한다고 말했습니다.
그동안 저희는 기자들이 신뢰하는 신뢰할 수 있는 AI 전사 도구인 Otter.ai를 고려할 것을 제안합니다. 이 도구는 최근 6개 신규 언어를 지원하기 시작했습니다. 오랜 사용자는 새로운 AI 요약 기능에서 환각 통계를 보고했지만, 오류는 전사 자체에는 나타나지 않았습니다. Otter.ai는 특히 중요한 작업에서 정확도를 위해 전사를 검토하고 편집할 것을 권고하며, 배경 소음, 억양, 대화의 복잡성과 같은 요인으로 인해 정확도가 달라질 수 있다고 언급했습니다.
iPhone 사용자의 경우, iOS 18.1에 Apple Intelligence가 포함된 AI 기반 통화 녹음 및 전사 기능이 제공되지만, ZDNET의 편집장 Jason Hiner는 이를 “아직 진행 중인 작업”이라고 설명했습니다.
OpenAI는 최근 2억 5천만 명의 ChatGPT Plus 사용자에게 더 많은 도구를 제공할 계획을 발표했습니다.




This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊




This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔




このツールは本当に助かる!AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね!😊




이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊




Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊




OpenAI의 Whisper 대체 도구는 정말 구세주네요! 환각이 적고 정확도가 높다니, 가입해야죠! 일에는 완벽하지만 인터페이스가 좀 더 세련되면 좋겠어요. 😅












