opción
Hogar
Noticias
Alternativa superior a la herramienta de transcripción de IA de OpenAI: menos alucinación, más precisión

Alternativa superior a la herramienta de transcripción de IA de OpenAI: menos alucinación, más precisión

14 de abril de 2025
218

Alternativa superior a la herramienta de transcripción de IA de OpenAI: menos alucinación, más precisión

El Whisper de OpenAI, una herramienta de reconocimiento y transcripción de voz impulsada por IA lanzada en 2022, genera frecuentemente alucinaciones o información fabricada, lo que plantea preocupaciones sobre su potencial para causar daño en entornos críticos.

Un investigador de la Universidad de Michigan descubrió alucinaciones en el 80% de las transcripciones de audio de reuniones públicas que revisó. De manera similar, un ingeniero que analizó 100 horas de transcripciones de Whisper reportó alucinaciones en aproximadamente la mitad, y otro desarrollador las encontró en casi todas las transcripciones que creó, totalizando 26,000 casos.

Aunque los errores menores en la transcripción son comunes, los expertos señalaron que el nivel de alucinación de Whisper es sin precedentes entre las herramientas de transcripción de IA. OpenAI afirma que Whisper, una red neuronal de código abierto, logra una precisión casi humana en el reconocimiento de voz en inglés. Es ampliamente utilizado en industrias para tareas como transcribir entrevistas, traducir contenido y generar subtítulos de video.

El uso generalizado de Whisper podría llevar a la propagación de texto fabricado, citas mal atribuidas y otra desinformación en diversas plataformas, con un impacto que varía según la naturaleza del contenido original. Whisper está integrado en algunas versiones de ChatGPT, usado en centros de llamadas, asistentes de voz y plataformas en la nube de Oracle y Microsoft, y fue descargado más de 4.2 millones de veces el último mes desde HuggingFace.

De particular preocupación es el creciente uso de herramientas basadas en Whisper por parte de profesionales médicos para transcribir consultas de pacientes. La AP habló con más de una docena de ingenieros, investigadores y desarrolladores que confirmaron que Whisper a menudo fabrica frases y oraciones completas, a veces incluyendo comentarios raciales, retórica violenta e incluso tratamientos médicos imaginados.

"Nadie quiere un diagnóstico erróneo," enfatizó Alondra Nelson, profesora del Instituto de Estudios Avanzados.

Aunque OpenAI desaconseja usar Whisper en dominios de alto riesgo como contextos de toma de decisiones donde los errores de precisión pueden generar problemas significativos, la precisión promocionada de la herramienta la hace atractiva para diversas industrias que buscan optimizar operaciones, a menudo pasando por alto los riesgos potenciales.

El problema no se limita a audios largos o mal grabados; los investigadores encontraron alucinaciones incluso en muestras de audio cortas y claras. Estiman que esto podría resultar en decenas de miles de transcripciones incorrectas en millones de grabaciones. Christian Vogler, director del Programa de Acceso Tecnológico de la Universidad de Gallaudet y sordo él mismo, señaló que las personas sordas o con dificultades auditivas podrían no detectar estas alucinaciones "ocultas entre todo este texto."

Estos hallazgos destacan un problema más amplio en la industria de la IA: la carrera por lanzar productos al mercado con fines de lucro, especialmente en ausencia de regulaciones integrales de IA en EE. UU. Esto es particularmente relevante en medio de debates sobre el estatus de OpenAI como empresa con o sin fines de lucro y recientes declaraciones de liderazgo que minimizan los riesgos de la IA.

Un portavoz de OpenAI dijo a la AP que la empresa está trabajando continuamente para reducir las alucinaciones y valora los hallazgos de los investigadores, incorporando retroalimentación en las actualizaciones del modelo.

Mientras tanto, sugerimos considerar Otter.ai, una herramienta de transcripción de IA confiable utilizada por periodistas, que recientemente añadió soporte para seis nuevos idiomas. Aunque un usuario de larga data reportó una estadística alucinada en una nueva función de resumen de IA, el error no apareció en la transcripción misma. Otter.ai aconseja a los usuarios revisar y editar las transcripciones para garantizar la precisión, especialmente para tareas críticas, señalando que la exactitud puede variar debido a factores como el ruido de fondo, acentos y la complejidad de la conversación.

Para usuarios de iPhone, iOS 18.1 con Apple Intelligence ahora ofrece grabación y transcripción de llamadas impulsadas por IA, aunque el editor en jefe de ZDNET, Jason Hiner, lo describe como "todavía un trabajo en progreso."

OpenAI anunció recientemente planes para proporcionar más herramientas a sus 250 millones de usuarios de ChatGPT Plus.

Artículo relacionado
Google Fotos da vida al emblemático armario de «Clueless» gracias a la inteligencia artificial Google Fotos da vida al emblemático armario de «Clueless» gracias a la inteligencia artificial Google Fotos anunció el miércoles una nueva función basada en la inteligencia artificial que pronto convertirá las fotos de tu ropa en un armario digital, lo que te permitirá crear nuevas combinacione
El cortometraje «Red Fruit» es acusado de utilizar IA para robar los rostros de personas corrientes; no hay respuesta oficial El cortometraje «Red Fruit» es acusado de utilizar IA para robar los rostros de personas corrientes; no hay respuesta oficial El sector de los vídeos cortos se enfrenta actualmente a una polémica relacionada con la infracción de derechos de autor mediante el uso de la inteligencia artificial. La producción de Red Fruit Short
Una guía por la nueva norma de seguridad de la IA del ETSI Una guía por la nueva norma de seguridad de la IA del ETSI La norma ETSI EN 304 223 establece los requisitos de seguridad fundamentales para la inteligencia artificial que las organizaciones deben integrar en sus estructuras de gobernanza.A medida que las emp
Recomendaciones de temas especiales relacionados
Productividad Diseñadores de arquitecturas de IA: Crea arquitecturas de sistemas escalables utilizando lenguaje natural
Diseñadores de arquitecturas de IA: Crea arquitecturas de sistemas escalables utilizando lenguaje natural

Descubre las mejores herramientas de diseño de arquitecturas de IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y mejor valorada, incluye soluciones potentes y revolucionarias para crear arquitecturas de sistemas escalables mediante el lenguaje natural. Compara las opciones gratuitas con las de pago con información basada en casos reales. Aprovecha tu ventaja en IA y optimiza el desarrollo hoy mismo.

10 herramientas
xix.ai
Creación de cómics Creadores de Perfiles de Personajes AI: Genera historias detalladas y referencias visuales para los personajes principales de los mangas.
Creadores de Perfiles de Personajes AI: Genera historias detalladas y referencias visuales para los personajes principales de los mangas.

2026: Los mejores creadores de perfiles de personajes AI: Descubra herramientas altamente valoradas para generar historias detalladas y referencias visuales para sus personajes principales en manga. Nuestra lista, actualizada semanalmente, compara opciones gratuitas y pagas basándose en pruebas reales. Encuentre soluciones poderosas que revolucionarán su proceso creativo y le ayudarán a crear personajes convincentes de manera más eficiente. Explore las clasificaciones en XIX.AI y descubra hoy mismo al aliado perfecto para su narrativa.

10 herramientas
xix.ai
Salud y bienestar Asistentes de IA para el embarazo: genera planes seguros de entrenamiento y nutrición trimestre a trimestre
Asistentes de IA para el embarazo: genera planes seguros de entrenamiento y nutrición trimestre a trimestre

Descubre los mejores asistentes de IA para el embarazo de 2026, que te ofrecen planes de entrenamiento y nutrición seguros y personalizados trimestre a trimestre. Obtén recomendaciones cuidadosamente seleccionadas y con las mejores valoraciones, con comparativas entre opciones gratuitas y de pago, y opiniones reales. Disfruta de un embarazo más saludable con la guía de expertos de XIX.AI. Explora ahora.

10 herramientas
xix.ai
escribiendo Los mejores generadores de texto gratuitos e indetectables por la IA: convierte borradores robóticos en prosa natural y de estilo humano
Los mejores generadores de texto gratuitos e indetectables por la IA: convierte borradores robóticos en prosa natural y de estilo humano

Descubre los mejores generadores de texto con IA indetectables y gratuitos de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a transformar borradores robóticos en prosa natural y de estilo humano. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo las ventajas de la escritura con IA.

10 herramientas
xix.ai
Edición de imágenes Generadores de arte por IA para guiones de cortometrajes: Personajes de fantasía y romance urbano
Generadores de arte por IA para guiones de cortometrajes: Personajes de fantasía y romance urbano

2026 Últimas novedades: Descubra los mejores generadores de arte por IA para guiones de historias cortas. Nuestra lista seleccionada incluye las herramientas más valoradas para crear personajes fascinantes de fantasía y romance urbano. Compare opciones gratuitas y pagas, vea resultados de pruebas reales y encuentre el compañero creativo perfecto para usted. Reciba clasificaciones actualizadas semanalmente y opiniones de expertos de XIX.AI. ¡Comience a visualizar su historia hoy mismo!

10 herramientas
xix.ai
escribiendo Los mejores herramientas de scripting AI para la radio y los podcasts: Crea anuncios de audio atractivos.
Los mejores herramientas de scripting AI para la radio y los podcasts: Crea anuncios de audio atractivos.

Descubra los mejores herramientas de scripting de IA para la radio y los podcasts en 2026 en XIX.AI. Nuestra lista seleccionada y altamente valorada incluye soluciones poderosas que cambiarán completamente la forma en que crea anuncios de audio atractivos. Compare opciones gratuitas y pagadas mediante pruebas reales y clasificaciones actualizadas semanalmente. ¡Despliegue todo su potencial creativo hoy mismo!

10 herramientas
xix.ai
comentario (18)
0/500
DouglasScott
DouglasScott 15 de agosto de 2025 04:01:03 GMT+02:00

This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄

PaulLewis
PaulLewis 5 de agosto de 2025 19:01:00 GMT+02:00

This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊

FrankSanchez
FrankSanchez 4 de agosto de 2025 08:48:52 GMT+02:00

This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔

WalterWhite
WalterWhite 16 de abril de 2025 05:50:21 GMT+02:00

このツールは本当に助かる!AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね!😊

HaroldLopez
HaroldLopez 15 de abril de 2025 20:21:19 GMT+02:00

이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

JimmyGarcia
JimmyGarcia 15 de abril de 2025 20:19:21 GMT+02:00

Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊

OR