Operai aboga por puntos de referencia de IA específicos de la industria: aquí está por qué importa

Hogar

Noticias

15 de abril de 2025

ChristopherHarris

200

Operai aboga por puntos de referencia de IA específicos de la industria: aquí está por qué importa

Los resultados de rendimiento de los benchmarks son una característica común cuando se lanzan nuevos modelos de IA, demostrando sus capacidades en una variedad de tareas generales como matemáticas de primaria (GSM8K) o razonamiento de nivel de posgrado (GPQA). Sin embargo, estos benchmarks a menudo no abordan las necesidades específicas de diversas industrias.

También: ChatGPT recordará todo lo que le digas ahora, como un verdadero asistente personal

Programa de Pioneros de OpenAI

Para cerrar esta brecha, OpenAI presentó el Programa de Pioneros de OpenAI, diseñado para mejorar el desarrollo de modelos de IA para industrias específicas y aplicaciones prácticas. Esta iniciativa es un esfuerzo de doble enfoque donde las empresas se asocian con los investigadores de OpenAI para crear evaluaciones más personalizadas y perfeccionar modelos para adaptarse a dominios específicos.

estamos lanzando el programa de pioneros de openai -- una asociación entre openai y empresas que construyen productos avanzados de IA para (a) ajustar intensivamente modelos que superen en tareas específicas de alto valor en dominios, y (b) construir mejores evaluaciones del mundo real que permitan a las industrias... https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025

En una publicación reciente en el blog, OpenAI señaló que sectores como el legal, financiero, de seguros, sanitario y contable carecen de una fuente de benchmarks integral. Para abordar esto, OpenAI planea colaborar con múltiples empresas dentro de cada sector para desarrollar estas evaluaciones. Este enfoque no solo busca mejorar el desarrollo de modelos, sino también fomentar una mayor confianza entre el público y las tecnologías de IA.

También: La IA no está llegando a un límite, simplemente se está volviendo demasiado inteligente para los benchmarks, dice Anthropic

La investigación ha identificado la ausencia de benchmarks específicos de la industria como un desafío significativo para la IA en entornos empresariales. Por ejemplo, Silvio Savarese, quien lidera Salesforce AI Research, discutió el concepto de Inteligencia General Empresarial (EGI) en una publicación de blog. EGI se centra en soluciones avanzadas de IA adaptadas a dominios comerciales específicos. En una discusión con ZDNET, enfatizó la importancia de desarrollar benchmarks que evalúen funciones específicas de dominio como un paso clave hacia la consecución de EGI.

Perfeccionamiento de modelos existentes

Además de crear nuevas evaluaciones, OpenAI trabajará con empresas para perfeccionar modelos existentes para tres casos de uso específicos de la industria a través de un método llamado ajuste fino por refuerzo (RFT). OpenAI proporcionará orientación sobre la implementación de RFT, permitiendo a las empresas decidir cómo implementar mejor estos modelos, que se espera que estén listos para un uso a gran escala según OpenAI.

También: La carrera de modelos de IA se ha vuelto repentinamente mucho más reñida, dicen los académicos de Stanford

El grupo inicial que participa en este programa incluirá un número selecto de startups enfocadas en casos de uso con un impacto significativo en el mundo real. Si tu empresa cumple con estos criterios, puedes solicitar enviando información básica de la empresa a través de la página web del Programa de Pioneros de OpenAI.

Recibe las principales noticias de la mañana en tu bandeja de entrada cada día con nuestro boletín Tech Today.

Artículo relacionado

El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib

Trace recauda 3 millones de dólares para superar las barreras en la adopción de agentes de IA empresariales A pesar de su potencial, los agentes de IA han tenido dificultades para ganar terreno en el ámbito empresarial. Una startup emergente cree que el problema fundamental radica en la falta de contexto.Lanzada como parte del grupo de verano 2025 de Y Co

Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve

Recomendaciones de temas especiales relacionados

código

Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados

Descubre los mejores revisores de código con IA de 2026 en XIX.AI. Nuestra lista seleccionada incluye herramientas de primera categoría y revolucionarias para automatizar el cumplimiento de las normas de código limpio y refactorizar archivos de repositorios heredados. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo tu ventaja con la IA.

10 herramientas

xix.ai

Texto a voz

Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes

Descubre las mejores aplicaciones de TTS con IA de 2026, seleccionadas específicamente para ayudar a las personas con dislexia. Nuestra clasificación, elaborada por expertos, compara herramientas gratuitas y de pago, y destaca sus potentes funciones para mejorar la eficiencia en la lectura y el aprendizaje. Explora soluciones innovadoras e imprescindibles para liberar el potencial de los estudiantes. Empieza tu viaje en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía

Descubre los mejores generadores de IA para manga shonen de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas para crear secuencias de acción trepidantes y efectos energéticos dinámicos. Compara las opciones gratuitas con las de pago mediante pruebas reales. ¡Libera tu potencial creativo y empieza a crear manga épico hoy mismo!

15 herramientas

xix.ai

Negocio

Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa

Los mejores gestores de gastos con IA de 2026: las herramientas mejor valoradas para escanear recibos y clasificar automáticamente los gastos de la empresa. Descubre soluciones potentes y revolucionarias para una gestión de gastos sin esfuerzo, un seguimiento financiero preciso y un cumplimiento normativo optimizado. Nuestra comparativa, seleccionada y actualizada semanalmente, entre opciones gratuitas y de pago te ayuda a encontrar la que mejor se adapta a tus necesidades. Aprovecha al máximo las ventajas de la IA con las recomendaciones de los expertos de XIX.AI.

10 herramientas

xix.ai

Negocio

Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas

xix.ai

Productividad

Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas

xix.ai

comentario (23)

0/500

Inicie sesión primero

WillLopez

12 de septiembre de 2025 00:30:33 GMT+02:00

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith

27 de agosto de 2025 17:01:28 GMT+02:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris

11 de agosto de 2025 07:00:59 GMT+02:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott

23 de abril de 2025 19:47:18 GMT+02:00

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson

22 de abril de 2025 23:27:27 GMT+02:00

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい！一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas

22 de abril de 2025 01:41:13 GMT+02:00

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como un revolucionario sistema de IA multimodal Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado

Más

Presentado