Hogar
Operai aboga por puntos de referencia de IA específicos de la industria: aquí está por qué importa

Los resultados de rendimiento de los benchmarks son una característica común cuando se lanzan nuevos modelos de IA, demostrando sus capacidades en una variedad de tareas generales como matemáticas de primaria (GSM8K) o razonamiento de nivel de posgrado (GPQA). Sin embargo, estos benchmarks a menudo no abordan las necesidades específicas de diversas industrias.
También: ChatGPT recordará todo lo que le digas ahora, como un verdadero asistente personal
Programa de Pioneros de OpenAI
Para cerrar esta brecha, OpenAI presentó el Programa de Pioneros de OpenAI, diseñado para mejorar el desarrollo de modelos de IA para industrias específicas y aplicaciones prácticas. Esta iniciativa es un esfuerzo de doble enfoque donde las empresas se asocian con los investigadores de OpenAI para crear evaluaciones más personalizadas y perfeccionar modelos para adaptarse a dominios específicos.
estamos lanzando el programa de pioneros de openai -- una asociación entre openai y empresas que construyen productos avanzados de IA para (a) ajustar intensivamente modelos que superen en tareas específicas de alto valor en dominios, y (b) construir mejores evaluaciones del mundo real que permitan a las industrias... https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025
En una publicación reciente en el blog, OpenAI señaló que sectores como el legal, financiero, de seguros, sanitario y contable carecen de una fuente de benchmarks integral. Para abordar esto, OpenAI planea colaborar con múltiples empresas dentro de cada sector para desarrollar estas evaluaciones. Este enfoque no solo busca mejorar el desarrollo de modelos, sino también fomentar una mayor confianza entre el público y las tecnologías de IA.
También: La IA no está llegando a un límite, simplemente se está volviendo demasiado inteligente para los benchmarks, dice Anthropic
La investigación ha identificado la ausencia de benchmarks específicos de la industria como un desafío significativo para la IA en entornos empresariales. Por ejemplo, Silvio Savarese, quien lidera Salesforce AI Research, discutió el concepto de Inteligencia General Empresarial (EGI) en una publicación de blog. EGI se centra en soluciones avanzadas de IA adaptadas a dominios comerciales específicos. En una discusión con ZDNET, enfatizó la importancia de desarrollar benchmarks que evalúen funciones específicas de dominio como un paso clave hacia la consecución de EGI.
Perfeccionamiento de modelos existentes
Además de crear nuevas evaluaciones, OpenAI trabajará con empresas para perfeccionar modelos existentes para tres casos de uso específicos de la industria a través de un método llamado ajuste fino por refuerzo (RFT). OpenAI proporcionará orientación sobre la implementación de RFT, permitiendo a las empresas decidir cómo implementar mejor estos modelos, que se espera que estén listos para un uso a gran escala según OpenAI.
También: La carrera de modelos de IA se ha vuelto repentinamente mucho más reñida, dicen los académicos de Stanford
El grupo inicial que participa en este programa incluirá un número selecto de startups enfocadas en casos de uso con un impacto significativo en el mundo real. Si tu empresa cumple con estos criterios, puedes solicitar enviando información básica de la empresa a través de la página web del Programa de Pioneros de OpenAI.
Recibe las principales noticias de la mañana en tu bandeja de entrada cada día con nuestro boletín Tech Today.
Artículo relacionado
El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad
El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib
Trace recauda 3 millones de dólares para superar las barreras en la adopción de agentes de IA empresariales
A pesar de su potencial, los agentes de IA han tenido dificultades para ganar terreno en el ámbito empresarial. Una startup emergente cree que el problema fundamental radica en la falta de contexto.Lanzada como parte del grupo de verano 2025 de Y Co
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail
Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
Recomendaciones de temas especiales relacionados
comentario (23)
0/500
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

Los resultados de rendimiento de los benchmarks son una característica común cuando se lanzan nuevos modelos de IA, demostrando sus capacidades en una variedad de tareas generales como matemáticas de primaria (GSM8K) o razonamiento de nivel de posgrado (GPQA). Sin embargo, estos benchmarks a menudo no abordan las necesidades específicas de diversas industrias.
También: ChatGPT recordará todo lo que le digas ahora, como un verdadero asistente personal
Programa de Pioneros de OpenAI
Para cerrar esta brecha, OpenAI presentó el Programa de Pioneros de OpenAI, diseñado para mejorar el desarrollo de modelos de IA para industrias específicas y aplicaciones prácticas. Esta iniciativa es un esfuerzo de doble enfoque donde las empresas se asocian con los investigadores de OpenAI para crear evaluaciones más personalizadas y perfeccionar modelos para adaptarse a dominios específicos.
estamos lanzando el programa de pioneros de openai -- una asociación entre openai y empresas que construyen productos avanzados de IA para (a) ajustar intensivamente modelos que superen en tareas específicas de alto valor en dominios, y (b) construir mejores evaluaciones del mundo real que permitan a las industrias... https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025
En una publicación reciente en el blog, OpenAI señaló que sectores como el legal, financiero, de seguros, sanitario y contable carecen de una fuente de benchmarks integral. Para abordar esto, OpenAI planea colaborar con múltiples empresas dentro de cada sector para desarrollar estas evaluaciones. Este enfoque no solo busca mejorar el desarrollo de modelos, sino también fomentar una mayor confianza entre el público y las tecnologías de IA.
También: La IA no está llegando a un límite, simplemente se está volviendo demasiado inteligente para los benchmarks, dice Anthropic
La investigación ha identificado la ausencia de benchmarks específicos de la industria como un desafío significativo para la IA en entornos empresariales. Por ejemplo, Silvio Savarese, quien lidera Salesforce AI Research, discutió el concepto de Inteligencia General Empresarial (EGI) en una publicación de blog. EGI se centra en soluciones avanzadas de IA adaptadas a dominios comerciales específicos. En una discusión con ZDNET, enfatizó la importancia de desarrollar benchmarks que evalúen funciones específicas de dominio como un paso clave hacia la consecución de EGI.
Perfeccionamiento de modelos existentes
Además de crear nuevas evaluaciones, OpenAI trabajará con empresas para perfeccionar modelos existentes para tres casos de uso específicos de la industria a través de un método llamado ajuste fino por refuerzo (RFT). OpenAI proporcionará orientación sobre la implementación de RFT, permitiendo a las empresas decidir cómo implementar mejor estos modelos, que se espera que estén listos para un uso a gran escala según OpenAI.
También: La carrera de modelos de IA se ha vuelto repentinamente mucho más reñida, dicen los académicos de Stanford
El grupo inicial que participa en este programa incluirá un número selecto de startups enfocadas en casos de uso con un impacto significativo en el mundo real. Si tu empresa cumple con estos criterios, puedes solicitar enviando información básica de la empresa a través de la página web del Programa de Pioneros de OpenAI.
Recibe las principales noticias de la mañana en tu bandeja de entrada cada día con nuestro boletín Tech Today.
El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad
El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib
Trace recauda 3 millones de dólares para superar las barreras en la adopción de agentes de IA empresariales
A pesar de su potencial, los agentes de IA han tenido dificultades para ganar terreno en el ámbito empresarial. Una startup emergente cree que el problema fundamental radica en la falta de contexto.Lanzada como parte del grupo de verano 2025 de Y Co
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail
Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀











