Operai aboga por puntos de referencia de IA específicos de la industria: aquí está por qué importa

Los resultados de rendimiento de los benchmarks son una característica común cuando se lanzan nuevos modelos de IA, demostrando sus capacidades en una variedad de tareas generales como matemáticas de primaria (GSM8K) o razonamiento de nivel de posgrado (GPQA). Sin embargo, estos benchmarks a menudo no abordan las necesidades específicas de diversas industrias.
También: ChatGPT recordará todo lo que le digas ahora, como un verdadero asistente personal
Programa de Pioneros de OpenAI
Para cerrar esta brecha, OpenAI presentó el Programa de Pioneros de OpenAI, diseñado para mejorar el desarrollo de modelos de IA para industrias específicas y aplicaciones prácticas. Esta iniciativa es un esfuerzo de doble enfoque donde las empresas se asocian con los investigadores de OpenAI para crear evaluaciones más personalizadas y perfeccionar modelos para adaptarse a dominios específicos.
estamos lanzando el programa de pioneros de openai -- una asociación entre openai y empresas que construyen productos avanzados de IA para (a) ajustar intensivamente modelos que superen en tareas específicas de alto valor en dominios, y (b) construir mejores evaluaciones del mundo real que permitan a las industrias... https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025
En una publicación reciente en el blog, OpenAI señaló que sectores como el legal, financiero, de seguros, sanitario y contable carecen de una fuente de benchmarks integral. Para abordar esto, OpenAI planea colaborar con múltiples empresas dentro de cada sector para desarrollar estas evaluaciones. Este enfoque no solo busca mejorar el desarrollo de modelos, sino también fomentar una mayor confianza entre el público y las tecnologías de IA.
También: La IA no está llegando a un límite, simplemente se está volviendo demasiado inteligente para los benchmarks, dice Anthropic
La investigación ha identificado la ausencia de benchmarks específicos de la industria como un desafío significativo para la IA en entornos empresariales. Por ejemplo, Silvio Savarese, quien lidera Salesforce AI Research, discutió el concepto de Inteligencia General Empresarial (EGI) en una publicación de blog. EGI se centra en soluciones avanzadas de IA adaptadas a dominios comerciales específicos. En una discusión con ZDNET, enfatizó la importancia de desarrollar benchmarks que evalúen funciones específicas de dominio como un paso clave hacia la consecución de EGI.
Perfeccionamiento de modelos existentes
Además de crear nuevas evaluaciones, OpenAI trabajará con empresas para perfeccionar modelos existentes para tres casos de uso específicos de la industria a través de un método llamado ajuste fino por refuerzo (RFT). OpenAI proporcionará orientación sobre la implementación de RFT, permitiendo a las empresas decidir cómo implementar mejor estos modelos, que se espera que estén listos para un uso a gran escala según OpenAI.
También: La carrera de modelos de IA se ha vuelto repentinamente mucho más reñida, dicen los académicos de Stanford
El grupo inicial que participa en este programa incluirá un número selecto de startups enfocadas en casos de uso con un impacto significativo en el mundo real. Si tu empresa cumple con estos criterios, puedes solicitar enviando información básica de la empresa a través de la página web del Programa de Pioneros de OpenAI.
Recibe las principales noticias de la mañana en tu bandeja de entrada cada día con nuestro boletín Tech Today.
Artículo relacionado
Transforme su estrategia de ventas: Tecnología AI Cold Calling de Vapi
Las empresas modernas funcionan a la velocidad del rayo y exigen soluciones innovadoras para seguir siendo competitivas. Imagina revolucionar el alcance de tu agencia con un sistema de llamadas en frí
Las mejores herramientas de AI para crear infografías educativas - Consejos y técnicas de diseño
En el panorama educativo digital actual, la infografía ha surgido como un medio de comunicación transformador que convierte información compleja en formatos visualmente atractivos y fácilmente compren
Topaz DeNoise AI: Mejor herramienta de reducción de ruido en 2025 - Guía completa
En el competitivo mundo de la fotografía digital, la claridad de imagen sigue siendo primordial. Fotógrafos de todos los niveles se enfrentan al ruido digital que compromete tomas que de otro modo ser
comentario (23)
0/200
WillLopez
12 de septiembre de 2025 00:30:33 GMT+02:00
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
0
RichardSmith
27 de agosto de 2025 17:01:28 GMT+02:00
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
0
JustinHarris
11 de agosto de 2025 07:00:59 GMT+02:00
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
0
JosephScott
23 de abril de 2025 19:47:18 GMT+02:00
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀
0
FrankJackson
22 de abril de 2025 23:27:27 GMT+02:00
業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅
0
BrianThomas
22 de abril de 2025 01:41:13 GMT+02:00
A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀
0
Los resultados de rendimiento de los benchmarks son una característica común cuando se lanzan nuevos modelos de IA, demostrando sus capacidades en una variedad de tareas generales como matemáticas de primaria (GSM8K) o razonamiento de nivel de posgrado (GPQA). Sin embargo, estos benchmarks a menudo no abordan las necesidades específicas de diversas industrias.
También: ChatGPT recordará todo lo que le digas ahora, como un verdadero asistente personal
Programa de Pioneros de OpenAI
Para cerrar esta brecha, OpenAI presentó el Programa de Pioneros de OpenAI, diseñado para mejorar el desarrollo de modelos de IA para industrias específicas y aplicaciones prácticas. Esta iniciativa es un esfuerzo de doble enfoque donde las empresas se asocian con los investigadores de OpenAI para crear evaluaciones más personalizadas y perfeccionar modelos para adaptarse a dominios específicos.
estamos lanzando el programa de pioneros de openai -- una asociación entre openai y empresas que construyen productos avanzados de IA para (a) ajustar intensivamente modelos que superen en tareas específicas de alto valor en dominios, y (b) construir mejores evaluaciones del mundo real que permitan a las industrias... https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025
En una publicación reciente en el blog, OpenAI señaló que sectores como el legal, financiero, de seguros, sanitario y contable carecen de una fuente de benchmarks integral. Para abordar esto, OpenAI planea colaborar con múltiples empresas dentro de cada sector para desarrollar estas evaluaciones. Este enfoque no solo busca mejorar el desarrollo de modelos, sino también fomentar una mayor confianza entre el público y las tecnologías de IA.
También: La IA no está llegando a un límite, simplemente se está volviendo demasiado inteligente para los benchmarks, dice Anthropic
La investigación ha identificado la ausencia de benchmarks específicos de la industria como un desafío significativo para la IA en entornos empresariales. Por ejemplo, Silvio Savarese, quien lidera Salesforce AI Research, discutió el concepto de Inteligencia General Empresarial (EGI) en una publicación de blog. EGI se centra en soluciones avanzadas de IA adaptadas a dominios comerciales específicos. En una discusión con ZDNET, enfatizó la importancia de desarrollar benchmarks que evalúen funciones específicas de dominio como un paso clave hacia la consecución de EGI.
Perfeccionamiento de modelos existentes
Además de crear nuevas evaluaciones, OpenAI trabajará con empresas para perfeccionar modelos existentes para tres casos de uso específicos de la industria a través de un método llamado ajuste fino por refuerzo (RFT). OpenAI proporcionará orientación sobre la implementación de RFT, permitiendo a las empresas decidir cómo implementar mejor estos modelos, que se espera que estén listos para un uso a gran escala según OpenAI.
También: La carrera de modelos de IA se ha vuelto repentinamente mucho más reñida, dicen los académicos de Stanford
El grupo inicial que participa en este programa incluirá un número selecto de startups enfocadas en casos de uso con un impacto significativo en el mundo real. Si tu empresa cumple con estos criterios, puedes solicitar enviando información básica de la empresa a través de la página web del Programa de Pioneros de OpenAI.
Recibe las principales noticias de la mañana en tu bandeja de entrada cada día con nuestro boletín Tech Today.




산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐




This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄




This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄




OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀




業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅




A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀












