Aberta dos advogados de benchmarks de IA específicos para o setor: eis por que isso importa

Resultados de desempenho de benchmark são uma característica comum quando novos modelos de IA são lançados, demonstrando suas capacidades em uma variedade de tarefas gerais, como matemática escolar (GSM8K) ou raciocínio de nível de pós-graduação (GPQA). No entanto, esses benchmarks muitas vezes não atendem às necessidades específicas de várias indústrias.
Também: ChatGPT agora lembrará tudo o que você lhe contar - como um verdadeiro assistente pessoal
Programa Pioneiros da OpenAI
Para preencher essa lacuna, a OpenAI lançou o Programa Pioneiros da OpenAI, projetado para aprimorar o desenvolvimento de modelos de IA para indústrias específicas e aplicações práticas. Esta iniciativa é um esforço de foco duplo onde empresas fazem parceria com os pesquisadores da OpenAI para criar avaliações mais personalizadas e refinar modelos para atender a domínios específicos.
estamos lançando o programa pioneiros da openai -- uma parceria entre a openai e empresas que desenvolvem produtos avançados de IA para (a) ajustar intensivamente modelos que superem em tarefas específicas de alto valor de domínio, e (b) construir melhores avaliações do mundo real que permitam às indústrias melhorar… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025
Em um recente post de blog, a OpenAI destacou que setores como jurídico, financeiro, seguros, saúde e contabilidade carecem de uma fonte abrangente de benchmarks. Para abordar isso, a OpenAI planeja colaborar com várias empresas de cada setor para desenvolver essas avaliações. Essa abordagem visa não apenas aprimorar o desenvolvimento de modelos, mas também promover maior confiança entre o público e as tecnologias de IA.
Também: A IA não está atingindo um limite, está apenas ficando inteligente demais para benchmarks, diz a Anthropic
Pesquisas identificaram a ausência de benchmarks específicos do setor como um desafio significativo para a IA em ambientes empresariais. Por exemplo, Silvio Savarese, que lidera a Salesforce AI Research, discutiu o conceito de Inteligência Geral Empresarial (EGI) em um post de blog. EGI foca em soluções avançadas de IA adaptadas a domínios de negócios específicos. Em uma discussão com a ZDNET, ele enfatizou a importância de desenvolver benchmarks que avaliem funções específicas de domínio como um passo chave para alcançar o EGI.
Refinando modelos existentes
Além de criar novas avaliações, a OpenAI trabalhará com empresas para refinar modelos existentes para três casos de uso específicos da indústria por meio de um método chamado ajuste fino por reforço (RFT). A OpenAI fornecerá orientação sobre a implementação do RFT, permitindo que as empresas decidam como melhor implantar esses modelos, que devem estar prontos para uso em larga escala, segundo a OpenAI.
Também: A corrida de modelos de IA ficou muito mais acirrada, dizem estudiosos de Stanford
O grupo inicial que participa deste programa incluirá um número seleto de startups focadas em casos de uso com impacto significativo no mundo real. Se sua empresa atender a esses critérios, você pode se inscrever enviando informações básicas da empresa através da página do Programa Pioneiros da OpenAI.
Receba as principais notícias da manhã em sua caixa de entrada todos os dias com nosso boletim Tech Today.
Artigo relacionado
Criando Livros de Colorir Alimentados por IA: Um Guia Completo
Projetar livros de colorir é uma busca recompensadora, combinando expressão artística com experiências calmantes para os usuários. No entanto, o processo pode ser trabalhoso. Felizmente, ferramentas d
Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores
Qodo, uma startup de codificação por IA baseada em Israel focada em qualidade de código, lançou uma parceria com Google Cloud para aprimorar a integridade de software gerado por IA.À medida que as emp
IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025
A IA da DeepMind alcançou um salto impressionante no raciocínio matemático, conquistando uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, apenas um ano após ganhar prata em
Comentários (21)
0/200
JustinHarris
11 de Agosto de 2025 à59 06:00:59 WEST
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
0
JosephScott
23 de Abril de 2025 à18 18:47:18 WEST
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀
0
FrankJackson
22 de Abril de 2025 à27 22:27:27 WEST
業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅
0
BrianThomas
22 de Abril de 2025 à13 00:41:13 WEST
A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀
0
ChristopherTaylor
20 de Abril de 2025 à37 23:32:37 WEST
¡Qué genial que OpenAI abogue por benchmarks de IA específicos de la industria! Ya era hora de que se centraran en las necesidades reales de cada sector, no solo en tareas genéricas. Estoy emocionado de ver cómo se desarrolla esto. ¡A por ello! 🚀
0
JonathanKing
20 de Abril de 2025 à27 05:12:27 WEST
Me encanta cómo este herramienta enfoca los benchmarks de IA en sectores específicos. ¡Es genial para ver dónde puede tener un impacto real la IA! Aunque la interfaz podría ser más intuitiva, es esencial para cualquier persona en el campo de la IA. ¡Recomendado! 🌟
0
Resultados de desempenho de benchmark são uma característica comum quando novos modelos de IA são lançados, demonstrando suas capacidades em uma variedade de tarefas gerais, como matemática escolar (GSM8K) ou raciocínio de nível de pós-graduação (GPQA). No entanto, esses benchmarks muitas vezes não atendem às necessidades específicas de várias indústrias.
Também: ChatGPT agora lembrará tudo o que você lhe contar - como um verdadeiro assistente pessoal
Programa Pioneiros da OpenAI
Para preencher essa lacuna, a OpenAI lançou o Programa Pioneiros da OpenAI, projetado para aprimorar o desenvolvimento de modelos de IA para indústrias específicas e aplicações práticas. Esta iniciativa é um esforço de foco duplo onde empresas fazem parceria com os pesquisadores da OpenAI para criar avaliações mais personalizadas e refinar modelos para atender a domínios específicos.
estamos lançando o programa pioneiros da openai -- uma parceria entre a openai e empresas que desenvolvem produtos avançados de IA para (a) ajustar intensivamente modelos que superem em tarefas específicas de alto valor de domínio, e (b) construir melhores avaliações do mundo real que permitam às indústrias melhorar… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025
Em um recente post de blog, a OpenAI destacou que setores como jurídico, financeiro, seguros, saúde e contabilidade carecem de uma fonte abrangente de benchmarks. Para abordar isso, a OpenAI planeja colaborar com várias empresas de cada setor para desenvolver essas avaliações. Essa abordagem visa não apenas aprimorar o desenvolvimento de modelos, mas também promover maior confiança entre o público e as tecnologias de IA.
Também: A IA não está atingindo um limite, está apenas ficando inteligente demais para benchmarks, diz a Anthropic
Pesquisas identificaram a ausência de benchmarks específicos do setor como um desafio significativo para a IA em ambientes empresariais. Por exemplo, Silvio Savarese, que lidera a Salesforce AI Research, discutiu o conceito de Inteligência Geral Empresarial (EGI) em um post de blog. EGI foca em soluções avançadas de IA adaptadas a domínios de negócios específicos. Em uma discussão com a ZDNET, ele enfatizou a importância de desenvolver benchmarks que avaliem funções específicas de domínio como um passo chave para alcançar o EGI.
Refinando modelos existentes
Além de criar novas avaliações, a OpenAI trabalhará com empresas para refinar modelos existentes para três casos de uso específicos da indústria por meio de um método chamado ajuste fino por reforço (RFT). A OpenAI fornecerá orientação sobre a implementação do RFT, permitindo que as empresas decidam como melhor implantar esses modelos, que devem estar prontos para uso em larga escala, segundo a OpenAI.
Também: A corrida de modelos de IA ficou muito mais acirrada, dizem estudiosos de Stanford
O grupo inicial que participa deste programa incluirá um número seleto de startups focadas em casos de uso com impacto significativo no mundo real. Se sua empresa atender a esses critérios, você pode se inscrever enviando informações básicas da empresa através da página do Programa Pioneiros da OpenAI.
Receba as principais notícias da manhã em sua caixa de entrada todos os dias com nosso boletim Tech Today.



This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄




OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀




業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅




A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀




¡Qué genial que OpenAI abogue por benchmarks de IA específicos de la industria! Ya era hora de que se centraran en las necesidades reales de cada sector, no solo en tareas genéricas. Estoy emocionado de ver cómo se desarrolla esto. ¡A por ello! 🚀




Me encanta cómo este herramienta enfoca los benchmarks de IA en sectores específicos. ¡Es genial para ver dónde puede tener un impacto real la IA! Aunque la interfaz podría ser más intuitiva, es esencial para cualquier persona en el campo de la IA. ¡Recomendado! 🌟












