opção
Lar
Notícias
Aberta dos advogados de benchmarks de IA específicos para o setor: eis por que isso importa

Aberta dos advogados de benchmarks de IA específicos para o setor: eis por que isso importa

15 de Abril de 2025
120

Aberta dos advogados de benchmarks de IA específicos para o setor: eis por que isso importa

Resultados de desempenho de benchmark são uma característica comum quando novos modelos de IA são lançados, demonstrando suas capacidades em uma variedade de tarefas gerais, como matemática escolar (GSM8K) ou raciocínio de nível de pós-graduação (GPQA). No entanto, esses benchmarks muitas vezes não atendem às necessidades específicas de várias indústrias.

Também: ChatGPT agora lembrará tudo o que você lhe contar - como um verdadeiro assistente pessoal

Programa Pioneiros da OpenAI

Para preencher essa lacuna, a OpenAI lançou o Programa Pioneiros da OpenAI, projetado para aprimorar o desenvolvimento de modelos de IA para indústrias específicas e aplicações práticas. Esta iniciativa é um esforço de foco duplo onde empresas fazem parceria com os pesquisadores da OpenAI para criar avaliações mais personalizadas e refinar modelos para atender a domínios específicos.

estamos lançando o programa pioneiros da openai -- uma parceria entre a openai e empresas que desenvolvem produtos avançados de IA para (a) ajustar intensivamente modelos que superem em tarefas específicas de alto valor de domínio, e (b) construir melhores avaliações do mundo real que permitam às indústrias melhorar… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 9 de abril de 2025

Em um recente post de blog, a OpenAI destacou que setores como jurídico, financeiro, seguros, saúde e contabilidade carecem de uma fonte abrangente de benchmarks. Para abordar isso, a OpenAI planeja colaborar com várias empresas de cada setor para desenvolver essas avaliações. Essa abordagem visa não apenas aprimorar o desenvolvimento de modelos, mas também promover maior confiança entre o público e as tecnologias de IA.

Também: A IA não está atingindo um limite, está apenas ficando inteligente demais para benchmarks, diz a Anthropic

Pesquisas identificaram a ausência de benchmarks específicos do setor como um desafio significativo para a IA em ambientes empresariais. Por exemplo, Silvio Savarese, que lidera a Salesforce AI Research, discutiu o conceito de Inteligência Geral Empresarial (EGI) em um post de blog. EGI foca em soluções avançadas de IA adaptadas a domínios de negócios específicos. Em uma discussão com a ZDNET, ele enfatizou a importância de desenvolver benchmarks que avaliem funções específicas de domínio como um passo chave para alcançar o EGI.

Refinando modelos existentes

Além de criar novas avaliações, a OpenAI trabalhará com empresas para refinar modelos existentes para três casos de uso específicos da indústria por meio de um método chamado ajuste fino por reforço (RFT). A OpenAI fornecerá orientação sobre a implementação do RFT, permitindo que as empresas decidam como melhor implantar esses modelos, que devem estar prontos para uso em larga escala, segundo a OpenAI.

Também: A corrida de modelos de IA ficou muito mais acirrada, dizem estudiosos de Stanford

O grupo inicial que participa deste programa incluirá um número seleto de startups focadas em casos de uso com impacto significativo no mundo real. Se sua empresa atender a esses critérios, você pode se inscrever enviando informações básicas da empresa através da página do Programa Pioneiros da OpenAI.

Receba as principais notícias da manhã em sua caixa de entrada todos os dias com nosso boletim Tech Today.

Artigo relacionado
Criando Livros de Colorir Alimentados por IA: Um Guia Completo Criando Livros de Colorir Alimentados por IA: Um Guia Completo Projetar livros de colorir é uma busca recompensadora, combinando expressão artística com experiências calmantes para os usuários. No entanto, o processo pode ser trabalhoso. Felizmente, ferramentas d
Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores Qodo, uma startup de codificação por IA baseada em Israel focada em qualidade de código, lançou uma parceria com Google Cloud para aprimorar a integridade de software gerado por IA.À medida que as emp
IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025 IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025 A IA da DeepMind alcançou um salto impressionante no raciocínio matemático, conquistando uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, apenas um ano após ganhar prata em
Comentários (21)
0/200
JustinHarris
JustinHarris 11 de Agosto de 2025 à59 06:00:59 WEST

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 23 de Abril de 2025 à18 18:47:18 WEST

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 22 de Abril de 2025 à27 22:27:27 WEST

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 22 de Abril de 2025 à13 00:41:13 WEST

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

ChristopherTaylor
ChristopherTaylor 20 de Abril de 2025 à37 23:32:37 WEST

¡Qué genial que OpenAI abogue por benchmarks de IA específicos de la industria! Ya era hora de que se centraran en las necesidades reales de cada sector, no solo en tareas genéricas. Estoy emocionado de ver cómo se desarrolla esto. ¡A por ello! 🚀

JonathanKing
JonathanKing 20 de Abril de 2025 à27 05:12:27 WEST

Me encanta cómo este herramienta enfoca los benchmarks de IA en sectores específicos. ¡Es genial para ver dónde puede tener un impacto real la IA! Aunque la interfaz podría ser más intuitiva, es esencial para cualquier persona en el campo de la IA. ¡Recomendado! 🌟

De volta ao topo
OR