Aberta dos advogados de benchmarks de IA específicos para o setor: eis por que isso importa

Lar

Notícias

15 de Abril de 2025

ChristopherHarris

200

Aberta dos advogados de benchmarks de IA específicos para o setor: eis por que isso importa

Resultados de desempenho de benchmark são uma característica comum quando novos modelos de IA são lançados, demonstrando suas capacidades em uma variedade de tarefas gerais, como matemática escolar (GSM8K) ou raciocínio de nível de pós-graduação (GPQA). No entanto, esses benchmarks muitas vezes não atendem às necessidades específicas de várias indústrias.

Também: ChatGPT agora lembrará tudo o que você lhe contar - como um verdadeiro assistente pessoal

Programa Pioneiros da OpenAI

Para preencher essa lacuna, a OpenAI lançou o Programa Pioneiros da OpenAI, projetado para aprimorar o desenvolvimento de modelos de IA para indústrias específicas e aplicações práticas. Esta iniciativa é um esforço de foco duplo onde empresas fazem parceria com os pesquisadores da OpenAI para criar avaliações mais personalizadas e refinar modelos para atender a domínios específicos.

estamos lançando o programa pioneiros da openai -- uma parceria entre a openai e empresas que desenvolvem produtos avançados de IA para (a) ajustar intensivamente modelos que superem em tarefas específicas de alto valor de domínio, e (b) construir melhores avaliações do mundo real que permitam às indústrias melhorar… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 de abril de 2025

Em um recente post de blog, a OpenAI destacou que setores como jurídico, financeiro, seguros, saúde e contabilidade carecem de uma fonte abrangente de benchmarks. Para abordar isso, a OpenAI planeja colaborar com várias empresas de cada setor para desenvolver essas avaliações. Essa abordagem visa não apenas aprimorar o desenvolvimento de modelos, mas também promover maior confiança entre o público e as tecnologias de IA.

Também: A IA não está atingindo um limite, está apenas ficando inteligente demais para benchmarks, diz a Anthropic

Pesquisas identificaram a ausência de benchmarks específicos do setor como um desafio significativo para a IA em ambientes empresariais. Por exemplo, Silvio Savarese, que lidera a Salesforce AI Research, discutiu o conceito de Inteligência Geral Empresarial (EGI) em um post de blog. EGI foca em soluções avançadas de IA adaptadas a domínios de negócios específicos. Em uma discussão com a ZDNET, ele enfatizou a importância de desenvolver benchmarks que avaliem funções específicas de domínio como um passo chave para alcançar o EGI.

Refinando modelos existentes

Além de criar novas avaliações, a OpenAI trabalhará com empresas para refinar modelos existentes para três casos de uso específicos da indústria por meio de um método chamado ajuste fino por reforço (RFT). A OpenAI fornecerá orientação sobre a implementação do RFT, permitindo que as empresas decidam como melhor implantar esses modelos, que devem estar prontos para uso em larga escala, segundo a OpenAI.

Também: A corrida de modelos de IA ficou muito mais acirrada, dizem estudiosos de Stanford

O grupo inicial que participa deste programa incluirá um número seleto de startups focadas em casos de uso com impacto significativo no mundo real. Se sua empresa atender a esses critérios, você pode se inscrever enviando informações básicas da empresa através da página do Programa Pioneiros da OpenAI.

Receba as principais notícias da manhã em sua caixa de entrada todos os dias com nosso boletim Tech Today.

Artigo relacionado

Como proteger bens, edifícios e a saúde pessoal? Em um mundo imprevisível, a proteção tornou-se uma necessidade estratégica — e não apenas uma opção. Seja para proteger as finanças, reforçar edifícios ou cuidar da saúde pessoal, a estabilidade a lon

O navegador Comet com IA é lançado com suporte total à multitarefa no iPad O navegador com IA da Perplexity, o Comet, lançou oficialmente sua versão para iPad, agora totalmente compatível com o iPadOS. A atualização traz navegação em múltiplas janelas, suporte à multitarefa

A Trace arrecadou 3 milhões de dólares para superar os obstáculos na adoção de agentes de IA empresariais. Apesar de seu potencial, os agentes de IA têm tido dificuldades para ganhar espaço no ambiente empresarial. Uma startup emergente acredita que o problema central é a falta de contexto.Lançada como parte do grupo de verão de 2025 da Y Combinator, a T

Recomendações de tópicos especiais relacionados

Negócios

Os melhores softwares de otimização de preços com IA: acompanhe os concorrentes e ajuste automaticamente os preços da loja

Descubra os melhores softwares de otimização de preços com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias que monitoram os concorrentes e ajustam automaticamente os preços da sua loja para maximizar o lucro. Compare opções gratuitas e pagas com testes práticos. Obtenha sua vantagem competitiva em preços agora mesmo.

10 ferramentas

xix.ai

código

Os melhores revisores de código com IA: automatize a conformidade com o código limpo e refatore arquivos de repositórios legados

Descubra os melhores revisores de código com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias para automatizar a conformidade com o código limpo e refatorar arquivos de repositórios legados. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Obtenha sua vantagem com IA hoje mesmo.

10 ferramentas

xix.ai

Conversão de texto para fala

Os melhores aplicativos de TTS com IA para dislexia: apoio à aprendizagem e à eficiência na leitura para alunos

Descubra os melhores aplicativos de TTS com IA de 2026, selecionados especialmente para auxiliar na dislexia. Nossas classificações especializadas comparam ferramentas gratuitas e pagas, destacando recursos avançados para melhorar a eficiência na leitura e na aprendizagem. Explore soluções inovadoras e imperdíveis para revelar o potencial dos alunos. Comece sua jornada no XIX.AI.

10 ferramentas

xix.ai

Criação de quadrinhos

Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas

xix.ai

Negócios

Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas

xix.ai

Negócios

As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas

xix.ai

Comentários (23)

0/500

Por favor, faça o login primeiro

WillLopez

11 de Setembro de 2025 à33 23:30:33 WEST

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith

27 de Agosto de 2025 à28 16:01:28 WEST

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris

11 de Agosto de 2025 à59 06:00:59 WEST

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott

23 de Abril de 2025 à18 18:47:18 WEST

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson

22 de Abril de 2025 à27 22:27:27 WEST

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい！一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas

22 de Abril de 2025 à13 00:41:13 WEST

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

Principais notícias

AI Builder e Power Automate Revolucionam a Sumarização de Documentos Hosts de IA do podcast Notebooklm agora disponíveis para entrevistas China revela padrão nacional para robôs humanóides e inteligência incorporada Platôs de adoção de IA corporativa, revelam dados da Ramp Tutorial do Criador de Imagens do Bing: Guia de Geração de Arte por IA Aprenda a criar música de IA usando sua voz: um tutorial passo a passo do SUNO iMyFone MagicMic: Revisão e Tutorial de Mudança de Voz AI em Tempo Real Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como uma revolução na IA multimodal A Embodied Intelligence divulga a primeira norma do setor para conter o crescimento descontrolado

Mais

Apresentou