A IA 'ZeroSearch' da Alibaba reduz os custos de treinamento em 88% por meio da aprendizagem autônoma

Lar

Notícias

19 de Setembro de 2025

JoseJackson

# alibaba # LLMs # nlp

A IA

ZeroSearch da Alibaba: Um divisor de águas para a eficiência do treinamento em IA

Os pesquisadores do Alibaba Group foram pioneiros em um método inovador que pode revolucionar a forma como os sistemas de IA aprendem a recuperar informações, ignorando totalmente as caras APIs de mecanismos de busca comerciais. Sua tecnologia ZeroSearch permite que grandes modelos de linguagem cultivem habilidades de busca sofisticadas por meio de ambientes simulados, em vez de interações convencionais com mecanismos de busca durante as fases de treinamento.

"O aprendizado por reforço tradicional exige solicitações de pesquisa extensas que acumulam custos substanciais de API e dificultam a escalabilidade", explicam os pesquisadores em seu artigo arXiv recém-publicado. "O ZeroSearch representa uma estrutura econômica de aprendizagem por reforço que aprimora os recursos de pesquisa do LLM independentemente dos mecanismos de pesquisa reais."

A mecânica por trás do treinamento sem pesquisa

Os métodos atuais de treinamento de IA enfrentam duas restrições principais: qualidade inconsistente dos documentos dos mecanismos de pesquisa comerciais durante os ciclos de treinamento e despesas proibitivas decorrentes de grandes volumes de chamadas de API para serviços como o Google Search.

O ZeroSearch implementa uma abordagem inovadora em duas fases:

O ajuste fino supervisionado inicial converte um LLM em um módulo de geração de documentos
O reforço avançado baseado em currículo varia progressivamente a qualidade do resultado

"Nossa descoberta fundamental revela que os LLMs pré-treinados possuem inerentemente conhecimento suficiente do mundo para gerar documentos contextualmente apropriados", observam os pesquisadores. "A principal distinção entre os resultados de pesquisa simulados e reais envolve diferenças textuais estilísticas em vez de lacunas substanciais no conteúdo."

Benchmarks de desempenho mostram vantagens significativas

Testes rigorosos em sete conjuntos de dados distintos de resposta a perguntas demonstraram a vantagem competitiva do ZeroSearch:

7B modelos de parâmetros corresponderam à precisão da Pesquisa Google
As configurações de parâmetros 14B excederam o desempenho da pesquisa comercial

As implicações financeiras são particularmente impressionantes:

Treinamento tradicional com 64 mil consultas: US$ 586,70 via SerpAPI
Equivalente ao ZeroSearch: US$ 70,80 usando quatro GPUs A100
Redução total de custos: 88%

"Esses resultados validam os LLMs como substitutos viáveis dos mecanismos de pesquisa convencionais em implementações de aprendizagem por reforço", conclui a equipe de pesquisa.

Implicações mais amplas para o desenvolvimento de IA

O ZeroSearch representa uma mudança de paradigma nas metodologias de treinamento de inteligência artificial ao demonstrar o desenvolvimento de recursos autônomos sem dependências de ferramentas externas.

A tecnologia promete vários impactos transformadores:

Democratização de custos: Reduz as barreiras financeiras para startups, eliminando dependências caras de APIs
Controle de treinamento: Permite a regulação precisa das entradas de informações durante o desenvolvimento do modelo
Flexibilidade arquitetônica: Compatível com as principais famílias de modelos, incluindo Qwen-2.5 e LLaMA-3.2

A Alibaba abriu o código da implementação completa - incluindo bases de código, conjuntos de dados de treinamento e modelos pré-treinados - por meio dos repositórios GitHub e Hugging Face.

Essa inovação prenuncia um cenário emergente de desenvolvimento de IA em que os recursos avançados surgem por meio de simulação sofisticada em vez de dependência de serviços externos. À medida que essas técnicas de treinamento autossuficientes amadurecem, elas podem remodelar substancialmente as dependências atuais do ecossistema tecnológico das principais APIs de plataforma.

Artigo relacionado

A personalização da IA está aprimorando a realidade ou distorcendo-a? Os riscos ocultos explorados A civilização humana já testemunhou revoluções cognitivas antes - a escrita à mão externalizou a memória, as calculadoras automatizaram a computação, os sistemas de GPS substituíram a orientação. Agor

O TreeQuest da Sakana AI aumenta o desempenho da IA com a colaboração de vários modelos O laboratório japonês de IA Sakana AI revelou uma técnica que permite que vários modelos de linguagem de grande porte (LLMs) trabalhem juntos, formando uma equipe de IA altamente eficaz. Denominado Mu

ByteDance Revela o Modelo de IA Seed-Thinking-v1.5 para Impulsionar Capacidades de Raciocínio A corrida por IA com raciocínio avançado começou com o modelo o1 da OpenAI em setembro de 2024, ganhando impulso com o lançamento do R1 da DeepSeek em janeiro de 2025.Os principais desenvolvedores de

Comentários (0)

0/200

Enviar

Principais notícias

Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Dublagem AI: Guia Definitivo para Criação de Voz Realista A IA de Cambium transforma a madeira desperdiçada em madeira serrada O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Como garantir que seus dados sejam confiáveis para a integração de IA Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O Google utiliza a IA para suspender mais de 39 milhões de contas de anúncios por suspeita de fraude Clone de Voz por IA: Guia definitivo para dominar a conversão de voz

Mais

Apresentou