opção
Lar
Notícias
A IA 'ZeroSearch' da Alibaba reduz os custos de treinamento em 88% por meio da aprendizagem autônoma

A IA 'ZeroSearch' da Alibaba reduz os custos de treinamento em 88% por meio da aprendizagem autônoma

19 de Setembro de 2025
2

A IA

ZeroSearch da Alibaba: Um divisor de águas para a eficiência do treinamento em IA

Os pesquisadores do Alibaba Group foram pioneiros em um método inovador que pode revolucionar a forma como os sistemas de IA aprendem a recuperar informações, ignorando totalmente as caras APIs de mecanismos de busca comerciais. Sua tecnologia ZeroSearch permite que grandes modelos de linguagem cultivem habilidades de busca sofisticadas por meio de ambientes simulados, em vez de interações convencionais com mecanismos de busca durante as fases de treinamento.

"O aprendizado por reforço tradicional exige solicitações de pesquisa extensas que acumulam custos substanciais de API e dificultam a escalabilidade", explicam os pesquisadores em seu artigo arXiv recém-publicado. "O ZeroSearch representa uma estrutura econômica de aprendizagem por reforço que aprimora os recursos de pesquisa do LLM independentemente dos mecanismos de pesquisa reais."

A mecânica por trás do treinamento sem pesquisa

Os métodos atuais de treinamento de IA enfrentam duas restrições principais: qualidade inconsistente dos documentos dos mecanismos de pesquisa comerciais durante os ciclos de treinamento e despesas proibitivas decorrentes de grandes volumes de chamadas de API para serviços como o Google Search.

O ZeroSearch implementa uma abordagem inovadora em duas fases:

  1. O ajuste fino supervisionado inicial converte um LLM em um módulo de geração de documentos
  2. O reforço avançado baseado em currículo varia progressivamente a qualidade do resultado

"Nossa descoberta fundamental revela que os LLMs pré-treinados possuem inerentemente conhecimento suficiente do mundo para gerar documentos contextualmente apropriados", observam os pesquisadores. "A principal distinção entre os resultados de pesquisa simulados e reais envolve diferenças textuais estilísticas em vez de lacunas substanciais no conteúdo."

Benchmarks de desempenho mostram vantagens significativas

Testes rigorosos em sete conjuntos de dados distintos de resposta a perguntas demonstraram a vantagem competitiva do ZeroSearch:

  • 7B modelos de parâmetros corresponderam à precisão da Pesquisa Google
  • As configurações de parâmetros 14B excederam o desempenho da pesquisa comercial

As implicações financeiras são particularmente impressionantes:

  • Treinamento tradicional com 64 mil consultas: US$ 586,70 via SerpAPI
  • Equivalente ao ZeroSearch: US$ 70,80 usando quatro GPUs A100
  • Redução total de custos: 88%

"Esses resultados validam os LLMs como substitutos viáveis dos mecanismos de pesquisa convencionais em implementações de aprendizagem por reforço", conclui a equipe de pesquisa.

Implicações mais amplas para o desenvolvimento de IA

O ZeroSearch representa uma mudança de paradigma nas metodologias de treinamento de inteligência artificial ao demonstrar o desenvolvimento de recursos autônomos sem dependências de ferramentas externas.

A tecnologia promete vários impactos transformadores:

  • Democratização de custos: Reduz as barreiras financeiras para startups, eliminando dependências caras de APIs
  • Controle de treinamento: Permite a regulação precisa das entradas de informações durante o desenvolvimento do modelo
  • Flexibilidade arquitetônica: Compatível com as principais famílias de modelos, incluindo Qwen-2.5 e LLaMA-3.2

A Alibaba abriu o código da implementação completa - incluindo bases de código, conjuntos de dados de treinamento e modelos pré-treinados - por meio dos repositórios GitHub e Hugging Face.

Essa inovação prenuncia um cenário emergente de desenvolvimento de IA em que os recursos avançados surgem por meio de simulação sofisticada em vez de dependência de serviços externos. À medida que essas técnicas de treinamento autossuficientes amadurecem, elas podem remodelar substancialmente as dependências atuais do ecossistema tecnológico das principais APIs de plataforma.

Artigo relacionado
A personalização da IA está aprimorando a realidade ou distorcendo-a? Os riscos ocultos explorados A personalização da IA está aprimorando a realidade ou distorcendo-a? Os riscos ocultos explorados A civilização humana já testemunhou revoluções cognitivas antes - a escrita à mão externalizou a memória, as calculadoras automatizaram a computação, os sistemas de GPS substituíram a orientação. Agor
O TreeQuest da Sakana AI aumenta o desempenho da IA com a colaboração de vários modelos O TreeQuest da Sakana AI aumenta o desempenho da IA com a colaboração de vários modelos O laboratório japonês de IA Sakana AI revelou uma técnica que permite que vários modelos de linguagem de grande porte (LLMs) trabalhem juntos, formando uma equipe de IA altamente eficaz. Denominado Mu
ByteDance Revela o Modelo de IA Seed-Thinking-v1.5 para Impulsionar Capacidades de Raciocínio ByteDance Revela o Modelo de IA Seed-Thinking-v1.5 para Impulsionar Capacidades de Raciocínio A corrida por IA com raciocínio avançado começou com o modelo o1 da OpenAI em setembro de 2024, ganhando impulso com o lançamento do R1 da DeepSeek em janeiro de 2025.Os principais desenvolvedores de
Comentários (0)
0/200
De volta ao topo
OR