Lar
A IA 'ZeroSearch' da Alibaba reduz os custos de treinamento em 88% por meio da aprendizagem autônoma

ZeroSearch da Alibaba: Um divisor de águas para a eficiência do treinamento em IA
Os pesquisadores do Alibaba Group foram pioneiros em um método inovador que pode revolucionar a forma como os sistemas de IA aprendem a recuperar informações, ignorando totalmente as caras APIs de mecanismos de busca comerciais. Sua tecnologia ZeroSearch permite que grandes modelos de linguagem cultivem habilidades de busca sofisticadas por meio de ambientes simulados, em vez de interações convencionais com mecanismos de busca durante as fases de treinamento.
"O aprendizado por reforço tradicional exige solicitações de pesquisa extensas que acumulam custos substanciais de API e dificultam a escalabilidade", explicam os pesquisadores em seu artigo arXiv recém-publicado. "O ZeroSearch representa uma estrutura econômica de aprendizagem por reforço que aprimora os recursos de pesquisa do LLM independentemente dos mecanismos de pesquisa reais."
A mecânica por trás do treinamento sem pesquisa
Os métodos atuais de treinamento de IA enfrentam duas restrições principais: qualidade inconsistente dos documentos dos mecanismos de pesquisa comerciais durante os ciclos de treinamento e despesas proibitivas decorrentes de grandes volumes de chamadas de API para serviços como o Google Search.
O ZeroSearch implementa uma abordagem inovadora em duas fases:
- O ajuste fino supervisionado inicial converte um LLM em um módulo de geração de documentos
- O reforço avançado baseado em currículo varia progressivamente a qualidade do resultado
"Nossa descoberta fundamental revela que os LLMs pré-treinados possuem inerentemente conhecimento suficiente do mundo para gerar documentos contextualmente apropriados", observam os pesquisadores. "A principal distinção entre os resultados de pesquisa simulados e reais envolve diferenças textuais estilísticas em vez de lacunas substanciais no conteúdo."
Benchmarks de desempenho mostram vantagens significativas
Testes rigorosos em sete conjuntos de dados distintos de resposta a perguntas demonstraram a vantagem competitiva do ZeroSearch:
- 7B modelos de parâmetros corresponderam à precisão da Pesquisa Google
- As configurações de parâmetros 14B excederam o desempenho da pesquisa comercial
As implicações financeiras são particularmente impressionantes:
- Treinamento tradicional com 64 mil consultas: US$ 586,70 via SerpAPI
- Equivalente ao ZeroSearch: US$ 70,80 usando quatro GPUs A100
- Redução total de custos: 88%
"Esses resultados validam os LLMs como substitutos viáveis dos mecanismos de pesquisa convencionais em implementações de aprendizagem por reforço", conclui a equipe de pesquisa.
Implicações mais amplas para o desenvolvimento de IA
O ZeroSearch representa uma mudança de paradigma nas metodologias de treinamento de inteligência artificial ao demonstrar o desenvolvimento de recursos autônomos sem dependências de ferramentas externas.
A tecnologia promete vários impactos transformadores:
- Democratização de custos: Reduz as barreiras financeiras para startups, eliminando dependências caras de APIs
- Controle de treinamento: Permite a regulação precisa das entradas de informações durante o desenvolvimento do modelo
- Flexibilidade arquitetônica: Compatível com as principais famílias de modelos, incluindo Qwen-2.5 e LLaMA-3.2
A Alibaba abriu o código da implementação completa - incluindo bases de código, conjuntos de dados de treinamento e modelos pré-treinados - por meio dos repositórios GitHub e Hugging Face.
Essa inovação prenuncia um cenário emergente de desenvolvimento de IA em que os recursos avançados surgem por meio de simulação sofisticada em vez de dependência de serviços externos. À medida que essas técnicas de treinamento autossuficientes amadurecem, elas podem remodelar substancialmente as dependências atuais do ecossistema tecnológico das principais APIs de plataforma.
Artigo relacionado
Multiverse Computing lança modelo gratuito de IA generativa compactada
Os grandes modelos de linguagem enfrentam um desafio significativo: seu tamanho imenso. A startup espanhola Multiverse Computing está enfrentando esse problema com a criação de modelos compactados, pr
A IA revela agendas ocultas no conteúdo noticioso
Modelos do tipo ChatGPT estão agora sendo treinados para revelar a perspectiva subjacente de uma notícia — mesmo quando esse ponto de vista está oculto por citações, enquadramento ou uma aparência de
Dados secretos de rastreamento expõem roubo de modelos de IA
Um novo método pode marcar invisivelmente modelos como o ChatGPT em segundos, sem necessidade de retreinamento, sem deixar rastros nas saídas padrão e resistindo a todas as tentativas práticas de remo
Recomendações de tópicos especiais relacionados
Comentários (1)

ZeroSearch da Alibaba: Um divisor de águas para a eficiência do treinamento em IA
Os pesquisadores do Alibaba Group foram pioneiros em um método inovador que pode revolucionar a forma como os sistemas de IA aprendem a recuperar informações, ignorando totalmente as caras APIs de mecanismos de busca comerciais. Sua tecnologia ZeroSearch permite que grandes modelos de linguagem cultivem habilidades de busca sofisticadas por meio de ambientes simulados, em vez de interações convencionais com mecanismos de busca durante as fases de treinamento.
"O aprendizado por reforço tradicional exige solicitações de pesquisa extensas que acumulam custos substanciais de API e dificultam a escalabilidade", explicam os pesquisadores em seu artigo arXiv recém-publicado. "O ZeroSearch representa uma estrutura econômica de aprendizagem por reforço que aprimora os recursos de pesquisa do LLM independentemente dos mecanismos de pesquisa reais."
A mecânica por trás do treinamento sem pesquisa
Os métodos atuais de treinamento de IA enfrentam duas restrições principais: qualidade inconsistente dos documentos dos mecanismos de pesquisa comerciais durante os ciclos de treinamento e despesas proibitivas decorrentes de grandes volumes de chamadas de API para serviços como o Google Search.
O ZeroSearch implementa uma abordagem inovadora em duas fases:
- O ajuste fino supervisionado inicial converte um LLM em um módulo de geração de documentos
- O reforço avançado baseado em currículo varia progressivamente a qualidade do resultado
"Nossa descoberta fundamental revela que os LLMs pré-treinados possuem inerentemente conhecimento suficiente do mundo para gerar documentos contextualmente apropriados", observam os pesquisadores. "A principal distinção entre os resultados de pesquisa simulados e reais envolve diferenças textuais estilísticas em vez de lacunas substanciais no conteúdo."
Benchmarks de desempenho mostram vantagens significativas
Testes rigorosos em sete conjuntos de dados distintos de resposta a perguntas demonstraram a vantagem competitiva do ZeroSearch:
- 7B modelos de parâmetros corresponderam à precisão da Pesquisa Google
- As configurações de parâmetros 14B excederam o desempenho da pesquisa comercial
As implicações financeiras são particularmente impressionantes:
- Treinamento tradicional com 64 mil consultas: US$ 586,70 via SerpAPI
- Equivalente ao ZeroSearch: US$ 70,80 usando quatro GPUs A100
- Redução total de custos: 88%
"Esses resultados validam os LLMs como substitutos viáveis dos mecanismos de pesquisa convencionais em implementações de aprendizagem por reforço", conclui a equipe de pesquisa.
Implicações mais amplas para o desenvolvimento de IA
O ZeroSearch representa uma mudança de paradigma nas metodologias de treinamento de inteligência artificial ao demonstrar o desenvolvimento de recursos autônomos sem dependências de ferramentas externas.
A tecnologia promete vários impactos transformadores:
- Democratização de custos: Reduz as barreiras financeiras para startups, eliminando dependências caras de APIs
- Controle de treinamento: Permite a regulação precisa das entradas de informações durante o desenvolvimento do modelo
- Flexibilidade arquitetônica: Compatível com as principais famílias de modelos, incluindo Qwen-2.5 e LLaMA-3.2
A Alibaba abriu o código da implementação completa - incluindo bases de código, conjuntos de dados de treinamento e modelos pré-treinados - por meio dos repositórios GitHub e Hugging Face.
Essa inovação prenuncia um cenário emergente de desenvolvimento de IA em que os recursos avançados surgem por meio de simulação sofisticada em vez de dependência de serviços externos. À medida que essas técnicas de treinamento autossuficientes amadurecem, elas podem remodelar substancialmente as dependências atuais do ecossistema tecnológico das principais APIs de plataforma.
Multiverse Computing lança modelo gratuito de IA generativa compactada
Os grandes modelos de linguagem enfrentam um desafio significativo: seu tamanho imenso. A startup espanhola Multiverse Computing está enfrentando esse problema com a criação de modelos compactados, pr
A IA revela agendas ocultas no conteúdo noticioso
Modelos do tipo ChatGPT estão agora sendo treinados para revelar a perspectiva subjacente de uma notícia — mesmo quando esse ponto de vista está oculto por citações, enquadramento ou uma aparência de
Dados secretos de rastreamento expõem roubo de modelos de IA
Um novo método pode marcar invisivelmente modelos como o ChatGPT em segundos, sem necessidade de retreinamento, sem deixar rastros nas saídas padrão e resistindo a todas as tentativas práticas de remo











