O modelo de IA Qwen de código aberto da Alibaba bate recordes de raciocínio
A equipe Qwen da Alibaba revelou uma nova versão de seu modelo de IA de raciocínio de código aberto, apresentando resultados de benchmark notáveis.
Introducing Qwen3-235B-A22B-Thinking-2507. Nos últimos três meses, a equipe do Qwen tem aumentado intensamente o que eles chamam de "capacidade de raciocínio" do modelo, esforçando-se para melhorar a qualidade e a profundidade de seus processos de raciocínio.
O resultado é um modelo que realmente se destaca nas áreas mais exigentes: raciocínio lógico, matemática complexa, desafios científicos e codificação avançada. Em campos que normalmente exigem conhecimento humano, esse modelo Qwen mais recente está estabelecendo um novo padrão para a IA de código aberto.
Em benchmarks de raciocínio, o mais novo modelo de IA de código aberto da Qwen obteve 92,3 pontos no AIME25 e 74,1 no LiveCodeBench v6 para codificação. Ele também apresenta um bom desempenho em avaliações de capacidade mais amplas, alcançando 79,7 na Arena-Hard v2, uma métrica que avalia o alinhamento com as preferências humanas.

Fundamentalmente, esse é um modelo de IA de raciocínio em grande escala da equipe Qwen, com um total de 235 bilhões de parâmetros. No entanto, ele emprega uma arquitetura Mixture-of-Experts (MoE), o que significa que apenas um subconjunto desses parâmetros - aproximadamente 22 bilhões - está ativo em um determinado momento. Imagine-o como uma vasta equipe de 128 especialistas de prontidão, com apenas os oito melhores especialistas para uma determinada tarefa realmente trabalhando nela.
Um de seus atributos de destaque é sua excepcional capacidade de memória. O modelo de IA de raciocínio de código aberto do Qwen suporta nativamente um comprimento de contexto de 262.144 tokens, proporcionando uma vantagem significativa para tarefas que exigem a compreensão de informações extensas.
Para os desenvolvedores e entusiastas, a equipe do Qwen simplificou o processo de início. O modelo pode ser acessado no Hugging Face e pode ser implantado usando ferramentas como sglang ou vllm para configurar um endpoint de API pessoal. A equipe também destaca sua estrutura Qwen-Agent como o método ideal para aproveitar as funcionalidades de chamada de ferramentas do modelo.
Para obter o máximo desempenho com esse modelo de raciocínio de IA de código aberto, a equipe do Qwen oferece várias recomendações. Eles aconselham um comprimento de saída de cerca de 32.768 tokens para tarefas padrão, mas para problemas altamente complexos, aumentar esse valor para 81.920 tokens permite que a IA tenha espaço suficiente para "pensar". Eles também sugerem o uso de instruções explícitas em seus prompts, como solicitar uma abordagem de "raciocínio passo a passo" para problemas matemáticos, para obter as respostas mais precisas e bem organizadas.
O lançamento desse novo modelo Qwen oferece uma IA de raciocínio poderosa e de código aberto capaz de competir com os principais modelos proprietários, especialmente para enfrentar desafios complexos e intelectualmente exigentes. Será fascinante observar o que a comunidade de desenvolvedores criará com essa tecnologia.
Veja também: Plano de ação de IA: A liderança dos EUA deve ser "incontestável
Interessado em aprofundar seus conhecimentos sobre IA e Big Data com especialistas do setor? Participe da AI & Big Data Expo em Amsterdã, Califórnia e Londres. Esse evento abrangente acontece junto com outras grandes conferências, incluindo a Intelligent Automation Conference, a BlockX, a Digital Transformation Week e a Cyber Security & Cloud Expo.
Descubra mais eventos futuros de tecnologia empresarial e webinars desenvolvidos pela TechForge aqui.
Artigo relacionado
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas
Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
A verdadeira diferença: não é uma coisa, mas outra
Às vezes, as coisas não são apenas uma coisa, mas também outra. A frase “Não é só isso — é aquilo” tornou-se tão comum em textos gerados por IA que agora serve como mais do que uma indicação de conteú
Recomendações de tópicos especiais relacionados
Comentários (1)
A equipe Qwen da Alibaba revelou uma nova versão de seu modelo de IA de raciocínio de código aberto, apresentando resultados de benchmark notáveis.
Introducing Qwen3-235B-A22B-Thinking-2507. Nos últimos três meses, a equipe do Qwen tem aumentado intensamente o que eles chamam de "capacidade de raciocínio" do modelo, esforçando-se para melhorar a qualidade e a profundidade de seus processos de raciocínio.
O resultado é um modelo que realmente se destaca nas áreas mais exigentes: raciocínio lógico, matemática complexa, desafios científicos e codificação avançada. Em campos que normalmente exigem conhecimento humano, esse modelo Qwen mais recente está estabelecendo um novo padrão para a IA de código aberto.
Em benchmarks de raciocínio, o mais novo modelo de IA de código aberto da Qwen obteve 92,3 pontos no AIME25 e 74,1 no LiveCodeBench v6 para codificação. Ele também apresenta um bom desempenho em avaliações de capacidade mais amplas, alcançando 79,7 na Arena-Hard v2, uma métrica que avalia o alinhamento com as preferências humanas.

Fundamentalmente, esse é um modelo de IA de raciocínio em grande escala da equipe Qwen, com um total de 235 bilhões de parâmetros. No entanto, ele emprega uma arquitetura Mixture-of-Experts (MoE), o que significa que apenas um subconjunto desses parâmetros - aproximadamente 22 bilhões - está ativo em um determinado momento. Imagine-o como uma vasta equipe de 128 especialistas de prontidão, com apenas os oito melhores especialistas para uma determinada tarefa realmente trabalhando nela.
Um de seus atributos de destaque é sua excepcional capacidade de memória. O modelo de IA de raciocínio de código aberto do Qwen suporta nativamente um comprimento de contexto de 262.144 tokens, proporcionando uma vantagem significativa para tarefas que exigem a compreensão de informações extensas.
Para os desenvolvedores e entusiastas, a equipe do Qwen simplificou o processo de início. O modelo pode ser acessado no Hugging Face e pode ser implantado usando ferramentas como sglang ou vllm para configurar um endpoint de API pessoal. A equipe também destaca sua estrutura Qwen-Agent como o método ideal para aproveitar as funcionalidades de chamada de ferramentas do modelo.
Para obter o máximo desempenho com esse modelo de raciocínio de IA de código aberto, a equipe do Qwen oferece várias recomendações. Eles aconselham um comprimento de saída de cerca de 32.768 tokens para tarefas padrão, mas para problemas altamente complexos, aumentar esse valor para 81.920 tokens permite que a IA tenha espaço suficiente para "pensar". Eles também sugerem o uso de instruções explícitas em seus prompts, como solicitar uma abordagem de "raciocínio passo a passo" para problemas matemáticos, para obter as respostas mais precisas e bem organizadas.
O lançamento desse novo modelo Qwen oferece uma IA de raciocínio poderosa e de código aberto capaz de competir com os principais modelos proprietários, especialmente para enfrentar desafios complexos e intelectualmente exigentes. Será fascinante observar o que a comunidade de desenvolvedores criará com essa tecnologia.
Veja também: Plano de ação de IA: A liderança dos EUA deve ser "incontestável
Interessado em aprofundar seus conhecimentos sobre IA e Big Data com especialistas do setor? Participe da AI & Big Data Expo em Amsterdã, Califórnia e Londres. Esse evento abrangente acontece junto com outras grandes conferências, incluindo a Intelligent Automation Conference, a BlockX, a Digital Transformation Week e a Cyber Security & Cloud Expo.
Descubra mais eventos futuros de tecnologia empresarial e webinars desenvolvidos pela TechForge aqui.
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas
Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
A verdadeira diferença: não é uma coisa, mas outra
Às vezes, as coisas não são apenas uma coisa, mas também outra. A frase “Não é só isso — é aquilo” tornou-se tão comum em textos gerados por IA que agora serve como mais do que uma indicação de conteú





Lar






