O Qwen3.5 da Alibaba lança modelos compactos para GPUs de consumo
O Tongyi Lab lançou oficialmente os mais recentes modelos de pequena escala da sua série Qwen3.5, que representam uma nova geração de modelos de linguagem de grande porte. O lançamento inclui quatro versões com tamanhos de parâmetros de 0,8B, 2B, 4B e 9B. Esses modelos foram projetados para reduzir as barreiras à implementação de IA, oferecendo uma otimização de desempenho excepcional, o que permite uma implantação econômica e eficiente em tudo, desde dispositivos de ponta até aplicações especializadas.

Toda a série é construída sobre uma base unificada do Qwen3.5. Ao contrário de modelos maiores que priorizam contagens massivas de parâmetros, essas versões compactas enfatizam ser “leves” e “altamente adaptáveis”. Os modelos de 0,8B e 2B são adaptados para dispositivos de borda, permitindo extrema eficiência e tempos de resposta na ordem de milissegundos em plataformas como smartphones e hardware embarcado. A versão de 4B se destaca por suas capacidades multimodais, tornando-a uma excelente escolha para o desenvolvimento de agentes de IA leves. Apesar de seu tamanho modesto, o modelo de 9B oferece desempenho comparável a contrapartes muito maiores e é capaz de lidar com raciocínio lógico complexo.

Em uma iniciativa para apoiar ainda mais a comunidade de desenvolvedores, o Tongyi Lab lançou a série sob a licença Apache 2.0, tornando-a de código aberto e gratuita para uso comercial. Isso permite que os desenvolvedores realizem livremente o LoRA ou o ajuste fino completo dos modelos, com a capacidade de iniciar adaptações específicas para tarefas usando GPUs comuns de nível de consumidor. Essa abordagem reduz significativamente o tempo e as despesas para desenvolvedores individuais e pequenas e médias empresas na criação de protótipos de ideias e na construção de aplicativos especializados.

Artigo relacionado
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg
O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos
A primeira série dramática com AIGC da Yaoke Media, “O Mistério do Bronze em Qinling”, estreia hoje com protagonistas criados por IA
Hoje marca o lançamento oficial da minissérie de mistério e fantasia com IA da Yaoke Media, “A História Secreta do Bronze de Qinling”. Estrelada pelos dois primeiros atores de IA contratados pela empr
Recomendações de tópicos especiais relacionados
Comentários (0)
O Tongyi Lab lançou oficialmente os mais recentes modelos de pequena escala da sua série Qwen3.5, que representam uma nova geração de modelos de linguagem de grande porte. O lançamento inclui quatro versões com tamanhos de parâmetros de 0,8B, 2B, 4B e 9B. Esses modelos foram projetados para reduzir as barreiras à implementação de IA, oferecendo uma otimização de desempenho excepcional, o que permite uma implantação econômica e eficiente em tudo, desde dispositivos de ponta até aplicações especializadas.

Toda a série é construída sobre uma base unificada do Qwen3.5. Ao contrário de modelos maiores que priorizam contagens massivas de parâmetros, essas versões compactas enfatizam ser “leves” e “altamente adaptáveis”. Os modelos de 0,8B e 2B são adaptados para dispositivos de borda, permitindo extrema eficiência e tempos de resposta na ordem de milissegundos em plataformas como smartphones e hardware embarcado. A versão de 4B se destaca por suas capacidades multimodais, tornando-a uma excelente escolha para o desenvolvimento de agentes de IA leves. Apesar de seu tamanho modesto, o modelo de 9B oferece desempenho comparável a contrapartes muito maiores e é capaz de lidar com raciocínio lógico complexo.

Em uma iniciativa para apoiar ainda mais a comunidade de desenvolvedores, o Tongyi Lab lançou a série sob a licença Apache 2.0, tornando-a de código aberto e gratuita para uso comercial. Isso permite que os desenvolvedores realizem livremente o LoRA ou o ajuste fino completo dos modelos, com a capacidade de iniciar adaptações específicas para tarefas usando GPUs comuns de nível de consumidor. Essa abordagem reduz significativamente o tempo e as despesas para desenvolvedores individuais e pequenas e médias empresas na criação de protótipos de ideias e na construção de aplicativos especializados.

Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg
O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos
A primeira série dramática com AIGC da Yaoke Media, “O Mistério do Bronze em Qinling”, estreia hoje com protagonistas criados por IA
Hoje marca o lançamento oficial da minissérie de mistério e fantasia com IA da Yaoke Media, “A História Secreta do Bronze de Qinling”. Estrelada pelos dois primeiros atores de IA contratados pela empr





Lar






