opção
Lar
Lista de modelos AL
Qwen1.5-72B-Chat
Modelo Parâmetro Quantidade
72B
Modelo Parâmetro Quantidade
Organização afiliada
Alibaba
Organização afiliada
Código aberto
Tipo de licença
Tempo de liberação
4 de Fevereiro de 2024
Tempo de liberação

Introdução ao modelo
Qwen1.5 é a versão beta do Qwen2, mantendo sua arquitetura como um modelo de transformador apenas decodificador com ativação SwiGLU, RoPE e mecanismos de atenção de múltiplas cabeças. Ele oferece nove tamanhos de modelos e tem capacidades multilíngues e de chat aprimoradas, suportando uma extensão de contexto de 32.768 tokens. Todos os modelos têm prompts de sistema habilitados para atuação de papéis, e o código suporta implementação nativa nos transformers.
Deslize para a esquerda e para a direita para ver mais
Capacidade de compreensão de idiomas Capacidade de compreensão de idiomas
Capacidade de compreensão de idiomas
Muitas vezes, faz mal julgamentos semânticos, levando a óbvias desconexões lógicas nas respostas.
5.9
Escopo de cobertura do conhecimento Escopo de cobertura do conhecimento
Escopo de cobertura do conhecimento
Possui conhecimento central das disciplinas convencionais, mas tem cobertura limitada de campos interdisciplinares de ponta.
7.0
Capacidade de raciocínio Capacidade de raciocínio
Capacidade de raciocínio
Incapaz de manter cadeias de raciocínio coerentes, geralmente causando causalidade invertida ou erros de cálculo.
4.0
Modelo relacionado
Qwen3-Next-80B-A3B-Thinking A mais recente série Qwen3-Next lançada nos modelos Qwen, melhorando a eficiência de escalabilidade por meio de uma arquitetura de modelo inovadora.
Qwen3-235B-A22B-Thinking-2507 Qwen3 é a última geração de modelos de linguagem de grande porte da série Qwen, oferecendo um conjunto abrangente de modelos densos e de mistura de especialistas (MoE).
Qwen3-Max-2026-01-23 O modelo de raciocínio emblemático recém-lançado pela Qwen apresenta duas inovações: chamada de ferramentas adaptativas e dimensionamento em tempo de teste.
Qwen3-Next-80B-A3B-Thinking A mais recente série Qwen3-Next lançada nos modelos Qwen, melhorando a eficiência do dimensionamento por meio de uma arquitetura de modelo inovadora.
Qwen3-235B-A22B-Thinking-2507 O Qwen3 é a última geração de modelos de idiomas grandes da série Qwen, oferecendo um conjunto abrangente de modelos densos e de mistura de especialistas (MoE).
Documentos relevantes
Lei Jun confirma que o agente de IA para desktop da Xiaomi, o MiClaw, está em desenvolvimento; o MiMo-V2-Pro é lançado em todas as plataformas No Fórum de Alto Nível sobre o Desenvolvimento da China de 2026, Lei Jun, do Grupo Xiaomi, confirmou que a tão esperada versão para desktop do agente de IA “MiClaw” (caranguejo) já está incluída no pl
A OpenAI retoma suas atividades no setor de robótica; a Automan busca engenheiros para pesquisa e desenvolvimento de infraestrutura Em 1º de junho, o CEO da OpenAI, Sam Altman, anunciou nas redes sociais que a empresa está voltando ao setor de robótica, divulgando vagas para a equipe da OpenAI Robotics. A empresa está contratando
A Bain prevê um mercado de SaaS de US$ 100 bilhões na automação por IA agênica A Bain & Company estimou um mercado de US$ 100 bilhões nos EUA para empresas de SaaS que utilizam IA agentiva. A empresa afirmou que esse mercado decorre da automação de tarefas de coordenação dentro
Política obrigatória de pesquisa com IA impulsiona êxodo; DuckDuckGo registra aumento no número de usuários Após o anúncio feito pela Google na conferência I/O de 2026 sobre uma reformulação completa do seu mecanismo de busca com IA, muitos usuários começaram a procurar alternativas mais controláveis, já qu
Xiaohongshu passa por reestruturação: Conan é nomeado presidente, cria o Departamento de IA e a Divisão Internacional Rednote Em 30 de abril, a Xiaohongshu enviou um memorando interno a todos os funcionários anunciando o lançamento de uma nova reestruturação organizacional. O cerne dessa mudança envolve a integração total de
Comparação de modelos
Inicie a comparação
OR