opción
Hogar
Lista de modelos AL
Qwen1.5-72B-Chat
Cantidad de parámetros del modelo
72B
Cantidad de parámetros del modelo
Organización afiliada
Alibaba
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
4 de febrero de 2024
Tiempo de lanzamiento

Introducción al modelo
Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelos y tiene capacidades mejoradas de lenguaje multilingüe y de chat, admitiendo una longitud de contexto de 32,768 tokens. Todos los modelos tienen prompts de sistema habilitados para roles, y el código admite la implementación nativa en transformers.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
5.9
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
7.0
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
4.0
Modelo relacionado
Qwen3-Next-80B-A3B-Thinking La última serie Qwen3-Next lanzada en los modelos Qwen, que mejora la eficiencia de escalado gracias a una arquitectura de modelo innovadora.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de modelos lingüísticos de gran tamaño de la serie Qwen, que ofrece un conjunto completo de modelos densos y de mezcla de expertos (MoE).
Qwen3-Max-2026-01-23 El modelo de razonamiento insignia recientemente lanzado por Qwen introduce dos innovaciones: llamada de herramientas adaptativa y escalado en tiempo de prueba.
Qwen3-Next-80B-A3B-Thinking El último lanzamiento de la serie Qwen3-Next en modelos Qwen, que mejora la eficacia de escalado gracias a una innovadora arquitectura de modelos.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de grandes modelos lingüísticos de la serie Qwen, que ofrece un completo conjunto de modelos densos y de mezcla de expertos (MoE).
Documentos relevantes
La política de búsqueda con IA obligatoria provoca una fuga de usuarios, mientras que DuckDuckGo registra un aumento de usuarios Tras el anuncio realizado por Google en la conferencia I/O de 2026 sobre una renovación completa de su motor de búsqueda basada en la IA, muchos usuarios comenzaron a buscar alternativas más controlab
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote» El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
El juego «Xiaolongxia» de Tencent supera todas las expectativas; el equipo multiplica por diez su capacidad, pide disculpas y ofrece compensaciones Tencent ha lanzado oficialmente WorkBuddy, un agente inteligente basado en IA para todo tipo de situaciones, lo que marca una nueva etapa en la carrera por la capa de aplicación de los modelos a gran
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
Comparación de modelos
Comience la comparación
OR