opción
Hogar
Lista de modelos AL
Qwen1.5-110B-Chat
Cantidad de parámetros del modelo
110B
Cantidad de parámetros del modelo
Organización afiliada
Alibaba
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
25 de abril de 2024
Tiempo de lanzamiento

Introducción al modelo
Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador solo decodificador con activación SwiGLU, RoPE y mecanismos de atención multi-cabeza. Ofrece nueve tamaños de modelo y tiene capacidades mejoradas de multilingüismo y chat, con un contexto de longitud de 32,768 tokens. Todos los modelos tienen promts de sistema habilitados para roles, y el código admite implementación nativa en transformers.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
5.9
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
7.1
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
3.7
Modelo relacionado
Qwen3-Next-80B-A3B-Thinking La última serie Qwen3-Next lanzada en los modelos Qwen, que mejora la eficiencia de escalado gracias a una arquitectura de modelo innovadora.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de modelos lingüísticos de gran tamaño de la serie Qwen, que ofrece un conjunto completo de modelos densos y de mezcla de expertos (MoE).
Qwen3-Max-2026-01-23 El modelo de razonamiento insignia recientemente lanzado por Qwen introduce dos innovaciones: llamada de herramientas adaptativa y escalado en tiempo de prueba.
Qwen3-Next-80B-A3B-Thinking El último lanzamiento de la serie Qwen3-Next en modelos Qwen, que mejora la eficacia de escalado gracias a una innovadora arquitectura de modelos.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de grandes modelos lingüísticos de la serie Qwen, que ofrece un completo conjunto de modelos densos y de mezcla de expertos (MoE).
Documentos relevantes
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
iFlytek lanza sus gafas inteligentes con el asistente GlassClaw por 4299 yuanes. A medida que los grandes modelos de IA se desplazan cada vez más hacia el hardware periférico, el mercado de dispositivos vestibles inteligentes ha adquirido un nuevo jugador importante. El 28 de mayo, iFLYTEK lanzó oficialmente sus “Gafas AI iFLYTEK
Lei Jun confirma que el agente de IA de escritorio de Xiaomi, MiClaw, está en fase de desarrollo, y se lanza MiMo-V2-Pro en todas las plataformas En el Foro de Alto Nivel sobre el Desarrollo de China de 2026, Lei Jun, del Grupo Xiaomi, confirmó que la tan esperada versión de escritorio del agente de IA «MiClaw» (cangrejo) ya forma parte de la h
OpenAI relanza su negocio de robótica; Automan busca ingenieros para I+D en infraestructuras El 1 de junio, el director ejecutivo de OpenAI, Sam Altman, anunció en las redes sociales que la empresa vuelve a entrar en el campo de la robótica, con la publicación de ofertas de empleo para el equ
Bain prevé un mercado de SaaS de 100 000 millones de dólares en el ámbito de la automatización basada en IA agentiva Bain & Company ha estimado que en Estados Unidos existe un mercado de 100 000 millones de dólares para las empresas de SaaS que aprovechan la IA agentiva. La consultora afirma que este mercado surge d
Comparación de modelos
Comience la comparación
OR