opción
Hogar
Lista de modelos AL
Qwen1.5-110B-Chat
Cantidad de parámetros del modelo
110B
Cantidad de parámetros del modelo
Organización afiliada
Alibaba
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
25 de abril de 2024
Tiempo de lanzamiento

Introducción al modelo
Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador solo decodificador con activación SwiGLU, RoPE y mecanismos de atención multi-cabeza. Ofrece nueve tamaños de modelo y tiene capacidades mejoradas de multilingüismo y chat, con un contexto de longitud de 32,768 tokens. Todos los modelos tienen promts de sistema habilitados para roles, y el código admite implementación nativa en transformers.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
5.9
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
7.1
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
3.7
Modelo relacionado
Qwen3-Next-80B-A3B-Thinking La última serie Qwen3-Next lanzada en los modelos Qwen, que mejora la eficiencia de escalado gracias a una arquitectura de modelo innovadora.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de modelos lingüísticos de gran tamaño de la serie Qwen, que ofrece un conjunto completo de modelos densos y de mezcla de expertos (MoE).
Qwen3-Max-2026-01-23 El modelo de razonamiento insignia recientemente lanzado por Qwen introduce dos innovaciones: llamada de herramientas adaptativa y escalado en tiempo de prueba.
Qwen3-Next-80B-A3B-Thinking El último lanzamiento de la serie Qwen3-Next en modelos Qwen, que mejora la eficacia de escalado gracias a una innovadora arquitectura de modelos.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de grandes modelos lingüísticos de la serie Qwen, que ofrece un completo conjunto de modelos densos y de mezcla de expertos (MoE).
Documentos relevantes
OpenAI relanza su negocio de robótica; Automan busca ingenieros para I+D en infraestructuras El 1 de junio, el director ejecutivo de OpenAI, Sam Altman, anunció en las redes sociales que la empresa vuelve a entrar en el campo de la robótica, con la publicación de ofertas de empleo para el equ
Bain prevé un mercado de SaaS de 100 000 millones de dólares en el ámbito de la automatización basada en IA agentiva Bain & Company ha estimado que en Estados Unidos existe un mercado de 100 000 millones de dólares para las empresas de SaaS que aprovechan la IA agentiva. La consultora afirma que este mercado surge d
La política de búsqueda con IA obligatoria provoca una fuga de usuarios, mientras que DuckDuckGo registra un aumento de usuarios Tras el anuncio realizado por Google en la conferencia I/O de 2026 sobre una renovación completa de su motor de búsqueda basada en la IA, muchos usuarios comenzaron a buscar alternativas más controlab
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote» El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
El juego «Xiaolongxia» de Tencent supera todas las expectativas; el equipo multiplica por diez su capacidad, pide disculpas y ofrece compensaciones Tencent ha lanzado oficialmente WorkBuddy, un agente inteligente basado en IA para todo tipo de situaciones, lo que marca una nueva etapa en la carrera por la capa de aplicación de los modelos a gran
Comparación de modelos
Comience la comparación
OR