opción
Hogar
Lista de modelos AL
Qwen1.5-7B-Chat
Cantidad de parámetros del modelo
7B
Cantidad de parámetros del modelo
Organización afiliada
Alibaba
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
4 de febrero de 2024
Tiempo de lanzamiento

Introducción al modelo
Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador de solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelo y tiene capacidades mejoradas en multilingüismo y modelos de chat, con un contexto de longitud de 32.768 tokens. Todos los modelos tienen habilitados prompts de sistema para interpretación de roles, y el código admite implementación nativa en transformers.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
4.5
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.
5.1
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
2.2
Modelo relacionado
Qwen3-Next-80B-A3B-Thinking La última serie Qwen3-Next lanzada en los modelos Qwen, que mejora la eficiencia de escalado gracias a una arquitectura de modelo innovadora.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de modelos lingüísticos de gran tamaño de la serie Qwen, que ofrece un conjunto completo de modelos densos y de mezcla de expertos (MoE).
Qwen3-Max-2026-01-23 El modelo de razonamiento insignia recientemente lanzado por Qwen introduce dos innovaciones: llamada de herramientas adaptativa y escalado en tiempo de prueba.
Qwen3-Next-80B-A3B-Thinking El último lanzamiento de la serie Qwen3-Next en modelos Qwen, que mejora la eficacia de escalado gracias a una innovadora arquitectura de modelos.
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de grandes modelos lingüísticos de la serie Qwen, que ofrece un completo conjunto de modelos densos y de mezcla de expertos (MoE).
Documentos relevantes
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote» El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
El juego «Xiaolongxia» de Tencent supera todas las expectativas; el equipo multiplica por diez su capacidad, pide disculpas y ofrece compensaciones Tencent ha lanzado oficialmente WorkBuddy, un agente inteligente basado en IA para todo tipo de situaciones, lo que marca una nueva etapa en la carrera por la capa de aplicación de los modelos a gran
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
Haier lanza el robot exoesqueleto deportivo con IA más ligero del mundo, con un peso de tan solo 1,75 kg El Grupo Haier ha presentado el robot exoesqueleto con inteligencia artificial más ligero del mundo para el deporte: el Haier Exoskeleton Robot W3. Este lanzamiento establece un nuevo récord del secto
Comparación de modelos
Comience la comparación
OR