opción
Hogar
Lista de modelos AL
Qwen1.5-7B-Chat
Cantidad de parámetros del modelo
7B
Cantidad de parámetros del modelo
Organización afiliada
Alibaba
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
4 de febrero de 2024
Tiempo de lanzamiento

Introducción al modelo
Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador de solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelo y tiene capacidades mejoradas en multilingüismo y modelos de chat, con un contexto de longitud de 32.768 tokens. Todos los modelos tienen habilitados prompts de sistema para interpretación de roles, y el código admite implementación nativa en transformers.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
4.5
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.
5.1
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
2.2
Modelo relacionado
Qwen3-235B-A22B-Instruct-2507 Qwen3 es la última generación de modelos de lenguaje grandes de la serie Qwen, que ofrece una colección completa de modelos densos y de mezcla de expertos (MoE).
Qwen3-235B-A22B-Thinking-2507 Qwen3 es la última generación de modelos de lenguaje grandes en la serie Qwen, que ofrece una suite completa de modelos densos y de mezcla de expertos (MoE).
Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.
Qwen3-32B (Thinking) Qwen3 es la última generación de modelos de lenguaje grande de la serie Qwen, ofreciendo una amplia suite de modelos densos y mezcla de expertos (MoE).
Qwen1.5-72B-Chat Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelos y tiene capacidades mejoradas de lenguaje multilingüe y de chat, admitiendo una longitud de contexto de 32,768 tokens. Todos los modelos tienen prompts de sistema habilitados para roles, y el código admite la implementación nativa en transformers.
Documentos relevantes
La búsqueda de Google amplía el modo Smarter AI a todo el mundo Google está llevando su experiencia de búsqueda basada en IA a 180 países más, ampliando significativamente su despliegue inicial a Estados Unidos, Reino Unido e India. Aunque por el momento sólo está
Guía paso a paso para crear libros para colorear en Amazon con Leonardo AI ¿Sueña con entrar en el próspero mercado de libros de Amazon? Los libros para colorear ofrecen una fantástica oportunidad de ingresos pasivos, pero encontrar ilustraciones distintivas puede ser difíci
Amazon presenta Lens Live con IA para experiencias de compra en el mundo real Amazon sigue avanzando en sus innovaciones de compra basadas en IA con la presentación el martes de Lens Live, una versión mejorada de su tecnología de búsqueda visual que ofrece a los clientes la pos
"AI Mode introduce formas innovadoras de relacionarse con la información" El futuro de las búsquedas basadas en IA ya está aquí: El Modo IA se abre a todo el mundoMillones de usuarios están revolucionando su experiencia de búsqueda con el Modo IA en Google Labs, abordando c
Cree cómics asombrosos fácilmente con la fábrica de cómics basada en inteligencia artificial Comic Factory AI representa un salto cualitativo en la narrativa digital, transformando el modo en que se elaboran las narraciones visuales. Esta innovadora plataforma aprovecha la inteligencia artifi
Comparación de modelos
Comience la comparación
Volver arriba
OR