opción
Hogar
Lista de modelos AL
Qwen2.5-72B-Instruct
Cantidad de parámetros del modelo
72B
Cantidad de parámetros del modelo
Organización afiliada
Alibaba
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
19 de septiembre de 2024
Tiempo de lanzamiento
Introducción al modelo
Al igual que Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
5.9
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
8.5
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
6.5
Modelo relacionado
Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.
Qwen3-32B (Thinking) Qwen3 es la última generación de modelos de lenguaje grande de la serie Qwen, ofreciendo una amplia suite de modelos densos y mezcla de expertos (MoE).
Qwen1.5-72B-Chat Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelos y tiene capacidades mejoradas de lenguaje multilingüe y de chat, admitiendo una longitud de contexto de 32,768 tokens. Todos los modelos tienen prompts de sistema habilitados para roles, y el código admite la implementación nativa en transformers.
Qwen1.5-7B-Chat Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador de solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelo y tiene capacidades mejoradas en multilingüismo y modelos de chat, con un contexto de longitud de 32.768 tokens. Todos los modelos tienen habilitados prompts de sistema para interpretación de roles, y el código admite implementación nativa en transformers.
Qwen1.5-14B-Chat Qwen1.5 es la versión beta de Qwen2, manteniendo su arquitectura como un modelo de transformador solo decodificador con activación SwiGLU, RoPE y mecanismos de atención de varias cabezas. Ofrece nueve tamaños de modelo y tiene capacidades mejoradas en multilingüismo y modelos de chat, admitiendo una longitud de contexto de 32.768 tokens. Todos los modelos tienen habilitados los prompts de sistema para roles, y el código admite implementación nativa en transformers.
Documentos relevantes
Viajes Impulsados por IA: Planifica tu Escapada Perfecta con Facilidad Planificar unas vacaciones puede parecer abrumador, con búsquedas y reseñas interminables que convierten la emoción en estrés. La planificación de viajes impulsada por IA cambia eso, haciendo que el p
NoteGPT Potenciado por IA Transforma la Experiencia de Aprendizaje en YouTube En el mundo acelerado de hoy, el aprendizaje efectivo es esencial. NoteGPT es una extensión dinámica de Chrome que revoluciona cómo interactúas con el contenido de YouTube. Al aprovechar la IA, ofrece
Comunidad Sindical y Google Se Asocian para Impulsar Habilidades de IA para Trabajadores del Reino Unido Nota del Editor: Google se ha asociado con Community Union en el Reino Unido para demostrar cómo las habilidades de IA pueden mejorar las capacidades de los trabajadores tanto de oficina como operativ
Magi-1 Revela Tecnología Revolucionaria de Generación de Video con IA de Código Abierto El ámbito de la creación de videos impulsada por IA está avanzando rápidamente, y Magi-1 marca un hito transformador. Este modelo innovador de código abierto ofrece una precisión sin igual en el contr
Ética de la IA: Navegando riesgos y responsabilidades en el desarrollo tecnológico La inteligencia artificial (IA) está transformando industrias, desde la salud hasta la logística, ofreciendo un enorme potencial para el progreso. Sin embargo, su rápido avance trae riesgos significat
Comparación de modelos
Comience la comparación
Volver arriba
OR