opción
Hogar
Lista de modelos AL
DeepSeek-V2-Lite-Chat
Cantidad de parámetros del modelo
16B
Cantidad de parámetros del modelo
Organización afiliada
DeepSeek
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
15 de mayo de 2024
Tiempo de lanzamiento
Introducción al modelo
DeepSeek-V2, un modelo fuerte de lenguaje Mixture-of-Experts (MoE) presentado por DeepSeek, el DeepSeek-V2-Lite es una versión ligera de él.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
3.1
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.
4.1
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
2.8
Modelo relacionado
DeepSeek-V2-Chat-0628 DeepSeek-V2 es un modelo de lenguaje de Mixture-of-Experts (MoE) potente, caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con 236 mil millones de parámetros en total, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el almacenamiento en caché KV en un 93,3% y mejora la capacidad máxima de generación hasta 5,76 veces.
DeepSeek-V2.5 DeepSeek-V2.5 es una versión actualizada que combina DeepSeek-V2-Chat y DeepSeek-Coder-V2-Instruct. El nuevo modelo integra las capacidades generales y de codificación de las dos versiones anteriores.
DeepSeek-V3-0324 DeepSeek-V3 supera a otros modelos open source como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y coincide con el rendimiento de los principales modelos cerrados como GPT-4 y Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, un modelo de lenguaje potente de Mixture-of-Experts (MoE) presentado por DeepSeek, el DeepSeek-V2-Lite es una versión ligera de él.
DeepSeek-V2-Chat DeepSeek-V2 es un modelo de lenguaje Mixture-of-Experts (MoE) potente caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con un total de 236 mil millones de parámetros, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el caché KV en un 93,3% y aumenta el rendimiento máximo de generación hasta 5,76 veces.
Documentos relevantes
Viajes Impulsados por IA: Planifica tu Escapada Perfecta con Facilidad Planificar unas vacaciones puede parecer abrumador, con búsquedas y reseñas interminables que convierten la emoción en estrés. La planificación de viajes impulsada por IA cambia eso, haciendo que el p
NoteGPT Potenciado por IA Transforma la Experiencia de Aprendizaje en YouTube En el mundo acelerado de hoy, el aprendizaje efectivo es esencial. NoteGPT es una extensión dinámica de Chrome que revoluciona cómo interactúas con el contenido de YouTube. Al aprovechar la IA, ofrece
Comunidad Sindical y Google Se Asocian para Impulsar Habilidades de IA para Trabajadores del Reino Unido Nota del Editor: Google se ha asociado con Community Union en el Reino Unido para demostrar cómo las habilidades de IA pueden mejorar las capacidades de los trabajadores tanto de oficina como operativ
Magi-1 Revela Tecnología Revolucionaria de Generación de Video con IA de Código Abierto El ámbito de la creación de videos impulsada por IA está avanzando rápidamente, y Magi-1 marca un hito transformador. Este modelo innovador de código abierto ofrece una precisión sin igual en el contr
Ética de la IA: Navegando riesgos y responsabilidades en el desarrollo tecnológico La inteligencia artificial (IA) está transformando industrias, desde la salud hasta la logística, ofreciendo un enorme potencial para el progreso. Sin embargo, su rápido avance trae riesgos significat
Comparación de modelos
Comience la comparación
Volver arriba
OR