opción
Hogar Flechas de navegación Lista de modelos AL Flechas de navegación DeepSeek-V2.5
Cantidad de parámetros del modelo
236B
Cantidad de parámetros del modelo
Organización afiliada
DeepSeek
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
4 de septiembre de 2024
Tiempo de lanzamiento
Introducción al modelo
DeepSeek-V2.5 es una versión actualizada que combina DeepSeek-V2-Chat y DeepSeek-Coder-V2-Instruct. El nuevo modelo integra las capacidades generales y de codificación de las dos versiones anteriores.
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
5.2
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
7.6
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
4.4
Modelo relacionado
DeepSeek-V2-Chat-0628 DeepSeek-V2 es un modelo de lenguaje de Mixture-of-Experts (MoE) potente, caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con 236 mil millones de parámetros en total, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el almacenamiento en caché KV en un 93,3% y mejora la capacidad máxima de generación hasta 5,76 veces.
DeepSeek-V3-0324 DeepSeek-V3 supera a otros modelos open source como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y coincide con el rendimiento de los principales modelos cerrados como GPT-4 y Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, un modelo de lenguaje potente de Mixture-of-Experts (MoE) presentado por DeepSeek, el DeepSeek-V2-Lite es una versión ligera de él.
DeepSeek-V2-Chat DeepSeek-V2 es un modelo de lenguaje Mixture-of-Experts (MoE) potente caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con un total de 236 mil millones de parámetros, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el caché KV en un 93,3% y aumenta el rendimiento máximo de generación hasta 5,76 veces.
DeepSeek-R1 DeepSeek-R1 es un modelo entrenado mediante aprendizaje por refuerzo a gran escala (RL) sin utilizar Afinamiento Supervisado (SFT) como paso inicial. Su rendimiento en tareas de matemáticas, codificación y razonamiento es comparable al de OpenAI-o1.
Documentos relevantes
OpenAI mejora el modelo de IA detrás de su Operator Agent OpenAI lleva a Operator al siguiente nivelOpenAI está dando una gran actualización a su agente de IA autónomo, Operator. Los próximos cambios significan que Operator pronto funcion
El fondo de futuro de IA de Google podría tener que proceder con cautela El nuevo programa de inversiones en IA de Google: un cambio estratégico ante la creciente escrutinización regulatoriaEl reciente anuncio de Google sobre la creación de su fondo de
AI YouTube MiniGnail Generator: aumente sus vistas de video El poder de la IA en la creación de miniatura de YouTube en el panorama digital de hoy, una cautivadora miniatura de YouTube es crucial para captar la atención de los espectadores. Con millones de videos compitiendo por clics, una miniatura llamativa puede marcar la diferencia. Los generadores de miniatura AI de YouTube se han convertido en un gam
Aplicaciones de viajes de IA: su guía para la planificación del viaje inteligente en 2025 ¿Planeando un viaje en 2025? Si aún no lo ha hecho, es probable que haya escuchado sobre las increíbles formas en que la inteligencia artificial (IA) está remodelando la industria de los viajes. Las aplicaciones de viajes de IA se están convirtiendo en la norma, prometiendo simplificar y mejorar cada aspecto de su viaje. Pero, ¿cómo funcionan realmente estas aplicaciones, y
Guía Paso a Paso para Crear Tu Propio Bot de Chat de IA Personalizado con Coze En el entorno digital de hoy, crear tu propio bot de chat puede parecer abrumador. Pero gracias a plataformas como Coze, esta tarea una vez compleja se ha vuelto sorprendentemente
Comparación de modelos
Comience la comparación
Volver arriba
OR