Name: DeepSeek-V2-Chat-0628
Rating: 1 (35 reviews)
Author: DeepSeek

Hogar

Lista de modelos AL

DeepSeek-V2-Chat-0628

Agregar comparación

236B

Cantidad de parámetros del modelo

DeepSeek

Organización afiliada

Código abierto

Tipo de licencia

6 de mayo de 2024

Tiempo de lanzamiento

Sitio web oficial

Documentación modelo

Informe técnico

Figuras relacionadas

Zhenda Xie

Kai Dong

Qihao Zhu

Daya Guo

Liang Wenfeng

Introducción al modelo

DeepSeek-V2 es un modelo de lenguaje de Mixture-of-Experts (MoE) potente, caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con 236 mil millones de parámetros en total, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el almacenamiento en caché KV en un 93,3% y mejora la capacidad máxima de generación hasta 5,76 veces.

Puntaje integral Diálogo del idioma Reserva de conocimiento Asociación de razonamiento Cálculo matemático Redacción de código Comando siguiente

Desliza hacia la izquierda y la derecha para ver más

Capacidad de comprensión del lenguaje

A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.

4.6

Alcance de cobertura de conocimiento

Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.

7.8

Capacidad de razonamiento

Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.

4.7

Comparación de modelos

DeepSeek-V2-Chat-0628 vs Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.

DeepSeek-V2-Chat-0628 vs GPT-4o-mini-20240718 GPT-4o-mini es un modelo de API producido por OpenAI, con el número de versión específico siendo gpt-4o-mini-2024-07-18.

DeepSeek-V2-Chat-0628 vs Gemini-2.5-Pro-Preview-05-06 Gemini 2.5 Pro es un modelo lanzado por el equipo de investigación en inteligencia artificial Google DeepMind, utilizando el número de versión Gemini-2.5-Pro-Preview-05-06.

DeepSeek-V2-Chat-0628 vs GPT-4o-mini-20240718 GPT-4o-mini es un modelo de API producido por OpenAI, con el número de versión específico siendo gpt-4o-mini-2024-07-18.

DeepSeek-V2-Chat-0628 vs Spark-X1 El modelo de inferencia Spark X1 lanzado por iFlytek, además de liderar tareas matematicas nacionales, evalua el rendimiento de tareas generales como inferencia, generacion de texto e inteligencia linguistica frente al OpenAI o1 y el DeepSeek R1.

Modelo relacionado

DeepSeek-V3-0324 DeepSeek-V3 supera a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y iguala el rendimiento de modelos de código cerrado de primer nivel como GPT-4 y Claude-3.5-Sonnet.

DeepSeek-R1-0528 La última versión de Deepseek R1.

DeepSeek-V2.5 DeepSeek-V2.5 es una versión actualizada que combina DeepSeek-V2-Chat y DeepSeek-Coder-V2-Instruct. El nuevo modelo integra las capacidades generales y de codificación de las dos versiones anteriores.

DeepSeek-V3-0324 DeepSeek-V3 supera a otros modelos open source como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y coincide con el rendimiento de los principales modelos cerrados como GPT-4 y Claude-3.5-Sonnet.

DeepSeek-V2-Lite-Chat DeepSeek-V2, un modelo de lenguaje potente de Mixture-of-Experts (MoE) presentado por DeepSeek, el DeepSeek-V2-Lite es una versión ligera de él.

Documentos relevantes

La búsqueda de Google amplía el modo Smarter AI a todo el mundo Google está llevando su experiencia de búsqueda basada en IA a 180 países más, ampliando significativamente su despliegue inicial a Estados Unidos, Reino Unido e India. Aunque por el momento sólo está

Guía paso a paso para crear libros para colorear en Amazon con Leonardo AI ¿Sueña con entrar en el próspero mercado de libros de Amazon? Los libros para colorear ofrecen una fantástica oportunidad de ingresos pasivos, pero encontrar ilustraciones distintivas puede ser difíci

Amazon presenta Lens Live con IA para experiencias de compra en el mundo real Amazon sigue avanzando en sus innovaciones de compra basadas en IA con la presentación el martes de Lens Live, una versión mejorada de su tecnología de búsqueda visual que ofrece a los clientes la pos

"AI Mode introduce formas innovadoras de relacionarse con la información" El futuro de las búsquedas basadas en IA ya está aquí: El Modo IA se abre a todo el mundoMillones de usuarios están revolucionando su experiencia de búsqueda con el Modo IA en Google Labs, abordando c

Cree cómics asombrosos fácilmente con la fábrica de cómics basada en inteligencia artificial Comic Factory AI representa un salto cualitativo en la narrativa digital, transformando el modo en que se elaboran las narraciones visuales. Esta innovadora plataforma aprovecha la inteligencia artifi

Comparación de modelos

Comience la comparación