opción
Hogar
Lista de modelos AL
DeepSeek-R1-0528
Cantidad de parámetros del modelo
671B
Cantidad de parámetros del modelo
Organización afiliada
DeepSeek
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
28 de mayo de 2025
Tiempo de lanzamiento

Introducción al modelo
La última versión de Deepseek R1.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
Capaz de comprender contextos complejos y generar oraciones lógicamente coherentes, aunque ocasionalmente en control de tono.
8.3
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
8.9
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
6.2
Modelo relacionado
DeepSeek-V3.2 La última versión de los modelos de la serie Deepseek V3.
DeepSeek-V3.2-Exp La última versión experimental de los modelos de la serie Deepseek V3.
DeepSeek-V3-0324 DeepSeek-V3 supera a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y iguala el rendimiento de modelos de código cerrado de primer nivel como GPT-4 y Claude-3.5-Sonnet.
DeepSeek-R1-0528 La última versión de Deepseek R1.
DeepSeek-V2-Chat-0628 DeepSeek-V2 es un modelo de lenguaje de Mixture-of-Experts (MoE) potente, caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con 236 mil millones de parámetros en total, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el almacenamiento en caché KV en un 93,3% y mejora la capacidad máxima de generación hasta 5,76 veces.
Documentos relevantes
La política de búsqueda con IA obligatoria provoca una fuga de usuarios, mientras que DuckDuckGo registra un aumento de usuarios Tras el anuncio realizado por Google en la conferencia I/O de 2026 sobre una renovación completa de su motor de búsqueda basada en la IA, muchos usuarios comenzaron a buscar alternativas más controlab
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote» El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
El juego «Xiaolongxia» de Tencent supera todas las expectativas; el equipo multiplica por diez su capacidad, pide disculpas y ofrece compensaciones Tencent ha lanzado oficialmente WorkBuddy, un agente inteligente basado en IA para todo tipo de situaciones, lo que marca una nueva etapa en la carrera por la capa de aplicación de los modelos a gran
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
Comparación de modelos
Comience la comparación
OR