Llama3.1-405B-Instruct-FP8
70B
Cantidad de parámetros del modelo
Meta
Organización afiliada
Código abierto
Tipo de licencia
22 de julio de 2024
Tiempo de lanzamiento
Introducción al modelo
Llama 3.1 405B es el primer modelo disponible públicamente que rivaliza con los principales modelos de IA en términos de capacidades de vanguardia en conocimiento general, controlabilidad, matemáticas, uso de herramientas y traducción multilingüe.
Puntaje integral
Diálogo del idioma
Reserva de conocimiento
Asociación de razonamiento
Cálculo matemático
Redacción de código
Comando siguiente


Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
4.6


Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
8.4


Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
3.5
Comparación de modelos
Llama3.1-405B-Instruct-FP8 vs Qwen2.5-7B-Instruct
Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.
Llama3.1-405B-Instruct-FP8 vs Gemini-2.5-Pro-Preview-05-06
Gemini 2.5 Pro es un modelo lanzado por el equipo de investigación en inteligencia artificial Google DeepMind, utilizando el número de versión Gemini-2.5-Pro-Preview-05-06.
Llama3.1-405B-Instruct-FP8 vs Doubao-1.5-thinking-pro-250415
El nuevo modelo de pensamiento profundo Doubao-1.5 se destaca en campos profesionales como las matemáticas, la programación, el razonamiento científico y tareas generales como la escritura creativa. Ha alcanzado o está cerca del nivel superior de la industria en varios benchmarks autoritarios como AIME 2024, Codeforces y GPQA.
Modelo relacionado
Llama3.1-8B-Instruct
Llama3.1 son multilingües y tienen una ventana de contexto significativamente más larga de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Llama3.1-405B-Instruct-FP8
El Llama 3.1 405B es el primer modelo disponible públicamente que rivaliza con los principales modelos de IA en términos de capacidades de vanguardia en conocimiento general, controlabilidad, matemáticas, uso de herramientas y traducción multilingüe.
Llama3.2-3B-Instruct
Los modelos Llama 3.2 3B admiten una longitud de contexto de 128K tokens y son líderes en su clase para casos de uso en dispositivo, como la creación de resúmenes, el seguimiento de instrucciones y tareas de reescritura ejecutadas localmente en el borde.
Llama3.1-8B-Instruct
Llama3.1 son multilingües y tienen una longitud de contexto significativamente mayor de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Llama3-70B-Instruct
Llama3 es el último modelo de lenguaje grande de código abierto de Meta, entrenado en un corpus de 15T, admite una longitud de contexto de 8K y ha sido optimizado para eficacia y seguridad.
Documentos relevantes
Faltan 3 días: TechCrunch AI en UC Berkeley
En solo tres días, el futuro de la inteligencia artificial tomará el centro del escenario en TechCrunch Sessions: AI en el Zellerbach Hall de UC Berkeley. Este jueves 5 de junio re
Imagen 4: Nuevo Generador de Imágenes AI de Google
Google acaba de presentar su último modelo de generación de imágenes con IA, Imagen 4, prometiendo una experiencia visual aún mejor que su predecesor, Imagen 3. Anunciado esta sema
Google Gemini Code Assist mejora codificación IA con capacidades agentes
Gemini Code Assist, el asistente de programación con IA de Google, está lanzando nuevas funciones "agénticas" en modo de vista previa. En la reciente conferencia Cloud Next, Google
Microsoft libera editor de texto CLI en Build
Microsoft apuesta fuerte por el código abierto en Build 2025En la conferencia Build 2025, Microsoft realizó movimientos importantes en el mundo del código abierto, lanzando varias
OpenAI mejora el modelo de IA detrás de su Operator Agent
OpenAI lleva a Operator al siguiente nivelOpenAI está dando una gran actualización a su agente de IA autónomo, Operator. Los próximos cambios significan que Operator pronto funcion