opción
Hogar
Lista de modelos AL
Llama3.1-405B-Instruct-FP8

Llama3.1-405B-Instruct-FP8

Agregar comparación
Agregar comparación
Cantidad de parámetros del modelo
70B
Cantidad de parámetros del modelo
Organización afiliada
Meta
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
23 de julio de 2024
Tiempo de lanzamiento

Introducción al modelo
El Llama 3.1 405B es el primer modelo disponible públicamente que rivaliza con los principales modelos de IA en términos de capacidades de vanguardia en conocimiento general, controlabilidad, matemáticas, uso de herramientas y traducción multilingüe.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
4.5
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
8.7
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
5.4
Modelo relacionado
Llama4-Maverick-17B-128E-Instruct Los modelos Llama 4 son modelos de lenguaje autorregresivos que utilizan una arquitectura de mezcla de expertos (MoE) e incorporan fusión temprana para multimodalidad nativa.
Llama3.1-8B-Instruct Llama3.1 son multilingües y tienen una ventana de contexto significativamente más larga de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Llama3.2-3B-Instruct Los modelos Llama 3.2 3B admiten una longitud de contexto de 128K tokens y son líderes en su clase para casos de uso en dispositivo, como la creación de resúmenes, el seguimiento de instrucciones y tareas de reescritura ejecutadas localmente en el borde.
Llama3.1-8B-Instruct Llama3.1 son multilingües y tienen una longitud de contexto significativamente mayor de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Llama3-70B-Instruct Llama3 es el último modelo de lenguaje grande de código abierto de Meta, entrenado en un corpus de 15T, admite una longitud de contexto de 8K y ha sido optimizado para eficacia y seguridad.
Documentos relevantes
Microsoft reduce su plantilla pese a sus sólidos resultados financieros Microsoft anuncia una reestructuración estratégica de su plantillaMicrosoft ha iniciado recortes de personal que afectan a aproximadamente 7.000 empleados, lo que representa el 3% de su plantilla global. Es importante destacar que estos cambios refle
Leonardo AI lanza un lienzo en tiempo real para impulsar la creatividad Entra en el reino de la creatividad impulsada por la IA con Leonardo AI. Esta innovadora plataforma se ha convertido rápidamente en la opción preferida de artistas digitales y creadores de contenidos
Ahorra 900 $ en entradas para TechCrunch Disrupt 2025 - ¡Sólo quedan 6 días! No pierdas esta última oportunidad: ¡sólo quedan 6 días para conseguir importantes descuentos para TechCrunch Disrupt 2025!Los precios de las entradas subirán después del 25 de mayo a las 11:59 PM PT.
Klarna promete un servicio VIP centrado en las personas para clientes premium El Equilibrio entre IA y Humanos: El CEO de Klarna Comparte PerspectivasEl público en el SXSW de Londres escuchó atentamente mientras el CEO de Klarna, Sebastian Siemiatkowski, revelaba la inspiración personal detrás de la estrategia de fuerza labora
Brendan Foody, de Mercor, explica la revolución de la IA en la contratación en TechCrunch Disrupt 2025 El futuro del trabajo es ahoraLa transformación del lugar de trabajo no está por llegar, está ocurriendo ante nuestros ojos.En el AI Stage de TechCrunch Disrupt 2025, Brendan Foody, CEO de Mercor, rev
Comparación de modelos
Comience la comparación
Volver arriba
OR