opción
Hogar
Lista de modelos AL
Llama3.1-405B-Instruct-FP8

Llama3.1-405B-Instruct-FP8

Agregar comparación
Agregar comparación
Cantidad de parámetros del modelo
70B
Cantidad de parámetros del modelo
Organización afiliada
Meta
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
23 de julio de 2024
Tiempo de lanzamiento

Introducción al modelo
El Llama 3.1 405B es el primer modelo disponible públicamente que rivaliza con los principales modelos de IA en términos de capacidades de vanguardia en conocimiento general, controlabilidad, matemáticas, uso de herramientas y traducción multilingüe.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
4.5
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Posee el conocimiento central de las disciplinas convencionales, pero tiene una cobertura limitada de los campos interdisciplinarios de vanguardia.
8.7
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
5.4
Modelo relacionado
Llama4-Maverick-17B-128E-Instruct Los modelos Llama 4 son modelos lingüísticos autorregresivos que utilizan una arquitectura de mezcla de expertos (MoE) e incorporan la fusión temprana para la multimodalidad nativa.
Llama4-Maverick-17B-128E-Instruct Los modelos Llama 4 son modelos de lenguaje autorregresivos que utilizan una arquitectura de mezcla de expertos (MoE) e incorporan fusión temprana para multimodalidad nativa.
Llama3.1-8B-Instruct Llama3.1 son multilingües y tienen una ventana de contexto significativamente más larga de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Llama3.2-3B-Instruct Los modelos Llama 3.2 3B admiten una longitud de contexto de 128K tokens y son líderes en su clase para casos de uso en dispositivo, como la creación de resúmenes, el seguimiento de instrucciones y tareas de reescritura ejecutadas localmente en el borde.
Llama3.1-8B-Instruct Llama3.1 son multilingües y tienen una longitud de contexto significativamente mayor de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Documentos relevantes
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Claude, la IA experimental de Anthropic, lleva a cabo negociaciones y transacciones en una prueba de comercio electrónico A medida que la inteligencia artificial avanza rápidamente, Anthropic puso en marcha discretamente el pasado viernes un experimento interno denominado «Project Deal», en el que se ponía de manifiesto
DeepSeek Code, listo para su lanzamiento A medida que la tecnología de IA avanza a pasos agigantados, DeepSeek se encuentra en un momento decisivo. La empresa de IA ha revelado recientemente que ha conseguido más de 70 000 millones de yuanes
Comparación de modelos
Comience la comparación
OR