opción
Hogar
Lista de modelos AL
Llama3-70B-Instruct
Cantidad de parámetros del modelo
70B
Cantidad de parámetros del modelo
Organización afiliada
Meta
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
18 de abril de 2024
Tiempo de lanzamiento

Introducción al modelo
Llama3 es el último modelo de lenguaje grande de código abierto de Meta, entrenado en un corpus de 15T, admite una longitud de contexto de 8K y ha sido optimizado para eficacia y seguridad.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
5.5
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.
6.8
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
3.9
Modelo relacionado
Llama4-Maverick-17B-128E-Instruct Los modelos Llama 4 son modelos lingüísticos autorregresivos que utilizan una arquitectura de mezcla de expertos (MoE) e incorporan la fusión temprana para la multimodalidad nativa.
Llama4-Maverick-17B-128E-Instruct Los modelos Llama 4 son modelos de lenguaje autorregresivos que utilizan una arquitectura de mezcla de expertos (MoE) e incorporan fusión temprana para multimodalidad nativa.
Llama3.1-8B-Instruct Llama3.1 son multilingües y tienen una ventana de contexto significativamente más larga de 128K, uso avanzado de herramientas y capacidades generales de razonamiento más fuertes.
Llama3.1-405B-Instruct-FP8 El Llama 3.1 405B es el primer modelo disponible públicamente que rivaliza con los principales modelos de IA en términos de capacidades de vanguardia en conocimiento general, controlabilidad, matemáticas, uso de herramientas y traducción multilingüe.
Llama3.2-3B-Instruct Los modelos Llama 3.2 3B admiten una longitud de contexto de 128K tokens y son líderes en su clase para casos de uso en dispositivo, como la creación de resúmenes, el seguimiento de instrucciones y tareas de reescritura ejecutadas localmente en el borde.
Documentos relevantes
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Claude, la IA experimental de Anthropic, lleva a cabo negociaciones y transacciones en una prueba de comercio electrónico A medida que la inteligencia artificial avanza rápidamente, Anthropic puso en marcha discretamente el pasado viernes un experimento interno denominado «Project Deal», en el que se ponía de manifiesto
DeepSeek Code, listo para su lanzamiento A medida que la tecnología de IA avanza a pasos agigantados, DeepSeek se encuentra en un momento decisivo. La empresa de IA ha revelado recientemente que ha conseguido más de 70 000 millones de yuanes
Grok, de Musk: 1,5 billones de parámetros y absorción de código de cursor: ¿un punto de inflexión o un farol? Elon Musk por fin está dando un paso adelante.En la carrera por la programación de IA, OpenAI y Anthropic están acelerando, mientras que xAI parece quedarse atrás. Musk ha manifestado en numerosas oca
OpenAI modifica en secreto sus estatutos para dificultar la destitución de Altman Tras el incidente similar a un golpe de Estado ocurrido en 2023, OpenAI ha reforzado aún más las garantías de protección para su director ejecutivo, Sam Altman, mediante la actualización de sus estatu
Comparación de modelos
Comience la comparación
OR