Descubre herramientas de IA de calidad

Reúna las principales herramientas de inteligencia artificial del mundo para ayudar a mejorar la eficiencia laboral

Buscar herramientas de Al…

Cancelar

Hogar

Celebridad de IA

Hugo Touvron

Científico de Investigación, Meta AI

Año de nacimiento 1990

Nacionalidad French

Hito importante

2018 Se unió a Meta AI

Comenzó la investigación en modelos de lenguaje grandes en Meta

Artículo de LLaMA 2023

Artículo de investigación de LLaMA coescrito sobre modelos fundamentales eficientes

Desarrollo de LLaMA 3.1 2024

Contribuyó a LLaMA 3.1, mejorando las capacidades multilingües

Producto de IA

Llama4-Maverick-17B-128E-Instruct

Die Llama-4-Modelle sind autoregressive Sprachmodelle, die eine Mixture-of-Experts (MoE)-Architektur verwenden und eine frühe Fusion für native Multimodalität integrieren.

Llama3.1-8B-Instruct

Llama3.1 sind mehrsprachig und haben eine erheblich längere Kontextlänge von 128K, fortschrittliche Werkzeugnutzung und insgesamt stärkere Argumentationsfähigkeiten.

Llama3.1-405B-Instruct-FP8

Das Llama 3.1 405B ist das erste öffentlich verfügbare Modell, das bei allgemeinem Wissen, Steuerbarkeit, Mathematik, Werkzeugnutzung und mehrsprachiger Übersetzung den Spitzen-Leistungsfähigkeiten der besten AI-Modelle gleichkommt.

Llama3.2-3B-Instruct

Die Llama 3.2 3B-Modelle unterstützen eine Kontextlänge von 128K Tokens und gehören zu den modernsten ihrer Klasse für On-Device-Anwendungen wie Zusammenfassung, Anweisungsnachvollzug und Rewriting-Aufgaben, die lokal am Edge ausgeführt werden.

Llama3.1-8B-Instruct

Llama3.1 sind mehrsprachig und haben eine deutlich längere Kontextlänge von 128K, avantgardistische Werkzeugnutzung und insgesamt stärkere Schlussfolgerungsvermögen.

Llama3-70B-Instruct

Llama3 ist das neueste Open-Source-Großsprachmodell von Meta, das auf einem 15-Terabyte-Korpus trainiert wurde, einen Kontext von 8K unterstützt und für Effizienz und Sicherheit optimiert wurde.

Llama3.1-405B-Instruct-FP8

Llama 3.1 405B ist das erste öffentlich verfügbare Modell, das bei allgemeinem Wissen, Steuerbarkeit, Mathematik, Werkzeugnutzung und mehrsprachiger Übersetzung den besten AI-Modellen gleichwertig ist.

Llama3.1-8B-Instruct

Die Llama3.1 sind mehrsprachig und haben eine signifikant längere Kontextlänge von 128K, avantgardistische Werkzeugnutzung und insgesamt stärkere Argumentationsfähigkeiten.

Llama3.1-70B-Instruct

Llama3.1 sind mehrsprachig und haben eine deutlich längere Kontextlänge von 128K, Spitzenfähigkeiten bei der Nutzung von Tools sowie insgesamt stärkere Schlussfolgerungsvermögen.

Llama3.2-3B-Instruct

Die Llama 3.2 3B-Modelle unterstützen eine Kontextlänge von 128K Tokens und gehören zu den fortschrittlichsten ihrer Klasse für On-Device-Anwendungen wie Zusammenfassung, Anweisungsnachfolge und Rewriting-Tasks, die lokal am Edge ausgeführt werden.

Llama4-Scout-17B-16E-Instruct

Die Llama 4 Modelle sind autoregressive Sprachmodelle, die eine Mixture-of-Experts (MoE) Architektur verwenden und frühe Fusion für native Multimodalität integrieren.

Llama3-8B-Instruct

Llama3 ist das neueste Open-Source-Großsprachmodell von Meta, das auf einem 15-Terabyte-Korpus trainiert wurde, einen Kontextlänge von 8K unterstützt und für Effizienz und Sicherheit optimiert wurde.

Mixtral-8x7B-Instruct-v0.1

Das Mixtral-8x7B-Großmodell (LLM) ist ein vortrainiertes generatives Sparse-Mixture-of-Experts-Modell. Das Mistral-8x7B übertrifft bei den meisten Benchmarks, die wir getestet haben, Llama 2 70B.

Llama3.1-405B-Instruct-FP8

Llama 3.1 405B ist das erste öffentlich verfügbare Modell, das bei allgemeinem Wissen, Steuerbarkeit, Mathematik, Werkzeugnutzung und mehrsprachiger Übersetzung den Spitzen-KI-Modellen gleichwertig ist.

Llama3.1-70B-Instruct

Die Llama3.1 sind mehrsprachig und haben eine deutlich längere Kontextlänge von 128K, fortschrittliche Werkzeugnutzung und insgesamt stärkere Argumentationsfähigkeiten.

Mixtral-8x7B-Instruct-v0.1

Das Mixtral-8x7B-Großmodell (LLM) ist ein prätrainiertes generatives Sparse-Mixture-of-Experts-Modell. Das Mistral-8x7B übertrifft Llama 2 70B in den meisten Benchmarks, die wir getestet haben.

Llama4-Maverick-17B-128E-Instruct

Die Llama 4 Modelle sind auto-regressive Sprachmodelle, die eine Mischung von Experten (MoE) Architektur verwenden und frühzeitige Fusion für native Multimodalität integrieren.

Llama3.1-70B-Instruct

Llama3.1 sind mehrsprachig und haben eine signifikant längere Kontextlänge von 128K, avantgardistische Werkzeugnutzung und insgesamt stärkere Schlussfolgerungsvermögen.

Llama3.1-8B-Instruct

Llama3.1 sind mehrsprachig und haben eine deutlich längere Kontextlänge von 128K, avantgardistische Werkzeugnutzung und insgesamt stärkere Argumentationsfähigkeiten.

Llama3.2-3B-Instruct

Die Llama 3.2 3B-Modelle unterstützen eine Kontextlänge von 128K Tokens und sind in ihrer Klasse für lokal ausführende Anwendungsfälle wie Zusammenfassungen, Anweisungsnachfolge und Umformulierungsaufgaben am Edge-Leisten.

Llama3.1-70B-Instruct

Llama3.1 sind mehrsprachig und haben eine deutlich längere Kontextlänge von 128K, avantgardistische Werkzeugnutzung und insgesamt stärkere Argumentationsfähigkeiten.