option
Maison
Nouvelles
Ai2 dévoile un modèle d'IA compact surpassant les rivaux de Google et Meta

Ai2 dévoile un modèle d'IA compact surpassant les rivaux de Google et Meta

14 août 2025
22

Ai2 dévoile un modèle d

Les petits modèles d'IA font des vagues cette semaine.

Jeudi, Ai2, un groupe de recherche en IA à but non lucratif, a lancé Olmo 2 1B, un modèle à 1 milliard de paramètres qui surpasse les modèles de taille similaire de Google, Meta et Alibaba sur plusieurs benchmarks. Les paramètres, souvent appelés poids, sont les éléments internes qui façonnent les performances d’un modèle.

Olmo 2 1B est disponible gratuitement sous une licence Apache 2.0 sur Hugging Face, une plateforme pour les développeurs d’IA. Contrairement à la plupart des modèles, il peut être entièrement recréé, Ai2 partageant le code et les ensembles de données (Olmo-mix-1124, Dolmino-mix-1124) utilisés dans son développement.

Bien que les modèles plus petits puissent manquer de la puissance des plus grands, ils ne nécessitent pas de matériel haut de gamme, ce qui les rend idéaux pour les développeurs et les amateurs utilisant des ordinateurs portables standard ou des appareils grand public.

Ces derniers jours ont vu une vague de sorties de petits modèles, de la famille Phi 4 de Microsoft axée sur le raisonnement à Qwen 2.5 Omni 3B. La plupart, y compris Olmo 2 1B, peuvent fonctionner sans problème sur des ordinateurs portables modernes ou même des appareils mobiles.

Ai2 indique qu’Olmo 2 1B a été entraîné sur 4 trillions de tokens provenant de sources publiques, générées par IA et sélectionnées. Un million de tokens équivaut approximativement à 750 000 mots.

Dans les tests de raisonnement arithmétique comme GSM8K, Olmo 2 1B surpasse Gemma 3 1B de Google, Llama 3.2 1B de Meta et Qwen 2.5 1.5B d’Alibaba. Il excelle également dans TruthfulQA, un benchmark pour l’exactitude factuelle.

Présentation aux TechCrunch Sessions : IA

Réservez votre place aux TC Sessions : IA pour présenter votre travail à plus de 1 200 décideurs sans vous ruiner. Disponible jusqu’au 9 mai ou jusqu’à épuisement des places.

Présentation aux TechCrunch Sessions : IA

Réservez votre place aux TC Sessions : IA pour présenter votre travail à plus de 1 200 décideurs sans vous ruiner. Disponible jusqu’au 9 mai ou jusqu’à épuisement des places.

Berkeley, CA | 5 juin RÉSERVEZ MAINTENANT

Ce modèle a été pré-entraîné sur 4T tokens de données de haute qualité, suivant le même standard de pré-entraînement avec un recuit de haute qualité que nos modèles 7, 13 et 32B. Nous téléchargeons des points de contrôle intermédiaires tous les 1000 pas d’entraînement.

Accédez au modèle de base : https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL

— Ai2 (@allen_ai) 1er mai 2025

Ai2 avertit que Olmo 2 1B comporte des risques. Comme tous les modèles d’IA, il peut générer des sorties problématiques, y compris des contenus nuisibles ou sensibles et des informations inexactes. Ai2 déconseille son utilisation dans des applications commerciales.

Article connexe
Qu'y a-t-il à l'intérieur du LLM? Ai2 olmotrace «retracera» la source Qu'y a-t-il à l'intérieur du LLM? Ai2 olmotrace «retracera» la source La compréhension de la connexion entre la sortie d'un modèle grand langage (LLM) et de ses données de formation a toujours été un peu un puzzle pour l'interprise. Cette semaine, l'Institut Allen pour l'IA (AI2) a lancé une nouvelle initiative excitante open source appelée Olmotrace, qui vise à démystifier ce relati
Un crossover généré par l'IA réunit Arthur Morgan et Joshua Graham dans un multivers ludique Un crossover généré par l'IA réunit Arthur Morgan et Joshua Graham dans un multivers ludique Quand les mondes du jeu s'entrechoquent : Arthur Morgan rencontre l'homme brûléImaginez un monde où des personnages de jeux légendaires dépassent leur propre histoire. Que se passe-t-il lorsque Arthur
Microsoft accueille les modèles avancés Grok 3 de xAI dans le cadre d'une nouvelle collaboration en matière d'IA Microsoft accueille les modèles avancés Grok 3 de xAI dans le cadre d'une nouvelle collaboration en matière d'IA Au début du mois, mon journalisme d'investigation *Notepad* a révélé les plans de Microsoft pour intégrer les modèles d'IA Grok d'Elon Musk - des révélations qui ont maintenant été officiellement conf
commentaires (1)
0/200
MarkWilson
MarkWilson 26 août 2025 17:01:15 UTC+02:00

This tiny AI model from Ai2 sounds like a game-changer! Beating Google and Meta? That's wild! 🚀 Curious how it performs in real-world apps.

Retour en haut
OR