Ai2 dévoile un modèle d'IA compact surpassant les rivaux de Google et Meta

Les petits modèles d'IA font des vagues cette semaine.
Jeudi, Ai2, un groupe de recherche en IA à but non lucratif, a lancé Olmo 2 1B, un modèle à 1 milliard de paramètres qui surpasse les modèles de taille similaire de Google, Meta et Alibaba sur plusieurs benchmarks. Les paramètres, souvent appelés poids, sont les éléments internes qui façonnent les performances d’un modèle.
Olmo 2 1B est disponible gratuitement sous une licence Apache 2.0 sur Hugging Face, une plateforme pour les développeurs d’IA. Contrairement à la plupart des modèles, il peut être entièrement recréé, Ai2 partageant le code et les ensembles de données (Olmo-mix-1124, Dolmino-mix-1124) utilisés dans son développement.
Bien que les modèles plus petits puissent manquer de la puissance des plus grands, ils ne nécessitent pas de matériel haut de gamme, ce qui les rend idéaux pour les développeurs et les amateurs utilisant des ordinateurs portables standard ou des appareils grand public.
Ces derniers jours ont vu une vague de sorties de petits modèles, de la famille Phi 4 de Microsoft axée sur le raisonnement à Qwen 2.5 Omni 3B. La plupart, y compris Olmo 2 1B, peuvent fonctionner sans problème sur des ordinateurs portables modernes ou même des appareils mobiles.
Ai2 indique qu’Olmo 2 1B a été entraîné sur 4 trillions de tokens provenant de sources publiques, générées par IA et sélectionnées. Un million de tokens équivaut approximativement à 750 000 mots.
Dans les tests de raisonnement arithmétique comme GSM8K, Olmo 2 1B surpasse Gemma 3 1B de Google, Llama 3.2 1B de Meta et Qwen 2.5 1.5B d’Alibaba. Il excelle également dans TruthfulQA, un benchmark pour l’exactitude factuelle.
Présentation aux TechCrunch Sessions : IA
Réservez votre place aux TC Sessions : IA pour présenter votre travail à plus de 1 200 décideurs sans vous ruiner. Disponible jusqu’au 9 mai ou jusqu’à épuisement des places.
Présentation aux TechCrunch Sessions : IA
Réservez votre place aux TC Sessions : IA pour présenter votre travail à plus de 1 200 décideurs sans vous ruiner. Disponible jusqu’au 9 mai ou jusqu’à épuisement des places.
Berkeley, CA | 5 juin
RÉSERVEZ MAINTENANT
Ce modèle a été pré-entraîné sur 4T tokens de données de haute qualité, suivant le même standard de pré-entraînement avec un recuit de haute qualité que nos modèles 7, 13 et 32B. Nous téléchargeons des points de contrôle intermédiaires tous les 1000 pas d’entraînement.
Accédez au modèle de base : https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 1er mai 2025
Ai2 avertit que Olmo 2 1B comporte des risques. Comme tous les modèles d’IA, il peut générer des sorties problématiques, y compris des contenus nuisibles ou sensibles et des informations inexactes. Ai2 déconseille son utilisation dans des applications commerciales.
Article connexe
Qu'y a-t-il à l'intérieur du LLM? Ai2 olmotrace «retracera» la source
La compréhension de la connexion entre la sortie d'un modèle grand langage (LLM) et de ses données de formation a toujours été un peu un puzzle pour l'interprise. Cette semaine, l'Institut Allen pour l'IA (AI2) a lancé une nouvelle initiative excitante open source appelée Olmotrace, qui vise à démystifier ce relati
Le jeu « Xiaolongxia » de Tencent dépasse toutes les attentes ; l'équipe multiplie par dix sa capacité, présente ses excuses et offre des compensations
Tencent a officiellement lancé WorkBuddy, un agent intelligent basé sur l'IA et adapté à tous les contextes, marquant ainsi une nouvelle étape dans la course aux applications des grands modèles, carac
Principal investisseur de Suno : la suppression des publications ne comblera pas les lacunes en matière de poursuites pour violation du droit d'auteur
La plateforme de génération musicale par IA très attendue, Suno, est confrontée à une rude bataille en matière de droits d'auteur, et une remarque sans détours de son principal investisseur pourrait b
Recommandations de sujets spéciaux liés
commentaires (4)
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!

Les petits modèles d'IA font des vagues cette semaine.
Jeudi, Ai2, un groupe de recherche en IA à but non lucratif, a lancé Olmo 2 1B, un modèle à 1 milliard de paramètres qui surpasse les modèles de taille similaire de Google, Meta et Alibaba sur plusieurs benchmarks. Les paramètres, souvent appelés poids, sont les éléments internes qui façonnent les performances d’un modèle.
Olmo 2 1B est disponible gratuitement sous une licence Apache 2.0 sur Hugging Face, une plateforme pour les développeurs d’IA. Contrairement à la plupart des modèles, il peut être entièrement recréé, Ai2 partageant le code et les ensembles de données (Olmo-mix-1124, Dolmino-mix-1124) utilisés dans son développement.
Bien que les modèles plus petits puissent manquer de la puissance des plus grands, ils ne nécessitent pas de matériel haut de gamme, ce qui les rend idéaux pour les développeurs et les amateurs utilisant des ordinateurs portables standard ou des appareils grand public.
Ces derniers jours ont vu une vague de sorties de petits modèles, de la famille Phi 4 de Microsoft axée sur le raisonnement à Qwen 2.5 Omni 3B. La plupart, y compris Olmo 2 1B, peuvent fonctionner sans problème sur des ordinateurs portables modernes ou même des appareils mobiles.
Ai2 indique qu’Olmo 2 1B a été entraîné sur 4 trillions de tokens provenant de sources publiques, générées par IA et sélectionnées. Un million de tokens équivaut approximativement à 750 000 mots.
Dans les tests de raisonnement arithmétique comme GSM8K, Olmo 2 1B surpasse Gemma 3 1B de Google, Llama 3.2 1B de Meta et Qwen 2.5 1.5B d’Alibaba. Il excelle également dans TruthfulQA, un benchmark pour l’exactitude factuelle.
Présentation aux TechCrunch Sessions : IA
Réservez votre place aux TC Sessions : IA pour présenter votre travail à plus de 1 200 décideurs sans vous ruiner. Disponible jusqu’au 9 mai ou jusqu’à épuisement des places.
Présentation aux TechCrunch Sessions : IA
Réservez votre place aux TC Sessions : IA pour présenter votre travail à plus de 1 200 décideurs sans vous ruiner. Disponible jusqu’au 9 mai ou jusqu’à épuisement des places.
Berkeley, CA | 5 juin RÉSERVEZ MAINTENANTCe modèle a été pré-entraîné sur 4T tokens de données de haute qualité, suivant le même standard de pré-entraînement avec un recuit de haute qualité que nos modèles 7, 13 et 32B. Nous téléchargeons des points de contrôle intermédiaires tous les 1000 pas d’entraînement.
— Ai2 (@allen_ai) 1er mai 2025
Accédez au modèle de base : https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
Ai2 avertit que Olmo 2 1B comporte des risques. Comme tous les modèles d’IA, il peut générer des sorties problématiques, y compris des contenus nuisibles ou sensibles et des informations inexactes. Ai2 déconseille son utilisation dans des applications commerciales.
Qu'y a-t-il à l'intérieur du LLM? Ai2 olmotrace «retracera» la source
La compréhension de la connexion entre la sortie d'un modèle grand langage (LLM) et de ses données de formation a toujours été un peu un puzzle pour l'interprise. Cette semaine, l'Institut Allen pour l'IA (AI2) a lancé une nouvelle initiative excitante open source appelée Olmotrace, qui vise à démystifier ce relati
Le jeu « Xiaolongxia » de Tencent dépasse toutes les attentes ; l'équipe multiplie par dix sa capacité, présente ses excuses et offre des compensations
Tencent a officiellement lancé WorkBuddy, un agent intelligent basé sur l'IA et adapté à tous les contextes, marquant ainsi une nouvelle étape dans la course aux applications des grands modèles, carac
Principal investisseur de Suno : la suppression des publications ne comblera pas les lacunes en matière de poursuites pour violation du droit d'auteur
La plateforme de génération musicale par IA très attendue, Suno, est confrontée à une rude bataille en matière de droits d'auteur, et une remarque sans détours de son principal investisseur pourrait b
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!





Maison






