Des chercheurs du MIT à l'origine d'un cadre d'auto-apprentissage de l'IA
Une équipe du MIT a mis au point un système innovant appelé SEAL (Self-Adapting Language Models) qui permet à de grands modèles de langage de faire évoluer leurs capacités de manière autonome. Cette avancée permet aux systèmes d'IA de générer leur propre matériel de formation et leurs propres protocoles d'apprentissage, ce qui permet l'intégration permanente de nouvelles connaissances et compétences.
SEAL représente une avancée significative pour les applications d'IA d'entreprise, en particulier pour les agents intelligents opérant dans des environnements fluides où l'adaptation continue est cruciale. Le cadre répond à une limitation fondamentale de la technologie LLM actuelle - le défi de l'intégration permanente des connaissances au-delà de l'apprentissage contextuel temporaire.
Le défi de l'adaptation dans l'IA moderne
Bien que les grands modèles de langage présentent des capacités impressionnantes, leur aptitude à apprendre et à intérioriser de nouvelles informations reste limitée. Les méthodes d'adaptation actuelles, telles que le réglage fin ou l'apprentissage en contexte, traitent les données d'entrée de manière passive, sans les optimiser pour les processus d'apprentissage du modèle.
"Les applications d'entreprise exigent plus qu'un rappel temporaire des connaissances : elles ont besoin d'une adaptation profonde et durable", explique Jyo Pari, doctorant au MIT et coauteur de l'article. "Qu'il s'agisse d'un assistant de codage maîtrisant des cadres propriétaires ou d'une IA de service à la clientèle apprenant les préférences des utilisateurs, ces connaissances doivent être intégrées dans l'architecture centrale du modèle."
L'architecture SEAL
Vue d'ensemble du cadre SEAL (Source : arXiv)
Le cadre SEAL introduit une nouvelle approche d'apprentissage par renforcement dans laquelle les modèles génèrent des "auto-éditions" - des instructions spécialisées pour la mise à jour de leurs propres paramètres. Ces modifications peuvent restructurer l'information, créer des exemples synthétiques de formation ou même définir des protocoles d'apprentissage, permettant ainsi au modèle de concevoir son propre programme d'études.
Le système fonctionne selon deux cycles d'apprentissage :
Boucle interne : Exécute des mises à jour temporaires de poids basées sur des modifications générées par le modèle lui-même.
Boucle externe : Évaluation de l'efficacité des mises à jour et renforcement des stratégies réussies
Ce mécanisme d'auto-amélioration continue combine la génération de données synthétiques, l'apprentissage par renforcement et la formation en temps réel dans un paradigme d'apprentissage cohésif.
Des performances éprouvées dans tous les domaines
Intégration des connaissances
Résultats de l'intégration des connaissances dans SEAL (Source : arXiv)
Dans les tests de rétention des connaissances, les modèles améliorés par SEAL ont démontré une précision de 47 % dans le rappel du contenu des passages sans accès au matériel source - surpassant de manière significative à la fois le réglage fin de base et les données synthétiques générées par GPT-4.1.
Apprentissage par petites touches
Performance de SEAL Few-Shot Learning (Source : arXiv)
Appliqué aux défis de raisonnement abstrait de l'ensemble de données ARC, SEAL a obtenu 72,5 % de réussite, ce qui représente une amélioration considérable par rapport aux approches d'apprentissage en contexte standard.
Applications d'entreprise
Face aux préoccupations croissantes concernant l'épuisement des données de formation de haute qualité, la capacité de SEAL à générer des supports d'apprentissage autonomes offre une voie durable pour l'avenir. La technologie permet aux modèles d'approfondir de manière autonome leur compréhension de documents complexes tels que des documents de recherche ou des rapports financiers par le biais d'une auto-explication itérative.
Le cadre est particulièrement prometteur pour le développement d'agents d'intelligence artificielle, car il permet aux systèmes d'intégrer en permanence les connaissances opérationnelles issues des interactions avec l'environnement. Contrairement aux approches de programmation statique, les agents alimentés par SEAL peuvent faire évoluer leurs compétences au fil du temps tout en réduisant la dépendance à l'égard de l'intervention humaine.
Limites actuelles
La mise en œuvre de SEAL est confrontée à plusieurs considérations pratiques :
Frais généraux de calcul : Le processus d'adaptation nécessite un temps de traitement important.
Nécessité d'une mise en œuvre hybride : La combinaison de SEAL et de RAG (retrieval-augmented generation) peut optimiser la gestion de la mémoire.
"Nous recommandons aux entreprises de mettre en œuvre des cycles de mise à jour programmés plutôt qu'une adaptation continue", conseille M. Pari. "Cela permet d'équilibrer les avantages de l'adaptation avec les contraintes opérationnelles pratiques.
Amélioration progressive de SEAL (Source : arXiv)
La recherche démontre que les modèles linguistiques n'ont pas besoin de rester statiques après la formation initiale. En apprenant à générer et à appliquer leurs propres mises à jour, ils peuvent développer leurs connaissances de manière autonome et s'adapter à de nouveaux défis - une capacité qui pourrait redéfinir la mise en œuvre de l'IA dans les entreprises.
Microsoft réduit ses effectifs malgré de solides performances financièresMicrosoft annonce un réalignement stratégique de sa main-d'œuvreMicrosoft a engagé des réductions d'effectifs touchant environ 7 000 employés, représentant 3 % de son personnel mondial. Il est important de noter que ces changements reflètent des prio
En cliquant sur "Accepter tous les cookies", vous consentez au stockage de cookies sur votre appareil afin d’améliorer la navigation sur le site, d’analyser l’utilisation du site et de soutenir nos efforts marketing.Politique de confidentialité Avis
Lorsque vous visitez un site web, il peut stocker ou récupérer des informations sur votre navigateur, principalement sous forme de cookies. Ces informations peuvent concerner vous, vos préférences ou votre appareil et sont principalement utilisées pour faire fonctionner le site comme vous vous y attendez. Ces informations n’identifient généralement pas directement vous-même, mais elles peuvent vous offrir une expérience web plus personnalisée. Parce que nous respectons votre droit à la vie privée, vous pouvez choisir de ne pas autoriser certains types de cookies. Cliquez sur les différents titres de catégorie pour en savoir plus et modifier nos paramètres par défaut. Cependant, bloquer certains types de cookies peut affecter votre expérience sur le site et les services que nous sommes en mesure de proposer. Politique de confidentialitéDéclaration
Gérer les préférences
Cookie strictement nécessaire
Toujours actif
Ces cookies sont nécessaires au fonctionnement du site web et ne peuvent pas être désactivés dans nos systèmes. Ils ne sont généralement définis qu’en réponse à des actions que vous effectuez qui équivalent à une demande de services, telles que la configuration de vos préférences de confidentialité, la connexion ou le remplissage de formulaires. Vous pouvez configurer votre navigateur pour bloquer ces cookies ou vous alerter à leur sujet, mais certaines parties du site ne fonctionneront alors plus. Ces cookies ne stockent aucune information permettant d’identifier personnellement.