Le plugin IA de Sakana AI simplifie le traitement des documents pour les grands modèles

Maison

Nouvelles

21 mars 2026

CarlPerez

Les difficultés rencontrées par les grands modèles linguistiques dans le traitement de textes longs, souvent qualifiées d’« anxiété de mémoire », pourraient bientôt appartenir au passé. Récemment, la start-up d'IA Sakana AI, basée à Tokyo, a dévoilé deux technologies révolutionnaires : Text-to-LoRA (T2L) et Doc-to-LoRA (D2L). Grâce à une architecture innovante de « super-réseau », ces technologies permettent aux grands modèles d'« absorber » des documents volumineux ou d'apprendre de nouvelles tâches en moins d'une seconde, le tout sans réentraînement.

Les développeurs d'IA sont depuis longtemps confrontés à un choix difficile : entasser de longs documents dans une fenêtre de chat — ce qui ralentit les réponses et consomme beaucoup de mémoire — ou payer le coût élevé du réglage fin d'un modèle. Sakana AI propose une troisième option. Grâce à un paiement unique pour le pré-entraînement, elle génère des plugins de poids minimes (LoRA) pour permettre une adaptation des modèles efficace et à faible coût.

Doc-to-LoRA : les besoins en mémoire passent de 12 Go à seulement 50 Mo

Il s'agit de la technologie la plus impressionnante de cette dernière version. Le traitement d'un document de 128 000 tokens (environ 100 000 mots) avec les méthodes traditionnelles nécessite plus de 12 Go de VRAM pour stocker les informations. Avec D2L, le modèle peut directement « digérer » ces informations pour les transformer en un plugin de moins de 50 Mo.

Une vitesse remarquable: les technologies existantes nécessitent entre 40 et 100 secondes pour traiter un document, tandis que D2L y parvient en moins d'une seconde.

Repousser les limites: cela permet aux modèles de traiter des textes jusqu’à quatre fois plus longs que leur fenêtre de contexte d’origine, atteignant une précision quasi parfaite lors de tests de recherche de type « aiguille dans une botte de foin ».

Text-to-LoRA : personnaliser l'IA avec le langage courant

Text-to-LoRA rend les modèles plus réactifs. Les utilisateurs décrivent simplement une tâche en langage naturel — par exemple, « aide-moi à résoudre un problème complexe de mathématiques » — et le système génère automatiquement un plugin dédié pour améliorer les performances. Des expériences révèlent que les adaptateurs créés de cette manière peuvent surpasser les modèles dédiés entraînés à partir de zéro sur des tâches de mathématiques et de raisonnement logique.

Une technologie intermodale puissante : permettre aux modèles textuels de « voir » les images

Les chercheurs ont découvert un avantage inattendu : D2L présente de solides capacités cross-modales. En mappant les informations visuelles dans les paramètres d’un modèle purement textuel, un modèle qui n’a jamais traité d’images auparavant peut les classer avec une précision de **75,03 %**.

Les réalisations de Sakana AI réduisent considérablement les obstacles pour les particuliers et les entreprises souhaitant personnaliser des modèles d'IA privés. Elles ouvrent également une nouvelle voie vers le développement d'une intelligence artificielle générale (AGI) plus légère et plus intelligente.

Article : https://arxiv.org/pdf/2602.15902

Article connexe

China Telecom investit dans Mianbi Intelligence et porte son capital à 713 000 yuans pour développer des modèles de langage de grande envergure (LLM) et une infrastructure de données L'«équipe nationale» et la figure de proue de l'université Tsinghua dans le domaine des grands modèles renforcent leur alliance stratégique. Le 1er mars 2026, selon les dernières données d'enregistrem

Le groupe Taotian accélère sa restructuration axée sur l'IA et offre des quotas de jetons gratuits à ses stagiaires Le groupe TaoTian a récemment lancé le « Plan de productivité IA », conçu pour accélérer l'intégration de la technologie IA dans les opérations de commerce électronique et les processus de R&D grâce à

Glean vise les infrastructures d'IA d'entreprise dans une course à l'acquisition de parts de marché La course à la domination du marché de l'IA d'entreprise s'accélère. Microsoft intègre Copilot à Office, Google intègre Gemini à Workspace, tandis qu'OpenAI et Anthropic commercialisent leurs produits

Recommandations de sujets spéciaux liés

en écrivant

Les meilleurs assistants IA pour les genres xianxia et wuxia : rédigez des récits épiques de progression spirituelle et des chorégraphies d'arts martiaux

Découvrez les meilleurs assistants IA de 2026 pour créer des récits épiques de xianxia et de wuxia. La sélection de XIX.AI regroupe les outils les mieux notés et les plus innovants pour maîtriser la progression dans la voie de la cultivation et la chorégraphie des arts martiaux. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez votre potentiel créatif et commencez à écrire dès aujourd'hui !

10 outils

xix.ai

code

Outils de codage pour applications mobiles AI : générer du code Flutter et React Native multiplateforme à partir de commandes.

Découvrez les 20 meilleurs outils de codage pour applications mobiles basées sur l'IA en 2026, conçus pour Flutter et React Native. Notre liste, soigneusement sélectionnée et hautement réputée, met en avant des solutions puissantes qui permettent de générer du code multiplateforme à partir de simples instructions. Comparez les options gratuites et payantes grâce à des tests pratiques. Accélérez votre développement et créez de meilleures applications. Consultez le classement sur XIX.AI dès maintenant !

10 outils

xix.ai

code

Les meilleurs générateurs d'extensions Chrome basés sur l'IA : créez des extensions de navigateur personnalisées sans aucune connaissance en programmation

Découvrez les meilleurs générateurs d'extensions Chrome basés sur l'IA de 2026 sur XIX.AI. Notre sélection comprend les outils les mieux notés et incontournables qui vous permettent de créer des extensions de navigateur personnalisées sans aucune connaissance en programmation. Comparez les options gratuites et payantes, consultez des tests en conditions réelles et boostez votre productivité. Explorez les derniers classements et trouvez l'outil idéal dès aujourd'hui !

10 outils

xix.ai

Synthèse vocale

Meilleur système de synthèse vocale multilingue par intelligence artificielle : génération de discours authentiques avec accent natif dans plus de 50 langues

Découvrez les meilleurs outils de synthèse vocale multilingues basés sur l'IA en 2026, qui permettent d'obtenir des prononciations authentiques avec l'accent natif dans plus de 50 langues. Explorez nos classements sélectionnés, accompagnés de comparaisons entre les versions gratuites et payantes ainsi que de tests réalisés dans le monde réel. Trouvez l'outil vocal idéal sur XIX.AI et déclenchez dès aujourd'hui une communication mondiale sans limites.

10 outils

xix.ai

Assistante de réunion

Meilleurs outils d'automatisation des réunions par intelligence artificielle pour une collaboration plus intelligente et plus rapide

Découvrez les derniers outils d’automatisation de réunions basés sur l’intelligence artificielle, hautement recommandés en 2026, pour une collaboration plus intelligente et plus rapide. Notre sélection met en avant des solutions puissantes et révolutionnaires permettant d’automatiser la prise de notes, la rédaction de résumés et l’organisation des tâches à accomplir. Comparez les options gratuites et payantes grâce à des tests pratiques et aux classements mises à jour chaque semaine. Optimisez ainsi la productivité de votre équipe. Découvrez nos meilleurs choix dès maintenant sur XIX.AI.

10 outils

xix.ai

Rapide

Suggestions d'IA pour l'infrastructure en tant que code : déployez en toute sécurité les configurations Terraform et Docker

Découvrez les meilleures suggestions d'IA de 2026 pour l'Infrastructure-as-Code. La sélection soigneusement préparée par XIX.AI vous aide à déployer en toute sécurité des configurations Terraform et Docker, à automatiser les configurations cloud et à booster la productivité DevOps. Comparez les options gratuites et payantes grâce à des tests concrets. Explorez dès maintenant et exploitez tout le potentiel de l'IA.

10 outils

xix.ai