Maison
Ant Digital dévoile Bai Ling Enterprise Financial LLM : la rapidité et l'efficacité redéfinies
L'essor des agents d'exécution autonomes, tels que l'Agent d'OpenAI, marque une accélération significative pour les applications d'IA, qui passent d'une simple « interaction dialoguée » à une « exécution de tâches » complexe. Si les entreprises adoptent rapidement cette tendance, elles sont également confrontées à des défis tels que le gaspillage de ressources informatiques et la conformité en matière de sécurité. La mise en œuvre durable et à grande échelle d'agents intelligents est désormais au cœur des préoccupations du secteur.
Le 26 mars, lors du Forum sur l'innovation industrielle du futur organisé dans le cadre du Forum de Zhongguancun, Zhang Peng, directeur général du département d'innovation technologique des grands modèles chez Ant Digital, a déclaré dans son discours que l'émergence de tels agents allait révolutionner le paradigme de l'IA en entreprise. Cette évolution fera passer le déploiement industriel des grands modèles d'une « compétition sur l'échelle des paramètres » à une « compétition sur l'efficacité des tokens ».

Zhang Peng, directeur général du département Innovation technologique des grands modèles chez Ant Digital, s'exprimant lors du Forum de Zhongguancun.
L'adoption rapide des agents intelligents reflète une forte demande du marché pour l'exécution autonome des tâches. Cependant, leur déploiement dans des environnements industriels réels présente des obstacles majeurs. Manquant souvent d’une compréhension approfondie des règles et des flux de travail du secteur, ces agents peuvent effectuer des appels d’outils répétés et inefficaces lorsqu’ils traitent des tâches complexes. Cela entraîne une consommation de tokens qui dépasse de loin la valeur réelle créée. Des rapports indiquent que dans certains scénarios à haute fréquence, le coût d’exécution des agents peut être des dizaines, voire des centaines de fois plus élevé que celui des solutions intégrées, ce qui soulève des inquiétudes quant à la viabilité d’une utilisation industrielle à grande échelle.
« Le principal défi de la prochaine phase d’industrialisation des grands modèles ne réside pas dans la concurrence sur le nombre de paramètres, mais dans l’amélioration continue de l’efficacité par token », a noté Zhang Peng. Il estime que les entreprises devraient choisir des solutions d’IA qui combinent stratégiquement des modèles de grande et de petite taille en fonction de scénarios et de besoins spécifiques, afin d’obtenir une plus grande valeur commerciale avec un coût de calcul moindre.
Prenons l'exemple du secteur financier. Ce domaine traite quotidiennement des volumes massifs de tâches à haute fréquence et à faible latence : identification rapide de l'intention de l'utilisateur, extraction de données clés, récupération et tri d'informations. Ces tâches exigent une forte concurrence, des temps de réponse rapides et une précision extrême. Si les modèles d’inférence traditionnels et puissants sont performants, leur utilisation dans de tels scénarios est souvent excessive — comme « utiliser un marteau pour casser une noix » —, ce qui entraîne des coûts élevés, des vitesses réduites et un gaspillage de ressources.
« Ce dont le secteur a véritablement besoin, c’est d’une solution d’IA qui garantisse professionnalisme, rigueur et conformité tout en offrant un rapport coût-efficacité et une vitesse de réponse optimaux », a expliqué Zhang Peng. Il a souligné que les modèles à paramètres volumineux excellent dans le raisonnement complexe et l’analyse approfondie, tandis que les modèles plus petits offrent une latence plus faible et une meilleure rentabilité pour les tâches simples et à haute fréquence. Une approche hybride tirant parti des deux est essentielle pour résoudre les problèmes du monde réel de manière plus efficace et plus économique.
Lors du Forum de Zhongguancun, Ant Digital a lancé un modèle léger spécifique au secteur financier, baptisé Ling-DT-Fin-Mini-2.5, le premier de sa série Ling DT. Ce modèle est une architecture légère de type « Mixture-of-Experts » (MoE) basée sur le tout dernier cadre hybride d'attention linéaire Ling 2.5, optimisé pour les tâches financières à forte concurrence et à faible latence. Il conserve ses capacités professionnelles tout en réduisant les coûts d'inférence à un niveau adapté au déploiement à grande échelle. Comparé aux modèles polyvalents courants de capacité similaire, il offre une vitesse d'inférence 100 % plus rapide et des coûts matériels nettement inférieurs pour le traitement de volumes de tâches équivalents, ce qui se traduit par des économies tangibles et des gains d'efficacité pour les institutions financières.
En effet, à mesure que les agents IA s’intègrent plus profondément dans les processus industriels fondamentaux pour effectuer un travail concret, la stratégie consistant à combiner des modèles de grande et de petite taille devient une norme du secteur. Récemment, OpenAI a lui-même publié deux modèles plus petits, GPT-4o mini et nano, axés sur une faible latence et une rentabilité élevée pour servir d’agents principaux au niveau de l’exécution.
Zhang Peng a conclu que les progrès technologiques doivent en fin de compte s'aligner sur les exigences rationnelles de l'efficacité industrielle. Dans la prochaine phase de la concurrence, l'efficacité des jetons deviendra le critère central pour évaluer la valeur de l'IA d'entreprise. Ant Digital restera concentré sur l'AGI de niveau entreprise, prévoyant de lancer une édition entreprise du grand modèle Ling DT ainsi que des versions spécifiques à chaque secteur, accélérant ainsi le déploiement à grande échelle d'agents intelligents dans des environnements commerciaux complexes.
Article connexe
OpenAI s’allie avec le Département de la Défense des États-Unis ; les installations de ChatGPT augmentent de 295 %.
Indignation du public : La collaboration militaire d’OpenAI déclenche une vague de désinstallationsRécemment, le leader de l’intelligence artificielle OpenAI a annoncé un partenariat étroit avec le Département de la Défense des États-Unis, intégrant
OpenAI lance la fonctionnalité « Sites », marquant la fin de l'ère du « no-code » avec des sites web créés à partir de texte
OpenAI a lancé « Sites », une nouvelle fonctionnalité pour Codex, son outil d'IA dédié à l'ingénierie logicielle. Actuellement en phase de préversion, elle n'est accessible qu'aux abonnés payants des
OpenAI rachète Hiro, une start-up spécialisée dans la gestion financière personnelle basée sur l'IA
OpenAI a racheté la start-up spécialisée dans la gestion des finances personnelles Hiro Finance, a annoncé lundi son fondateur Ethan Bloch, OpenAI ayant confirmé cette transaction à TechCrunch. La sta
Recommandations de sujets spéciaux liés
commentaires (0)
L'essor des agents d'exécution autonomes, tels que l'Agent d'OpenAI, marque une accélération significative pour les applications d'IA, qui passent d'une simple « interaction dialoguée » à une « exécution de tâches » complexe. Si les entreprises adoptent rapidement cette tendance, elles sont également confrontées à des défis tels que le gaspillage de ressources informatiques et la conformité en matière de sécurité. La mise en œuvre durable et à grande échelle d'agents intelligents est désormais au cœur des préoccupations du secteur.
Le 26 mars, lors du Forum sur l'innovation industrielle du futur organisé dans le cadre du Forum de Zhongguancun, Zhang Peng, directeur général du département d'innovation technologique des grands modèles chez Ant Digital, a déclaré dans son discours que l'émergence de tels agents allait révolutionner le paradigme de l'IA en entreprise. Cette évolution fera passer le déploiement industriel des grands modèles d'une « compétition sur l'échelle des paramètres » à une « compétition sur l'efficacité des tokens ».

Zhang Peng, directeur général du département Innovation technologique des grands modèles chez Ant Digital, s'exprimant lors du Forum de Zhongguancun.
L'adoption rapide des agents intelligents reflète une forte demande du marché pour l'exécution autonome des tâches. Cependant, leur déploiement dans des environnements industriels réels présente des obstacles majeurs. Manquant souvent d’une compréhension approfondie des règles et des flux de travail du secteur, ces agents peuvent effectuer des appels d’outils répétés et inefficaces lorsqu’ils traitent des tâches complexes. Cela entraîne une consommation de tokens qui dépasse de loin la valeur réelle créée. Des rapports indiquent que dans certains scénarios à haute fréquence, le coût d’exécution des agents peut être des dizaines, voire des centaines de fois plus élevé que celui des solutions intégrées, ce qui soulève des inquiétudes quant à la viabilité d’une utilisation industrielle à grande échelle.
« Le principal défi de la prochaine phase d’industrialisation des grands modèles ne réside pas dans la concurrence sur le nombre de paramètres, mais dans l’amélioration continue de l’efficacité par token », a noté Zhang Peng. Il estime que les entreprises devraient choisir des solutions d’IA qui combinent stratégiquement des modèles de grande et de petite taille en fonction de scénarios et de besoins spécifiques, afin d’obtenir une plus grande valeur commerciale avec un coût de calcul moindre.
Prenons l'exemple du secteur financier. Ce domaine traite quotidiennement des volumes massifs de tâches à haute fréquence et à faible latence : identification rapide de l'intention de l'utilisateur, extraction de données clés, récupération et tri d'informations. Ces tâches exigent une forte concurrence, des temps de réponse rapides et une précision extrême. Si les modèles d’inférence traditionnels et puissants sont performants, leur utilisation dans de tels scénarios est souvent excessive — comme « utiliser un marteau pour casser une noix » —, ce qui entraîne des coûts élevés, des vitesses réduites et un gaspillage de ressources.
« Ce dont le secteur a véritablement besoin, c’est d’une solution d’IA qui garantisse professionnalisme, rigueur et conformité tout en offrant un rapport coût-efficacité et une vitesse de réponse optimaux », a expliqué Zhang Peng. Il a souligné que les modèles à paramètres volumineux excellent dans le raisonnement complexe et l’analyse approfondie, tandis que les modèles plus petits offrent une latence plus faible et une meilleure rentabilité pour les tâches simples et à haute fréquence. Une approche hybride tirant parti des deux est essentielle pour résoudre les problèmes du monde réel de manière plus efficace et plus économique.
Lors du Forum de Zhongguancun, Ant Digital a lancé un modèle léger spécifique au secteur financier, baptisé Ling-DT-Fin-Mini-2.5, le premier de sa série Ling DT. Ce modèle est une architecture légère de type « Mixture-of-Experts » (MoE) basée sur le tout dernier cadre hybride d'attention linéaire Ling 2.5, optimisé pour les tâches financières à forte concurrence et à faible latence. Il conserve ses capacités professionnelles tout en réduisant les coûts d'inférence à un niveau adapté au déploiement à grande échelle. Comparé aux modèles polyvalents courants de capacité similaire, il offre une vitesse d'inférence 100 % plus rapide et des coûts matériels nettement inférieurs pour le traitement de volumes de tâches équivalents, ce qui se traduit par des économies tangibles et des gains d'efficacité pour les institutions financières.
En effet, à mesure que les agents IA s’intègrent plus profondément dans les processus industriels fondamentaux pour effectuer un travail concret, la stratégie consistant à combiner des modèles de grande et de petite taille devient une norme du secteur. Récemment, OpenAI a lui-même publié deux modèles plus petits, GPT-4o mini et nano, axés sur une faible latence et une rentabilité élevée pour servir d’agents principaux au niveau de l’exécution.
Zhang Peng a conclu que les progrès technologiques doivent en fin de compte s'aligner sur les exigences rationnelles de l'efficacité industrielle. Dans la prochaine phase de la concurrence, l'efficacité des jetons deviendra le critère central pour évaluer la valeur de l'IA d'entreprise. Ant Digital restera concentré sur l'AGI de niveau entreprise, prévoyant de lancer une édition entreprise du grand modèle Ling DT ainsi que des versions spécifiques à chaque secteur, accélérant ainsi le déploiement à grande échelle d'agents intelligents dans des environnements commerciaux complexes.
OpenAI s’allie avec le Département de la Défense des États-Unis ; les installations de ChatGPT augmentent de 295 %.
Indignation du public : La collaboration militaire d’OpenAI déclenche une vague de désinstallationsRécemment, le leader de l’intelligence artificielle OpenAI a annoncé un partenariat étroit avec le Département de la Défense des États-Unis, intégrant
OpenAI lance la fonctionnalité « Sites », marquant la fin de l'ère du « no-code » avec des sites web créés à partir de texte
OpenAI a lancé « Sites », une nouvelle fonctionnalité pour Codex, son outil d'IA dédié à l'ingénierie logicielle. Actuellement en phase de préversion, elle n'est accessible qu'aux abonnés payants des
OpenAI rachète Hiro, une start-up spécialisée dans la gestion financière personnelle basée sur l'IA
OpenAI a racheté la start-up spécialisée dans la gestion des finances personnelles Hiro Finance, a annoncé lundi son fondateur Ethan Bloch, OpenAI ayant confirmé cette transaction à TechCrunch. La sta











