Maison
Ant Group fait sensation lors d'une conférence sur la vision par ordinateur grâce à une avancée majeure dans la détection de l'AIGC

Ant Group a récemment remporté les premières places dans deux catégories du concours NTIRE Image Detection Challenge organisé dans le cadre de la conférence CVPR 2026 : « Test de robustesse sur des échantillons dans des scénarios complexes du monde réel » et « Détection d’anomalies dans l’amélioration des visages ». Cette réussite apporte un soutien essentiel à l’amélioration de l’identification des risques dans des domaines tels que les paiements, la vérification de la sécurité des contenus et l’authentification d’identité financière à l’ère de l’IA.
Les risques liés aux deepfakes et à l'utilisation abusive de l'AIGC ne cessent de croître. Ces contenus synthétiques sont souvent impossibles à distinguer à l'œil nu, et les modèles de détection existants souffrent d'une baisse significative de leur précision lorsqu'ils sont confrontés aux conditions du monde réel et à l'évolution rapide des grands modèles multimodaux. Le défi CVPR s'attaque directement à ce problème en exigeant des modèles qu'ils maintiennent une précision et une robustesse élevées lors de tests extrêmes impliquant des « architectures de génération inconnues » et des « interférences de dégradation complexes ».
Issu du secteur des systèmes de paiement, Ant Group a développé des technologies de sécurité de pointe au cours des deux dernières décennies. Cette expertise s’étend désormais à la sécurité de l’IA. L’équipe a proposé un cadre de détection basé sur le modèle de base visuel DINOv3, permettant un bond en avant significatif dans la capacité de détection de l’AIGC, du laboratoire aux applications du monde réel.
Pour la catégorie « Robustness Sample Testing », l’équipe de l’Ant AI Security Lab a construit un corpus d’entraînement complexe contenant des millions d’échantillons de haute qualité. Ce corpus intégrait des ensembles de données tels que WildFake, Z-Image, Seedream et Nano-banana-pro, ainsi que des modèles de pointe. L'architecture sous-jacente utilise une structure d'intégration parallèle à double flux, comme si l'on dotait le modèle de détection de deux « yeux » complémentaires pour capturer à la fois les détails locaux et les caractéristiques globales de l'image. L'équipe a simulé une chaîne complète d'effets de dégradation d'image, allant de simples points de bruit à de multiples distorsions, reproduisant fidèlement les altérations d'images observées dans la diffusion sur les réseaux sociaux et la photographie secondaire. Cette approche a considérablement amélioré les performances de détection du modèle dans des scénarios pratiques.
De plus, l'équipe a introduit un paradigme de détection en deux étapes « Localiser puis examiner ». Cette méthode identifie d'abord les zones suspectes avant de procéder à un examen détaillé. Elle a également constitué l'ensemble de données FakeXplained, qui fournit des explications textuelles localisées. Lors de l'analyse d'une image suspecte, cette technique permet non seulement de déterminer si elle est générée par l'IA, mais aussi de repérer les zones contenant des défauts de falsification ou des incohérences physiques, tout en générant simultanément une justification détaillée. Cette avancée va au-delà de la détection traditionnelle de type « boîte noire », rendant les décisions du modèle traçables et interprétables. Afin de favoriser la collaboration pour relever les défis liés aux deepfakes, l'équipe a mis en open source sur GitHub l'un des référentiels de ressources de détection d'images et de vidéos AIGC les plus complets du domaine.
Lors du concours « Face Enhancement Anomaly Detection », l’équipe d’Ant International a remporté la victoire en localisant avec précision les zones anormales au sein des images faciales. Cette technologie est principalement appliquée dans des scénarios tels que la vérification d’identité lors de transactions financières et l’examen de documents pour l’ouverture de comptes, offrant des garanties techniques cruciales contre les attaques basées sur le Deepfake et l’AIGC. Dans le domaine des paiements transfrontaliers et des services financiers, Ant International a profondément intégré la technologie d'identification AIGC dans des processus tels que l'EKYC et la lutte contre la contrefaçon de documents, garantissant ainsi de solides capacités de détection pour divers types de contenus générés.
La CVPR (Conference on Computer Vision and Pattern Recognition) est une conférence internationale parrainée par l'IEEE. Avec l'ICCV et l'ECCV, elle est considérée comme l'une des trois conférences phares dans le domaine de la vision par ordinateur. Le défi de cette année a attiré plus de 500 équipes du monde entier.
Article connexe
L'Administration chinoise du cyberespace impose l'étiquetage des courtes vidéos générées par l'IA et des vidéos de fiction
L'Administration chinoise du cyberespace a mis en place un plan global visant à normaliser l'étiquetage des contenus vidéo courts, en imposant aux plateformes l'utilisation de six balises obligatoires
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
Recommandations de sujets spéciaux liés
commentaires (0)

Ant Group a récemment remporté les premières places dans deux catégories du concours NTIRE Image Detection Challenge organisé dans le cadre de la conférence CVPR 2026 : « Test de robustesse sur des échantillons dans des scénarios complexes du monde réel » et « Détection d’anomalies dans l’amélioration des visages ». Cette réussite apporte un soutien essentiel à l’amélioration de l’identification des risques dans des domaines tels que les paiements, la vérification de la sécurité des contenus et l’authentification d’identité financière à l’ère de l’IA.
Les risques liés aux deepfakes et à l'utilisation abusive de l'AIGC ne cessent de croître. Ces contenus synthétiques sont souvent impossibles à distinguer à l'œil nu, et les modèles de détection existants souffrent d'une baisse significative de leur précision lorsqu'ils sont confrontés aux conditions du monde réel et à l'évolution rapide des grands modèles multimodaux. Le défi CVPR s'attaque directement à ce problème en exigeant des modèles qu'ils maintiennent une précision et une robustesse élevées lors de tests extrêmes impliquant des « architectures de génération inconnues » et des « interférences de dégradation complexes ».
Issu du secteur des systèmes de paiement, Ant Group a développé des technologies de sécurité de pointe au cours des deux dernières décennies. Cette expertise s’étend désormais à la sécurité de l’IA. L’équipe a proposé un cadre de détection basé sur le modèle de base visuel DINOv3, permettant un bond en avant significatif dans la capacité de détection de l’AIGC, du laboratoire aux applications du monde réel.
Pour la catégorie « Robustness Sample Testing », l’équipe de l’Ant AI Security Lab a construit un corpus d’entraînement complexe contenant des millions d’échantillons de haute qualité. Ce corpus intégrait des ensembles de données tels que WildFake, Z-Image, Seedream et Nano-banana-pro, ainsi que des modèles de pointe. L'architecture sous-jacente utilise une structure d'intégration parallèle à double flux, comme si l'on dotait le modèle de détection de deux « yeux » complémentaires pour capturer à la fois les détails locaux et les caractéristiques globales de l'image. L'équipe a simulé une chaîne complète d'effets de dégradation d'image, allant de simples points de bruit à de multiples distorsions, reproduisant fidèlement les altérations d'images observées dans la diffusion sur les réseaux sociaux et la photographie secondaire. Cette approche a considérablement amélioré les performances de détection du modèle dans des scénarios pratiques.
De plus, l'équipe a introduit un paradigme de détection en deux étapes « Localiser puis examiner ». Cette méthode identifie d'abord les zones suspectes avant de procéder à un examen détaillé. Elle a également constitué l'ensemble de données FakeXplained, qui fournit des explications textuelles localisées. Lors de l'analyse d'une image suspecte, cette technique permet non seulement de déterminer si elle est générée par l'IA, mais aussi de repérer les zones contenant des défauts de falsification ou des incohérences physiques, tout en générant simultanément une justification détaillée. Cette avancée va au-delà de la détection traditionnelle de type « boîte noire », rendant les décisions du modèle traçables et interprétables. Afin de favoriser la collaboration pour relever les défis liés aux deepfakes, l'équipe a mis en open source sur GitHub l'un des référentiels de ressources de détection d'images et de vidéos AIGC les plus complets du domaine.
Lors du concours « Face Enhancement Anomaly Detection », l’équipe d’Ant International a remporté la victoire en localisant avec précision les zones anormales au sein des images faciales. Cette technologie est principalement appliquée dans des scénarios tels que la vérification d’identité lors de transactions financières et l’examen de documents pour l’ouverture de comptes, offrant des garanties techniques cruciales contre les attaques basées sur le Deepfake et l’AIGC. Dans le domaine des paiements transfrontaliers et des services financiers, Ant International a profondément intégré la technologie d'identification AIGC dans des processus tels que l'EKYC et la lutte contre la contrefaçon de documents, garantissant ainsi de solides capacités de détection pour divers types de contenus générés.
La CVPR (Conference on Computer Vision and Pattern Recognition) est une conférence internationale parrainée par l'IEEE. Avec l'ICCV et l'ECCV, elle est considérée comme l'une des trois conférences phares dans le domaine de la vision par ordinateur. Le défi de cette année a attiré plus de 500 équipes du monde entier.
L'Administration chinoise du cyberespace impose l'étiquetage des courtes vidéos générées par l'IA et des vidéos de fiction
L'Administration chinoise du cyberespace a mis en place un plan global visant à normaliser l'étiquetage des contenus vidéo courts, en imposant aux plateformes l'utilisation de six balises obligatoires
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve











