Heim
Ant Group überzeugt auf Computer-Vision-Konferenz mit Durchbruch bei der AIGC-Erkennung

Die Ant Group hat kürzlich bei der CVPR 2026 NTIRE Image Detection Challenge in zwei Kategorien den ersten Platz belegt: „Robustness Sample Testing in Complex Real-World Scenarios“ und „Face Enhancement Anomaly Detection“. Diese Leistung leistet einen entscheidenden Beitrag zur Verbesserung der Risikoerkennung in Bereichen wie Zahlungsverkehr, Überprüfung der Inhaltssicherheit und Authentifizierung finanzieller Identitäten im Zeitalter der KI.
Die mit Deepfakes und dem Missbrauch von AIGC verbundenen Risiken nehmen zu. Diese synthetischen Inhalte sind mit bloßem Auge oft nicht zu unterscheiden, und bestehende Erkennungsmodelle weisen erhebliche Genauigkeitseinbußen auf, wenn sie mit realen Bedingungen und der rasanten Entwicklung multimodaler Großmodelle konfrontiert werden. Die CVPR-Challenge geht dieses Problem direkt an, indem sie von den Modellen verlangt, unter extremen Testbedingungen mit „unbekannten Generierungsarchitekturen“ und „komplexen Degradationsstörungen“ eine hohe Genauigkeit und Robustheit aufrechtzuerhalten.
Mit seinen Wurzeln im Zahlungsverkehr hat die Ant Group über zwei Jahrzehnte hinweg führende Sicherheitstechnologien entwickelt. Dieses Fachwissen wird nun auf den Bereich der KI-Sicherheit ausgeweitet. Das Team schlug ein Erkennungs-Framework vor, das auf dem visuellen Grundmodell DINOv3 basiert und einen bedeutenden Sprung in der AIGC-Erkennungsfähigkeit vom Laborumfeld hin zu realen Anwendungen ermöglicht.
Für den Track „Robustness Sample Testing“ erstellte das Team des Ant AI Security Lab einen komplexen Trainingskorpus mit Millionen hochwertiger Samples. Dieser Korpus umfasste Datensätze wie WildFake, Z-Image, Seedream und Nano-banana-pro sowie modernste Modelle. Die zugrunde liegende Architektur nutzt eine parallele Dual-Stream-Integrationsstruktur, die dem Erkennungsmodell sozusagen zwei komplementäre „Augen“ verleiht, um sowohl lokale Details als auch globale Bildmerkmale zu erfassen. Das Team simulierte eine vollständige Kette von Bildverschlechterungseffekten, von einzelnen Rauschpunkten bis hin zu vielfältigen Verzerrungen, und ahmte dabei realistische Bildveränderungen nach, wie sie bei der Verbreitung in sozialen Medien und bei der Sekundärfotografie auftreten. Dieser Ansatz verbesserte die Erkennungsleistung des Modells in praktischen Szenarien erheblich.
Darüber hinaus führte das Team ein zweistufiges „Locate-Then-Examine“-Erkennungsparadigma ein. Diese Methode identifiziert zunächst verdächtige Bereiche, bevor eine detaillierte Überprüfung durchgeführt wird. Außerdem erstellten sie den Datensatz „FakeXplained“, der lokalisierte textuelle Erklärungen bereitstellt. Bei der Analyse eines verdächtigen Bildes ermittelt diese Technik nicht nur, ob es KI-generiert ist, sondern lokalisiert auch Bereiche, die Fälschungsfehler oder physikalische Unstimmigkeiten enthalten, und generiert gleichzeitig eine detaillierte Begründung. Dieser Durchbruch geht über die traditionelle „Black-Box“-Erkennung hinaus und macht Modellentscheidungen nachvollziehbar und interpretierbar. Um die Zusammenarbeit bei der Bewältigung von Deepfake-Herausforderungen zu fördern, hat das Team eines der umfassendsten AIGC-Bild- und Videoerkennungs-Repositorien der Branche auf GitHub als Open Source veröffentlicht.
Im Wettbewerb „Face Enhancement Anomaly Detection“ gewann das Team von Ant International durch die präzise Lokalisierung anomaler Bereiche in Gesichtsbildern. Diese Technologie wird vor allem in Szenarien wie der Identitätsprüfung bei Finanztransaktionen und der Dokumentenprüfung bei Kontoeröffnungen eingesetzt und bietet entscheidende technische Schutzmaßnahmen gegen Deepfake- und AIGC-basierte Angriffe. Im Bereich grenzüberschreitender Zahlungen und Finanzdienstleistungen hat Ant International die AIGC-Identifizierungstechnologie tief in Prozesse wie EKYC und die Fälschungssicherung von Dokumenten integriert und gewährleistet so robuste Erkennungsfähigkeiten für verschiedene Arten generierter Inhalte.
Die CVPR (Conference on Computer Vision and Pattern Recognition) ist eine von der IEEE gesponserte internationale Konferenz. Neben der ICCV und der ECCV gilt sie als eine der drei führenden Konferenzen im Bereich Computer Vision. Der diesjährige Wettbewerb zog über 500 Teams aus aller Welt an.
Verwandter Artikel
Der KI-Browser Comet startet mit vollständiger Multitasking-Unterstützung auf dem iPad
Der KI-Browser „Comet“ von Perplexity hat offiziell seine iPad-Version veröffentlicht, die nun vollständig mit iPadOS kompatibel ist. Das Update bietet nun das Surfen in mehreren Fenstern, Multitaskin
Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden.
Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Die Ant Group hat kürzlich bei der CVPR 2026 NTIRE Image Detection Challenge in zwei Kategorien den ersten Platz belegt: „Robustness Sample Testing in Complex Real-World Scenarios“ und „Face Enhancement Anomaly Detection“. Diese Leistung leistet einen entscheidenden Beitrag zur Verbesserung der Risikoerkennung in Bereichen wie Zahlungsverkehr, Überprüfung der Inhaltssicherheit und Authentifizierung finanzieller Identitäten im Zeitalter der KI.
Die mit Deepfakes und dem Missbrauch von AIGC verbundenen Risiken nehmen zu. Diese synthetischen Inhalte sind mit bloßem Auge oft nicht zu unterscheiden, und bestehende Erkennungsmodelle weisen erhebliche Genauigkeitseinbußen auf, wenn sie mit realen Bedingungen und der rasanten Entwicklung multimodaler Großmodelle konfrontiert werden. Die CVPR-Challenge geht dieses Problem direkt an, indem sie von den Modellen verlangt, unter extremen Testbedingungen mit „unbekannten Generierungsarchitekturen“ und „komplexen Degradationsstörungen“ eine hohe Genauigkeit und Robustheit aufrechtzuerhalten.
Mit seinen Wurzeln im Zahlungsverkehr hat die Ant Group über zwei Jahrzehnte hinweg führende Sicherheitstechnologien entwickelt. Dieses Fachwissen wird nun auf den Bereich der KI-Sicherheit ausgeweitet. Das Team schlug ein Erkennungs-Framework vor, das auf dem visuellen Grundmodell DINOv3 basiert und einen bedeutenden Sprung in der AIGC-Erkennungsfähigkeit vom Laborumfeld hin zu realen Anwendungen ermöglicht.
Für den Track „Robustness Sample Testing“ erstellte das Team des Ant AI Security Lab einen komplexen Trainingskorpus mit Millionen hochwertiger Samples. Dieser Korpus umfasste Datensätze wie WildFake, Z-Image, Seedream und Nano-banana-pro sowie modernste Modelle. Die zugrunde liegende Architektur nutzt eine parallele Dual-Stream-Integrationsstruktur, die dem Erkennungsmodell sozusagen zwei komplementäre „Augen“ verleiht, um sowohl lokale Details als auch globale Bildmerkmale zu erfassen. Das Team simulierte eine vollständige Kette von Bildverschlechterungseffekten, von einzelnen Rauschpunkten bis hin zu vielfältigen Verzerrungen, und ahmte dabei realistische Bildveränderungen nach, wie sie bei der Verbreitung in sozialen Medien und bei der Sekundärfotografie auftreten. Dieser Ansatz verbesserte die Erkennungsleistung des Modells in praktischen Szenarien erheblich.
Darüber hinaus führte das Team ein zweistufiges „Locate-Then-Examine“-Erkennungsparadigma ein. Diese Methode identifiziert zunächst verdächtige Bereiche, bevor eine detaillierte Überprüfung durchgeführt wird. Außerdem erstellten sie den Datensatz „FakeXplained“, der lokalisierte textuelle Erklärungen bereitstellt. Bei der Analyse eines verdächtigen Bildes ermittelt diese Technik nicht nur, ob es KI-generiert ist, sondern lokalisiert auch Bereiche, die Fälschungsfehler oder physikalische Unstimmigkeiten enthalten, und generiert gleichzeitig eine detaillierte Begründung. Dieser Durchbruch geht über die traditionelle „Black-Box“-Erkennung hinaus und macht Modellentscheidungen nachvollziehbar und interpretierbar. Um die Zusammenarbeit bei der Bewältigung von Deepfake-Herausforderungen zu fördern, hat das Team eines der umfassendsten AIGC-Bild- und Videoerkennungs-Repositorien der Branche auf GitHub als Open Source veröffentlicht.
Im Wettbewerb „Face Enhancement Anomaly Detection“ gewann das Team von Ant International durch die präzise Lokalisierung anomaler Bereiche in Gesichtsbildern. Diese Technologie wird vor allem in Szenarien wie der Identitätsprüfung bei Finanztransaktionen und der Dokumentenprüfung bei Kontoeröffnungen eingesetzt und bietet entscheidende technische Schutzmaßnahmen gegen Deepfake- und AIGC-basierte Angriffe. Im Bereich grenzüberschreitender Zahlungen und Finanzdienstleistungen hat Ant International die AIGC-Identifizierungstechnologie tief in Prozesse wie EKYC und die Fälschungssicherung von Dokumenten integriert und gewährleistet so robuste Erkennungsfähigkeiten für verschiedene Arten generierter Inhalte.
Die CVPR (Conference on Computer Vision and Pattern Recognition) ist eine von der IEEE gesponserte internationale Konferenz. Neben der ICCV und der ECCV gilt sie als eine der drei führenden Konferenzen im Bereich Computer Vision. Der diesjährige Wettbewerb zog über 500 Teams aus aller Welt an.
Der KI-Browser Comet startet mit vollständiger Multitasking-Unterstützung auf dem iPad
Der KI-Browser „Comet“ von Perplexity hat offiziell seine iPad-Version veröffentlicht, die nun vollständig mit iPadOS kompatibel ist. Das Update bietet nun das Surfen in mehreren Fenstern, Multitaskin
Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden.
Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze











