Ant Group überzeugt auf Computer-Vision-Konferenz mit Durchbruch bei der AIGC-Erkennung

Heim

Nachricht

17. Mai 2026

WalterTaylor

Ant Group überzeugt auf Computer-Vision-Konferenz mit Durchbruch bei der AIGC-Erkennung

Die Ant Group hat kürzlich bei der CVPR 2026 NTIRE Image Detection Challenge in zwei Kategorien den ersten Platz belegt: „Robustness Sample Testing in Complex Real-World Scenarios“ und „Face Enhancement Anomaly Detection“. Diese Leistung leistet einen entscheidenden Beitrag zur Verbesserung der Risikoerkennung in Bereichen wie Zahlungsverkehr, Überprüfung der Inhaltssicherheit und Authentifizierung finanzieller Identitäten im Zeitalter der KI.

Die mit Deepfakes und dem Missbrauch von AIGC verbundenen Risiken nehmen zu. Diese synthetischen Inhalte sind mit bloßem Auge oft nicht zu unterscheiden, und bestehende Erkennungsmodelle weisen erhebliche Genauigkeitseinbußen auf, wenn sie mit realen Bedingungen und der rasanten Entwicklung multimodaler Großmodelle konfrontiert werden. Die CVPR-Challenge geht dieses Problem direkt an, indem sie von den Modellen verlangt, unter extremen Testbedingungen mit „unbekannten Generierungsarchitekturen“ und „komplexen Degradationsstörungen“ eine hohe Genauigkeit und Robustheit aufrechtzuerhalten.

Mit seinen Wurzeln im Zahlungsverkehr hat die Ant Group über zwei Jahrzehnte hinweg führende Sicherheitstechnologien entwickelt. Dieses Fachwissen wird nun auf den Bereich der KI-Sicherheit ausgeweitet. Das Team schlug ein Erkennungs-Framework vor, das auf dem visuellen Grundmodell DINOv3 basiert und einen bedeutenden Sprung in der AIGC-Erkennungsfähigkeit vom Laborumfeld hin zu realen Anwendungen ermöglicht.

Für den Track „Robustness Sample Testing“ erstellte das Team des Ant AI Security Lab einen komplexen Trainingskorpus mit Millionen hochwertiger Samples. Dieser Korpus umfasste Datensätze wie WildFake, Z-Image, Seedream und Nano-banana-pro sowie modernste Modelle. Die zugrunde liegende Architektur nutzt eine parallele Dual-Stream-Integrationsstruktur, die dem Erkennungsmodell sozusagen zwei komplementäre „Augen“ verleiht, um sowohl lokale Details als auch globale Bildmerkmale zu erfassen. Das Team simulierte eine vollständige Kette von Bildverschlechterungseffekten, von einzelnen Rauschpunkten bis hin zu vielfältigen Verzerrungen, und ahmte dabei realistische Bildveränderungen nach, wie sie bei der Verbreitung in sozialen Medien und bei der Sekundärfotografie auftreten. Dieser Ansatz verbesserte die Erkennungsleistung des Modells in praktischen Szenarien erheblich.

Darüber hinaus führte das Team ein zweistufiges „Locate-Then-Examine“-Erkennungsparadigma ein. Diese Methode identifiziert zunächst verdächtige Bereiche, bevor eine detaillierte Überprüfung durchgeführt wird. Außerdem erstellten sie den Datensatz „FakeXplained“, der lokalisierte textuelle Erklärungen bereitstellt. Bei der Analyse eines verdächtigen Bildes ermittelt diese Technik nicht nur, ob es KI-generiert ist, sondern lokalisiert auch Bereiche, die Fälschungsfehler oder physikalische Unstimmigkeiten enthalten, und generiert gleichzeitig eine detaillierte Begründung. Dieser Durchbruch geht über die traditionelle „Black-Box“-Erkennung hinaus und macht Modellentscheidungen nachvollziehbar und interpretierbar. Um die Zusammenarbeit bei der Bewältigung von Deepfake-Herausforderungen zu fördern, hat das Team eines der umfassendsten AIGC-Bild- und Videoerkennungs-Repositorien der Branche auf GitHub als Open Source veröffentlicht.

Im Wettbewerb „Face Enhancement Anomaly Detection“ gewann das Team von Ant International durch die präzise Lokalisierung anomaler Bereiche in Gesichtsbildern. Diese Technologie wird vor allem in Szenarien wie der Identitätsprüfung bei Finanztransaktionen und der Dokumentenprüfung bei Kontoeröffnungen eingesetzt und bietet entscheidende technische Schutzmaßnahmen gegen Deepfake- und AIGC-basierte Angriffe. Im Bereich grenzüberschreitender Zahlungen und Finanzdienstleistungen hat Ant International die AIGC-Identifizierungstechnologie tief in Prozesse wie EKYC und die Fälschungssicherung von Dokumenten integriert und gewährleistet so robuste Erkennungsfähigkeiten für verschiedene Arten generierter Inhalte.

Die CVPR (Conference on Computer Vision and Pattern Recognition) ist eine von der IEEE gesponserte internationale Konferenz. Neben der ICCV und der ECCV gilt sie als eine der drei führenden Konferenzen im Bereich Computer Vision. Der diesjährige Wettbewerb zog über 500 Teams aus aller Welt an.

Verwandter Artikel

Der KI-Browser Comet startet mit vollständiger Multitasking-Unterstützung auf dem iPad Der KI-Browser „Comet“ von Perplexity hat offiziell seine iPad-Version veröffentlicht, die nun vollständig mit iPadOS kompatibel ist. Das Update bietet nun das Surfen in mehreren Fenstern, Multitaskin

Trace sammelt 3 Millionen Dollar, um die Hürden bei der Einführung von künstlichen Intelligenz-Agenten in Unternehmen zu überwinden. Trotz ihres Potenzials haben künstliche Intelligenz-Agenten Schwierigkeiten, in Unternehmen Fuß zu fassen. Ein aufstrebendes Start-up ist der Ansicht, dass das Kernproblem ein Mangel an Kontext ist.Trace, ein als Teil der Sommerausbildung von Y Comb

Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze

Empfehlungen zu verwandten Spezialthemen

Code

Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys

Entdecken Sie die besten KI-Code-Reviewer des Jahres 2026 auf XIX.AI. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools zur Automatisierung der Einhaltung von Clean-Code-Standards und zur Refaktorisierung von Dateien in älteren Repositorys. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren KI-Vorsprung.

10 Tools

xix.ai

Text-zu-Sprache

Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern

Entdecken Sie die besten KI-TTS-Apps des Jahres 2026, die speziell zur Unterstützung bei Legasthenie ausgewählt wurden. In unseren Experten-Rankings vergleichen wir kostenlose und kostenpflichtige Tools und stellen leistungsstarke Funktionen für mehr Leseeffizienz und besseren Lernerfolg vor. Entdecken Sie bahnbrechende Lösungen, die Sie unbedingt ausprobieren sollten, um das Potenzial Ihrer Schüler voll auszuschöpfen. Beginnen Sie Ihre Reise bei XIX.AI.

10 Tools

xix.ai

Comic-Erstellung

Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools

xix.ai

Geschäft

Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools

xix.ai

Geschäft

Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools

xix.ai

Produktivität

KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools

xix.ai