螞蟻集團憑藉 AIGC 偵測技術的突破,在電腦視覺會議上大放異彩

螞蟻集團近期在 CVPR 2026 NTIRE 影像偵測挑戰賽的兩個賽道中榮獲最高榮譽,分別是「複雜真實世界情境下的穩健性樣本測試」與「人臉增強異常偵測」。這項成就為在 AI 時代推進支付、內容安全審查及金融身分驗證等領域的風險識別工作提供了關鍵支持。
深度偽造(deepfakes)及生成式人工智慧內容(AIGC)濫用所衍生的風險正日益加劇。此類合成內容常難以肉眼辨識,而現有檢測模型在面對真實世界環境及多模態大型模型的快速演進時,準確度往往大幅下降。CVPR挑戰賽針對此問題提出解決方案,要求模型在涉及「未知生成架構」與「複雜退化干擾」的極端測試中,仍能維持高準確度與強健性。
螞蟻集團深耕支付系統領域逾二十年,已開發出領先業界的安全技術。這份專業知識現正延伸至 AI 安全領域。團隊提出基於 DINOv3 視覺基礎模型的偵測框架,使 AIGC 偵測能力從實驗室環境邁向實際應用,實現了重大飛躍。
針對「強健性樣本測試」賽道,螞蟻AI安全實驗室團隊建構了一個包含數百萬個高品質樣本的複雜訓練語料庫。該語料庫整合了WildFake、Z-Image、Seedream及Nano-banana-pro等資料集,並結合了尖端模型。 其底層架構採用雙流並行整合結構,猶如賦予檢測模型兩隻互補的「眼睛」,既能捕捉局部細節,亦能掌握整體影像特徵。團隊模擬了完整的影像退化效果鏈,從單一噪點到多重變形,精準重現了社交媒體傳播及二次攝影中常見的真實世界影像篡改情形。此方法大幅提升了模型在實際情境中的檢測表現。
此外,研究團隊還引入了兩階段的「定位-檢視」檢測範式。此方法會先標定可疑區域,再進行詳細檢視。他們同時建置了 FakeXplained 資料集,提供針對特定區域的文字解釋。 在分析可疑影像時,此技術不僅能判定其是否為 AI 生成,更能精準標示出含有偽造瑕疵或物理不一致性的區域,並同步生成詳細的推理依據。這項突破超越了傳統的「黑箱」檢測模式,使模型決策變得可追溯且可解釋。為促進合作以應對 Deepfake 挑戰,該團隊已在 GitHub 上開源了該領域最全面的 AIGC 影像與影片檢測資源庫之一。
在「人臉增強異常檢測」競賽中,螞蟻國際團隊憑藉精準定位人臉影像中的異常區域而奪冠。這項技術主要應用於金融交易身分驗證及開戶文件審查等情境,為防範深度偽造(Deepfake)及基於 AIGC 的攻擊提供了關鍵的技術保障。 在跨境支付與金融服務領域,螞蟻國際已將 AIGC 識別技術深度整合至 EKYC(電子身份驗證)及文件防偽等流程中,確保能對各類生成內容具備強大的檢測能力。
CVPR(電腦視覺與模式識別會議)是由IEEE贊助的國際會議。與ICCV及ECCV並列,被視為電腦視覺領域三大頂級會議之一。今年的挑戰賽吸引了來自全球超過500支隊伍參與。
相關文章
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
OpenAI 執行長阿爾特曼抨擊 Anthropic 採取恐慌式行銷策略
人工智慧領域的兩大龍頭 OpenAI 與 Anthropic 之間的公開爭執持續升溫。OpenAI 執行長山姆·奧特曼(Sam Altman)近日在一檔播客節目中,對競爭對手的最新安全模型提出質疑。奧特曼主張,Anthropic 利用大眾對科技的恐懼,誇大了其產品的實際能力。他認為這種做法更像是行銷手段,而非真正的安全措施。僅限精英階層使用引發「築起技術壁壘」的指控這場爭議源於Anthropic本
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的
相關專題推薦
評論 (0)
0/500

螞蟻集團近期在 CVPR 2026 NTIRE 影像偵測挑戰賽的兩個賽道中榮獲最高榮譽,分別是「複雜真實世界情境下的穩健性樣本測試」與「人臉增強異常偵測」。這項成就為在 AI 時代推進支付、內容安全審查及金融身分驗證等領域的風險識別工作提供了關鍵支持。
深度偽造(deepfakes)及生成式人工智慧內容(AIGC)濫用所衍生的風險正日益加劇。此類合成內容常難以肉眼辨識,而現有檢測模型在面對真實世界環境及多模態大型模型的快速演進時,準確度往往大幅下降。CVPR挑戰賽針對此問題提出解決方案,要求模型在涉及「未知生成架構」與「複雜退化干擾」的極端測試中,仍能維持高準確度與強健性。
螞蟻集團深耕支付系統領域逾二十年,已開發出領先業界的安全技術。這份專業知識現正延伸至 AI 安全領域。團隊提出基於 DINOv3 視覺基礎模型的偵測框架,使 AIGC 偵測能力從實驗室環境邁向實際應用,實現了重大飛躍。
針對「強健性樣本測試」賽道,螞蟻AI安全實驗室團隊建構了一個包含數百萬個高品質樣本的複雜訓練語料庫。該語料庫整合了WildFake、Z-Image、Seedream及Nano-banana-pro等資料集,並結合了尖端模型。 其底層架構採用雙流並行整合結構,猶如賦予檢測模型兩隻互補的「眼睛」,既能捕捉局部細節,亦能掌握整體影像特徵。團隊模擬了完整的影像退化效果鏈,從單一噪點到多重變形,精準重現了社交媒體傳播及二次攝影中常見的真實世界影像篡改情形。此方法大幅提升了模型在實際情境中的檢測表現。
此外,研究團隊還引入了兩階段的「定位-檢視」檢測範式。此方法會先標定可疑區域,再進行詳細檢視。他們同時建置了 FakeXplained 資料集,提供針對特定區域的文字解釋。 在分析可疑影像時,此技術不僅能判定其是否為 AI 生成,更能精準標示出含有偽造瑕疵或物理不一致性的區域,並同步生成詳細的推理依據。這項突破超越了傳統的「黑箱」檢測模式,使模型決策變得可追溯且可解釋。為促進合作以應對 Deepfake 挑戰,該團隊已在 GitHub 上開源了該領域最全面的 AIGC 影像與影片檢測資源庫之一。
在「人臉增強異常檢測」競賽中,螞蟻國際團隊憑藉精準定位人臉影像中的異常區域而奪冠。這項技術主要應用於金融交易身分驗證及開戶文件審查等情境,為防範深度偽造(Deepfake)及基於 AIGC 的攻擊提供了關鍵的技術保障。 在跨境支付與金融服務領域,螞蟻國際已將 AIGC 識別技術深度整合至 EKYC(電子身份驗證)及文件防偽等流程中,確保能對各類生成內容具備強大的檢測能力。
CVPR(電腦視覺與模式識別會議)是由IEEE贊助的國際會議。與ICCV及ECCV並列,被視為電腦視覺領域三大頂級會議之一。今年的挑戰賽吸引了來自全球超過500支隊伍參與。
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
OpenAI 執行長阿爾特曼抨擊 Anthropic 採取恐慌式行銷策略
人工智慧領域的兩大龍頭 OpenAI 與 Anthropic 之間的公開爭執持續升溫。OpenAI 執行長山姆·奧特曼(Sam Altman)近日在一檔播客節目中,對競爭對手的最新安全模型提出質疑。奧特曼主張,Anthropic 利用大眾對科技的恐懼,誇大了其產品的實際能力。他認為這種做法更像是行銷手段,而非真正的安全措施。僅限精英階層使用引發「築起技術壁壘」的指控這場爭議源於Anthropic本
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的





首頁






