選項
首頁
新聞
JPEG AI:模糊真實圖像和合成圖像之間的界線

JPEG AI:模糊真實圖像和合成圖像之間的界線

2025-04-20
147

今年二月,JPEG AI國際標準在多年研發後正式登場。這項新標準利用機器學習縮減圖像檔案大小,同時保持感知品質完整,使圖像更容易儲存和傳送。但問題在於:儘管具備潛力,JPEG AI並未在新聞頭條中引起太多關注。為什麼?原來,宣布這項突破的核心文件並非免費提供—even在像Arxiv這樣通常托管此類研究的平台上也是如此。諷刺的是,Arxiv確實發布了幾篇關於JPEG AI的研究,探討其獨特的壓縮偽影及其對鑑識科學的影響。

來自JPEG AI官方出版串流的比較,展示了峰值訊噪比(PSNR)與JPEG AI的機器學習增強方法之間的對比。來源:https://jpeg.org/jpegai/documentation.html*來自JPEG AI官方出版串流的比較,展示了峰值訊噪比(PSNR)與JPEG AI的機器學習增強方法之間的對比。* 來源:https://jpeg.org/jpegai/documentation.html

例如,一項研究指出,JPEG AI傾向於模糊文字,這在需要清晰度的法律情境中是一個重大問題。造成此問題的原因?JPEG AI的壓縮方法模仿了合成圖像生成器的視覺特性,使得現有鑑識工具難以分辨真偽。

一項研究比較了壓縮偽影,包括JPEG AI早期草案的偽影,發現新方法有模糊文字的傾向——這在編解碼器可能影響證據鏈的情況下並非小事。來源:https://arxiv.org/pdf/2411.06810*一項研究比較了壓縮偽影,包括JPEG AI早期草案的偽影,發現新方法有模糊文字的傾向——這在編解碼器可能影響證據鏈的情況下並非小事。* 來源:https://arxiv.org/pdf/2411.06810

混淆源於JPEG AI使用的模型架構與鑑識工具設計用於檢測的生成系統相似。這種相似性意味著兩者可能留下相似的視覺線索,複雜化鑑識分析。

根據2025年3月的一篇最新論文,經過JPEG AI壓縮後,最先進的演算法無法在定位圖中可靠地區分真實內容與被操縱的區域。左邊的來源範例是經過操縱/偽造的圖像,在標準鑑識技術下(中間圖像),篡改區域清晰可辨。然而,JPEG AI壓縮為偽造圖像增添了一層可信度(最右邊的圖像)。來源:https://arxiv.org/pdf/2412.03261*根據2025年3月的一篇最新論文,經過JPEG AI壓縮後,最先進的演算法無法在定位圖中可靠地區分真實內容與被操縱的區域。左邊的來源範例是經過操縱/偽造的圖像,在標準鑑識技術下(中間圖像),篡改區域清晰可辨。然而,JPEG AI壓縮為偽造圖像增添了一層可信度(最右邊的圖像)。* 來源:https://arxiv.org/pdf/2412.03261

兩種模型都使用了名為量化的技術,這在這裡至關重要。量化將連續數據轉換為離散點,這一過程對於減少檔案大小和提高機器學習模型效率至關重要。在JPEG AI中,它通過簡化圖像內的數值表示來減少儲存或傳輸圖像所需的數據。然而,這也引入了與生成模型相似的模式,誤導了鑑識工具。

新論文展示了AI驅動的圖像壓縮方法與實際AI生成圖像的方法相似性。來源:https://arxiv.org/pdf/2504.03191*新論文展示了AI驅動的圖像壓縮方法與實際AI生成圖像的方法相似性。* 來源:https://arxiv.org/pdf/2504.03191

量化

在此情境中,量化是指將圖像潛在表示中的連續值轉換為固定的離散步驟。這使得編碼更有效率,但也引入了結構規律性,可能模仿生成模型的偽影,這些偽影雖然微妙,但足以挑戰鑑識工具。

為應對此問題,一篇名為**JPEG AI圖像的三個鑑識線索**的論文提出了非神經、可解釋的方法,用於檢測JPEG AI壓縮、識別重新壓縮以及區分真實與AI生成的圖像。

方法

色彩相關性

該論文介紹了針對JPEG AI的三個鑑識線索:色彩通道相關性、多次壓縮中的圖像品質失真以及潛在空間中的量化模式。JPEG AI的預處理在色彩通道之間引入了統計依賴,創造出獨特的特徵。例如,它將RGB圖像轉換為YUV色彩空間,並使用4:2:0色度子採樣,在壓縮前降低色度通道的分辨率。這導致紅、綠、藍通道的高頻殘差之間產生細微相關性,與未壓縮圖像、傳統JPEG或合成圖像生成器產生的圖像不同。

比較JPEG AI壓縮如何改變圖像中的色彩相關性,以紅色通道為例。面板(a)比較未壓縮圖像與JPEG AI壓縮圖像,顯示壓縮顯著增加通道間相關性。面板(b)單獨展示JPEG AI預處理的影響——僅色彩轉換和子採樣——表明僅此步驟就顯著提高了相關性。面板(c)顯示傳統JPEG壓縮也略微增加相關性,但程度不同。面板(d)檢視合成圖像,Midjourney-V5和Firefly顯示適度相關性增加,而其他則接近未壓縮水平。*比較JPEG AI壓縮如何改變圖像中的色彩相關性。*

來自該論文的上述圖像展示了JPEG AI壓縮如何影響色彩相關性,特別聚焦於紅色通道。它顯示壓縮顯著提高了通道間相關性,即使僅預處理步驟也顯著增加這些相關性。

速率-失真

速率-失真線索追蹤圖像品質(以峰值訊噪比(PSNR)測量)在JPEG AI多次壓縮中可預測的下降。研究表明,每輪壓縮導致逐漸減小的但可測量的品質損失,這可用作重新壓縮的鑑識指標。與傳統JPEG監控特定圖像塊不同,JPEG AI的神經架構需要追蹤壓縮過程中的比特率和PSNR變化。

展示了多次壓縮如何影響不同編解碼器的圖像品質,顯示JPEG AI和在https://arxiv.org/pdf/1802.01436開發的神經編解碼器在每次額外壓縮時PSNR穩定下降——即使在較低比特率下也是如此。相比之下,傳統JPEG在多次壓縮中保持相對穩定的品質,除非比特率很高。這種模式展示了重新壓縮如何在AI基於的編解碼器中留下可測量的痕跡,提供潛在的鑑識信號。*展示了多次壓縮如何影響不同編解碼器的圖像品質,包含JPEG AI和在https://arxiv.org/pdf/1802.01436開發的神經編解碼器的結果;兩者在每次額外壓縮時PSNR穩定下降,即使在較低比特率下也是如此。相比之下,傳統JPEG壓縮在多次壓縮中保持相對穩定的品質,除非比特率很高。*

繪製的速率-失真曲線顯示,JPEG AI和另一神經編解碼器在所有比特率下顯示一致的PSNR下降,而傳統JPEG僅在較高比特率下顯著下降。這種行為為檢測JPEG AI圖像的重新壓縮提供了清晰的信號。

量化

JPEG AI鑑識中最棘手的挑戰之一是其與擴散模型創建的圖像在視覺上的相似性,兩者均使用編碼器-解碼器架構在壓縮潛在空間中處理圖像。然而,JPEG AI應用量化來四捨五入潛在值以實現高效壓縮,這是生成模型通常不使用的步驟。新論文利用這一差異設計了一個鑑識線索,通過分析潛在表示如何與四捨五入值對齊來測試量化的存在。這些模式雖然肉眼不可見,但有助於區分壓縮真實圖像與合成圖像。

平均傅立葉光譜的範例顯示,JPEG AI壓縮圖像和由擴散模型如Midjourney-V5和Stable Diffusion XL生成的圖像在頻率域中呈現規則的網格狀模式——這些偽影通常與上採樣相關。相比之下,真實圖像缺乏這些模式。這種光譜結構的重疊解釋了為什麼鑑識工具經常將壓縮真實圖像與合成圖像混淆。*平均傅立葉光譜的範例顯示,JPEG AI壓縮圖像和由擴散模型如Midjourney-V5和Stable Diffusion XL生成的圖像在頻率域中呈現規則的網格狀模式——這些偽影通常與上採樣相關。相比之下,真實圖像缺乏這些模式。這種光譜結構的重疊解釋了為什麼鑑識工具經常將壓縮真實圖像與合成圖像混淆。*

此線索在各種生成模型和強壓縮下保持有效,提供了一種實用的方法來區分壓縮真實圖像與合成圖像。

數據與測試

壓縮

為測試檢測JPEG AI壓縮的色彩相關性線索,研究人員使用來自RAISE數據集的高品質未壓縮圖像,以不同比特率使用JPEG AI參考實現進行壓縮。他們在色彩通道相關性上訓練了一個簡單的隨機森林,並與在圖像像素上訓練的ResNet50進行比較。結果顯示,雖然ResNet50在匹配測試條件下表現良好,但難以泛化到不同壓縮水平。然而,基於相關性的方法證明更一致,特別是在JPEG AI預處理影響較強的較低比特率下。

使用色彩相關性特徵檢測JPEG AI壓縮的準確性,跨多個比特率進行比較。該方法在壓縮偽影較強的較低比特率下最有效,且比基線ResNet50模型展示出對未見壓縮水平的更好泛化能力。*使用色彩相關性特徵檢測JPEG AI壓縮的準確性,跨多個比特率進行比較。該方法在壓縮偽影較強的較低比特率下最有效,且比基線ResNet50模型展示出對未見壓縮水平的更好泛化能力。*

重新壓縮

為檢測JPEG AI重新壓縮,研究人員在不同比特率下壓縮圖像(一些壓縮一次,一些壓縮兩次)使用速率-失真線索。他們提取了一個17維特徵向量來追蹤壓縮過程中的比特率和PSNR變化。在這些特徵上訓練的隨機森林始終優於在圖像塊上訓練的ResNet50,特別是在初始壓縮較強時。該方法在各種場景中保持穩定,甚至泛化到另一個基於AI的編解碼器。

使用速率-失真特徵訓練的隨機森林對JPEG AI圖像是否被重新壓縮的分類準確性結果。該方法在初始壓縮較強(即較低比特率)時表現最佳,且始終優於基於像素的ResNet50——特別是在第二次壓縮比第一次溫和的情況下。*使用速率-失真特徵訓練的隨機森林對JPEG AI圖像是否被重新壓縮的分類準確性結果。該方法在初始壓縮較強(即較低比特率)時表現最佳,且始終優於基於像素的ResNet50——特別是在第二次壓縮比第一次溫和的情況下。*

JPEG AI與合成圖像

最後,為區分JPEG AI壓縮圖像與完全合成圖像,研究人員使用Synthbuster數據集,混合來自RAISE數據庫的真實照片與來自各種模型的生成圖像。他們使用JPEG AI以不同比特率壓縮真實圖像,並在固定區域提取的量化特徵上使用隨機森林分類器。基於量化的方法優於ResNet50基線,特別是在壓縮偽影更明顯的較低比特率下。

Synthbuster中合成圖像的範例,使用受RAISE-1k數據集自然照片啟發的文字提示生成。圖像使用各種擴散模型創建,提示設計為生成逼真的內容和紋理,而非風格化或藝術化的渲染,反映數據集專注於測試區分真實與生成圖像的方法。*Synthbuster中合成圖像的範例,使用受RAISE-1k數據集自然照片啟發的文字提示生成。圖像使用各種擴散模型創建,提示設計為生成逼真的內容和紋理,而非風格化或藝術化的渲染。* 來源:https://ieeexplore.ieee.org/document/10334046

使用量化特徵的隨機森林分類JPEG AI壓縮圖像與合成圖像的準確性。*使用量化特徵的隨機森林分類JPEG AI壓縮圖像與合成圖像的準確性。*

作者指出,量化特徵在壓縮強度和生成器類型上泛化良好,完整的整數向量在檢測JPEG AI壓縮圖像時提供更高的準確性。UMAP可視化顯示JPEG AI與合成圖像之間的清晰分離,較低比特率增加了類別之間的距離。

基於量化特徵的JPEG AI壓縮與合成圖像的二維UMAP可視化。左圖顯示較低的JPEG AI比特率與合成圖像之間產生更大的分離;右圖顯示來自不同生成器的圖像在特徵空間中如何形成明顯的集群。*基於量化特徵的JPEG AI壓縮與合成圖像的二維UMAP可視化。左圖顯示較低的JPEG AI比特率與合成圖像之間產生更大的分離;右圖顯示來自不同生成器的圖像在特徵空間中如何形成明顯的集群。*

最後,研究人員評估了這些特徵在典型後處理(如JPEG重新壓縮和圖像縮放)下的穩健性。雖然在較重的處理下性能下降,但下降是漸進的,顯示出該方法的某種韌性。

結論

目前尚不清楚JPEG AI是否會被廣泛採用。現有基礎設施對任何新編解碼器構成挑戰,即使是像AV1這樣已建立的編解碼器也難以取代舊方法。如果JPEG AI的量化偽影繼續混淆鑑識工具,其採用可能會受阻。然而,如果未來的AI生成器留下不同的鑑識痕跡,JPEG AI目前的問題可能不那麼重要。儘管如此,如果JPEG AI模糊了真實與生成圖像之間的界線,其廣泛使用可能會受到質疑。

首次發布於2025年4月8日星期二

相關文章
創建AI驅動的著色書:全面指南 創建AI驅動的著色書:全面指南 設計著色書是一項有益的追求,結合藝術表達與為使用者提供平靜的體驗。然而,此過程可能相當勞力密集。幸運的是,AI工具能輕鬆簡化高品質、一致的著色頁創建。本指南提供使用AI製作著色書的逐步方法,專注於保持一致風格和最佳效率的技術。關鍵要點使用AI提示工具開發詳細、結構化的著色頁提示。確保著色書中所有頁面的藝術風格一致。生成單一著色頁設計的多樣變化。利用Ideogram等AI平台快速高效創建著色書。精煉
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。國際數學奧林匹克的重要性自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽
評論 (22)
0/200
ArthurSanchez
ArthurSanchez 2025-08-04 14:48:52

This JPEG AI thing is wild! Shrinking files while keeping images crisp? I'm all for it, but wonder if it'll make fake images too convincing. 😅

JohnYoung
JohnYoung 2025-08-01 10:48:18

This JPEG AI thing is wild! Shrinking file sizes while keeping images crisp? That's like magic for my phone storage. Can't wait to see how it changes photo sharing! 📸

LawrenceLopez
LawrenceLopez 2025-04-23 16:10:33

JPEG AI é incrível! Comprime imagens muito bem e ainda assim elas parecem ótimas. Economizei muito espaço no meu celular. Mas às vezes, as imagens parecem um pouco artificiais, o que é estranho. Ainda assim, é essencial para quem lida com muitas fotos! 😊

HaroldLopez
HaroldLopez 2025-04-23 09:34:54

JPEG AI는 꽤 괜찮지만, 실제와 합성 이미지의 경계를 흐리게 하는 것이 이상해요. 온라인에서 보는 모든 것을 의심하게 만드네요! 🤔 그래도 공간을 절약하는 데는 유용해요.

JerryGonzález
JerryGonzález 2025-04-23 06:00:58

JPEG AIは便利ですが、リアルと合成の画像の境界が曖昧になるのは不思議です。オンラインで見るもの全てに疑問を持ってしまいます!🤔 それでも、スペースを節約するのに役立ちますね。

WillMitchell
WillMitchell 2025-04-22 20:18:56

JPEG AI es increíble! Comprime las imágenes muy bien y aún así se ven geniales. He ahorrado mucho espacio en mi teléfono. Pero a veces, las imágenes parecen un poco artificiales, lo que es raro. Aún así, es imprescindible para quien maneja muchas fotos! 😎

回到頂部
OR