JPEG AI：模糊真實圖像和合成圖像之間的界線

首頁

新聞

2025-04-20

CharlesMartinez

154

今年二月，JPEG AI國際標準在多年研發後正式登場。這項新標準利用機器學習縮減圖像檔案大小，同時保持感知品質完整，使圖像更容易儲存和傳送。但問題在於：儘管具備潛力，JPEG AI並未在新聞頭條中引起太多關注。為什麼？原來，宣布這項突破的核心文件並非免費提供—even在像Arxiv這樣通常托管此類研究的平台上也是如此。諷刺的是，Arxiv確實發布了幾篇關於JPEG AI的研究，探討其獨特的壓縮偽影及其對鑑識科學的影響。

*來自JPEG AI官方出版串流的比較，展示了峰值訊噪比（PSNR）與JPEG AI的機器學習增強方法之間的對比。* 來源：https://jpeg.org/jpegai/documentation.html

例如，一項研究指出，JPEG AI傾向於模糊文字，這在需要清晰度的法律情境中是一個重大問題。造成此問題的原因？JPEG AI的壓縮方法模仿了合成圖像生成器的視覺特性，使得現有鑑識工具難以分辨真偽。

*一項研究比較了壓縮偽影，包括JPEG AI早期草案的偽影，發現新方法有模糊文字的傾向——這在編解碼器可能影響證據鏈的情況下並非小事。* 來源：https://arxiv.org/pdf/2411.06810

混淆源於JPEG AI使用的模型架構與鑑識工具設計用於檢測的生成系統相似。這種相似性意味著兩者可能留下相似的視覺線索，複雜化鑑識分析。

*根據2025年3月的一篇最新論文，經過JPEG AI壓縮後，最先進的演算法無法在定位圖中可靠地區分真實內容與被操縱的區域。左邊的來源範例是經過操縱/偽造的圖像，在標準鑑識技術下（中間圖像），篡改區域清晰可辨。然而，JPEG AI壓縮為偽造圖像增添了一層可信度（最右邊的圖像）。* 來源：https://arxiv.org/pdf/2412.03261

兩種模型都使用了名為量化的技術，這在這裡至關重要。量化將連續數據轉換為離散點，這一過程對於減少檔案大小和提高機器學習模型效率至關重要。在JPEG AI中，它通過簡化圖像內的數值表示來減少儲存或傳輸圖像所需的數據。然而，這也引入了與生成模型相似的模式，誤導了鑑識工具。

*新論文展示了AI驅動的圖像壓縮方法與實際AI生成圖像的方法相似性。* 來源：https://arxiv.org/pdf/2504.03191

量化

在此情境中，量化是指將圖像潛在表示中的連續值轉換為固定的離散步驟。這使得編碼更有效率，但也引入了結構規律性，可能模仿生成模型的偽影，這些偽影雖然微妙，但足以挑戰鑑識工具。

為應對此問題，一篇名為**JPEG AI圖像的三個鑑識線索**的論文提出了非神經、可解釋的方法，用於檢測JPEG AI壓縮、識別重新壓縮以及區分真實與AI生成的圖像。

方法

色彩相關性

該論文介紹了針對JPEG AI的三個鑑識線索：色彩通道相關性、多次壓縮中的圖像品質失真以及潛在空間中的量化模式。JPEG AI的預處理在色彩通道之間引入了統計依賴，創造出獨特的特徵。例如，它將RGB圖像轉換為YUV色彩空間，並使用4:2:0色度子採樣，在壓縮前降低色度通道的分辨率。這導致紅、綠、藍通道的高頻殘差之間產生細微相關性，與未壓縮圖像、傳統JPEG或合成圖像生成器產生的圖像不同。

比較JPEG AI壓縮如何改變圖像中的色彩相關性，以紅色通道為例。面板(a)比較未壓縮圖像與JPEG AI壓縮圖像，顯示壓縮顯著增加通道間相關性。面板(b)單獨展示JPEG AI預處理的影響——僅色彩轉換和子採樣——表明僅此步驟就顯著提高了相關性。面板(c)顯示傳統JPEG壓縮也略微增加相關性，但程度不同。面板(d)檢視合成圖像，Midjourney-V5和Firefly顯示適度相關性增加，而其他則接近未壓縮水平。 *比較JPEG AI壓縮如何改變圖像中的色彩相關性。*

來自該論文的上述圖像展示了JPEG AI壓縮如何影響色彩相關性，特別聚焦於紅色通道。它顯示壓縮顯著提高了通道間相關性，即使僅預處理步驟也顯著增加這些相關性。

速率-失真

速率-失真線索追蹤圖像品質（以峰值訊噪比（PSNR）測量）在JPEG AI多次壓縮中可預測的下降。研究表明，每輪壓縮導致逐漸減小的但可測量的品質損失，這可用作重新壓縮的鑑識指標。與傳統JPEG監控特定圖像塊不同，JPEG AI的神經架構需要追蹤壓縮過程中的比特率和PSNR變化。

展示了多次壓縮如何影響不同編解碼器的圖像品質，顯示JPEG AI和在https://arxiv.org/pdf/1802.01436開發的神經編解碼器在每次額外壓縮時PSNR穩定下降——即使在較低比特率下也是如此。相比之下，傳統JPEG在多次壓縮中保持相對穩定的品質，除非比特率很高。這種模式展示了重新壓縮如何在AI基於的編解碼器中留下可測量的痕跡，提供潛在的鑑識信號。 *展示了多次壓縮如何影響不同編解碼器的圖像品質，包含JPEG AI和在https://arxiv.org/pdf/1802.01436開發的神經編解碼器的結果；兩者在每次額外壓縮時PSNR穩定下降，即使在較低比特率下也是如此。相比之下，傳統JPEG壓縮在多次壓縮中保持相對穩定的品質，除非比特率很高。*

繪製的速率-失真曲線顯示，JPEG AI和另一神經編解碼器在所有比特率下顯示一致的PSNR下降，而傳統JPEG僅在較高比特率下顯著下降。這種行為為檢測JPEG AI圖像的重新壓縮提供了清晰的信號。

量化

JPEG AI鑑識中最棘手的挑戰之一是其與擴散模型創建的圖像在視覺上的相似性，兩者均使用編碼器-解碼器架構在壓縮潛在空間中處理圖像。然而，JPEG AI應用量化來四捨五入潛在值以實現高效壓縮，這是生成模型通常不使用的步驟。新論文利用這一差異設計了一個鑑識線索，通過分析潛在表示如何與四捨五入值對齊來測試量化的存在。這些模式雖然肉眼不可見，但有助於區分壓縮真實圖像與合成圖像。

*平均傅立葉光譜的範例顯示，JPEG AI壓縮圖像和由擴散模型如Midjourney-V5和Stable Diffusion XL生成的圖像在頻率域中呈現規則的網格狀模式——這些偽影通常與上採樣相關。相比之下，真實圖像缺乏這些模式。這種光譜結構的重疊解釋了為什麼鑑識工具經常將壓縮真實圖像與合成圖像混淆。*

此線索在各種生成模型和強壓縮下保持有效，提供了一種實用的方法來區分壓縮真實圖像與合成圖像。

數據與測試

壓縮

為測試檢測JPEG AI壓縮的色彩相關性線索，研究人員使用來自RAISE數據集的高品質未壓縮圖像，以不同比特率使用JPEG AI參考實現進行壓縮。他們在色彩通道相關性上訓練了一個簡單的隨機森林，並與在圖像像素上訓練的ResNet50進行比較。結果顯示，雖然ResNet50在匹配測試條件下表現良好，但難以泛化到不同壓縮水平。然而，基於相關性的方法證明更一致，特別是在JPEG AI預處理影響較強的較低比特率下。

*使用色彩相關性特徵檢測JPEG AI壓縮的準確性，跨多個比特率進行比較。該方法在壓縮偽影較強的較低比特率下最有效，且比基線ResNet50模型展示出對未見壓縮水平的更好泛化能力。*

重新壓縮

為檢測JPEG AI重新壓縮，研究人員在不同比特率下壓縮圖像（一些壓縮一次，一些壓縮兩次）使用速率-失真線索。他們提取了一個17維特徵向量來追蹤壓縮過程中的比特率和PSNR變化。在這些特徵上訓練的隨機森林始終優於在圖像塊上訓練的ResNet50，特別是在初始壓縮較強時。該方法在各種場景中保持穩定，甚至泛化到另一個基於AI的編解碼器。

*使用速率-失真特徵訓練的隨機森林對JPEG AI圖像是否被重新壓縮的分類準確性結果。該方法在初始壓縮較強（即較低比特率）時表現最佳，且始終優於基於像素的ResNet50——特別是在第二次壓縮比第一次溫和的情況下。*

JPEG AI與合成圖像

最後，為區分JPEG AI壓縮圖像與完全合成圖像，研究人員使用Synthbuster數據集，混合來自RAISE數據庫的真實照片與來自各種模型的生成圖像。他們使用JPEG AI以不同比特率壓縮真實圖像，並在固定區域提取的量化特徵上使用隨機森林分類器。基於量化的方法優於ResNet50基線，特別是在壓縮偽影更明顯的較低比特率下。

*Synthbuster中合成圖像的範例，使用受RAISE-1k數據集自然照片啟發的文字提示生成。圖像使用各種擴散模型創建，提示設計為生成逼真的內容和紋理，而非風格化或藝術化的渲染。* 來源：https://ieeexplore.ieee.org/document/10334046

*使用量化特徵的隨機森林分類JPEG AI壓縮圖像與合成圖像的準確性。*

作者指出，量化特徵在壓縮強度和生成器類型上泛化良好，完整的整數向量在檢測JPEG AI壓縮圖像時提供更高的準確性。UMAP可視化顯示JPEG AI與合成圖像之間的清晰分離，較低比特率增加了類別之間的距離。

*基於量化特徵的JPEG AI壓縮與合成圖像的二維UMAP可視化。左圖顯示較低的JPEG AI比特率與合成圖像之間產生更大的分離；右圖顯示來自不同生成器的圖像在特徵空間中如何形成明顯的集群。*

最後，研究人員評估了這些特徵在典型後處理（如JPEG重新壓縮和圖像縮放）下的穩健性。雖然在較重的處理下性能下降，但下降是漸進的，顯示出該方法的某種韌性。

結論

目前尚不清楚JPEG AI是否會被廣泛採用。現有基礎設施對任何新編解碼器構成挑戰，即使是像AV1這樣已建立的編解碼器也難以取代舊方法。如果JPEG AI的量化偽影繼續混淆鑑識工具，其採用可能會受阻。然而，如果未來的AI生成器留下不同的鑑識痕跡，JPEG AI目前的問題可能不那麼重要。儘管如此，如果JPEG AI模糊了真實與生成圖像之間的界線，其廣泛使用可能會受到質疑。

首次發布於2025年4月8日星期二

訓練會減緩人工智能引起的認知負載效應嗎？ Unite.ai 最近發表了一篇題為「ChatGPT Might Be Draining Your Brain：Cognitive Debt in the AI Era"（人工智能時代的認知債務），揭示了麻省理工學院的相關研究。記者 Alex McFarland 詳述了令人信服的證據，證明過度依賴 AI 會侵蝕基本的認知能力，尤其是批判性思考和判斷力。雖然這些發現與許多其他研究結果一致，但目前的迫

輕鬆產生由 AI 驅動的圖表和可視化，以獲得更好的資料洞察力現代資料分析需要複雜資訊的直覺視覺化。人工智能驅動的圖表生成解決方案已成為不可或缺的資產，徹底改變了專業人員將原始資料轉換為引人入勝的視覺故事的方式。這些智慧型系統可省去手動製圖的工作，同時保留精確度，讓技術與非技術使用者都能透過自動化的可視化方式，發掘可行的洞察力。主要重點自動可視化：立即將結構化及非結構化資料轉換成專業級圖表。自然語言處理：透過會話指令產生可視化，無需編碼。全面的圖表支援：製作

改變您的銷售策略：由 Vapi 驅動的 AI Cold Calling 技術現代企業以閃電般的速度運作，需要創新的解決方案來保持競爭力。試想一下，使用人工智能驅動的冷呼叫系統，同時與數十個潛在客戶接觸，並全天候自主運行，從而徹底改變您公司的外聯工作。像 Vapi 這樣的平台讓這種轉型成為可能，讓您能夠建立可進行自然對話的客製化撥號器，同時解放您的團隊進行高價值的工作。本全面指南揭示了如何實施最先進的人工智能呼叫技術，以實現大規模的個性化外展、大幅提升潛在客戶的產生，並為您

評論 (22)

0/200

提交

ArthurSanchez

2025-08-04 14:48:52

This JPEG AI thing is wild! Shrinking files while keeping images crisp? I'm all for it, but wonder if it'll make fake images too convincing. 😅

JohnYoung

2025-08-01 10:48:18

This JPEG AI thing is wild! Shrinking file sizes while keeping images crisp? That's like magic for my phone storage. Can't wait to see how it changes photo sharing! 📸

LawrenceLopez

2025-04-23 16:10:33

JPEG AI é incrível! Comprime imagens muito bem e ainda assim elas parecem ótimas. Economizei muito espaço no meu celular. Mas às vezes, as imagens parecem um pouco artificiais, o que é estranho. Ainda assim, é essencial para quem lida com muitas fotos! 😊

HaroldLopez

2025-04-23 09:34:54

JPEG AI는 꽤 괜찮지만, 실제와 합성 이미지의 경계를 흐리게 하는 것이 이상해요. 온라인에서 보는 모든 것을 의심하게 만드네요! 🤔 그래도 공간을 절약하는 데는 유용해요.

JerryGonzález

2025-04-23 06:00:58

JPEG AIは便利ですが、リアルと合成の画像の境界が曖昧になるのは不思議です。オンラインで見るもの全てに疑問を持ってしまいます！🤔 それでも、スペースを節約するのに役立ちますね。

WillMitchell

2025-04-22 20:18:56

JPEG AI es increíble! Comprime las imágenes muy bien y aún así se ven geniales. He ahorrado mucho espacio en mi teléfono. Pero a veces, las imágenes parecen un poco artificiales, lo que es raro. Aún así, es imprescindible para quien maneja muchas fotos! 😎

頭號新聞

2025頂級AI影片生成器：Pika Labs與其他對比 Gemini 2.5 Pro現在比Claude，GPT-4O更便宜，更便宜 AI配音：真實聲音創作終極指南 Cambium的AI將垃圾木頭變成木材 AI Builder和Power Automate革新文件摘要 Openai增強了AI語音助手以進行更好的聊天如何確保您的數據值得信賴AI集成 Duolingo轉用能量系統 NotebookLM在全球範圍內擴展，添加幻燈片並增強了事實檢查對美國數據中心的調整可以解鎖76 GW的新電源容量

精選