JPEG AI：模糊真实图像和合成图像之间的界线

首页

新闻

2025-04-20

CharlesMartinez

154

今年二月，JPEG AI国际标准在经过多年开发后问世。这一新标准利用机器学习技术压缩图像文件大小，同时保持感知质量不变，使图像存储和传输更加便捷。但令人意外的是，尽管具有潜力，JPEG AI并未在头条新闻中引起太多关注。为什么？原来，宣布这一突破的核心文件并非免费提供——即使在通常托管此类研究的Arxiv平台上也是如此。具有讽刺意味的是，Arxiv确实发表了多篇关于JPEG AI的研究，探讨了其独特的压缩伪影以及对取证科学的意义。

*来自JPEG AI官方出版物的图像，展示了峰值信噪比（PSNR）与JPEG AI的机器学习增强方法的比较。* 来源：https://jpeg.org/jpegai/documentation.html

例如，一项研究指出，JPEG AI倾向于模糊文本，这在需要清晰度的法律场景中是一个重大问题。原因何在？JPEG AI的压缩方法模仿了合成图像生成器的视觉特性，使得现有取证工具难以区分真假图像。

*一项研究比较了压缩伪影，包括JPEG AI早期草案的伪影，发现新方法有模糊文本的倾向——在编解码器可能影响证据链的情况下，这不是小问题。* 来源：https://arxiv.org/pdf/2411.06810

这种混淆源于JPEG AI使用了与取证工具设计用来识别的生成系统相似的模型架构。这种相似性意味着两者可能留下相似的视觉线索，复杂化了取证分析。

*根据2025年3月的一篇最新论文，经过JPEG AI压缩后，最先进的算法无法在定位图中可靠地区分真实内容与被篡改区域。左侧的源示例是被篡改/伪造的图像，在标准取证技术下，篡改区域清晰可见（中间图像）。然而，JPEG AI压缩为伪造图像增添了一层可信度（最右侧图像）。* 来源：https://arxiv.org/pdf/2412.03261

两种模型都使用了量化技术，这在此处至关重要。量化将连续数据转换为离散点，这一过程对于减小文件大小和提高机器学习模型效率至关重要。在JPEG AI中，量化通过简化图像内的数值表示来减少存储或传输图像所需的数据。然而，这也引入了与生成模型相似的模式，欺骗了取证工具。

*新论文展示了AI驱动的图像压缩方法与实际AI生成图像之间的方法相似性。* 来源：https://arxiv.org/pdf/2504.03191

量化

在此背景下，量化是将图像潜在表示中的连续值转换为固定的离散步骤。这使得编码更高效，但也引入了结构规律，可能模仿生成模型的伪影，微妙但足以干扰取证工具。

为此，一篇题为**JPEG AI图像的三种取证线索**的论文提出了非神经、可解释的方法，用于检测JPEG AI压缩、识别重压缩以及区分真实图像与AI生成图像。

方法

颜色相关性

该论文介绍了为JPEG AI量身定制的三种取证线索：颜色通道相关性、多次压缩中的图像质量失真以及潜在空间中的量化模式。JPEG AI的预处理在颜色通道之间引入了统计依赖，形成了独特的签名。例如，它将RGB图像转换为YUV颜色空间，并使用4:2:0色度子采样，在压缩前降低色度通道的分辨率。这导致红、绿、蓝通道高频残差之间的微妙相关性，不同于未压缩图像、传统JPEG或合成图像生成器产生的图像。

比较JPEG AI压缩如何改变图像中的颜色相关性，以红色通道为例。面板（a）比较了未压缩图像与JPEG AI压缩图像，显示压缩显著增加了通道间相关性。面板（b）单独展示了JPEG AI预处理（仅颜色转换和子采样）的影响，证明即使仅此步骤也明显提高了相关性。面板（c）显示传统JPEG压缩也略微增加相关性，但程度不如JPEG AI。面板（d）检查合成图像，Midjourney-V5和Firefly显示出适度相关性增加，而其他模型则更接近未压缩水平。 *比较JPEG AI压缩如何改变图像中的颜色相关性。*

论文中的上述图像展示了JPEG AI压缩如何影响颜色相关性，特别聚焦于红色通道。结果显示，压缩显著提高了通道间相关性，即使仅预处理步骤也明显增加了这些相关性。

率失真

率失真线索跟踪图像质量（以峰值信噪比（PSNR）衡量）在JPEG AI多次压缩中的可预测下降。研究表明，每次压缩都会导致逐渐减小但可测量的质量损失，这可作为重压缩的取证指标。与传统JPEG监控特定图像块不同，JPEG AI的神经架构需要在压缩过程中跟踪比特率和PSNR的变化。

展示多次压缩如何影响不同编解码器的图像质量，JPEG AI和https://arxiv.org/pdf/1802.01436开发的神经编解码器在每次额外压缩中均显示PSNR稳步下降，即使在较低比特率下也是如此。相比之下，传统JPEG在多次压缩中保持相对稳定的质量，除非比特率较高。这种模式展示了AI基编解码器中重压缩留下的可测量痕迹，可作为潜在的取证信号。 *展示多次压缩如何影响不同编解码器的图像质量，包含JPEG AI和https://arxiv.org/pdf/1802.01436开发的神经编解码器的结果；两者在每次额外压缩中均显示PSNR稳步下降，即使在较低比特率下也是如此。相比之下，传统JPEG压缩在多次压缩中保持相对稳定的质量，除非比特率较高。* 来源：https://arxiv.org/pdf/1802.01436

绘制的率失真曲线显示，JPEG AI和另一神经编解码器在所有比特率下均显示出一致的PSNR下降，而传统JPEG仅在较高比特率下明显下降。这种行为为检测JPEG AI图像重压缩提供了清晰信号。

量化

JPEG AI与扩散模型创建的图像在视觉上的相似性是取证中的一大挑战，两者都使用编码器-解码器架构，在压缩潜在空间中处理图像。然而，JPEG AI通过量化将潜在值四舍五入以实现高效压缩，这一步骤通常不被生成模型使用。新论文利用这一差异设计了取证线索，通过分析潜在表示如何与四舍五入值对齐来测试量化的存在。这些模式虽然肉眼不可见，但有助于区分压缩的真实图像与合成图像。

*平均傅里叶光谱示例显示，JPEG AI压缩图像以及Midjourney-V5和Stable Diffusion XL等扩散模型生成的图像在频域中呈现出规则的网格状模式——通常与上采样相关的伪影。相比之下，真实图像缺乏这些模式。*

这一线索在各种生成模型和强压缩下仍然有效，提供了区分压缩真实图像与合成图像的实用方法。

数据与测试

压缩

为测试检测JPEG AI压缩的颜色相关性线索，研究人员使用RAISE数据集中的高质量未压缩图像，使用JPEG AI参考实现以不同比特率进行压缩。他们在颜色通道相关性上训练了一个简单的随机森林，并将其与在图像像素上训练的ResNet50进行比较。结果显示，虽然ResNet50在匹配测试条件下表现良好，但难以泛化到不同压缩级别。而基于相关性的方法在较低比特率下表现更一致，此时JPEG AI的预处理影响更强。

*使用颜色相关性特征检测JPEG AI压缩的准确性，跨多个比特率进行比较。该方法在较低比特率下最有效，此时压缩伪影更强，并且比基线ResNet50模型显示出更好的泛化能力，特别是在未见过的压缩级别上。*

重压缩

为检测JPEG AI重压缩，研究人员在不同比特率下压缩的图像上使用率失真线索，部分图像压缩一次，部分压缩两次。他们提取了一个17维特征向量来跟踪压缩过程中的比特率和PSNR变化。在这些特征上训练的随机森林始终优于在图像块上训练的ResNet50，特别是在初始压缩较强时。该方法在多种场景下保持稳定，甚至泛化到其他AI基编解码器。

*使用率失真特征训练的随机森林在检测JPEG AI图像是否被重压缩时的分类准确性结果。该方法在初始压缩较强（即较低比特率）时表现最佳，并且始终优于基于像素的ResNet50——尤其是在第二次压缩比第一次温和的情况下。*

JPEG AI与合成图像

最后，为区分JPEG AI压缩图像与完全合成图像，研究人员使用了Synthbuster数据集，混合了RAISE数据库的真实照片与来自不同 Hawkins模型生成的图像。他们以不同比特率使用JPEG AI压缩真实图像，并在固定区域提取量化特征，使用随机森林分类器。基于量化的方法在较低比特率下优于ResNet50基线，此时压缩伪影更明显。

*Synthbuster中合成图像示例，使用受RAISE-1k数据集中的自然照片启发的文本提示生成。图像使用多种扩散模型创建，提示设计为生成逼真的内容和纹理，而非风格化或艺术化的渲染。* 来源：https://ieeexplore.ieee.org/document/10334046

*使用量化特征的随机森林分类器在区分JPEG AI压缩图像与合成图像时的分类准确性。*

作者指出，量化特征在不同压缩强度和生成器类型下泛化良好，完整的整数向量在检测JPEG AI压缩图像时提供了更高的准确性。UMAP可视化显示JPEG AI与合成图像之间有清晰的分离，较低比特率增加了类别之间的距离。

*基于量化特征的JPEG AI压缩图像与合成图像的二维UMAP可视化。左侧图显示较低的JPEG AI比特率与合成图像有更大的分离；右侧图显示不同生成器的图像在特征空间中如何明显聚类。*

最后，研究人员评估了这些特征在典型后处理（如JPEG重压缩和图像大小调整）下的鲁棒性。虽然在较重的处理下性能下降，但下降是渐进的，表明该方法具有一定的鲁棒性。

*评估量化特征在后处理（如JPEG重压缩（JPG）和图像大小调整（RS））下的鲁棒性。*

结论

JPEG AI是否会被广泛采用尚不确定。现有的基础设施对任何新编解码器都构成挑战，即使是像AV1这样已建立的编解码器也难以取代旧方法。如果JPEG AI的量化伪影继续干扰取证工具，其采用可能受阻。然而，如果未来的AI生成器留下不同的取证痕迹，JPEG AI当前的缺陷可能不那么重要。尽管如此，如果JPEG AI模糊了真实图像与生成图像的界限，其广泛使用可能会受到质疑。

首次发布于2025年4月8日，星期二

翡翠开藏大师》（Master Emerald Kaizo Nuzlocke）：终极生存与策略指南 Emerald Kaizo 是有史以来最强大的神奇宝贝 ROM 黑客之一。虽然尝试运行 Nuzlocke 会使挑战成倍增加，但通过精心策划和战略执行，胜利仍然是可以实现的。这本权威指南提供了在硬核 Nuzlocke 规则下征服翡翠海藏的必备工具、经过实战检验的战术和深入的人工智能分析。准备好接受神奇宝贝高手的终极考验吧！基本策略收集关键工具：游戏文档、专门的 PKHeX（EK 版）和精确的伤害计算

人工智能驱动的求职信：期刊投稿专家指南在当今竞争激烈的学术出版环境中，撰写一封有效的求职信是稿件能否被录用的关键。了解像 ChatGPT 这样的人工智能工具如何简化这一重要任务，帮助您撰写出精美、专业的信件，吸引期刊编辑的注意。我们的综合指南将逐步揭示优化投稿包、最大限度地提高发表成功率的策略。要点必要的研究准备：整理所有稿件细节和期刊规范。人工智能辅助起草：使用 ChatGPT 生成最初的求职信模板。个性化定制：完善人工智能输出，以

美国将因社交媒体法规制裁外国官员美国站出来反对全球数字内容法规美国国务院本周针对欧洲的数字治理政策发出了尖锐的外交斥责，表明在网络平台控制权问题上的紧张局势正在升级。国务卿马可-卢比奥（Marco Rubio）公布了一项新的签证限制政策，该政策针对的是参与美国认为影响美国数字空间的过度审查的外国官员。新签证限制解释根据周三宣布的政策，美国将拒绝被认定正在执行影响美国受保护言论的海外内容法规的外国公民入境。卢比奥强调了两

0/200

提交

ArthurSanchez

2025-08-04 14:48:52

This JPEG AI thing is wild! Shrinking files while keeping images crisp? I'm all for it, but wonder if it'll make fake images too convincing. 😅

JohnYoung

2025-08-01 10:48:18

This JPEG AI thing is wild! Shrinking file sizes while keeping images crisp? That's like magic for my phone storage. Can't wait to see how it changes photo sharing! 📸

LawrenceLopez

2025-04-23 16:10:33

JPEG AI é incrível! Comprime imagens muito bem e ainda assim elas parecem ótimas. Economizei muito espaço no meu celular. Mas às vezes, as imagens parecem um pouco artificiais, o que é estranho. Ainda assim, é essencial para quem lida com muitas fotos! 😊

HaroldLopez

2025-04-23 09:34:54

JPEG AI는 꽤 괜찮지만, 실제와 합성 이미지의 경계를 흐리게 하는 것이 이상해요. 온라인에서 보는 모든 것을 의심하게 만드네요! 🤔 그래도 공간을 절약하는 데는 유용해요.

JerryGonzález

2025-04-23 06:00:58

JPEG AIは便利ですが、リアルと合成の画像の境界が曖昧になるのは不思議です。オンラインで見るもの全てに疑問を持ってしまいます！🤔 それでも、スペースを節約するのに役立ちますね。

WillMitchell

2025-04-22 20:18:56

JPEG AI es increíble! Comprime las imágenes muy bien y aún así se ven geniales. He ahorrado mucho espacio en mi teléfono. Pero a veces, las imágenes parecen un poco artificiales, lo que es raro. Aún así, es imprescindible para quien maneja muchas fotos! 😎

头条新闻

2025顶级AI视频生成器：Pika Labs与其他对比 Gemini 2.5 Pro现在比Claude，GPT-4O更便宜，更便宜 AI配音：真实声音创作终极指南 Cambium的AI将垃圾木头变成木材 AI Builder和Power Automate革新文档摘要 Openai增强了AI语音助手以进行更好的聊天如何确保您的数据值得信赖AI集成 NotebookLM在全球范围内扩展，添加幻灯片并增强了事实检查对美国数据中心的调整可以解锁76 GW的新电源容量 Google利用AI暂停了超过3900万的广告帐户，以涉嫌欺诈

精选