JPEG AI：実際の画像と合成画像の間の境界線を曖昧にする

家

ニュース

2025年4月20日

CharlesMartinez

154

今年2月に、JPEG AI国際標準が数年の開発を経て登場しました。この新標準は、機械学習を活用して画像ファイルのサイズを縮小しつつ、知覚的品質を維持することで、画像の保存や送信を容易にします。しかし、驚くべきことに、この可能性にもかかわらず、JPEG AIはニュースの見出しであまり話題になりませんでした。なぜでしょうか？実は、この画期的な発表の中心となる文書が、Arxivのような通常そのような研究を公開するプラットフォームでも無料で入手できなかったのです。皮肉なことに、ArxivではJPEG AIに関するいくつかの研究が公開されており、その独特な圧縮アーティファクトや法科学への影響が探求されています。

*JPEG AIの公式公開ストリームからの、ピーク信号対ノイズ比（PSNR）とJPEG AIのML拡張アプローチの比較。* 出典：https://jpeg.org/jpegai/documentation.html

例えば、ある研究では、JPEG AIがテキストをぼかす傾向があることが強調されており、これは画像が法的文 Pulse で使用される場合に明確さが重要な問題となります。この問題の原因は？ JPEG AIの圧縮方法が、合成画像生成器の視覚的特徴を模倣するため、既存の法科学ツールが本物と偽物を区別するのが難しいのです。

*ある研究では、JPEG AIの初期ドラフトを含む圧縮アーティファクトを比較し、新しい方法がテキストをぼかす傾向があることを発見しました。これは、コーデックが証拠の連鎖に寄与する場合に軽視できない問題です。* 出典：https://arxiv.org/pdf/2411.06810

混乱の原因は、JPEG AIが法科学ツールが捕捉するように設計された生成システムと類似したモデルアーキテクチャを使用していることにあります。この類似性により、両者が似た視覚的痕跡を残し、法科学分析を複雑にします。

*JPEG AI圧縮後、最先端のアルゴリズムは、2025年3月の最近の論文によると、ローカリゼーションマップで本物のコンテンツと操作された領域を確実に分離できなくなります。左側のソース例は操作された/偽の画像で、標準的な法科学技術（中央の画像）では改ざんされた領域が明確に区別されます。しかし、JPEG AI圧縮は偽の画像に信頼性の層を付与します（右端の画像）。* 出典：https://arxiv.org/pdf/2412.03261

両モデルは量子化と呼ばれる技術を使用しており、ここではそれが重要です。量子化は連続データを離散点に変換するプロセスで、ファイルサイズの削減と機械学習モデルの効率化に不可欠です。JPEG AIでは、画像内の数値表現を簡略化することで、画像の保存や送信に必要なデータを削減します。しかし、これにより生成モデルから生じるパターンと似たパターンが導入され、法科学ツールを欺きます。

*新しい論文は、AI駆動の画像圧縮と実際のAI生成画像の方法論の類似性を示しています。* 出典：https://arxiv.org/pdf/2504.03191

量子化

この文脈での量子化は、画像の潜在表現の連続値を固定された離散ステップに変換することです。これによりエンコーディングが効率的になりますが、生成モデルのアーティファクトを模倣する構造的規則性を導入し、法科学ツールに挑戦する微妙かつ破壊的なパターンを生み出します。

**JPEG AI画像のための3つの法科学的指標**と題された論文では、JPEG AI圧縮の検出、再圧縮の特定、本物とAI生成画像の区別に、非ニューラルで解釈可能な方法を提案しています。

方法

色の相関

この論文は、JPEG AI向けに調整された3つの法科学的指標を紹介しています：色チャネルの相関、複数回圧縮による画像品質の歪み、潜在空間の量子化パターンです。JPEG AIの前処理は、色チャネル間に統計的依存関係を導入し、独自の署名を生み出します。例えば、RGB画像をYUV色空間に変換し、4:2:0クロマサブサンプリングを使用して、圧縮前にクロミナンスチャネルをダウンスケールします。これにより、赤、緑、青のチャネルの高周波残差間に、未圧縮画像や従来のJPEG、合成画像生成器とは異なる微妙な相関が生じます。

*JPEG AI圧縮が画像の色相関にどのように影響するかの比較。*

上記の論文からの画像は、JPEG AI圧縮が特に赤チャネルに焦点を当てて色相関にどのように影響するかを示しています。圧縮がチャネル間相関を大幅に増加させ、前処理ステップだけでもこれらの相関が顕著に増加することがわかります。

レート歪み

レート歪み指標は、ピーク信号対ノイズ比（PSNR）で測定される画像品質が、JPEG AIによる複数回の圧縮で予測可能な低下を示すことを追跡します。研究では、各圧縮ラウンドが徐々に小さく、しかし測定可能な品質損失を引き起こし、再圧縮の法科学的指標として機能できると示唆しています。従来のJPEGでは特定の画像ブロックを監視していましたが、JPEG AIのニューラルアーキテクチャでは、圧縮全体のビットレートとPSNRの変化を追跡する必要があります。

*異なるコーデックでの繰り返し圧縮が画像品質にどのように影響するかを示す図で、JPEG AIとhttps://arxiv.org/pdf/1802.01436で開発されたニューラルコーデックの結果を特徴づけ、両者は追加の圧縮ごとに、さらには低ビットレートでもPSNRが着実に低下します。対照的に、従来のJPEG圧縮は、ビットレートが高い場合を除き、複数回の圧縮で比較的安定した品質を維持します。*

チャート化されたレート歪み曲線は、JPEG AIと別のニューラルコーデックがすべてのビットレートで一貫したPSNRの低下を示し、従来のJPEGは高ビットレートでのみ顕著に劣化することを示しています。この動作は、JPEG AI画像の再圧縮検出のための明確な信号を提供します。

量子化

JPEG AIの最も難しい法科学的課題の一つは、拡散モデルによって作成された画像との視覚的類似性で、両者はエンコーダー-デコーダーアーキテクチャを使用して圧縮された潜在空間で画像を処理します。しかし、JPEG AIは効率的な圧縮のために潜在値を丸める量子化を適用し、これは生成モデルでは通常使用されません。新しい論文は、この違いを活用して、潜在表現が丸められた値にどのように整列するかを分析することで量子化の存在をテストする法科学的指標を設計します。これらのパターンは目に見えませんが、圧縮された本物の画像と合成画像を区別するのに役立ちます。

*平均フーリエスペクトルの例は、JPEG AI圧縮画像とMidjourney-V5やStable Diffusion XLのような拡散モデルによって生成された画像の両方が、周波数領域で規則的なグリッドパターンを示すことを明らかにします。対照的に、本物の画像にはこれらのパターンがありません。このスペクトル構造の重複は、法科学ツールが圧縮された本物の画像を合成画像と混同する理由を説明します。*

この指標は、さまざまな生成モデルや強い圧縮においても有効であり、圧縮された本物の画像と合成画像を区別する実際的な方法を提供します。

データとテスト

圧縮

JPEG AI圧縮を検出するための色相関指標をテストするために、研究者はRAISEデータセットの高品質な未圧縮画像を使用し、JPEG AIリファレンス実装を使用してさまざまなビットレートで圧縮しました。色チャネル相関に基づく単純なランダムフォレストを訓練し、画像ピクセルに基づいて訓練されたResNet50と比較しました。結果は、ResNet50が一致するテスト条件下では良好に機能する一方で、異なる圧縮レベルに一般化するのに苦労することを示しました。しかし、相関ベースのアプローチは、特にJPEG AIの前処理の影響が強い低ビットレートでより一貫していました。

*色相関特徴を使用したJPEG AI圧縮の検出精度を、複数のビットレートで比較しました。この方法は、圧縮アーティファクトが強い低ビットレートで最も効果的であり、ベースラインのResNet50モデルよりも見知らぬ圧縮レベルへの一般化が優れています。*

再圧縮

JPEG AI再圧縮の検出には、研究者は異なるビットレートで一度または二度圧縮された画像に対してレート歪み指標を使用しました。圧縮全体のビットレートとPSNRの変化を追跡するために17次元の特徴ベクトルを抽出し、これらの特徴に基づいて訓練されたランダムフォレストは、画像パッチに基づいて訓練されたResNet50を一貫して上回り、特に初期圧縮が強い場合に優れていました。この方法はさまざまなシナリオで安定しており、別のAIベースのコーデックにも一般化しました。

*レート歪み特徴に基づいて訓練されたランダムフォレストの分類精度の結果で、JPEG AI画像が再圧縮されたかどうかを検出します。この方法は、初期圧縮が強い場合（つまり、低ビットレートで）に最も効果的で、2番目の圧縮が1番目よりも穏やかな場合に特にピクセルベースのResNet50を上回ります。*

JPEG AIと合成画像

最後に、JPEG AI圧縮画像と完全な合成画像を区別するために、研究者はSynthbusterデータセットを使用し、RAISEデータベースからの本物の写真とさまざまなモデルから生成された画像を混ぜました。本物の画像を異なるビットレートでJPEG AIを使用して圧縮し、固定領域から抽出された量子Auch特徴に基づくランダムフォレスト分類器を使用しました。量子化ベースのアプローチは、特に圧縮アーティファクトがより顕著な低ビットレートで、ResNet50ベースラインを上回りました。

*Synthbusterの合成画像の例で、RAISE-1kデータセットの自然写真に着想を得たテキストプロンプトを使用して生成されました。画像は、さまざまな拡散モデルを使用して、様式化されたものや芸術的なレンダリングではなく、フォトリアリスティックなコンテンツとテクスチャを生成するように設計されたプロンプトで作成されました。* 出典：https://ieeexplore.ieee.org/document/10334046

*量子化特徴を使用したランダムフォレストの分類精度で、JPEG AI圧縮画像と合成画像を分離します。*

著者は、量子化特徴が圧縮強度や生成器の種類にわたって良好に一般化し、完全な整数ベクトルがJPEG AI圧縮画像の検出で高い精度を提供することを指摘しました。UMAP可視化は、JPEG AIと合成画像の明確な分離を示し、低ビットレートではクラス間の距離が増加しました。

*量子化特徴に基づくJPEG AI圧縮画像と合成画像の2次元UMAP可視化。左のプロットは、低いJPEG AIビットレートが合成画像からより大きな分離を生み出すことを示し、右のプロットは、異なる生成器からの画像が特徴空間内で明確にクラスタリングすることを示しています。*

最後に、研究者は、JPEG再圧縮や画像リサイズなどの典型的な後処理下でのこれらの特徴の堅牢性を評価しました。処理が重くなるにつれて性能は低下しましたが、その低下は徐々であり、このアプローチにある程度の耐性があることを示しています。

初公開：2025年4月8日火曜日

Topaz DeNoise AI：2025年のベストノイズリダクションツール-完全ガイド競争の激しいデジタル写真の世界では、画像の鮮明さが最も重要です。あらゆるレベルのフォトグラファーが、デジタルノイズに悩まされています。Topaz DeNoise AIは、人工知能を活用し、重要なディテールを維持しながらノイズ除去に取り組む最先端のソリューションとして登場しました。この詳細なレビューでは、この革新的なソフトウェアが2025年の写真ワークフローをどのように変えることができるのか、その主

マスターエメラルド海賊ヌズロッケ究極のサバイバル＆ストラテジーガイド Emerald Kaizoは、これまでに考案されたポケモンのROMハックの中で最も手強いものの1つである。Nuzlockeの実行を試みることは飛躍的に挑戦を増加させるが、綿密な計画と戦略的な実行によって勝利は達成可能である。この決定版ガイドでは、ハードコア・ヌズロッケのルールでエメラルドのかいぞくを制覇するために必要なツール、実戦で試された戦術、綿密なAI分析が紹介されている。ポケモンマスターの究

AIを駆使したカバーレター：ジャーナル投稿のためのエキスパートガイド競争の激しい今日の学術出版環境では、効果的なカバーレターを作成することが、原稿の採否を決定的に左右します。ChatGPTのようなAIを搭載したツールが、この重要なタスクをいかに効率化し、ジャーナル編集者の目を引く洗練されたプロフェッショナルなレターを作成できるかをご覧ください。ChatGPTの包括的なガイドでは、投稿パッケージを最適化し、出版を最大限に成功させるための戦略をステップごとに紹介してい

コメント (22)

0/200

提出する

ArthurSanchez

2025年8月4日 15:48:52 JST

This JPEG AI thing is wild! Shrinking files while keeping images crisp? I'm all for it, but wonder if it'll make fake images too convincing. 😅

JohnYoung

2025年8月1日 11:48:18 JST

This JPEG AI thing is wild! Shrinking file sizes while keeping images crisp? That's like magic for my phone storage. Can't wait to see how it changes photo sharing! 📸

LawrenceLopez

2025年4月23日 17:10:33 JST

JPEG AI é incrível! Comprime imagens muito bem e ainda assim elas parecem ótimas. Economizei muito espaço no meu celular. Mas às vezes, as imagens parecem um pouco artificiais, o que é estranho. Ainda assim, é essencial para quem lida com muitas fotos! 😊

HaroldLopez

2025年4月23日 10:34:54 JST

JPEG AI는 꽤 괜찮지만, 실제와 합성 이미지의 경계를 흐리게 하는 것이 이상해요. 온라인에서 보는 모든 것을 의심하게 만드네요! 🤔 그래도 공간을 절약하는 데는 유용해요.

JerryGonzález

2025年4月23日 7:00:58 JST

JPEG AIは便利ですが、リアルと合成の画像の境界が曖昧になるのは不思議です。オンラインで見るもの全てに疑問を持ってしまいます！🤔 それでも、スペースを節約するのに役立ちますね。

WillMitchell

2025年4月22日 21:18:56 JST

JPEG AI es increíble! Comprime las imágenes muy bien y aún así se ven geniales. He ahorrado mucho espacio en mi teléfono. Pero a veces, las imágenes parecen un poco artificiales, lo que es raro. Aún así, es imprescindible para quien maneja muchas fotos! 😎

トップニュース

2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します AI BuilderとPower Automateがドキュメントの要約を革新 Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します

もっと

特集