オプション
ニュース
JPEG AI:実際の画像と合成画像の間の境界線を曖昧にする

JPEG AI:実際の画像と合成画像の間の境界線を曖昧にする

2025年4月20日
147

今年2月に、JPEG AI国際標準が数年の開発を経て登場しました。この新標準は、機械学習を活用して画像ファイルのサイズを縮小しつつ、知覚的品質を維持することで、画像の保存や送信を容易にします。しかし、驚くべきことに、この可能性にもかかわらず、JPEG AIはニュースの見出しであまり話題になりませんでした。なぜでしょうか?実は、この画期的な発表の中心となる文書が、Arxivのような通常そのような研究を公開するプラットフォームでも無料で入手できなかったのです。皮肉なことに、ArxivではJPEG AIに関するいくつかの研究が公開されており、その独特な圧縮アーティファクトや法科学への影響が探求されています。

JPEG AIの公式公開ストリームからの、ピーク信号対ノイズ比(PSNR)とJPEG AIのML拡張アプローチの比較。出典:https://jpeg.org/jpegai/documentation.html*JPEG AIの公式公開ストリームからの、ピーク信号対ノイズ比(PSNR)とJPEG AIのML拡張アプローチの比較。* 出典:https://jpeg.org/jpegai/documentation.html

例えば、ある研究では、JPEG AIがテキストをぼかす傾向があることが強調されており、これは画像が法的文 Pulse で使用される場合に明確さが重要な問題となります。この問題の原因は? JPEG AIの圧縮方法が、合成画像生成器の視覚的特徴を模倣するため、既存の法科学ツールが本物と偽物を区別するのが難しいのです。

ある研究では、JPEG AIの初期ドラフトを含む圧縮アーティファクトを比較し、新しい方法がテキストをぼかす傾向があることを発見しました。これは、コーデックが証拠の連鎖に寄与する場合に軽視できない問題です。出典:https://arxiv.org/pdf/2411.06810*ある研究では、JPEG AIの初期ドラフトを含む圧縮アーティファクトを比較し、新しい方法がテキストをぼかす傾向があることを発見しました。これは、コーデックが証拠の連鎖に寄与する場合に軽視できない問題です。* 出典:https://arxiv.org/pdf/2411.06810

混乱の原因は、JPEG AIが法科学ツールが捕捉するように設計された生成システムと類似したモデルアーキテクチャを使用していることにあります。この類似性により、両者が似た視覚的痕跡を残し、法科学分析を複雑にします。

JPEG AI圧縮後、最先端のアルゴリズムは、2025年3月の最近の論文によると、ローカリゼーションマップで本物のコンテンツと操作された領域を確実に分離できなくなります。左側のソース例は操作された/偽の画像で、標準的な法科学技術(中央の画像)では改ざんされた領域が明確に区別されます。しかし、JPEG AI圧縮は偽の画像に信頼性の層を付与します(右端の画像)。出典:https://arxiv.org/pdf/2412.03261*JPEG AI圧縮後、最先端のアルゴリズムは、2025年3月の最近の論文によると、ローカリゼーションマップで本物のコンテンツと操作された領域を確実に分離できなくなります。左側のソース例は操作された/偽の画像で、標準的な法科学技術(中央の画像)では改ざんされた領域が明確に区別されます。しかし、JPEG AI圧縮は偽の画像に信頼性の層を付与します(右端の画像)。* 出典:https://arxiv.org/pdf/2412.03261

両モデルは量子化と呼ばれる技術を使用しており、ここではそれが重要です。量子化は連続データを離散点に変換するプロセスで、ファイルサイズの削減と機械学習モデルの効率化に不可欠です。JPEG AIでは、画像内の数値表現を簡略化することで、画像の保存や送信に必要なデータを削減します。しかし、これにより生成モデルから生じるパターンと似たパターンが導入され、法科学ツールを欺きます。

新しい論文は、AI駆動の画像圧縮と実際のAI生成画像の方法論の類似性を示しています。出典:https://arxiv.org/pdf/2504.03191*新しい論文は、AI駆動の画像圧縮と実際のAI生成画像の方法論の類似性を示しています。* 出典:https://arxiv.org/pdf/2504.03191

量子化

この文脈での量子化は、画像の潜在表現の連続値を固定された離散ステップに変換することです。これによりエンコーディングが効率的になりますが、生成モデルのアーティファクトを模倣する構造的規則性を導入し、法科学ツールに挑戦する微妙かつ破壊的なパターンを生み出します。

**JPEG AI画像のための3つの法科学的指標**と題された論文では、JPEG AI圧縮の検出、再圧縮の特定、本物とAI生成画像の区別に、非ニューラルで解釈可能な方法を提案しています。

方法

色の相関

この論文は、JPEG AI向けに調整された3つの法科学的指標を紹介しています:色チャネルの相関、複数回圧縮による画像品質の歪み、潜在空間の量子化パターンです。JPEG AIの前処理は、色チャネル間に統計的依存関係を導入し、独自の署名を生み出します。例えば、RGB画像をYUV色空間に変換し、4:2:0クロマサブサンプリングを使用して、圧縮前にクロミナンスチャネルをダウンスケールします。これにより、赤、緑、青のチャネルの高周波残差間に、未圧縮画像や従来のJPEG、合成画像生成器とは異なる微妙な相関が生じます。

JPEG AI圧縮が画像の色相関にどのように影響するかの比較、特に赤チャネルに焦点を当てています。パネル(a)は未圧縮画像とJPEG AI圧縮画像を比較し、圧縮がチャネル間相関を大幅に増加させることを示しています。パネル(b)は、JPEG AIの前処理(色変換とサブサンプリングのみ)の効果を分離し、このステップだけでも相関が顕著に増加することを示しています。パネル(c)は、従来のJPEG圧縮も相関をわずかに増加させるが、同じ程度ではないことを示しています。パネル(d)は、合成画像を検討し、Midjourney-V5とFireflyが中程度の相関増加を示す一方で、他のものは未圧縮レベルに近いことを示しています。*JPEG AI圧縮が画像の色相関にどのように影響するかの比較。*

上記の論文からの画像は、JPEG AI圧縮が特に赤チャネルに焦点を当てて色相関にどのように影響するかを示しています。圧縮がチャネル間相関を大幅に増加させ、前処理ステップだけでもこれらの相関が顕著に増加することがわかります。

レート歪み

レート歪み指標は、ピーク信号対ノイズ比(PSNR)で測定される画像品質が、JPEG AIによる複数回の圧縮で予測可能な低下を示すことを追跡します。研究では、各圧縮ラウンドが徐々に小さく、しかし測定可能な品質損失を引き起こし、再圧縮の法科学的指標として機能できると示唆しています。従来のJPEGでは特定の画像ブロックを監視していましたが、JPEG AIのニューラルアーキテクチャでは、圧縮全体のビットレートとPSNRの変化を追跡する必要があります。

異なるコーデックでの繰り返し圧縮が画像品質にどのように影響するかを示す図で、JPEG AIとhttps://arxiv.org/pdf/1802.01436で開発されたニューラルコーデックは、追加の圧縮ごとにPSNRが着実に低下することを示しています—低ビットレートでも同様です。対照的に、従来のJPEGはビットレートが高い場合を除き、複数回の圧縮で比較的安定した品質を維持します。このパターンは、AIベースのコーデックで再圧縮が測定可能な痕跡を残す例を示し、潜在的な法科学的信号を提供します。*異なるコーデックでの繰り返し圧縮が画像品質にどのように影響するかを示す図で、JPEG AIとhttps://arxiv.org/pdf/1802.01436で開発されたニューラルコーデックの結果を特徴づけ、両者は追加の圧縮ごとに、さらには低ビットレートでもPSNRが着実に低下します。対照的に、従来のJPEG圧縮は、ビットレートが高い場合を除き、複数回の圧縮で比較的安定した品質を維持します。*

チャート化されたレート歪み曲線は、JPEG AIと別のニューラルコーデックがすべてのビットレートで一貫したPSNRの低下を示し、従来のJPEGは高ビットレートでのみ顕著に劣化することを示しています。この動作は、JPEG AI画像の再圧縮検出のための明確な信号を提供します。

量子化

JPEG AIの最も難しい法科学的課題の一つは、拡散モデルによって作成された画像との視覚的類似性で、両者はエンコーダー-デコーダーアーキテクチャを使用して圧縮された潜在空間で画像を処理します。しかし、JPEG AIは効率的な圧縮のために潜在値を丸める量子化を適用し、これは生成モデルでは通常使用されません。新しい論文は、この違いを活用して、潜在表現が丸められた値にどのように整列するかを分析することで量子化の存在をテストする法科学的指標を設計します。これらのパターンは目に見えませんが、圧縮された本物の画像と合成画像を区別するのに役立ちます。

平均フーリエスペクトルの例は、JPEG AI圧縮画像とMidjourney-V5やStable Diffusion XLのような拡散モデルによって生成された画像の両方が、周波数領域で規則的なグリッドパターンを示すことを明らかにします—これはアップサンプリングに一般的に関連するアーティファクトです。対照的に、本物の画像にはこれらのパターンがありません。このスペクトル構造の重複は、法科学ツールが圧縮された本物の画像を合成画像と混同する理由を説明します。*平均フーリエスペクトルの例は、JPEG AI圧縮画像とMidjourney-V5やStable Diffusion XLのような拡散モデルによって生成された画像の両方が、周波数領域で規則的なグリッドパターンを示すことを明らかにします。対照的に、本物の画像にはこれらのパターンがありません。このスペクトル構造の重複は、法科学ツールが圧縮された本物の画像を合成画像と混同する理由を説明します。*

この指標は、さまざまな生成モデルや強い圧縮においても有効であり、圧縮された本物の画像と合成画像を区別する実際的な方法を提供します。

データとテスト

圧縮

JPEG AI圧縮を検出するための色相関指標をテストするために、研究者はRAISEデータセットの高品質な未圧縮画像を使用し、JPEG AIリファレンス実装を使用してさまざまなビットレートで圧縮しました。色チャネル相関に基づく単純なランダムフォレストを訓練し、画像ピクセルに基づいて訓練されたResNet50と比較しました。結果は、ResNet50が一致するテスト条件下では良好に機能する一方で、異なる圧縮レベルに一般化するのに苦労することを示しました。しかし、相関ベースのアプローチは、特にJPEG AIの前処理の影響が強い低ビットレートでより一貫していました。

色相関特徴を使用したJPEG AI圧縮の検出精度を、複数のビットレートで比較しました。この方法は、圧縮アーティファクトが強い低ビットレートで最も効果的であり、ベースラインのResNet50モデルよりも見知らぬ圧縮レベルへの一般化が優れています。*色相関特徴を使用したJPEG AI圧縮の検出精度を、複数のビットレートで比較しました。この方法は、圧縮アーティファクトが強い低ビットレートで最も効果的であり、ベースラインのResNet50モデルよりも見知らぬ圧縮レベルへの一般化が優れています。*

再圧縮

JPEG AI再圧縮の検出には、研究者は異なるビットレートで一度または二度圧縮された画像に対してレート歪み指標を使用しました。圧縮全体のビットレートとPSNRの変化を追跡するために17次元の特徴ベクトルを抽出し、これらの特徴に基づいて訓練されたランダムフォレストは、画像パッチに基づいて訓練されたResNet50を一貫して上回り、特に初期圧縮が強い場合に優れていました。この方法はさまざまなシナリオで安定しており、別のAIベースのコーデックにも一般化しました。

レート歪み特徴に基づいて訓練されたランダムフォレストの分類精度の結果で、JPEG AI画像が再圧縮されたかどうかを検出します。この方法は、初期圧縮が強い場合(つまり、低ビットレートで)に最も効果的で、2番目の圧縮が1番目よりも穏やかな場合に特にピクセルベースのResNet50を上回ります。*レート歪み特徴に基づいて訓練されたランダムフォレストの分類精度の結果で、JPEG AI画像が再圧縮されたかどうかを検出します。この方法は、初期圧縮が強い場合(つまり、低ビットレートで)に最も効果的で、2番目の圧縮が1番目よりも穏やかな場合に特にピクセルベースのResNet50を上回ります。*

JPEG AIと合成画像

最後に、JPEG AI圧縮画像と完全な合成画像を区別するために、研究者はSynthbusterデータセットを使用し、RAISEデータベースからの本物の写真とさまざまなモデルから生成された画像を混ぜました。本物の画像を異なるビットレートでJPEG AIを使用して圧縮し、固定領域から抽出された量子Auch特徴に基づくランダムフォレスト分類器を使用しました。量子化ベースのアプローチは、特に圧縮アーティファクトがより顕著な低ビットレートで、ResNet50ベースラインを上回りました。

Synthbusterの合成画像の例で、RAISE-1kデータセットの自然写真に着想を得たテキストプロンプトを使用して生成されました。画像は、さまざまな拡散モデルを使用して、様式化されたものや芸術的なレンダリングではなく、フォトリアリスティックなコンテンツとテクスチャを生成するように設計されたプロンプトで作成されました。データセットは、本物と生成された画像を区別するためのテスト方法に焦点を当てています。*Synthbusterの合成画像の例で、RAISE-1kデータセットの自然写真に着想を得たテキストプロンプトを使用して生成されました。画像は、さまざまな拡散モデルを使用して、様式化されたものや芸術的なレンダリングではなく、フォトリアリスティックなコンテンツとテクスチャを生成するように設計されたプロンプトで作成されました。* 出典:https://ieeexplore.ieee.org/document/10334046

量子化特徴を使用したランダムフォレストの分類精度で、JPEG AI圧縮画像と合成画像を分離します。*量子化特徴を使用したランダムフォレストの分類精度で、JPEG AI圧縮画像と合成画像を分離します。*

著者は、量子化特徴が圧縮強度や生成器の種類にわたって良好に一般化し、完全な整数ベクトルがJPEG AI圧縮画像の検出で高い精度を提供することを指摘しました。UMAP可視化は、JPEG AIと合成画像の明確な分離を示し、低ビットレートではクラス間の距離が増加しました。

量子化特徴に基づくJPEG AI圧縮画像と合成画像の2次元UMAP可視化。左のプロットは、低いJPEG AIビットレートが合成画像からより大きな分離を生み出すことを示し、右のプロットは、異なる生成器からの画像が特徴空間内で明確にクラスタリングすることを示しています。*量子化特徴に基づくJPEG AI圧縮画像と合成画像の2次元UMAP可視化。左のプロットは、低いJPEG AIビットレートが合成画像からより大きな分離を生み出すことを示し、右のプロットは、異なる生成器からの画像が特徴空間内で明確にクラスタリングすることを示しています。*

最後に、研究者は、JPEG再圧縮や画像リサイズなどの典型的な後処理下でのこれらの特徴の堅牢性を評価しました。処理が重くなるにつれて性能は低下しましたが、その低下は徐々であり、このアプローチにある程度の耐性があることを示しています。

初公開:2025年4月8日火曜日

関連記事
AI駆動の音楽作成:楽曲とビデオを簡単に制作 AI駆動の音楽作成:楽曲とビデオを簡単に制作 音楽作成は時間、資源、専門知識を必要とする複雑なプロセスです。人工知能はこのプロセスを変革し、シンプルで誰でも利用できるものにしました。このガイドでは、AIがどのようにして誰でも無料でユニークな楽曲やビジュアルを制作できるようにするか、新たな創造的可能性を解き放つ方法を紹介します。直感的で使いやすいインターフェースと先進的なAIを備えたプラットフォームを探索し、音楽のアイデアを高コストなしで現実に
AI駆動の塗り絵ブック作成:包括的ガイド AI駆動の塗り絵ブック作成:包括的ガイド 塗り絵ブックのデザインは、芸術的表現とユーザーのリラックス体験を組み合わせた報われる追求です。しかし、そのプロセスは労働集約的です。幸い、AIツールは高品質で均一な塗り絵ページを簡単に作成できます。このガイドは、AIを使用して一貫したスタイルと最適な効率に焦点を当てた塗り絵ブック作成のステップごとのアプローチを提供します。主なポイントAIプロンプトツールを使用して、詳細で構造化された塗り絵ページの
QodoがGoogle Cloudと提携し、開発者向け無料AIコードレビューを提供 QodoがGoogle Cloudと提携し、開発者向け無料AIコードレビューを提供 Qodo、イスラエル拠点のAIコーディングスタートアップは、コード品質に焦点を当て、Google Cloudと提携し、AI生成ソフトウェアの完全性を強化。企業がコーディングにAIをますます活用する中、堅牢な監視と品質保証ツールの需要が増加。QodoのCEOイタマール・フリードマンは、AI生成コードが現代の開発の中心であると指摘。「AIがすべてのコードを書く未来を想像してください。人間がすべてをレビ
コメント (22)
0/200
ArthurSanchez
ArthurSanchez 2025年8月4日 15:48:52 JST

This JPEG AI thing is wild! Shrinking files while keeping images crisp? I'm all for it, but wonder if it'll make fake images too convincing. 😅

JohnYoung
JohnYoung 2025年8月1日 11:48:18 JST

This JPEG AI thing is wild! Shrinking file sizes while keeping images crisp? That's like magic for my phone storage. Can't wait to see how it changes photo sharing! 📸

LawrenceLopez
LawrenceLopez 2025年4月23日 17:10:33 JST

JPEG AI é incrível! Comprime imagens muito bem e ainda assim elas parecem ótimas. Economizei muito espaço no meu celular. Mas às vezes, as imagens parecem um pouco artificiais, o que é estranho. Ainda assim, é essencial para quem lida com muitas fotos! 😊

HaroldLopez
HaroldLopez 2025年4月23日 10:34:54 JST

JPEG AI는 꽤 괜찮지만, 실제와 합성 이미지의 경계를 흐리게 하는 것이 이상해요. 온라인에서 보는 모든 것을 의심하게 만드네요! 🤔 그래도 공간을 절약하는 데는 유용해요.

JerryGonzález
JerryGonzález 2025年4月23日 7:00:58 JST

JPEG AIは便利ですが、リアルと合成の画像の境界が曖昧になるのは不思議です。オンラインで見るもの全てに疑問を持ってしまいます!🤔 それでも、スペースを節約するのに役立ちますね。

WillMitchell
WillMitchell 2025年4月22日 21:18:56 JST

JPEG AI es increíble! Comprime las imágenes muy bien y aún así se ven geniales. He ahorrado mucho espacio en mi teléfono. Pero a veces, las imágenes parecen un poco artificiales, lo que es raro. Aún así, es imprescindible para quien maneja muchas fotos! 😎

トップに戻ります
OR