オプション
ニュース
グーグルの最新AIモデル「ジェミニ」、テストで安全性スコアが低下

グーグルの最新AIモデル「ジェミニ」、テストで安全性スコアが低下

2025年9月19日
98

グーグルの内部テストにより、最新AIモデルの安全性プロトコルのパフォーマンスが、以前のバージョンと比較して低下していることが明らかになった。新たに公表されたベンチマークによると、Gemini 2.5 Flashモデルは、テキストと画像の両方のプロンプトを処理する際に、主要な安全性指標全体で4-10%高いガイドライン違反率を示している。

テクノロジージャイアントの自動化された評価は、憂慮すべき傾向を浮き彫りにしている。境界テスト用のプロンプトが表示された場合、Gemini 2.5 Flashは、Gemini 2.0の前モデルよりも、確立されたコンテンツの安全ラインを超える頻度が高い。Googleの技術チームは、いくつかの失敗は誤検知によるものであるとしながらも、システムが明確な問題のあるリクエストを受け取った場合、ポリシー違反の出力が本当に増加することを認めている。

この安全性の後退は、より寛容なAIシステムへの、より幅広い業界のシフトと一致している。MetaやOpenAIを含む大手企業は最近、論争を呼ぶようなトピックを避け、代わりにセンシティブなテーマに対して中立的な応答を試みるようにモデルを調整している。しかし、このような変更は時として意図しない結果を生む。今週初めにChatGPTが一時的に未成年者に不適切なコンテンツ生成を許可したように。

グーグルの報告によれば、新モデルは、倫理的に問題のある指示を含め、忠実な指示に従うことに優れている。独自のテストによると、Gemini 2.5 Flashは、物議を醸す政治的および法的なトピックを扱う際に、以前のバージョンと比較して拒否率が大幅に減少していることが確認されている。

AIの安全性の専門家は、グーグルの報告における限られた情報開示について懸念を表明している。より詳細な違反ケーススタディがなければ、外部の評価者はこれらの安全性後退の現実世界での深刻さを評価するのに苦労する。同社は以前にも、今年初めのフラッグシップモデル「ジェミニ2.5プロ」を含め、安全に関する文書化の遅れや不完全さについて批判に直面したことがある。

無制限の指示追従能力と強固なコンテンツ保護措置の間の緊張は、AI開発者に継続的な課題を提示している。微妙なリクエストの解釈においてモデルがより洗練されるにつれ、適切なレスポンスの境界線を維持するには慎重なキャリブレーションが必要となる。

関連記事
GoogleフォトがAIを活用し、『クルーレス』の象徴的なクローゼットを再現 GoogleフォトがAIを活用し、『クルーレス』の象徴的なクローゼットを再現 Googleフォトは水曜日、AIを活用した新機能を発表した。この機能により、まもなく自分の服の写真をデジタルクローゼットに変換できるようになり、新しいコーディネートを考えたり、バーチャルで試着したりできるようになる。このコンセプトは、映画『クルーレス』に登場するシェールの象徴的なバーチャルワードローブから明らかに着想を得たもので、彼女は何を着るか決める際に、数多くのコーディネートの中から自由に選ん
Google I/O 2026で、Gmailの受信トレイとの音声操作機能が発表された Google I/O 2026で、Gmailの受信トレイとの音声操作機能が発表された Googleは引き続き、AIをメール受信トレイに組み込んでいます。火曜日に開催された開発者向けカンファレンス「IO 2026」で、同社はGmailの「AI Inbox」機能を対話型AIで拡張し、ユーザーが検索語句だけに頼るのではなく、受信トレイの内容について質問できるようになりました。Googleによると、Gmail Liveと名付けられたこのGemini AI搭載ツールは、受信トレイの奥深くに埋
Google、インドでChrome向け「Gemini」の提供を開始 Google、インドでChrome向け「Gemini」の提供を開始 水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
関連特集おすすめ
動画作成 脚本作成とビジュアルストーリーテリングに最適なAIテキスト・トゥ・ビデオ・プラットフォーム
脚本作成とビジュアルストーリーテリングに最適なAIテキスト・トゥ・ビデオ・プラットフォーム

2026年最新・最高のAIテキストから動画生成プラットフォーム:脚本作成やビジュアルストーリーテリングに最適なツールをご紹介。テキストを魅力的な動画に変える、画期的なソリューションをご覧ください。毎週更新されるランキングと実地テストに基づき、無料版と有料版の比較も可能です。創造性と生産性を高める、あなたにぴったりのプラットフォームを見つけましょう。XIX.AIで厳選されたラインナップをご覧ください。

10 ツール
xix.ai
チャットボット AIマルチエージェントオーケストレーター:自然言語を通じて複雑な自動化ワークフローを設計する
AIマルチエージェントオーケストレーター:自然言語を通じて複雑な自動化ワークフローを設計する

2026年最新情報:自然言語を通じて複雑な自動化ワークフローを設計するための最適なAIマルチエージェントオーケストレーターを発見しましょう。当社が厳選したリストには、タスクのシームレスな自動化とインテリジェントなプロセス管理に最適な高評価の強力なプラットフォームが掲載されています。無料オプションと有料オプションを実際の使用例を交えて比較しましょう。XIX.AIが毎週更新する専門的なランキングを活用して、AIの力を最大限に引き出しましょう。

10 ツール
xix.ai
画像編集 最高のAIノイズリダクションソフトウェア:低照度の夜間撮影で発生する粒状ノイズやアーチファクトを除去する
最高のAIノイズリダクションソフトウェア:低照度の夜間撮影で発生する粒状ノイズやアーチファクトを除去する

2026年に最も優れたAIノイズリダクションソフトウェアを探そう。低照度の夜間撮影に最適なこれらのツールは、無料版と有料版を比較しており、実際のテスト結果や毎週更新されるランキングも掲載されている。粒状ノイズや不要なアーティファクトを簡単に除去できる。XIX.AIでAIの力を最大限に活用しよう。

10 ツール
xix.ai
チャットボット おすすめのAIガールフレンド生成ツール:個性や趣味、バックストーリーを自由にデザイン
おすすめのAIガールフレンド生成ツール:個性や趣味、バックストーリーを自由にデザイン

XIX.AIで、2026年最高のカスタムAIガールフレンド生成ツールを発見しましょう。ユニークな性格、趣味、そして深いバックストーリーをデザインするための、厳選された高評価リストをご覧ください。実際の利用体験に基づく情報を参考に、無料版と有料版の比較も可能です。今すぐ、あなたにぴったりのクリエイティブなパートナーを手に入れましょう。

10 ツール
xix.ai
生産性 AIアーキテクチャ設計者:自然言語を用いてスケーラブルなシステムアーキテクチャを構築する
AIアーキテクチャ設計者:自然言語を用いてスケーラブルなシステムアーキテクチャを構築する

XIX.AIで、2026年最高のAIアーキテクチャ設計ツールをご覧ください。厳選された高評価のリストには、自然言語を用いてスケーラブルなシステムアーキテクチャを構築するための、強力で革新的なソリューションが揃っています。実際の事例に基づく知見をもとに、無料版と有料版の機能を比較しましょう。今すぐAI開発の競争力を高め、開発プロセスを効率化しましょう。

10 ツール
xix.ai
漫画制作 AIキャラクタープロフィール作成ツール:漫画の主人公たちに詳細な背景設定やビジュアル参考資料を生成する
AIキャラクタープロフィール作成ツール:漫画の主人公たちに詳細な背景設定やビジュアル参考資料を生成する

2026年最新の最高のAIキャラクタープロフィール作成ツール:マンガの主人公たちに詳細な背景設定や視覚的参考資料を生成するための高評価ツールを発見しましょう。当社が厳選し、毎週更新しているこのリストでは、実際のテスト結果に基づいて無料版と有料版を比較しています。強力で革新的なソリューションを使って魅力的なキャラクターを創造し、創作作業の効率を高めましょう。XIX.AIでランキングを確認し、今日すぐに完璧なストーリーテリングの助けとなるツールを手に入れてください。

10 ツール
xix.ai
コメント (5)
0/500
BillyYoung
BillyYoung 2026年2月8日 23:00:26 JST

Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.

BrianThomas
BrianThomas 2026年1月14日 15:30:34 JST

Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔

SamuelEvans
SamuelEvans 2025年12月5日 19:30:31 JST

Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔

WalterKing
WalterKing 2025年11月27日 1:31:08 JST

Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!

StevenMartínez
StevenMartínez 2025年10月25日 3:30:31 JST

C'est inquiétant de voir les scores de sécurité baisser avec les nouvelles versions d'IA. Est-ce qu'ils privilégient la vitesse au détriment de la fiabilité ? J'espère que ce n'est pas le début d'une tendance dangereuse dans le développement de l'IA 🤔

OR