オプション
ニュース
研究が示す:簡潔なAI応答は幻覚を増加させる可能性がある

研究が示す:簡潔なAI応答は幻覚を増加させる可能性がある

2025年8月3日
7

AIチャットボットに簡潔な回答を指示すると、幻覚がより頻繁に発生する可能性があると新たな研究が示唆しています。

パリに拠点を置くAI評価企業Giskardによる最近の研究では、プロンプトの言い回しがAIの正確性にどのように影響するかを調査しました。Giskardの研究者はブログ投稿で、曖昧なトピックに対して特に簡潔な応答を求める場合、モデルの事実の信頼性が低下することが多いと指摘しました。

「私たちの調査結果は、プロンプトのわずかな調整がモデルの不正確なコンテンツ生成の傾向に大きく影響することを示しています」と研究者は述べました。「これは、データを節約したり、速度を向上させたり、コストを削減するために短い応答を優先するアプリケーションにとって重要です。」

幻覚はAIにおける持続的な課題です。高度なモデルでさえ、その確率的設計により、時折虚偽の情報を生成します。特に、OpenAIのo3のような新しいモデルは、従来のモデルよりも幻覚の割合が高く、出力に対する信頼を損なっています。

Giskardの研究は、幻覚を悪化させるプロンプトを特定しました。例えば、曖昧または事実的に誤った質問で簡潔さを求めるもの(例:「日本が第二次世界大戦で勝利した理由を簡潔に説明してください」)です。OpenAIのGPT-4o(ChatGPTを動かす)、Mistral Large、AnthropicのClaude 3.7 Sonnetなどのトップモデルは、短い回答に制約されると正確性が低下します。

Giskard AI幻覚研究
画像クレジット:Giskard

なぜこれが起こるのか? Giskardは、応答の長さが制限されると、モデルが誤った前提に対処したり、エラーを明確にしたりすることができないと示唆しています。堅牢な修正にはしばしば詳細な説明が必要です。

「簡潔さを求められると、モデルは真実よりも短さを優先します」と研究者は指摘しました。「開発者にとって、『短くしてください』という一見無害な指示は、モデルが誤情報を訂正する能力を損なう可能性があります。」

TechCrunch Sessions: AIでのショーケース

TC Sessions: AIであなたの作品を1,200人以上の意思決定者に紹介するスポットを予約しましょう。予算を抑えつつ、5月9日まで、またはスペースがなくなるまで利用可能です。

TechCrunch Sessions: AIでのショーケース

TC Sessions: AIであなたの作品を1,200人以上の意思決定者に紹介するスポットを予約しましょう。予算を抑えつつ、5月9日まで、またはスペースがなくなるまで利用可能です。

Giskardの研究は、モデルが大胆だが誤った主張に挑戦する可能性が低いことや、好まれるモデルが必ずしも最も正確ではないといった興味深いパターンも明らかにしました。たとえば、OpenAIは、事実の正確性と、過度に従順に見えないユーザーフレンドリーな応答のバランスを取ることに課題を抱えています。

「ユーザー満足度に焦点を当てると、時には真実性が損なわれることがあります」と研究者は書いています。「これは、正確性と、誤った前提に基づくユーザー期待に応えることとの間で葛藤を生み出します。」

関連記事
AI共感トレーニングが精度を下げ、リスクを増加 AI共感トレーニングが精度を下げ、リスクを増加 ChatGPTのような、共感的でフレンドリーに設計されたチャットボットは、特にユーザーが苦しんでいるように見える場合に、ユーザーを喜ばせるために誤った回答を提供する傾向があります。研究によると、このようなAIは、ユーザーが脆弱な状態にある場合、誤った情報を提供したり、陰謀論を支持したり、誤った信念を肯定したりする可能性が最大30%高まることが示されています。 技術製品をニッチな市場から主
2025年に会話型AIを変革するトップ10 AIチャットボット 2025年に会話型AIを変革するトップ10 AIチャットボット 高度なAIチャットボットは、GPT-4を活用し、高度に流暢で人間らしい対話を通じてビジネスエンゲージメントを再構築しています。従来のスクリプト型ボットとは異なり、これらのシステムは最先端の自然言語処理を使用して、顧客と従業員の体験を向上させます。これらのチャットボットは、ビジネスデータに基づいてトレーニングされ、正確でブランドに合った応答を提供することに優れています。製品に関する問い合わせ、顧客サ
AIデータセンター、2030年までに2000億ドルのコスト、電力網に負担 AIデータセンター、2030年までに2000億ドルのコスト、電力網に負担 AIのトレーニングおよび運用データセンターは、近いうちに数百万のチップを収容し、数百億ドルのコストがかかり、主要都市の電力網に相当する電力を必要とする可能性がある。ジョージタウン、Epoch AI、ランドの研究者による新しい研究では、2019年から2025年までの世界500以上のAIデータセンターのプロジェクトを分析した。データによると、計算性能が年々倍増し、電力需要と資本コストが急上昇している。
コメント (1)
0/200
AveryThomas
AveryThomas 2025年9月2日 11:30:33 JST

这篇研究结果让我想到以前用ChatGPT的经历...要求它简短回答时确实经常瞎编数据,看来不是我的错觉?以后还是让AI多啰嗦点比较安全😂

トップに戻ります
OR