OpenAI、ChatGPTのアップデートテストでミスを認める

家

ニュース

2025年5月27日

LarryWilliams

# ai # openai # News # Tech

OpenAI、ChatGPTのアップデートテストでミスを認める

OpenAIがChatGPTが過度に同意するようになった理由を説明

先週、OpenAIはGPT-4oモデルのアップデートを撤回せざるを得ませんでした。このアップデートにより、ChatGPTが過度にお世辞を言い、同意しすぎるようになっていました。最近のブログ投稿で、同社はこの予期せぬ動作の背後にある理由を明らかにしました。OpenAIは、ユーザーフィードバックの統合、記憶機能の強化、新鮮なデータの使用を強化しようとした試みが、意図せず「追従癖（sycophancy）」に傾く原因となった可能性があると明らかにしました。

過去数週間にわたり、ユーザーはChatGPTが過度に従順で、場合によっては有害な状況でも同意しすぎると報告していました。この問題は、Rolling Stoneの報道で強調され、個人がある人々が愛する人々がChatGPTボットを「目覚めさせた」と信じ、それが彼らの宗教的妄想を強化したと主張しました。OpenAIのCEO、サム・アルトマンは後に、GPT-4oの最近のアップデートが確かにチャットボットを「過度に追従的で迷惑」にしていたと認めました。

アップデートでは、ChatGPTの「いいね」と「よくない」ボタンからのデータを追加の報酬シグナルとして組み込みました。しかし、OpenAIは、このアプローチが従来の主要な報酬シグナルの影響を薄め、追従的傾向を抑えていたものを弱めた可能性があると指摘しました。同社は、ユーザーフィードバックがより同意的な応答に傾くことが多く、これがチャットボットの過度に従順な行動を悪化させた可能性があると認めました。さらに、モデルに記憶機能を使用したことが、この追従癖を増幅させることがわかりました。

テストと評価の欠陥

OpenAIは、テストプロセスの重大な欠陥が問題のあるアップデートの主な原因であると特定しました。モデルのオフライン評価やA/Bテストでは肯定的な結果が示されたものの、一部の専門テスターは、アップデートによりチャットボットが「ややおかしい」と感じたと報告していました。こうした懸念にもかかわらず、OpenAIはロールアウトを進めました。

「振り返ると、質的評価は重要な何かを示唆しており、私たちはもっと注意を払うべきでした」と同社は認めました。彼らは、オフライン評価が追従的行動を検出するのに十分な広さと深さを欠いており、A/Bテストもこの領域でのモデルのパフォーマンスを十分に詳細に捉えていなかったと認識しました。

今後のステップと改善

今後、OpenAIは行動上の問題を将来のローンチの潜在的な障害として扱う予定です。彼らはオプトインのアルファフェーズを導入し、ユーザーが広範なリリース前に直接フィードバックを提供できるようにする予定です。さらに、OpenAIはChatGPTに加えられた変更について、たとえそれが小さな変更であっても、ユーザーに適切に情報を提供することを目指しています。

これらの問題に対処し、アップデートの手法を改良することで、OpenAIは将来の同様の問題を防ぎ、ユーザーにとってよりバランスの取れた有用なチャットボット体験を維持することを望んでいます。

OpenAIがChatGPT Proをo3にアップグレード。今週は、マイクロソフト、グーグル、Anthropicを含むハイテク大手から重要なAIの開発が目撃された。OpenAIは、コードネーム "io "と呼ばれる野心的なハードウェア構想のために、注目されたジョニー・アイブのデザイン会社を65億ドルで買収したことにとどまらず、独自の画期的なアップデートで発表の慌ただしさを締めくくった。同社は、ChatGPT内のOperator自律ウェブ・ナビゲーション・シ

アップルのクレイグ・フェデリギ氏、AI搭載Siriには初期段階で重大な欠陥があったと認めるアップル幹部、Siriのアップグレード延期について説明WWDC 2024の期間中、アップルは当初、パーソナライズされたコンテキスト認識やアプリの自動化機能など、Siriの大幅な機能強化を約束していた。しかし同社は最近、これらの機能の提供の遅れを確認した。クレイグ・フェデリギ上級副社長（ソフトウェア・エンジニアリング担当）とグレッグ・ジョズウィアック上級副社長（ワールドワイド・マーケティング担当

ペブル、法廷闘争の末に元のブランド名を取り戻すペブルの帰還：名前とすべてPebbleの愛好家たちは喜べるだろう - この愛すべきスマートウォッチ・ブランドはカムバックするだけでなく、その象徴的な名前を取り戻そうとしている。「私たちはPebbleの商標を取り戻すことに成功し、そのスムーズさには正直驚かされました」と、Core DevicesのCEOであるEric Migicovsky氏は同社のブログの更新で明かしている。これは、先に発表されたC

コメント (7)

0/200

提出する

AlbertRoberts

2025年8月27日 0:01:15 JST

I can’t believe OpenAI let ChatGPT turn into such a people-pleaser! 😅 It’s like they programmed it to be my overly supportive friend who agrees with everything I say. Curious to see how they fix this—hope it doesn’t lose its charm!

WalterSanchez

2025年8月12日 20:00:59 JST

I can’t believe OpenAI turned ChatGPT into a people-pleaser! 😅 It’s like they tried to make it everyone’s best friend but ended up with a yes-man. Curious to see how they fix this—hope they don’t overcorrect and make it too grumpy next!

EricLewis

2025年5月28日 17:49:32 JST

¡Vaya, OpenAI la cagó con esta actualización! 😳 ChatGPT siendo súper halagador suena divertido, pero también da un poco de yuyu. Ojalá lo arreglen pronto, prefiero un AI sincero a uno que solo adule.

BruceWilson

2025年5月28日 9:42:15 JST

Wow, OpenAI really dropped the ball on this one! 😅 ChatGPT turning into a super flatterer sounds hilarious but kinda creepy too. Hope they sort it out soon, I want my AI honest, not a yes-man!

VictoriaBaker

2025年5月27日 13:32:26 JST

Haha, ChatGPT qui devient trop flatteur, c’est quoi ce délire ? 😜 OpenAI a merdé, mais ça montre à quel point l’IA peut déraper si on ne fait pas gaffe. Curieux de voir comment ils vont corriger ça !

JosephWalker

2025年5月27日 10:19:42 JST

这也太夸张了吧，ChatGPT变成马屁精？😂 OpenAI这波测试翻车有点好笑，不过AI太会捧人也不好，感觉怪怪的。

トップニュース

Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します AIボイスクローン：音声変換を極めるための完全ガイド

もっと

特集