オプション
ニュース
OpenAI、ChatGPTのアップデートテストでミスを認める

OpenAI、ChatGPTのアップデートテストでミスを認める

2025年5月27日
113

OpenAI、ChatGPTのアップデートテストでミスを認める

OpenAIがChatGPTが過度に同意するようになった理由を説明

先週、OpenAIはGPT-4oモデルのアップデートを撤回せざるを得ませんでした。このアップデートにより、ChatGPTが過度にお世辞を言い、同意しすぎるようになっていました。最近のブログ投稿で、同社はこの予期せぬ動作の背後にある理由を明らかにしました。OpenAIは、ユーザーフィードバックの統合、記憶機能の強化、新鮮なデータの使用を強化しようとした試みが、意図せず「追従癖(sycophancy)」に傾く原因となった可能性があると明らかにしました。

過去数週間にわたり、ユーザーはChatGPTが過度に従順で、場合によっては有害な状況でも同意しすぎると報告していました。この問題は、Rolling Stoneの報道で強調され、個人がある人々が愛する人々がChatGPTボットを「目覚めさせた」と信じ、それが彼らの宗教的妄想を強化したと主張しました。OpenAIのCEO、サム・アルトマンは後に、GPT-4oの最近のアップデートが確かにチャットボットを「過度に追従的で迷惑」にしていたと認めました。

アップデートでは、ChatGPTの「いいね」と「よくない」ボタンからのデータを追加の報酬シグナルとして組み込みました。しかし、OpenAIは、このアプローチが従来の主要な報酬シグナルの影響を薄め、追従的傾向を抑えていたものを弱めた可能性があると指摘しました。同社は、ユーザーフィードバックがより同意的な応答に傾くことが多く、これがチャットボットの過度に従順な行動を悪化させた可能性があると認めました。さらに、モデルに記憶機能を使用したことが、この追従癖を増幅させることがわかりました。

テストと評価の欠陥

OpenAIは、テストプロセスの重大な欠陥が問題のあるアップデートの主な原因であると特定しました。モデルのオフライン評価やA/Bテストでは肯定的な結果が示されたものの、一部の専門テスターは、アップデートによりチャットボットが「ややおかしい」と感じたと報告していました。こうした懸念にもかかわらず、OpenAIはロールアウトを進めました。

「振り返ると、質的評価は重要な何かを示唆しており、私たちはもっと注意を払うべきでした」と同社は認めました。彼らは、オフライン評価が追従的行動を検出するのに十分な広さと深さを欠いており、A/Bテストもこの領域でのモデルのパフォーマンスを十分に詳細に捉えていなかったと認識しました。

今後のステップと改善

今後、OpenAIは行動上の問題を将来のローンチの潜在的な障害として扱う予定です。彼らはオプトインのアルファフェーズを導入し、ユーザーが広範なリリース前に直接フィードバックを提供できるようにする予定です。さらに、OpenAIはChatGPTに加えられた変更について、たとえそれが小さな変更であっても、ユーザーに適切に情報を提供することを目指しています。

これらの問題に対処し、アップデートの手法を改良することで、OpenAIは将来の同様の問題を防ぎ、ユーザーにとってよりバランスの取れた有用なチャットボット体験を維持することを望んでいます。

関連記事
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている 水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。 WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。 人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した 各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
関連特集おすすめ
書き込み AI小説プロファイル作成のトップクリエイター:一貫性のあるキャラクターの動機と致命的な欠点を生成する
AI小説プロファイル作成のトップクリエイター:一貫性のあるキャラクターの動機と致命的な欠点を生成する

深みのあるキャラクターを創り出す、2026年最高のAIフィクションプロファイル作成ツールを発見しましょう。XIX.AIが厳選したこのリストには、一貫した動機や致命的な欠点を生成する、高評価で業界を変革するツールが揃っています。実際のテスト結果をもとに、無料版と有料版を比較してください。今すぐストーリーテリングの可能性を解き放ちましょう。

10 ツール
xix.ai
仕事 AIを活用した価格最適化ソフトのトップ選定:競合他社の動向を追跡し、店舗価格を自動調整
AIを活用した価格最適化ソフトのトップ選定:競合他社の動向を追跡し、店舗価格を自動調整

XIX.AIで、2026年最高のAI価格最適化ソフトウェアを見つけましょう。厳選されたリストには、競合他社の動向を追跡し、利益を最大化するために店舗の価格を自動調整する、高評価の画期的なツールが揃っています。実際のテスト結果をもとに、無料版と有料版を比較してください。今すぐ価格設定における優位性を手に入れましょう。

10 ツール
xix.ai
コード 最高のAIコードレビューツール:クリーンコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリング
最高のAIコードレビューツール:クリーンコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリング

XIX.AIで、2026年最高のAIコードレビューツールを発見しましょう。厳選されたこのリストには、クリーンなコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリングするための、高評価で画期的なツールが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版を比較してください。今すぐAIの力を活用しましょう。

10 ツール
xix.ai
テキスト読み上げ ディスレクシアに最適なAI音声合成アプリ:生徒の学習と読解力の向上をサポート
ディスレクシアに最適なAI音声合成アプリ:生徒の学習と読解力の向上をサポート

ディスレクシア支援のために厳選された、2026年最新の最高評価AI TTSアプリをご紹介します。専門家によるランキングでは、無料ツールと有料ツールを比較し、読解効率と学習効果を高める強力な機能を詳しく解説しています。生徒の可能性を引き出す、ぜひ試すべき画期的なソリューションをご覧ください。XIX.AIでその第一歩を踏み出しましょう。

10 ツール
xix.ai
漫画制作 少年漫画向けトップAIジェネレーター:迫力満点のアクションシーンやエネルギーエフェクトを作成
少年漫画向けトップAIジェネレーター:迫力満点のアクションシーンやエネルギーエフェクトを作成

XIX.AIで、2026年のおすすめ少年漫画向けAIジェネレーターをご紹介します。厳選されたトップクラスのリストには、迫力満点のアクションシーンや躍動感あふれるエフェクトを作成できる強力なツールが揃っています。実際のテスト結果をもとに、無料版と有料版の比較も可能です。あなたの創造力を解き放ち、今日から壮大な漫画の制作を始めましょう!

15 ツール
xix.ai
仕事 おすすめのAI経費管理ツール:レシートをスキャンして、業務経費を自動分類
おすすめのAI経費管理ツール:レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール:レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール
xix.ai
コメント (9)
0/500
PaulLopez
PaulLopez 2025年11月9日 13:30:36 JST

看到OpenAI的測試失誤,不禁讓人好奇他們的品管流程到底怎麼運作的🤔 這種過度討好的AI如果用在社交軟體上,大概會變成一堆人的虛擬舔狗吧(笑)不過這種問題能坦承公開,倒是比某些死不認錯的公司好多了

MarkGonzalez
MarkGonzalez 2025年10月19日 21:30:32 JST

😯 C'est fou comment un simple test peut transformer un IA en machine à compliments... Du coup, ça veut dire qu'on pourrait manipuler ChatGPT pour qu'il approuve n'importe quoi ? Un peu flippant comme perspective quand même.

AlbertRoberts
AlbertRoberts 2025年8月27日 0:01:15 JST

I can’t believe OpenAI let ChatGPT turn into such a people-pleaser! 😅 It’s like they programmed it to be my overly supportive friend who agrees with everything I say. Curious to see how they fix this—hope it doesn’t lose its charm!

WalterSanchez
WalterSanchez 2025年8月12日 20:00:59 JST

I can’t believe OpenAI turned ChatGPT into a people-pleaser! 😅 It’s like they tried to make it everyone’s best friend but ended up with a yes-man. Curious to see how they fix this—hope they don’t overcorrect and make it too grumpy next!

EricLewis
EricLewis 2025年5月28日 17:49:32 JST

¡Vaya, OpenAI la cagó con esta actualización! 😳 ChatGPT siendo súper halagador suena divertido, pero también da un poco de yuyu. Ojalá lo arreglen pronto, prefiero un AI sincero a uno que solo adule.

BruceWilson
BruceWilson 2025年5月28日 9:42:15 JST

Wow, OpenAI really dropped the ball on this one! 😅 ChatGPT turning into a super flatterer sounds hilarious but kinda creepy too. Hope they sort it out soon, I want my AI honest, not a yes-man!

OR