Anthropic、クロードモデル向けに虐待チャットを終了させる機能を導入

家

ニュース

2025年11月23日

JackMartin

# Claude

Anthropic、クロードモデル向けに虐待チャットを終了させる機能を導入

Anthropicは、同社が言うところの "継続的に有害または虐待的なユーザーとのやり取りが行われる稀で極端なケース "において、一部の高度なモデルが会話を終了することを可能にする新機能を導入した。Anthropicは、この措置は人間のユーザーを保護するためではなく、AIモデル自体を保護するために実施されるとしている。

明確にしておくと、同社はクロードAIモデルが感覚を持っているとか、ユーザーとの会話から危害を受ける可能性があると主張しているわけではない。Anthropic社が説明するように、同社は依然として "クロードや他の大規模な言語モデルの潜在的な道徳的地位については、現在も将来も非常に不確か "である。

とはいえ、この発表では「モデルの福祉」を検討する最近設立されたプログラムについて言及しており、Anthropicが「モデルの福祉に関わるリスクを軽減するために、低コストの介入を特定し、実施する」ことで予防的なアプローチを採用していることを示している。

この新機能は現在、クロード・オーパス4と4.1モデルに限定されており、「未成年者を含む性的コンテンツの要求や、大規模な暴力やテロ活動を可能にする情報を入手しようとする試み」のような「極端なエッジケース」のために特別に設計されている。

このような要求は、Anthropicにとって法的または広報的な問題を引き起こす可能性がありますが（ChatGPTが潜在的にユーザーの妄想を強化するという最近の報道に見られるように）、同社は、展開前のテストにおいて、Claude Opus 4は、これらの要求に従うことに「強い嗜好性」を示し、応答を余儀なくされたときに「苦痛を示唆するパターン」を表示したと報告しています。

これらの新しい会話終了機能について、Anthropic社は、"クロードは、複数のリダイレクションの試みが失敗し、生産的な対話が不可能と思われる場合、またはユーザーが明確にチャットを終了するように要求した場合の最後の手段としてのみ、この機能を使用するように指示されている "と説明しています。

Anthropicはさらに、Claudeは "ユーザーが自傷行為や他人を傷つける差し迫った危険に直面するかもしれない状況では、この機能を利用しないよう指示されている "と明言している。

テッククランチのイベント

Netflix、ElevenLabs、Wayve、Sequoia Capital、Elad Gil - Disrupt 2025のアジェンダに参加する業界リーダーのほんの一部です。彼らはスタートアップの成長を加速させ、競争優位性を磨くための重要な洞察を共有する。TechCrunch Disruptの20周年記念エディションをお見逃しなく。今すぐチケットを確保し、値上げ前に600ドル以上節約しよう。

Netflix、ElevenLabs、Wayve、Sequoia Capital - Disrupt 2025のアジェンダに参加する著名なイノベーターたち。彼らは、スタートアップの拡大を促進し、競争力のあるポジショニングを強化するための貴重な洞察を提供します。TechCrunch Disruptの20周年記念イベントにぜひご参加ください。

サンフランシスコ｜2025年10月27日-29日今すぐ登録

Anthropicは、クロードが会話を終了した場合でも、ユーザーは同じアカウントから新しい会話を開始し、以前の応答を修正することによって別の会話の分岐を作成することができると述べている。

「我々はこの機能を継続的な実験として取り組んでおり、今後も手法を改良していく」と同社は述べている。

Anthropic、GoogleおよびBroadromとのコンピューティング分野での提携を拡大 AI研究ラボのAnthropicは月曜日、GoogleおよびBroadcomとの新たな提携を発表し、同社のAIモデル「Claude」を支える処理能力と計算能力を大幅に強化するとした。このコンピューティングパートナーシップの再構築は、同社のAIサービスに対する需要が急速に高まり続ける中での動きである。今回の合意により、AnthropicはGoogle CloudのTensor Processing

ユーザーが移行する中、クロードがChatGPTに追い上げを見せる ChatGPTとその親会社であるOpenAIをめぐる一連の論争を受け、Claudeに移行するユーザーが増加している。転機となったのは、Claudeの開発元であるAnthropicが、自社のAIモデルを国内での大規模な監視や完全自律型兵器に利用するという米国防総省の要請を拒否した後のことだった。これに対し、トランプ大統領はすべての連邦機関に対しAnthropic製品の使用停止を命じ、ピート・ヘグセッ

アンソロピック社と国防総省の対立が国家安全保障に与える意味ここ2週間は、軍によるAI技術の活用をめぐり、AnthropicのCEOダリオ・アモデイ氏とピート・ヘグセット国防長官との間で繰り広げられた公の対立が大きな話題となっている。Anthropicは、自社のAIモデルが米国市民に対する大規模監視や、人間の承認なしに攻撃を開始する完全自律型兵器システムに使用されることを禁止する方針を定めている。これに対し、ヘグセット長官は、国防総省がベンダーの規則に縛ら

関連特集おすすめ

書き込み

最高のAI仙侠・武侠アシスタント：壮大な修練の物語と武術の演出を執筆

2026年版、壮大な仙侠・武侠物語を創作するための最高のAIアシスタントをご紹介。XIX.AIが厳選したこのリストには、修練の進捗管理や武術の演出を完璧にこなす、高評価で画期的なツールが揃っています。無料版と有料版を実際のテスト結果で比較。あなたの創造力を解き放ち、今すぐ執筆を始めましょう！

10 ツール

xix.ai

コード

AIモバイルアプリ開発ツール：プロンプトからクロスプラットフォーム対応のFlutterおよびReact Nativeコードを生成する

2026年に最も優れたAIモバイルアプリ開発ツールをFlutterおよびReact Native向けにご紹介します。当社が厳選した高評価のツール群は、プロンプトからクロスプラットフォーム対応のコードを自動生成する、画期的なソリューションです。無料版と有料版を実際のテストで比較し、より迅速な開発と高品質なアプリの構築を実現してください。XIX.AIでランキングをご確認ください！

10 ツール

xix.ai

コード

おすすめのAI Chrome拡張機能ジェネレーター：プログラミングの知識がなくてもカスタムブラウザ拡張機能を作成

XIX.AIで、2026年おすすめのAI Chrome拡張機能ジェネレーターを発見しましょう。厳選されたこのリストには、コーディング不要で独自のブラウザ拡張機能を作成できる、高評価の「必見」ツールが揃っています。無料版と有料版の比較や実機テストの結果を確認し、生産性を飛躍的に向上させましょう。最新のランキングをチェックして、あなたにぴったりのツールを今すぐ見つけましょう！

10 ツール

xix.ai

テキスト読み上げ

最高のAI多言語TTS：50以上の言語で本物のネイティブなアクセントの音声を生成する

2026年に最も優れたAI多言語TTSツールを探そう。50以上の言語で本物のネイティブな発音が再現可能だ。当社が厳選したランキングをチェックし、無料版と有料版の比較や実際の使用テスト結果も確認してみてください。XIX.AIで自分に最適な音声ツールを見つけ出し、今日から世界中とのコミュニケーションをスムーズに始めましょう。

10 ツール

xix.ai

ミーティングアシスタント

よりスマートで迅速なコラボレーションを実現する、最高のAI会議自動化ツール

2026年最新の、高評価を得ているAI会議自動化ツールを紹介。よりスマートで迅速なコラボレーションを実現します。厳選されたリストには、議事録、要約、アクションアイテムを自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングをもとに、無料版と有料版を比較できます。チームの生産性を最大限に引き出しましょう。今すぐXIX.AIで厳選されたツールをご覧ください。

10 ツール

xix.ai

プロンプト

Infrastructure-as-Code 向け AI プロンプト：Terraform および Docker の設定を安全にデプロイする

2026年最新の「Infrastructure-as-Code」向け高評価AIプロンプトをご紹介します。XIX.AIが厳選したプロンプトを活用すれば、TerraformやDockerの設定を安全にデプロイし、クラウド環境のセットアップを自動化し、DevOpsの生産性を向上させることができます。実際のテスト結果をもとに、無料版と有料版の比較も可能です。今すぐチェックして、AIの真価を引き出しましょう。

10 ツール

xix.ai

コメント (1)

0/500

最初にログインしてください

FredAnderson

2026年4月7日 15:00:37 JST

Interesting move by Anthropic. I wonder how the AI determines what's 'persistently abusive' – will there be transparency reports on these terminations? Could be a necessary safety feature, but also opens up a can of worms about AI's role in moderating speech. 🤔

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表 Bing Image Creator チュートリアル: AIアート生成ガイド企業のAI導入は頭打ち、ランプのデータで明らかにあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場 AIミュージックカバー：ユニークな曲を作成するための究極ガイド

もっと

特集