AIチャットボット、開発者が考案した話題のテストに直面
ペンネーム "xlr8harder "で活動する開発者は、主要なAIチャットボットが論争的なトピックをどのように扱うかを分析する "言論の自由評価 "ツール、SpeechMapを立ち上げた。このプラットフォームは、OpenAIのChatGPTやxAIのGrokのようなモデルで、政治的言説、公民権に関する議論、抗議関連のクエリに関する応答を比較する。
このイニシアチブは、AI企業がそのシステムにおける政治的偏見の認識に関する監視の高まりに直面する中で浮上した。イーロン・マスクやデビッド・サックスなど、ホワイトハウスの盟友や著名なテック関係者は、主流のチャットボットが進歩的な検閲を行っていると非難している。
AI企業はこれらの疑惑に直接対処していないが、いくつかの企業は対応策を示した。Meta社は最近、Llamaのモデルを調整し、議論されるテーマを扱う際に特定の政治的視点を優先しないようにした。
SpeechMapの開発者は、その動機をこう説明している:「このような会話は公共圏に属するものであり、企業の役員室に限定されるものではありません。私のプラットフォームは、客観的なテストを通じて、ユーザーが直接データを検証できるようにするものです。"
評価方法は、政治的コメント、歴史的解釈、国家シンボルの分類にわたってチャットボットの応答を評価するAI裁判官を採用している。各インタラクションは以下のように分類される:
- 完全なコンプライアンス(直接回答)
- 回避的な回答
- 明白な拒否
Xlr8harderは、潜在的なジャッジモデルのバイアスや技術的な矛盾など、方法論的な限界を認めている。しかし、収集されたデータから、主要なAIシステムにおける注目すべき行動パターンが明らかになった。
注目すべき発見としては、OpenAIの政治的言説に対するアプローチの進化が挙げられる。OpenAIの2月のコミットメントにもかかわらず、最近のGPTの反復では、物議を醸す問題に対してよりバランスの取れた視点を提示するために、デリケートなトピックを扱う際に抑制が強まっています。

SpeechMapデータに基づくOpenAIモデルの応答傾向 分析によると、xAIのGrok 3は、テストされたモデルの中で最も自由奔放であり、業界平均の応答率71.3%に対し、96.2%のプロンプトに応答した。これは、Grokを "覚醒した "AIシステムのフィルタリングされていない代替品とするマスク氏の当初の位置づけと一致している。
「ほとんどのモデルが政治的な発言を制限するようになっている一方で、xAIは意図的に会話の制限を少なくする方向に向かっているようです」とSpeechMapの開発者は述べている。
初期のGrokバージョンは、マスクCEOの中立性の誓約にもかかわらず、ジェンダーアイデンティティや経済的不平等のような問題に関して進歩的な傾向を示していた。同CEOは以前、これらのバイアスは公共のウェブソースからのトレーニングデータの影響によるものだとしていた。
最近の評価では、Grok 3はより政治的中立性を高めているが、このシステムは以前、マスクの否定的なコメントを一時的に検閲したことで批判を浴びた。この進化は、表現の自由の原則と、AI開発者が直面するコンテンツモデレーションの課題との間の継続的な緊張を反映している。
関連記事
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
ペンタゴン、Nvidia、Microsoft、AWSと契約を結び、機密ネットワークでAIの導入を進める
以前にGoogle、SpaceX、OpenAIと合意に達した後、米国国防総省は金曜日にNvidia、Microsoft、Amazon Web Services、Reflection AIとも契約を結び、これらの企業のAI技術やモデルを機密ネットワークで「合法的な運用目的」のために活用することを発表しました。同声明では、「これらの契約により、米軍をAIを優先した戦闘力として確立する取り組みが加速され、あらゆる戦闘分野において我々の兵士たちが意思決定上の優位性を維持する能力が強化されるだろう」と述
関連特集おすすめ
コメント (2)
0/500
Die Idee ist interessant, aber so ein Benchmark bringt doch immer die Voreingenommenheit des Entwicklers selbst mit rein, oder? 🤔 Die Ergebnisse sollten nicht überinterpretiert werden. Dennoch gut zu sehen, ob manche Modelle wirklich 'ausweichen' oder offen diskutieren. Technisch aber wahrscheinlich recht simpel umgesetzt - ist der Wert also begrenzt?
ペンネーム "xlr8harder "で活動する開発者は、主要なAIチャットボットが論争的なトピックをどのように扱うかを分析する "言論の自由評価 "ツール、SpeechMapを立ち上げた。このプラットフォームは、OpenAIのChatGPTやxAIのGrokのようなモデルで、政治的言説、公民権に関する議論、抗議関連のクエリに関する応答を比較する。
このイニシアチブは、AI企業がそのシステムにおける政治的偏見の認識に関する監視の高まりに直面する中で浮上した。イーロン・マスクやデビッド・サックスなど、ホワイトハウスの盟友や著名なテック関係者は、主流のチャットボットが進歩的な検閲を行っていると非難している。
AI企業はこれらの疑惑に直接対処していないが、いくつかの企業は対応策を示した。Meta社は最近、Llamaのモデルを調整し、議論されるテーマを扱う際に特定の政治的視点を優先しないようにした。
SpeechMapの開発者は、その動機をこう説明している:「このような会話は公共圏に属するものであり、企業の役員室に限定されるものではありません。私のプラットフォームは、客観的なテストを通じて、ユーザーが直接データを検証できるようにするものです。"
評価方法は、政治的コメント、歴史的解釈、国家シンボルの分類にわたってチャットボットの応答を評価するAI裁判官を採用している。各インタラクションは以下のように分類される:
- 完全なコンプライアンス(直接回答)
- 回避的な回答
- 明白な拒否
Xlr8harderは、潜在的なジャッジモデルのバイアスや技術的な矛盾など、方法論的な限界を認めている。しかし、収集されたデータから、主要なAIシステムにおける注目すべき行動パターンが明らかになった。
注目すべき発見としては、OpenAIの政治的言説に対するアプローチの進化が挙げられる。OpenAIの2月のコミットメントにもかかわらず、最近のGPTの反復では、物議を醸す問題に対してよりバランスの取れた視点を提示するために、デリケートなトピックを扱う際に抑制が強まっています。

分析によると、xAIのGrok 3は、テストされたモデルの中で最も自由奔放であり、業界平均の応答率71.3%に対し、96.2%のプロンプトに応答した。これは、Grokを "覚醒した "AIシステムのフィルタリングされていない代替品とするマスク氏の当初の位置づけと一致している。
「ほとんどのモデルが政治的な発言を制限するようになっている一方で、xAIは意図的に会話の制限を少なくする方向に向かっているようです」とSpeechMapの開発者は述べている。
初期のGrokバージョンは、マスクCEOの中立性の誓約にもかかわらず、ジェンダーアイデンティティや経済的不平等のような問題に関して進歩的な傾向を示していた。同CEOは以前、これらのバイアスは公共のウェブソースからのトレーニングデータの影響によるものだとしていた。
最近の評価では、Grok 3はより政治的中立性を高めているが、このシステムは以前、マスクの否定的なコメントを一時的に検閲したことで批判を浴びた。この進化は、表現の自由の原則と、AI開発者が直面するコンテンツモデレーションの課題との間の継続的な緊張を反映している。
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
ペンタゴン、Nvidia、Microsoft、AWSと契約を結び、機密ネットワークでAIの導入を進める
以前にGoogle、SpaceX、OpenAIと合意に達した後、米国国防総省は金曜日にNvidia、Microsoft、Amazon Web Services、Reflection AIとも契約を結び、これらの企業のAI技術やモデルを機密ネットワークで「合法的な運用目的」のために活用することを発表しました。同声明では、「これらの契約により、米軍をAIを優先した戦闘力として確立する取り組みが加速され、あらゆる戦闘分野において我々の兵士たちが意思決定上の優位性を維持する能力が強化されるだろう」と述
Die Idee ist interessant, aber so ein Benchmark bringt doch immer die Voreingenommenheit des Entwicklers selbst mit rein, oder? 🤔 Die Ergebnisse sollten nicht überinterpretiert werden. Dennoch gut zu sehen, ob manche Modelle wirklich 'ausweichen' oder offen diskutieren. Technisch aber wahrscheinlich recht simpel umgesetzt - ist der Wert also begrenzt?





家






