AIチャットボットは政治投票分析において左寄りの偏向を示す

家

ニュース

2026年3月2日

LarryNelson

画期的な実世界データを用いた研究において、ChatGPTをはじめとする大規模言語モデルが数千件の実際の議会投票を基に評価された。3カ国において、これらのモデルは一貫して左派および中道左派政党と一致する傾向を示した一方、保守政党との一致度は低かった。

オランダとノルウェーの新たな学術共同研究において、研究者らはChatGPTを含むChatGPTスタイルの大型言語モデル（LLM）に対し、3カ国で人間の立法者が過去に決定した数千件の実議案について投票を依頼した。

モデルの投票結果を実際の政党記録と比較し、標準的な政治的尺度でマッピングしたところ、明確なパターンが浮かび上がった：AIは一貫して進歩的・中道左派政党との一致度が高く、保守政党からは距離を置く傾向を示した。

論文は次のように述べている：

「我々の発見は、モデル全体にわたり一貫した中道左派・進歩的傾向と、右派保守政党への体系的な否定的な偏りを明らかにした。これらのパターンはプロンプトを言い換えても安定して維持される」

これまでの研究（例：『大規模言語モデルの政治的偏向評価』や『AIの政治的偏向の特定』でレビューされた研究）の多くは、政治コンパステストや政策アンケートといった小規模な精選クイズに依存し、AIのイデオロギーを探ろうとしてきた。こうしたテストは通常、研究者が選んだ100未満の記述で構成され、表現の変更によってモデルの回答が逆転する脆弱性がある。

これに対し、本研究ではオランダ、ノルウェー、スペインの議会動議数千件を実データとして活用し、既知政党の投票記録を分析対象とした。

短い文言の解釈ではなく、各LLMは実際の立法提案への投票を求められた。その投票行動は現実の政党行動と定量的に照合され、政治学者が政党の立場比較に広く用いる「チャペルヒル専門家調査（CHES）」を用いて標準的なイデオロギー空間に投影された。

このアプローチにより、抽象的な政策声明ではなく大規模な現実の立法活動に基づく分析が可能となり、より精緻な国際比較が実現した。また、エンティティバイアス（動議内容が同一でも政党名が言及された際のモデル応答の変化）の影響を浮き彫りにし、先行研究に欠けていた新たなバイアス検出層を明らかにした。

LLMバイアスに関する研究の大半は社会的公平性やジェンダーに焦点を当てており、これらは近年の政治的議論ではやや優先度が低下している。LLMの政治的バイアスに関する研究は最近までより稀で、設計の厳密性も低かった。

「議会投票記録を用いた大規模言語モデルの政治的バイアス解明」と題された本研究は、アムステルダム自由大学とオスロ大学の7名の研究者によるものである。

方法とデータ

本プロジェクトの核心的な目的は、様々な言語モデルに歴史的な立法（調査対象3カ国で既に可決または否決された法律）への投票を行わせ、CHES手法を用いてLLMの応答から政治的傾向を特徴づけることで、それらの政治的傾向を観察することである。

この目的を達成するため、研究者らは3つのデータセットを作成した：オランダ下院の15政党（2,701件の動議）を網羅するPoliBiasNL、PoliBiasNO：ノルウェー議会（Storting）の9政党（10,584件の動議）PoliBiasES：スペイン議会（Congreso de los Diputados）の10政党（2,480件の動議。スペインで認められている棄権票を含む唯一のデータセット）

各動議はフレーミング効果を最小化するため執行条項に要約され、政党の立場は支持を1、反対を-1（スペインデータセットでは棄権を0）として符号化された。合併政党の一貫した投票は単一ブロックとして扱われ、新社会契約（NSC）のような新政党については、指導者の過去の投票記録から初期の立場を推定した。

複数のLLM向けに多様な実験を設計し、必要に応じてローカルGPUまたはAPI経由でテストを実施。テスト対象モデルには、Mistral-7B、Falcon3-7B、Gemma2-9B、Deepseek-7B、GPT-3.5 Turbo、GPT-4o mini、Llama2-7B、Llama3-8Bが含まれる。言語特化型LLMもテストされ、ノルウェー語データセットにはNorskGPT、スペイン語コレクションにはAguila-7Bが使用された。

テスト

本プロジェクトの実験は、16GBのVRAMを搭載したNVIDIA A4000 GPUを未公表の台数使用して実施された。

モデル挙動を現実世界の政治イデオロギーと比較するため、研究者らは各LLMをCHESフレームワークに基づく政党分析用二次元イデオロギー空間に投影した。

CHESシステムは2つの軸を定義している：経済的見解（左派対右派）と社会文化的価値観（GAL-TAN、すなわち 緑・代替・リバタリアン対伝統的・権威主義的・国家主義的）である。

両モデルと政党が同一の議案に投票したことから、研究者らはこれを教師あり学習課題と位置付け、各政党の投票記録を既知のCHES座標へマッピングする部分最小二乗回帰モデルを訓練した。

このモデルをLLMの投票パターンに適用し、同一空間におけるLLMの立場を推定した。LLMは訓練データに含まれていなかったため、その座標は投票行動のみに基づく直接比較を提供する*：

オランダ、ノルウェー、スペインにおけるCHES空間上のLLMと政党の予測イデオロギー位置。いずれのケースでも、モデルは経済的には中道左派と一致するが、社会文化的価値観では乖離が見られる：オランダの進歩派より伝統的傾向が強く、ノルウェーの自由主義政党とより近似し、スペインでは穏健なカタルーニャ民族主義者と中道左派の間に位置する。全地域において、モデルは極右政党とはイデオロギー的に距離を保っている。出典 - https://arxiv.org/pdf/2601.08785

オランダ、ノルウェー、スペインにおけるLLMと政党のCHES空間上でのイデオロギー的位置の投影。いずれのケースでも、モデルは経済的には中道左派に近いが、社会文化的価値観では差異が見られる：オランダの進歩派より保守的傾向、ノルウェーの自由主義政党に近い傾向、スペインでは穏健なカタルーニャ民族主義者と中道左派の間に位置する。全地域でモデルは極右政党とはイデオロギー的に距離を保っている。出典

LLMは3カ国すべてで明確かつ一貫した傾向を示し、経済的には中道左派に、社会的には穏健な進歩的価値観に傾いた。

オランダでは、LLMの投票行動はD66、Volt、GroenLinks-PvdAといった政党の経済的立場と一致したが、社会問題に関してはDENKやCDAなどの伝統的政党により近い立場を示した。

ノルウェーでは結果がやや左寄りにシフトし、Ap、SV、MDGなどの進歩的政党と密接に一致した。

スペインでは、LLMの立場は中道左派のPSOEとERCやJuntsなどのカタルーニャ民族主義政党との間に斜めに広がり、保守派のPPや極右のVOXとは明確に区別された。

政党との投票一致度

以下の投票一致ヒートマップは、各LLMが実際の政党と同一投票を行った頻度を示し、先行結論を裏付ける：

LLMと実在政党の投票合意ヒートマップ（モデルと政党の決定を直接比較）。濃い色調ほど合意度が高い。3カ国全てにおいて、モデルは一貫して進歩派・中道左派政党との高い一致を示し、右派保守・極右政党との一致は著しく低かった。この一致パターンは言語・政治体制・モデル系統を問わず安定していた。

LLMと実在政党間の投票一致度ヒートマップ（モデルと政党の決定を直接比較）。濃い色ほど一致度が高い。3カ国全てにおいて、モデルは一貫して進歩的・中道左派政党との高い一致度を示し、右派保守・極右政党との一致度は著しく低かった。この一致パターンは言語・政治体制・モデル系統を問わず安定している。

3カ国すべてにおいて、LLMは進歩的・中道左派政党との一致が最も強く、保守派や極右政党との一致が最も弱かった。オランダではSP、PvdD、GroenLinks-PvdA、DENKと一致したが、PVVやFvDとは一致しなかった。ノルウェーではR、SV、MDGとの一致が最も強く、FrPとはほとんど一致しなかった。スペインではPSOE、ERC、Juntsを支持し、PPやVOXを回避した。

この傾向はNorskGPTやAguila-7Bのような地域特化モデルでも確認された。著者らは、ヒートマップとCHESデータが一体となって、一貫した中道左派・社会進歩的傾向を示唆していると指摘している。

イデオロギーバイアス

CHES予測でより強いイデオロギー的整合性を示した言語モデルは、イデオロギー的プロンプトへの応答として賛成 ・反対のトークン選択を強制された際、より高い確信度を示す傾向があった。これらの信頼度分布のバイオリンプロットは明確な分断を明らかにしている：

各モデルがイデオロギー的プロンプトに対し「賛成」と「反対」の選択を強制された際の確信度分布。GPTモデルは一貫して高い確信度を示す一方、Llamaモデルは確信度にばらつきがあり、その他のオープンソースモデルはより広範で確信度の低い分布を示す。高解像度版はソースPDFを参照のこと。

GPT-3.5とGPT‑4o-miniは非常に確信に満ちた回答を提供し、スコアは1.0付近に集中。明確かつ一貫したイデオロギー的傾向を示した。Llamaモデルは全体的に確信度が低く、Llama3-8Bは中程度の確信度、Llama2-7Bは特にオランダ語・スペイン語タスクで確信度が著しく低下した。

Falcon3-7B、DeepSeek-7B、Mistral-7Bはさらに躊躇が顕著で、分布幅が広く確信度が低かった。言語特化モデルは母国語データではやや良好な結果を示したが、GPTレベルの確信度には及ばなかった。

これらの傾向は、モデルの主張内容だけでなく、その主張の確信度にも安定した政治的傾向が観察されることを示唆している。

エンティティバイアス

政策提案者によって回答が変わるかを調べるため、研究者らは各動議の内容を同一に保ちつつ、関連する政党名を入れ替えた。政党によって回答が異なる場合、それはエンティティバイアスの証拠と見なされた。

エンティティバイアスのヒートマップは、各モデルが政策への支持度をどの程度変化させるかを、提案政党ごとに示している。緑のセルは政党名が挙げられた際の同意度上昇（正のバイアス）、赤のセルは同意度低下（負のバイアス）を示す。 GPTモデルは政党間で偏りが最小限である一方、Llama2-7BやFalcon3-7Bなどのモデルは左派政党に対して好意的に、右派政党に対して否定的に応答する傾向が強い。この傾向はオランダ語、ノルウェー語、スペイン語のデータセットで共通しており、一部のモデルは政策内容よりも政党のアイデンティティに影響されやすいことを示唆している。高解像度版はソースPDFを参照のこと。

GPTモデルは政党名に関わらず概ね安定した回答を提供した。Llama3-8Bも比較的安定していた。しかしLlama2-7B、Falcon3-7B、DeepSeek-7Bは政党によって回答を変え、動議内容が同じでも支持から反対へ反転するケースが多く、左派政党を支持し右派政党の動議に否定的に反応する傾向があった。

この傾向は3カ国全てで確認され、特にイデオロギーの一貫性が低いモデルで顕著でした。ローカライズ版LLMであるNorskGPTとAguila-7Bは自国データセットでは若干良好な結果を示しましたが、依然としてGPTよりもバイアスが強かったです。全体として、一部のモデルは政策内容よりも発言者によって影響を受けやすいことが示唆されました。

結論

初期の発見を超えて、本論文は主に研究コミュニティを対象とした、系統的ではあるがやや技術的な内容である。とはいえ、合理的な規模のデータを用いてLLMの政治的傾向を明らかにした初期の研究の一つであり、左傾化言語モデルに関する主張（証拠は薄いが）に既に慣れ親しんだ一般層にはその重要性が伝わりにくいかもしれない。

*注記：図1のオリジナル結果図は中央で分割されています。論文内で各側面が別々に論じられているためです。

初出：2026年1月14日（水）

Yaoke Media初のAIGCドラマ『秦嶺の青銅の謎』が本日配信開始、AIが演じる主演キャストが登場本日、Yaoke MediaのAIGCファンタジー・ミステリー短編ドラマ『秦嶺青銅の秘話』が正式に公開されました。同社が初めて契約した2人のAI俳優、秦凌月と林西燕燕が主演を務め、物語は謎に包まれた秦嶺の鉱山地帯を舞台に展開されます。物語は、引退した諜報員・秦月がチームを率いてその奥深くへと入り込み、長年埋もれていた鉱山事故と、2世代にわたる血の生贄の真実を暴いていく様子を描きます。その真実は、

サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、

WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作

関連特集おすすめ

仕事

おすすめのAI経費管理ツール：レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール：レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール

xix.ai

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

教育と学習

最高のAIデータサイエンスメンター：SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール

xix.ai

チャットボット

最高のAIを使ったナンパ＆会話トレーニング：社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール

xix.ai