「IQ：AI評価の欠陥のある尺度」

家

ニュース

「IQ：AI評価の欠陥のある尺度」

2025年4月8日

EdwardYoung

107

# ai # iq tests

「IQ：AI評価の欠陥のある尺度」

最近の記者会見で、OpenAIのCEOであるサム・アルトマン氏は、AIの「IQ」の急速な進歩についての考えを共有しました。彼は次のように述べました。「非常に大まかに言えば、これは科学的には正確ではありませんが、ただの感覚的または精神的な答えです。毎年、IQの1標準偏差分進んでいるように感じます。」アルトマン氏だけがAIの進歩の基準としてIQを使用しているわけではありません。ソーシャルメディアのインフルエンサーたちも、AIモデルにIQテストを受けさせ、その結果を共有することで知られています。

しかし、多くの専門家は、AIの能力を評価するためにIQを使用することは不適切であるだけでなく、誤解を招くと主張しています。オックスフォードで技術と規制を研究しているサンドラ・ワクター氏は、TechCrunchに対し、「人間の能力や進歩を記述するために使用するのと同じ基準をAIに使うのは非常に魅力的ですが、これはリンゴとオレンジを比較するようなものです」と語りました。

記者会見中、アルトマン氏はIQを知能と同等に扱っているようでした。しかし、IQテストは特定の種類の知能の相対的な尺度であり、絶対的な尺度ではありません。これらは一般に論理や抽象的推論の良い指標とされていますが、実際の知能、つまり物事を機能させる方法を見つけ出す能力については十分ではありません。また、IQテストは個人の能力のスナップショットを提供するだけです。

ワクター氏は次のように指摘しました。「IQは、科学者が人間の知能と考えているものに基づいて、人間の能力を測定するツールです——それ自体が議論の的となるツールです。しかし、AIの能力を記述するために同じ基準を使うことはできません。車は人間よりも速く、潜水艦は潜水に優れています。しかし、これは車や潜水艦が人間の知能を超えているという意味ではありません。パフォーマンスの一部の側面を人間の知能と同等に扱うのは、はるかに複雑なものです。」

IQテストの起源は、選択的育種によって人々を改善するという、信用を失った優生学の理論に結びついています。これらのテストで良い成績を収めるには、優れたワーキングメモリと西洋の文化的規範への慣れが必要であり、これが偏見を生む可能性があります。ワシントン大学の博士課程で倫理的AIを研究しているオス・キーズ氏は、AIモデルがIQテストで良い成績を収めた場合、それはモデルの能力というよりもテストの欠点について多くを物語ると考えています。キーズ氏は次のように述べました。「これらのテストは、ほぼ無限のメモリと忍耐力があれば、かなり簡単に攻略できます。IQテストは、認知、意識、知能を測定する非常に限定的な方法であり、これはデジタルコンピュータの発明以前から知られていたことです。」

AIは、膨大なメモリと知識をすぐに利用できるため、IQテストで不公平な優位性を持つ可能性があります。AIはしばしば公開ウェブデータでトレーニングされており、そこには多くのIQテストの問題が含まれています。キングス・カレッジ・ロンドンでAIを専門とする研究フェローのマイク・クック氏は、次のように指摘しました。「テストは非常に似たパターンを繰り返す傾向があります。IQを上げる確実な方法は、IQテストを練習することであり、これはすべてのモデルが実質的に行っていることです。私が何かを学ぶとき、AIとは異なり、100万回完全に明確に脳に送り込まれるわけではありませんし、ノイズや信号の損失なしに処理することもできません。」

クック氏はまた、IQテストはその固有の偏見により、人間の一般的な問題解決スキルを評価するために設計されたものであり、AIには適していないと指摘しました。彼は次のように述べました。「カラスは道具を使って箱からおやつを取り出すことができるかもしれませんが、それがハーバード大学に入学できるという意味ではありません。私が数学の問題を解くとき、私の脳はページの文字を正しく読む能力、帰宅途中に必要な買い物のことを考えないようにする能力、部屋が今寒すぎるかどうかを気にする能力とも戦っています。つまり、人間の脳は、IQテストであれ他の問題であれ、問題を解くときに多くのことを同時に処理しなければならず、AIよりもはるかに少ない助けでそれを行います。」

AI Now Instituteの主任AI科学者であるハイディ・クラーフ氏は、TechCrunchに対し、AIをテストするより良い方法が必要だと語りました。彼女は次のように述べました。「計算の歴史において、計算能力を人間の能力と直接比較することはありませんでした。なぜなら、計算の本質上、システムは常に人間の能力を超えるタスクを完了できたからです。システムのパフォーマンスを人間の能力と直接比較するという考えは、最近の現象であり、非常に議論の的となっています。そして、AIシステムを評価するために作られている、常に拡大し、変化するベンチマークをめぐる論争がこれを取り巻いています。」

"ドットAIコンパニオンアプリが閉鎖を発表、パーソナライズドサービスを中止" 個人的な友人や親友として機能するように設計されたAIコンパニオン・アプリケーションであるDotが、金曜日の開発者からの発表によると、運営を終了する。Dotを開発したスタートアップのNew Computer社は、10月5日までサービスを提供し、ユーザーが個人データをエクスポートできるようにするとウェブサイトで述べている。このアプリは、共同設立者であるサム・ホイットモアと元アップルのデザイン・スペシャ

Anthropic、AIが作成した書籍の著作権侵害をめぐる訴訟を解決 Anthropic社は、米国の著作者との重要な著作権紛争で解決に達し、高額になる可能性のある裁判を回避する集団訴訟の和解案に合意した。今週火曜日に裁判所文書に提出されたこの合意は、AI企業が海賊版の文学作品を使ってクロードモデルを訓練したという申し立てに起因する。和解の詳細は非公開だが、この訴訟は作家のアンドレア・バーツ、チャールズ・グレイバー、カーク・ウォレス・ジョンソンの主張に端を発している。

Figma、AIを搭載したアプリビルダー・ツールを全ユーザーに公開今年初めに発表された革新的なプロンプト・トゥ・アプリ開発プラットフォームであるFigma Makeが、正式にベータ版を終了し、全ユーザーにロールアウトしました。この画期的なツールは、グーグルのジェミニ・コード・アシストやマイクロソフトのギットハブ・コパイロットのようなAIを搭載したコーディング・アシスタントの仲間入りをし、クリエイターが従来のプログラミングの専門知識がなくても、自然言語の記述を機能

コメント (45)

0/200

提出する

PatrickMartinez

2025年4月22日 15:29:16 JST

A visão de Sam Altman sobre o crescimento do IQ da IA é intrigante, mas me parece um pouco vaga. É legal pensar que a IA está ficando mais inteligente a cada ano, mas como medimos isso? Ainda assim, é um conceito divertido para refletir tomando um café. ☕ Talvez eles devessem desenvolver uma métrica mais concreta? 🤔

RalphMitchell

2025年4月22日 7:56:36 JST

サム・アルトマンのAIのIQ成長に関する見解は興味深いですが、私には少し曖昧に感じます。AIが毎年賢くなると思うのはクールですが、それをどう測るのでしょうか？それでも、コーヒーを飲みながら考える楽しいコンセプトですね。☕もっと具体的な指標を開発すべきかもしれませんね？🤔

GregoryJones

2025年4月21日 16:45:40 JST

サム・アルトマンがAIの「IQ」について語ったのは興味深いけど、私には少し曖昧すぎる感じがする。「ビジョンやスピリチュアルな答え」？本当に？もっと具体的なデータが必要だよ！それでも、AIがどれだけ早く成長しているかを見るのはクールだね。🤔

JonathanKing

2025年4月17日 2:41:37 JST

La perspectiva de Sam Altman sobre el 'IQ' de la IA es interesante, pero me parece un poco demasiado vaga. ¿'Vibe o respuesta espiritual'? Vamos, necesitamos datos más concretos. Aún así, es genial ver lo rápido que está creciendo la IA. 🤔

ArthurThomas

2025年4月15日 15:03:27 JST

Sam Altman's take on AI's 'IQ' growth is pretty wild! Every year a standard deviation? That's like AI is leveling up faster than my favorite RPG character! But honestly, using IQ to measure AI feels off. It's like judging a fish by its ability to climb a tree. Still, it's a cool vibe to think about! 🤔🚀

TimothyHernández

2025年4月15日 11:02:54 JST

Sam Altman's take on AI's 'IQ' is interesting, but it feels a bit too vague for me. 'Vibe or spiritual answer'? Come on, we need more concrete data! Still, it's cool to see how fast AI is growing. 🤔

トップニュース

2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します AI BuilderとPower Automateがドキュメントの要約を革新 Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します

もっと

特集