「IQ:AI評価の欠陥のある尺度」

最近の記者会見で、OpenAIのCEOであるサム・アルトマン氏は、AIの「IQ」の急速な進歩についての考えを共有しました。彼は次のように述べました。「非常に大まかに言えば、これは科学的には正確ではありませんが、ただの感覚的または精神的な答えです。毎年、IQの1標準偏差分進んでいるように感じます。」アルトマン氏だけがAIの進歩の基準としてIQを使用しているわけではありません。ソーシャルメディアのインフルエンサーたちも、AIモデルにIQテストを受けさせ、その結果を共有することで知られています。
しかし、多くの専門家は、AIの能力を評価するためにIQを使用することは不適切であるだけでなく、誤解を招くと主張しています。オックスフォードで技術と規制を研究しているサンドラ・ワクター氏は、TechCrunchに対し、「人間の能力や進歩を記述するために使用するのと同じ基準をAIに使うのは非常に魅力的ですが、これはリンゴとオレンジを比較するようなものです」と語りました。
記者会見中、アルトマン氏はIQを知能と同等に扱っているようでした。しかし、IQテストは特定の種類の知能の相対的な尺度であり、絶対的な尺度ではありません。これらは一般に論理や抽象的推論の良い指標とされていますが、実際の知能、つまり物事を機能させる方法を見つけ出す能力については十分ではありません。また、IQテストは個人の能力のスナップショットを提供するだけです。
ワクター氏は次のように指摘しました。「IQは、科学者が人間の知能と考えているものに基づいて、人間の能力を測定するツールです——それ自体が議論の的となるツールです。しかし、AIの能力を記述するために同じ基準を使うことはできません。車は人間よりも速く、潜水艦は潜水に優れています。しかし、これは車や潜水艦が人間の知能を超えているという意味ではありません。パフォーマンスの一部の側面を人間の知能と同等に扱うのは、はるかに複雑なものです。」
IQテストの起源は、選択的育種によって人々を改善するという、信用を失った優生学の理論に結びついています。これらのテストで良い成績を収めるには、優れたワーキングメモリと西洋の文化的規範への慣れが必要であり、これが偏見を生む可能性があります。ワシントン大学の博士課程で倫理的AIを研究しているオス・キーズ氏は、AIモデルがIQテストで良い成績を収めた場合、それはモデルの能力というよりもテストの欠点について多くを物語ると考えています。キーズ氏は次のように述べました。「これらのテストは、ほぼ無限のメモリと忍耐力があれば、かなり簡単に攻略できます。IQテストは、認知、意識、知能を測定する非常に限定的な方法であり、これはデジタルコンピュータの発明以前から知られていたことです。」
AIは、膨大なメモリと知識をすぐに利用できるため、IQテストで不公平な優位性を持つ可能性があります。AIはしばしば公開ウェブデータでトレーニングされており、そこには多くのIQテストの問題が含まれています。キングス・カレッジ・ロンドンでAIを専門とする研究フェローのマイク・クック氏は、次のように指摘しました。「テストは非常に似たパターンを繰り返す傾向があります。IQを上げる確実な方法は、IQテストを練習することであり、これはすべてのモデルが実質的に行っていることです。私が何かを学ぶとき、AIとは異なり、100万回完全に明確に脳に送り込まれるわけではありませんし、ノイズや信号の損失なしに処理することもできません。」
クック氏はまた、IQテストはその固有の偏見により、人間の一般的な問題解決スキルを評価するために設計されたものであり、AIには適していないと指摘しました。彼は次のように述べました。「カラスは道具を使って箱からおやつを取り出すことができるかもしれませんが、それがハーバード大学に入学できるという意味ではありません。私が数学の問題を解くとき、私の脳はページの文字を正しく読む能力、帰宅途中に必要な買い物のことを考えないようにする能力、部屋が今寒すぎるかどうかを気にする能力とも戦っています。つまり、人間の脳は、IQテストであれ他の問題であれ、問題を解くときに多くのことを同時に処理しなければならず、AIよりもはるかに少ない助けでそれを行います。」
AI Now Instituteの主任AI科学者であるハイディ・クラーフ氏は、TechCrunchに対し、AIをテストするより良い方法が必要だと語りました。彼女は次のように述べました。「計算の歴史において、計算能力を人間の能力と直接比較することはありませんでした。なぜなら、計算の本質上、システムは常に人間の能力を超えるタスクを完了できたからです。システムのパフォーマンスを人間の能力と直接比較するという考えは、最近の現象であり、非常に議論の的となっています。そして、AIシステムを評価するために作られている、常に拡大し、変化するベンチマークをめぐる論争がこれを取り巻いています。」
関連記事
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
関連特集おすすめ
コメント (48)
0/500
interesting perspective! always thought of AI as a super-fast learner, not something we could measure with something like IQ. sam’s analogy does make it relatable, but i agree—AI probably needs its own new rating system entirely. 🤔
Это точно! IQ — устаревший инструмент для оценки ИИ 🤖 Интеллект многогранен — творчество, эмоции, адаптация куда важнее сухих цифр. Интересно, какие метрики придут на смену?
¿IQ para medir IA? 😅 Qué idea más anticuada. Sam Altman tiene razón en que es una métrica limitada. Los humanos tenemos inteligencias múltiples, ¿por qué reducirlo todo a un número? Me pregunto si no deberíamos desarrollar nuevas formas de evaluar capacidades como creatividad o empatía en sistemas de IA. ¡Eso sí sería revolucionario!
A visão de Sam Altman sobre o crescimento do IQ da IA é intrigante, mas me parece um pouco vaga. É legal pensar que a IA está ficando mais inteligente a cada ano, mas como medimos isso? Ainda assim, é um conceito divertido para refletir tomando um café. ☕ Talvez eles devessem desenvolver uma métrica mais concreta? 🤔
サム・アルトマンのAIのIQ成長に関する見解は興味深いですが、私には少し曖昧に感じます。AIが毎年賢くなると思うのはクールですが、それをどう測るのでしょうか?それでも、コーヒーを飲みながら考える楽しいコンセプトですね。☕もっと具体的な指標を開発すべきかもしれませんね?🤔

最近の記者会見で、OpenAIのCEOであるサム・アルトマン氏は、AIの「IQ」の急速な進歩についての考えを共有しました。彼は次のように述べました。「非常に大まかに言えば、これは科学的には正確ではありませんが、ただの感覚的または精神的な答えです。毎年、IQの1標準偏差分進んでいるように感じます。」アルトマン氏だけがAIの進歩の基準としてIQを使用しているわけではありません。ソーシャルメディアのインフルエンサーたちも、AIモデルにIQテストを受けさせ、その結果を共有することで知られています。
しかし、多くの専門家は、AIの能力を評価するためにIQを使用することは不適切であるだけでなく、誤解を招くと主張しています。オックスフォードで技術と規制を研究しているサンドラ・ワクター氏は、TechCrunchに対し、「人間の能力や進歩を記述するために使用するのと同じ基準をAIに使うのは非常に魅力的ですが、これはリンゴとオレンジを比較するようなものです」と語りました。
記者会見中、アルトマン氏はIQを知能と同等に扱っているようでした。しかし、IQテストは特定の種類の知能の相対的な尺度であり、絶対的な尺度ではありません。これらは一般に論理や抽象的推論の良い指標とされていますが、実際の知能、つまり物事を機能させる方法を見つけ出す能力については十分ではありません。また、IQテストは個人の能力のスナップショットを提供するだけです。
ワクター氏は次のように指摘しました。「IQは、科学者が人間の知能と考えているものに基づいて、人間の能力を測定するツールです——それ自体が議論の的となるツールです。しかし、AIの能力を記述するために同じ基準を使うことはできません。車は人間よりも速く、潜水艦は潜水に優れています。しかし、これは車や潜水艦が人間の知能を超えているという意味ではありません。パフォーマンスの一部の側面を人間の知能と同等に扱うのは、はるかに複雑なものです。」
IQテストの起源は、選択的育種によって人々を改善するという、信用を失った優生学の理論に結びついています。これらのテストで良い成績を収めるには、優れたワーキングメモリと西洋の文化的規範への慣れが必要であり、これが偏見を生む可能性があります。ワシントン大学の博士課程で倫理的AIを研究しているオス・キーズ氏は、AIモデルがIQテストで良い成績を収めた場合、それはモデルの能力というよりもテストの欠点について多くを物語ると考えています。キーズ氏は次のように述べました。「これらのテストは、ほぼ無限のメモリと忍耐力があれば、かなり簡単に攻略できます。IQテストは、認知、意識、知能を測定する非常に限定的な方法であり、これはデジタルコンピュータの発明以前から知られていたことです。」
AIは、膨大なメモリと知識をすぐに利用できるため、IQテストで不公平な優位性を持つ可能性があります。AIはしばしば公開ウェブデータでトレーニングされており、そこには多くのIQテストの問題が含まれています。キングス・カレッジ・ロンドンでAIを専門とする研究フェローのマイク・クック氏は、次のように指摘しました。「テストは非常に似たパターンを繰り返す傾向があります。IQを上げる確実な方法は、IQテストを練習することであり、これはすべてのモデルが実質的に行っていることです。私が何かを学ぶとき、AIとは異なり、100万回完全に明確に脳に送り込まれるわけではありませんし、ノイズや信号の損失なしに処理することもできません。」
クック氏はまた、IQテストはその固有の偏見により、人間の一般的な問題解決スキルを評価するために設計されたものであり、AIには適していないと指摘しました。彼は次のように述べました。「カラスは道具を使って箱からおやつを取り出すことができるかもしれませんが、それがハーバード大学に入学できるという意味ではありません。私が数学の問題を解くとき、私の脳はページの文字を正しく読む能力、帰宅途中に必要な買い物のことを考えないようにする能力、部屋が今寒すぎるかどうかを気にする能力とも戦っています。つまり、人間の脳は、IQテストであれ他の問題であれ、問題を解くときに多くのことを同時に処理しなければならず、AIよりもはるかに少ない助けでそれを行います。」
AI Now Instituteの主任AI科学者であるハイディ・クラーフ氏は、TechCrunchに対し、AIをテストするより良い方法が必要だと語りました。彼女は次のように述べました。「計算の歴史において、計算能力を人間の能力と直接比較することはありませんでした。なぜなら、計算の本質上、システムは常に人間の能力を超えるタスクを完了できたからです。システムのパフォーマンスを人間の能力と直接比較するという考えは、最近の現象であり、非常に議論の的となっています。そして、AIシステムを評価するために作られている、常に拡大し、変化するベンチマークをめぐる論争がこれを取り巻いています。」
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
interesting perspective! always thought of AI as a super-fast learner, not something we could measure with something like IQ. sam’s analogy does make it relatable, but i agree—AI probably needs its own new rating system entirely. 🤔
Это точно! IQ — устаревший инструмент для оценки ИИ 🤖 Интеллект многогранен — творчество, эмоции, адаптация куда важнее сухих цифр. Интересно, какие метрики придут на смену?
¿IQ para medir IA? 😅 Qué idea más anticuada. Sam Altman tiene razón en que es una métrica limitada. Los humanos tenemos inteligencias múltiples, ¿por qué reducirlo todo a un número? Me pregunto si no deberíamos desarrollar nuevas formas de evaluar capacidades como creatividad o empatía en sistemas de IA. ¡Eso sí sería revolucionario!
A visão de Sam Altman sobre o crescimento do IQ da IA é intrigante, mas me parece um pouco vaga. É legal pensar que a IA está ficando mais inteligente a cada ano, mas como medimos isso? Ainda assim, é um conceito divertido para refletir tomando um café. ☕ Talvez eles devessem desenvolver uma métrica mais concreta? 🤔
サム・アルトマンのAIのIQ成長に関する見解は興味深いですが、私には少し曖昧に感じます。AIが毎年賢くなると思うのはクールですが、それをどう測るのでしょうか?それでも、コーヒーを飲みながら考える楽しいコンセプトですね。☕もっと具体的な指標を開発すべきかもしれませんね?🤔





家






