IQ: ошибочная мера для оценки ИИ

Дом

Новости

8 апреля 2025 г.

EdwardYoung

107

# ai # iq tests

"IQ: ошибочная мера для оценки ИИ"

На недавнем пресс-мероприятии генеральный директор OpenAI Сэм Альтман поделился своими мыслями о быстром развитии "IQ" искусственного интеллекта. Он отметил: «Очень грубо говоря, мне кажется — это не научно точно, это просто ощущение или духовный ответ — каждый год мы продвигаемся на одно стандартное отклонение IQ». Альтман не единственный, кто использует IQ как мерило прогресса ИИ; известно, что влиятельные личности в социальных сетях также подвергают модели ИИ тестам на IQ и делятся результатами.

Однако многие эксперты утверждают, что использование IQ для оценки возможностей ИИ не только недостаточно, но и вводит в заблуждение. Сандра Вахтер, исследователь из Оксфорда, специализирующийся на технологиях и регулировании, рассказала TechCrunch: «Очень заманчиво использовать те же меры, что мы применяем к людям, для описания возможностей или прогресса, но это всё равно что сравнивать яблоки с апельсинами».

Во время пресс-конференции Альтман, похоже, приравнивал IQ к интеллекту. Однако тесты на IQ больше касаются относительных, а не абсолютных мер определённых типов интеллекта. Их обычно считают хорошими индикаторами логики и абстрактного мышления, но они не справляются, когда речь заходит о практическом интеллекте — том, который помогает разобраться, как заставить вещи работать. Кроме того, они дают лишь моментальный снимок способностей человека.

Вахтер отметила: «IQ — это инструмент для измерения человеческих способностей — и при этом спорный — основанный на том, что учёные считают человеческим интеллектом. Но вы не можете использовать ту же меру для описания возможностей ИИ. Машина быстрее человека, а подводная лодка лучше ныряет. Но это не значит, что машины или подводные лодки превосходят человеческий интеллект. Вы приравниваете один аспект производительности к человеческому интеллекту, который намного сложнее».

Происхождение тестов на IQ связано с евгеникой, дискредитированной теорией об улучшении людей путём селективного разведения. Чтобы хорошо справиться с этими тестами, нужна хорошая рабочая память и знакомство с западными культурными нормами, что может вносить предвзятость. Ос Кейс, докторант Университета Вашингтона, изучающий этичный ИИ, считает, что если модель ИИ хорошо справляется с тестом на IQ, это больше говорит о недостатках теста, чем о мастерстве модели. Кейс сказал: «Эти тесты довольно легко обойти, если у вас практически бесконечный объём памяти и терпения. Тесты на IQ — это крайне ограниченный способ измерения познания, сознания и интеллекта, что мы знали ещё до изобретения цифрового компьютера».

У ИИ может быть несправедливое преимущество в тестах на IQ, потому что модели обладают огромной памятью и знаниями на кончиках пальцев. Они часто обучаются на общедоступных веб-данных, которые включают множество вопросов из тестов на IQ. Майк Кук, научный сотрудник Королевского колледжа Лондона, специализирующийся на ИИ, отметил: «Тесты, как правило, повторяют очень похожие шаблоны — довольно надёжный способ повысить свой IQ — это практиковаться в прохождении тестов на IQ, что, по сути, и делает каждая модель. Когда я что-то изучаю, это не поступает в мой мозг с идеальной чёткостью миллион раз, в отличие от ИИ, и я не могу обрабатывать это без шума или потери сигнала».

Кук также указал, что тесты на IQ, с их присущими предвзятостями, были разработаны для людей, чтобы оценивать общие навыки решения проблем. Они не подходят для ИИ, который решает задачи иначе. Он сказал: «Ворона может использовать инструмент, чтобы достать лакомство из коробки, но это не значит, что она может поступить в Гарвард. Когда я решаю математическую задачу, мой мозг также борется с тем, чтобы правильно прочитать слова на странице, не думать о покупках, которые мне нужно сделать по дороге домой, или о том, не слишком ли холодно в комнате сейчас. Другими словами, человеческий мозг сталкивается с гораздо большим количеством вещей, когда решает задачу — любую задачу, тесты на IQ или что-то ещё — и делает это с гораздо меньшей помощью, чем ИИ».

Хейди Хлааф, главный учёный по ИИ в Институте AI Now, рассказала TechCrunch, что нам нужны лучшие способы тестирования ИИ. Она сказала: «В истории вычислений мы не сравнивали вычислительные способности с человеческими именно потому, что природа вычислений означает, что системы всегда могли выполнять задачи, уже выходящие за пределы человеческих возможностей. Идея прямого сравнения производительности систем с человеческими способностями — это недавнее явление, которое вызывает много споров, и вокруг него разгорается полемика о постоянно расширяющихся — и меняющихся — эталонах, создаваемых для оценки систем ИИ».

Связанная статья

"Dot AI Companion объявляет о закрытии и прекращает предоставление персонализированных услуг" Dot, приложение-компаньон с искусственным интеллектом, предназначенное для работы в качестве личного друга и доверенного лица, прекращает свою работу, как сообщили в пятницу его разработчики. New Comp

Anthropic разрешила судебное дело о пиратстве книг, созданных искусственным интеллектом Компания Anthropic достигла разрешения значительного спора с американскими авторами по поводу авторских прав, согласившись на предложенное урегулирование коллективного иска, которое позволит избежать

Figma выпустила инструмент для создания приложений на основе искусственного интеллекта для всех пользователей Figma Make, инновационная платформа для разработки приложений с подсказками, представленная ранее в этом году, официально вышла из бета-версии и стала доступна для всех пользователей. Этот революционн

Комментарии (45)

0/200

Представлять на рассмотрение

PatrickMartinez

22 апреля 2025 г., 9:29:16 GMT+03:00

A visão de Sam Altman sobre o crescimento do IQ da IA é intrigante, mas me parece um pouco vaga. É legal pensar que a IA está ficando mais inteligente a cada ano, mas como medimos isso? Ainda assim, é um conceito divertido para refletir tomando um café. ☕ Talvez eles devessem desenvolver uma métrica mais concreta? 🤔

RalphMitchell

22 апреля 2025 г., 1:56:36 GMT+03:00

サム・アルトマンのAIのIQ成長に関する見解は興味深いですが、私には少し曖昧に感じます。AIが毎年賢くなると思うのはクールですが、それをどう測るのでしょうか？それでも、コーヒーを飲みながら考える楽しいコンセプトですね。☕もっと具体的な指標を開発すべきかもしれませんね？🤔

GregoryJones

21 апреля 2025 г., 10:45:40 GMT+03:00

サム・アルトマンがAIの「IQ」について語ったのは興味深いけど、私には少し曖昧すぎる感じがする。「ビジョンやスピリチュアルな答え」？本当に？もっと具体的なデータが必要だよ！それでも、AIがどれだけ早く成長しているかを見るのはクールだね。🤔

JonathanKing

16 апреля 2025 г., 20:41:37 GMT+03:00

La perspectiva de Sam Altman sobre el 'IQ' de la IA es interesante, pero me parece un poco demasiado vaga. ¿'Vibe o respuesta espiritual'? Vamos, necesitamos datos más concretos. Aún así, es genial ver lo rápido que está creciendo la IA. 🤔

ArthurThomas

15 апреля 2025 г., 9:03:27 GMT+03:00

Sam Altman's take on AI's 'IQ' growth is pretty wild! Every year a standard deviation? That's like AI is leveling up faster than my favorite RPG character! But honestly, using IQ to measure AI feels off. It's like judging a fish by its ability to climb a tree. Still, it's a cool vibe to think about! 🤔🚀

TimothyHernández

15 апреля 2025 г., 5:02:54 GMT+03:00

Sam Altman's take on AI's 'IQ' is interesting, but it feels a bit too vague for me. 'Vibe or spiritual answer'? Come on, we need more concrete data! Still, it's cool to see how fast AI is growing. 🤔

Лучшие новости

Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Gemini 2.5 Pro в настоящее время неограничен и дешевле, чем Claude, GPT-4O Озвучка с помощью ИИ: Ультимативное руководство по созданию реалистичных голосов ИИ ИИ Cambium превращает отходы в пиломатериалы AI Builder и Power Automate Революционизируют Суммирование Документов OpenAI улучшает AI Voice Assistant для лучших чатов Как гарантировать, что ваши данные заслуживают доверия для интеграции искусственного интеллекта NoteBooklm расширяется во всем мире, добавляет слайды и расширенную проверку фактов Настройки для дата -центров США могут разблокировать 76 ГВт новой мощности. Google использует ИИ для приостановки более 39 миллионов счетов объявлений о подозрении на мошенничество

Более

Показан