вариант
Дом
Новости
"IQ: ошибочная мера для оценки ИИ"

"IQ: ошибочная мера для оценки ИИ"

8 апреля 2025 г.
107

"IQ: ошибочная мера для оценки ИИ"

На недавнем пресс-мероприятии генеральный директор OpenAI Сэм Альтман поделился своими мыслями о быстром развитии "IQ" искусственного интеллекта. Он отметил: «Очень грубо говоря, мне кажется — это не научно точно, это просто ощущение или духовный ответ — каждый год мы продвигаемся на одно стандартное отклонение IQ». Альтман не единственный, кто использует IQ как мерило прогресса ИИ; известно, что влиятельные личности в социальных сетях также подвергают модели ИИ тестам на IQ и делятся результатами.

Однако многие эксперты утверждают, что использование IQ для оценки возможностей ИИ не только недостаточно, но и вводит в заблуждение. Сандра Вахтер, исследователь из Оксфорда, специализирующийся на технологиях и регулировании, рассказала TechCrunch: «Очень заманчиво использовать те же меры, что мы применяем к людям, для описания возможностей или прогресса, но это всё равно что сравнивать яблоки с апельсинами».

Во время пресс-конференции Альтман, похоже, приравнивал IQ к интеллекту. Однако тесты на IQ больше касаются относительных, а не абсолютных мер определённых типов интеллекта. Их обычно считают хорошими индикаторами логики и абстрактного мышления, но они не справляются, когда речь заходит о практическом интеллекте — том, который помогает разобраться, как заставить вещи работать. Кроме того, они дают лишь моментальный снимок способностей человека.

Вахтер отметила: «IQ — это инструмент для измерения человеческих способностей — и при этом спорный — основанный на том, что учёные считают человеческим интеллектом. Но вы не можете использовать ту же меру для описания возможностей ИИ. Машина быстрее человека, а подводная лодка лучше ныряет. Но это не значит, что машины или подводные лодки превосходят человеческий интеллект. Вы приравниваете один аспект производительности к человеческому интеллекту, который намного сложнее».

Происхождение тестов на IQ связано с евгеникой, дискредитированной теорией об улучшении людей путём селективного разведения. Чтобы хорошо справиться с этими тестами, нужна хорошая рабочая память и знакомство с западными культурными нормами, что может вносить предвзятость. Ос Кейс, докторант Университета Вашингтона, изучающий этичный ИИ, считает, что если модель ИИ хорошо справляется с тестом на IQ, это больше говорит о недостатках теста, чем о мастерстве модели. Кейс сказал: «Эти тесты довольно легко обойти, если у вас практически бесконечный объём памяти и терпения. Тесты на IQ — это крайне ограниченный способ измерения познания, сознания и интеллекта, что мы знали ещё до изобретения цифрового компьютера».

У ИИ может быть несправедливое преимущество в тестах на IQ, потому что модели обладают огромной памятью и знаниями на кончиках пальцев. Они часто обучаются на общедоступных веб-данных, которые включают множество вопросов из тестов на IQ. Майк Кук, научный сотрудник Королевского колледжа Лондона, специализирующийся на ИИ, отметил: «Тесты, как правило, повторяют очень похожие шаблоны — довольно надёжный способ повысить свой IQ — это практиковаться в прохождении тестов на IQ, что, по сути, и делает каждая модель. Когда я что-то изучаю, это не поступает в мой мозг с идеальной чёткостью миллион раз, в отличие от ИИ, и я не могу обрабатывать это без шума или потери сигнала».

Кук также указал, что тесты на IQ, с их присущими предвзятостями, были разработаны для людей, чтобы оценивать общие навыки решения проблем. Они не подходят для ИИ, который решает задачи иначе. Он сказал: «Ворона может использовать инструмент, чтобы достать лакомство из коробки, но это не значит, что она может поступить в Гарвард. Когда я решаю математическую задачу, мой мозг также борется с тем, чтобы правильно прочитать слова на странице, не думать о покупках, которые мне нужно сделать по дороге домой, или о том, не слишком ли холодно в комнате сейчас. Другими словами, человеческий мозг сталкивается с гораздо большим количеством вещей, когда решает задачу — любую задачу, тесты на IQ или что-то ещё — и делает это с гораздо меньшей помощью, чем ИИ».

Хейди Хлааф, главный учёный по ИИ в Институте AI Now, рассказала TechCrunch, что нам нужны лучшие способы тестирования ИИ. Она сказала: «В истории вычислений мы не сравнивали вычислительные способности с человеческими именно потому, что природа вычислений означает, что системы всегда могли выполнять задачи, уже выходящие за пределы человеческих возможностей. Идея прямого сравнения производительности систем с человеческими способностями — это недавнее явление, которое вызывает много споров, и вокруг него разгорается полемика о постоянно расширяющихся — и меняющихся — эталонах, создаваемых для оценки систем ИИ».

Связанная статья
Salesforce представляет цифровых помощников с ИИ в Slack для конкуренции с Microsoft Copilot Salesforce представляет цифровых помощников с ИИ в Slack для конкуренции с Microsoft Copilot Salesforce запустила новую стратегию ИИ для рабочего места, представив специализированных «цифровых помощников», интегрированных в беседы Slack, сообщила компания в понедельник.Новый инструмент, Agent
Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе Oracle планирует инвестировать около $40 млрд в чипы Nvidia для нового крупного дата-центра в Техасе, разработанного OpenAI, как сообщает Financial Times. Эта сделка, одна из крупнейших по закупке чип
Приложение Meta AI представит премиум-уровень и рекламу Приложение Meta AI представит премиум-уровень и рекламу Приложение Meta AI вскоре может предложить платную подписку, аналогичную предложениям конкурентов, таких как OpenAI, Google и Microsoft. Во время отчета о доходах за первый квартал 2025 года генеральн
Комментарии (45)
PatrickMartinez
PatrickMartinez 22 апреля 2025 г., 9:29:16 GMT+03:00

A visão de Sam Altman sobre o crescimento do IQ da IA é intrigante, mas me parece um pouco vaga. É legal pensar que a IA está ficando mais inteligente a cada ano, mas como medimos isso? Ainda assim, é um conceito divertido para refletir tomando um café. ☕ Talvez eles devessem desenvolver uma métrica mais concreta? 🤔

RalphMitchell
RalphMitchell 22 апреля 2025 г., 1:56:36 GMT+03:00

サム・アルトマンのAIのIQ成長に関する見解は興味深いですが、私には少し曖昧に感じます。AIが毎年賢くなると思うのはクールですが、それをどう測るのでしょうか?それでも、コーヒーを飲みながら考える楽しいコンセプトですね。☕もっと具体的な指標を開発すべきかもしれませんね?🤔

GregoryJones
GregoryJones 21 апреля 2025 г., 10:45:40 GMT+03:00

サム・アルトマンがAIの「IQ」について語ったのは興味深いけど、私には少し曖昧すぎる感じがする。「ビジョンやスピリチュアルな答え」?本当に?もっと具体的なデータが必要だよ!それでも、AIがどれだけ早く成長しているかを見るのはクールだね。🤔

JonathanKing
JonathanKing 16 апреля 2025 г., 20:41:37 GMT+03:00

La perspectiva de Sam Altman sobre el 'IQ' de la IA es interesante, pero me parece un poco demasiado vaga. ¿'Vibe o respuesta espiritual'? Vamos, necesitamos datos más concretos. Aún así, es genial ver lo rápido que está creciendo la IA. 🤔

ArthurThomas
ArthurThomas 15 апреля 2025 г., 9:03:27 GMT+03:00

Sam Altman's take on AI's 'IQ' growth is pretty wild! Every year a standard deviation? That's like AI is leveling up faster than my favorite RPG character! But honestly, using IQ to measure AI feels off. It's like judging a fish by its ability to climb a tree. Still, it's a cool vibe to think about! 🤔🚀

TimothyHernández
TimothyHernández 15 апреля 2025 г., 5:02:54 GMT+03:00

Sam Altman's take on AI's 'IQ' is interesting, but it feels a bit too vague for me. 'Vibe or spiritual answer'? Come on, we need more concrete data! Still, it's cool to see how fast AI is growing. 🤔

Вернуться к вершине
OR