вариант
Дом
Новости
ИИ выросла за пределы человеческих знаний, говорит подразделение Google DeepMind

ИИ выросла за пределы человеческих знаний, говорит подразделение Google DeepMind

26 апреля 2025 г.
133

Продвижение ИИ за пределы традиционных тестов: Подъем экспериментального обучения

Сфера искусственного интеллекта (ИИ) полна усилий по продвижению генеративного ИИ за рамки традиционных тестов, таких как тест Тьюринга, которые многие модели уже превзошли. Теперь внимание переключается на разработку ИИ, который не просто предназначен для прохождения этих тестов, а развивается через более динамичный процесс.

Исследователи из Google DeepMind, включая таких легенд, как Дэвид Сильвер и Ричард Саттон, утверждают в своей статье Добро пожаловать в эру опыта, что ключ к раскрытию новых возможностей ИИ лежит не в тестах, а в способе обучения ИИ. Они считают, что используемые сейчас статические наборы данных слишком ограничены для значительных достижений.

Их решение? ИИ должен взаимодействовать с миром более экспериментальным образом, обучаясь на взаимодействиях и устанавливая цели на основе обратной связи от окружающей среды. "Невероятные новые возможности появятся, как только будет полностью реализован потенциал экспериментального обучения", — утверждают они. Сильвер, известный своей работой над AlphaZero, которая превзошла людей в шахматах и го, и Саттон, пионер в области обучения с подкреплением, предлагают новый подход, называемый "потоки", чтобы преодолеть ограничения современных больших языковых моделей (LLM).

Google DeepMind

Google DeepMind

От обучения с подкреплением к генеративному ИИ: Сдвиг и его последствия

После успехов AlphaZero и AlphaGo сообщество ИИ переключилось на генеративные модели ИИ, такие как ChatGPT, которые в значительной степени отошли от обучения с подкреплением. Хотя это позволило ИИ обрабатывать более широкий спектр спонтанных человеческих запросов, это также означало утрату аспекта самообнаружения, который обеспечивало обучение с подкреплением.

По словам Сильвера и Саттона, текущие LLM сильно зависят от человеческого суждения на этапе запросов, что ограничивает их потенциал. "Агент не может обнаружить лучшие стратегии, недооцененные человеком-оценщиком", — объясняют они. Более того, краткий, отрывистый характер взаимодействия с запросами не позволяет ИИ развиваться за пределы простых диалогов в формате вопрос-ответ.

Представляем потоки: Новая парадигма для обучения ИИ

Предлагаемая "Эра опыта" предполагает, что агенты ИИ работают в "потоках" непрерывного взаимодействия, подобно тому, как люди учатся на протяжении всей жизни. Сильвер и Саттон представляют агентов ИИ с их собственными долгосрочными потоками опыта, что позволяет им преследовать цели, выходящие за рамки немедленных задач.

Этот подход основывается на обучении с подкреплением, где агенты ИИ взаимодействуют с моделью мира, получая обратную связь в виде наград. Эти награды помогают ИИ понять, какие действия ценны в разных контекстах. Исследователи указывают, что мир полон сигналов, которые могут служить наградами, от экономических показателей до метрик здоровья.

Создание агентов ИИ с долгосрочными целями

Для запуска этого процесса разработчики ИИ могут использовать симуляцию "мировой модели", позволяющую ИИ делать прогнозы, тестировать их в реальности и совершенствовать модель на основе результатов. По мере того как ИИ продолжает взаимодействовать с миром, его понимание развивается, адаптируясь к новым данным и исправляя ошибки.

Люди по-прежнему будут играть роль в установлении общих целей, таких как улучшение физической формы или изучение нового языка, с функцией вознаграждения ИИ, настроенной на эти цели. Такая настройка может привести к созданию ассистентов ИИ, которые отслеживают и консультируют по вопросам здоровья или образования в течение длительного времени или даже преследуют амбициозные научные цели, такие как открытие новых материалов или снижение выбросов углерода.

Будущее ИИ: За пределами рассуждений к экспериментальному обучению

Исследователи считают, что агенты ИИ, способные к долгосрочному экспериментальному обучению, могут превзойти текущие модели ИИ, основанные на "рассуждениях", такие как Gemini и R1 от DeepSeek. Они утверждают, что модели, основанные на рассуждениях, часто имитируют человеческое мышление, которое может быть ограничено устаревшими предположениями. В отличие от этого, экспериментальные агенты могут открыть беспрецедентные возможности, ведя к будущему, значительно отличающемуся от того, что мы видели.

Однако этот сдвиг также несет риски, такие как потеря рабочих мест и сложность контроля над агентами ИИ, которые могут действовать автономно в течение длительного времени. С другой стороны, адаптивный ИИ может научиться смягчать негативное воздействие на людей, корректируя свое поведение на основе обратной связи.

Сильвер и Саттон уверены, что экспериментальные данные значительно превзойдут масштаб и качество данных, созданных человеком, что потенциально приведет к искусственному общему интеллекту или супер-интеллекту. Этот сдвиг парадигмы, в сочетании с достижениями в обучении с подкреплением, может открыть новые возможности, недоступные человеку во многих областях.

Сильвер подробнее обсудил эти идеи в недавнем подкасте DeepMind, подчеркивая потенциал и вызовы перехода ИИ в эру опыта.

Связанная статья
Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo, израильский стартап в области AI-кодирования, ориентированный на качество кода, начал сотрудничество с Google Cloud для повышения целостности программного обеспечения, созданного AI.По мере рост
DeepMind's AI Secures Gold at 2025 Math Olympiad DeepMind's AI Secures Gold at 2025 Math Olympiad ИИ DeepMind достиг потрясающего прорыва в математическом мышлении, завоевав золотую медаль на Международной математической олимпиаде (IMO) 2025 года, всего через год после получения серебра в 2024 год
AI-управляемый Parallax Maker: Создание динамичных 2.5D анимаций AI-управляемый Parallax Maker: Создание динамичных 2.5D анимаций Преобразуйте статические изображения в захватывающие 2.5D анимации с помощью Parallax Maker. Этот инструмент с открытым исходным кодом позволяет художникам и разработчикам игр добавлять глубину и движ
WalterNelson
WalterNelson 19 августа 2025 г., 9:26:53 GMT+03:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

ScottWalker
ScottWalker 15 августа 2025 г., 18:00:59 GMT+03:00

AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀

AlbertGarcía
AlbertGarcía 8 августа 2025 г., 5:00:59 GMT+03:00

Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?

FrankSanchez
FrankSanchez 28 июля 2025 г., 4:20:02 GMT+03:00

This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!

CarlGarcia
CarlGarcia 27 апреля 2025 г., 21:31:27 GMT+03:00

AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!

PaulTaylor
PaulTaylor 27 апреля 2025 г., 18:12:58 GMT+03:00

¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!

Вернуться к вершине
OR