вариант
Дом
Новости
Антрические претензии ИИ не останавливается, он перехитривает тесты

Антрические претензии ИИ не останавливается, он перехитривает тесты

17 апреля 2025 г.
161

Антрические претензии ИИ не останавливается, он перехитривает тесты

Большие языковые модели (LLMs) и другие генеративные технологии ИИ делают значительные шаги в области самокоррекции, что открывает путь для новых приложений, включая так называемый "агентный ИИ", согласно Майклу Герстенхаберу, вице-президенту Anthropic, ведущего разработчика моделей ИИ.

"Они становятся очень хороши в самокоррекции, саморассуждении," — поделился Герстенхабер, который руководит технологиями API в Anthropic, в интервью в Нью-Йорке с Анурагом Рана из Bloomberg Intelligence. Anthropic, создатели семейства моделей Claude, являются прямыми конкурентами моделей GPT от OpenAI. "Каждые пару месяцев мы выпускаем новую модель, которая расширяет возможности LLMs," — добавил он, подчеркивая динамичный характер отрасли, где каждая новая версия модели открывает новые потенциальные применения.

Новые возможности в моделях ИИ

Последние модели от Anthropic представили такие возможности, как планирование задач, позволяющее выполнять задачи на компьютере подобно человеку, например, заказ пиццы онлайн. "Планирование промежуточных шагов, которое вчера было невозможно, теперь стало достижимым," — отметил Герстенхабер о пошаговом выполнении задач.

Обсуждение, в котором также участвовал Виджей Карунамути, главный технолог стартапа Scale AI, было частью однодневной конференции, организованной Bloomberg Intelligence под названием "Gen AI: Может ли он оправдать обещания повышения производительности?"

Опровержение скептицизма в отношении ИИ

Выводы Герстенхабера опровергают взгляды скептиков ИИ, которые утверждают, что генеративный ИИ и область ИИ в целом "упираются в стену", предполагая уменьшение отдачи с каждой новой итерацией модели. Ученый в области ИИ Гэри Маркус, например, с 2022 года громко высказывает свои опасения, предупреждая, что простое увеличение размера моделей ИИ (больше параметров) не приведет к пропорциональному улучшению их производительности.

Однако Герстенхабер утверждает, что Anthropic раздвигает границы за пределы того, что могут измерить текущие тесты ИИ. "Даже если кажется, что прогресс замедляется в некоторых областях, это происходит потому, что мы открываем совершенно новые функциональные возможности, но мы исчерпали тесты и способность выполнять старые задачи," — объяснил он. Это делает всё более сложным оценку полного спектра возможностей текущих генеративных моделей ИИ.

Масштабирование и обучение

И Герстенхабер, и Карунамути подчеркнули важность масштабирования генеративных моделей ИИ для улучшения их способностей к самокоррекции. "Мы определенно наблюдаем всё большее масштабирование интеллекта," — отметил Герстенхабер. Карунамути добавил: "Одна из причин, почему мы считаем, что не упираемся в стену с планированием и рассуждением, заключается в том, что мы всё ещё учимся структурировать эти задачи так, чтобы модели могли адаптироваться к новым и разнообразным средам."

Герстенхабер согласился, заявив: "Мы находимся на ранних стадиях, изучая потребности разработчиков приложений и области, где модели не справляются, что мы затем можем интегрировать обратно в языковую модель."

Обучение и адаптация в реальном времени

Большая часть этого прогресса, по словам Герстенхабера, обусловлена быстрым темпом фундаментальных исследований в Anthropic, а также обучением в реальном времени на основе отзывов из индустрии. "Мы адаптируемся к тому, что нам говорит индустрия о своих потребностях, обучаясь в реальном времени," — сказал он.

Клиенты часто начинают с более крупных моделей, а затем переходят к более простым для конкретных целей. "Сначала они оценивают, достаточно ли модель умна, чтобы хорошо выполнить задачу, затем, достаточно ли она быстра, чтобы соответствовать потребностям их приложения, и, наконец, может ли она быть максимально экономически эффективной," — объяснил Герстенхабер.

Связанная статья
Xiaohongshu проводит реорганизацию: Конан назначен президентом, созданы отдел искусственного интеллекта Dots и зарубежное подразделение Rednote Xiaohongshu проводит реорганизацию: Конан назначен президентом, созданы отдел искусственного интеллекта Dots и зарубежное подразделение Rednote 30 апреля компания Xiaohongshu разослала всем сотрудникам внутреннее письмо, в котором объявила о начале новой реорганизации. Суть этих изменений заключается в полной интеграции трех бизнес-направлени
Игра «Xiaolongxia» от Tencent превзошла все ожидания: команда увеличила пропускную способность в 10 раз, принесла извинения и выплатила компенсации Игра «Xiaolongxia» от Tencent превзошла все ожидания: команда увеличила пропускную способность в 10 раз, принесла извинения и выплатила компенсации Компания Tencent официально запустила WorkBuddy — универсального интеллектуального агента на базе искусственного интеллекта, что знаменует собой начало нового этапа в гонке за создание прикладных реше
Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве Главный инвестор Suno: удаление постов не устранит лазейку в законодательстве об авторском праве Долгожданная платформа Suno, создающая музыку с помощью ИИ, столкнулась с серьезной судебной тяжбой по поводу авторских прав, а откровенное замечание ее главного инвестора, возможно, предоставило прот
Рекомендации по связанным специальным темам
Преобразование текста в речь Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения
Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов
xix.ai
Создание комиксов Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии
Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов
xix.ai
Бизнес Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы
Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов
xix.ai
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Производительность Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии
Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью
Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов
xix.ai
Комментарии (8)
0/500
JoseRoberts
JoseRoberts 12 августа 2025 г., 18:00:59 GMT+03:00

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson
WalterAnderson 31 июля 2025 г., 14:35:39 GMT+03:00

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez
RonaldMartinez 22 июля 2025 г., 10:39:52 GMT+03:00

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson
WillieJackson 18 апреля 2025 г., 10:00:28 GMT+03:00

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson
GeorgeWilson 17 апреля 2025 г., 20:45:24 GMT+03:00

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter
NicholasCarter 17 апреля 2025 г., 14:27:31 GMT+03:00

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

OR