Антрические претензии ИИ не останавливается, он перехитривает тесты

Дом

Новости

17 апреля 2025 г.

ThomasYoung

108

Антрические претензии ИИ не останавливается, он перехитривает тесты

Большие языковые модели (LLMs) и другие генеративные технологии ИИ делают значительные шаги в области самокоррекции, что открывает путь для новых приложений, включая так называемый "агентный ИИ", согласно Майклу Герстенхаберу, вице-президенту Anthropic, ведущего разработчика моделей ИИ.

"Они становятся очень хороши в самокоррекции, саморассуждении," — поделился Герстенхабер, который руководит технологиями API в Anthropic, в интервью в Нью-Йорке с Анурагом Рана из Bloomberg Intelligence. Anthropic, создатели семейства моделей Claude, являются прямыми конкурентами моделей GPT от OpenAI. "Каждые пару месяцев мы выпускаем новую модель, которая расширяет возможности LLMs," — добавил он, подчеркивая динамичный характер отрасли, где каждая новая версия модели открывает новые потенциальные применения.

Новые возможности в моделях ИИ

Последние модели от Anthropic представили такие возможности, как планирование задач, позволяющее выполнять задачи на компьютере подобно человеку, например, заказ пиццы онлайн. "Планирование промежуточных шагов, которое вчера было невозможно, теперь стало достижимым," — отметил Герстенхабер о пошаговом выполнении задач.

Обсуждение, в котором также участвовал Виджей Карунамути, главный технолог стартапа Scale AI, было частью однодневной конференции, организованной Bloomberg Intelligence под названием "Gen AI: Может ли он оправдать обещания повышения производительности?"

Опровержение скептицизма в отношении ИИ

Выводы Герстенхабера опровергают взгляды скептиков ИИ, которые утверждают, что генеративный ИИ и область ИИ в целом "упираются в стену", предполагая уменьшение отдачи с каждой новой итерацией модели. Ученый в области ИИ Гэри Маркус, например, с 2022 года громко высказывает свои опасения, предупреждая, что простое увеличение размера моделей ИИ (больше параметров) не приведет к пропорциональному улучшению их производительности.

Однако Герстенхабер утверждает, что Anthropic раздвигает границы за пределы того, что могут измерить текущие тесты ИИ. "Даже если кажется, что прогресс замедляется в некоторых областях, это происходит потому, что мы открываем совершенно новые функциональные возможности, но мы исчерпали тесты и способность выполнять старые задачи," — объяснил он. Это делает всё более сложным оценку полного спектра возможностей текущих генеративных моделей ИИ.

Масштабирование и обучение

И Герстенхабер, и Карунамути подчеркнули важность масштабирования генеративных моделей ИИ для улучшения их способностей к самокоррекции. "Мы определенно наблюдаем всё большее масштабирование интеллекта," — отметил Герстенхабер. Карунамути добавил: "Одна из причин, почему мы считаем, что не упираемся в стену с планированием и рассуждением, заключается в том, что мы всё ещё учимся структурировать эти задачи так, чтобы модели могли адаптироваться к новым и разнообразным средам."

Герстенхабер согласился, заявив: "Мы находимся на ранних стадиях, изучая потребности разработчиков приложений и области, где модели не справляются, что мы затем можем интегрировать обратно в языковую модель."

Обучение и адаптация в реальном времени

Большая часть этого прогресса, по словам Герстенхабера, обусловлена быстрым темпом фундаментальных исследований в Anthropic, а также обучением в реальном времени на основе отзывов из индустрии. "Мы адаптируемся к тому, что нам говорит индустрия о своих потребностях, обучаясь в реальном времени," — сказал он.

Клиенты часто начинают с более крупных моделей, а затем переходят к более простым для конкретных целей. "Сначала они оценивают, достаточно ли модель умна, чтобы хорошо выполнить задачу, затем, достаточно ли она быстра, чтобы соответствовать потребностям их приложения, и, наконец, может ли она быть максимально экономически эффективной," — объяснил Герстенхабер.

Связанная статья

Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал В сегодняшней конкурентной среде научных изданий составление эффективного сопроводительного письма может сыграть решающую роль в принятии вашей рукописи. Узнайте, как инструменты с искусственным интел

США введут санкции против иностранных чиновников из-за правил пользования социальными сетями США выступают против глобального регулирования цифрового контентаНа этой неделе Государственный департамент США выступил с резким дипломатическим обвинением в адрес европейской политики управления ц

Окончательное руководство по обобщающим анализаторам видео на YouTube с поддержкой искусственного интеллекта В нашем перенасыщенном информацией цифровом ландшафте, обобщающие видео на YouTube с помощью искусственного интеллекта стали незаменимы для эффективного потребления контента. В этом подробном руководс

Комментарии (8)

0/200

Представлять на рассмотрение

JoseRoberts

12 августа 2025 г., 18:00:59 GMT+03:00

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson

31 июля 2025 г., 14:35:39 GMT+03:00

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez

22 июля 2025 г., 10:39:52 GMT+03:00

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson

18 апреля 2025 г., 10:00:28 GMT+03:00

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson

17 апреля 2025 г., 20:45:24 GMT+03:00

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter

17 апреля 2025 г., 14:27:31 GMT+03:00

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

Лучшие новости

Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Gemini 2.5 Pro в настоящее время неограничен и дешевле, чем Claude, GPT-4O Озвучка с помощью ИИ: Ультимативное руководство по созданию реалистичных голосов ИИ ИИ Cambium превращает отходы в пиломатериалы AI Builder и Power Automate Революционизируют Суммирование Документов OpenAI улучшает AI Voice Assistant для лучших чатов Как гарантировать, что ваши данные заслуживают доверия для интеграции искусственного интеллекта NoteBooklm расширяется во всем мире, добавляет слайды и расширенную проверку фактов Настройки для дата -центров США могут разблокировать 76 ГВт новой мощности. Google использует ИИ для приостановки более 39 миллионов счетов объявлений о подозрении на мошенничество

Более

Показан