Антрические претензии ИИ не останавливается, он перехитривает тесты

Большие языковые модели (LLMs) и другие генеративные технологии ИИ делают значительные шаги в области самокоррекции, что открывает путь для новых приложений, включая так называемый "агентный ИИ", согласно Майклу Герстенхаберу, вице-президенту Anthropic, ведущего разработчика моделей ИИ.
"Они становятся очень хороши в самокоррекции, саморассуждении," — поделился Герстенхабер, который руководит технологиями API в Anthropic, в интервью в Нью-Йорке с Анурагом Рана из Bloomberg Intelligence. Anthropic, создатели семейства моделей Claude, являются прямыми конкурентами моделей GPT от OpenAI. "Каждые пару месяцев мы выпускаем новую модель, которая расширяет возможности LLMs," — добавил он, подчеркивая динамичный характер отрасли, где каждая новая версия модели открывает новые потенциальные применения.
Новые возможности в моделях ИИ
Последние модели от Anthropic представили такие возможности, как планирование задач, позволяющее выполнять задачи на компьютере подобно человеку, например, заказ пиццы онлайн. "Планирование промежуточных шагов, которое вчера было невозможно, теперь стало достижимым," — отметил Герстенхабер о пошаговом выполнении задач.
Обсуждение, в котором также участвовал Виджей Карунамути, главный технолог стартапа Scale AI, было частью однодневной конференции, организованной Bloomberg Intelligence под названием "Gen AI: Может ли он оправдать обещания повышения производительности?"
Опровержение скептицизма в отношении ИИ
Выводы Герстенхабера опровергают взгляды скептиков ИИ, которые утверждают, что генеративный ИИ и область ИИ в целом "упираются в стену", предполагая уменьшение отдачи с каждой новой итерацией модели. Ученый в области ИИ Гэри Маркус, например, с 2022 года громко высказывает свои опасения, предупреждая, что простое увеличение размера моделей ИИ (больше параметров) не приведет к пропорциональному улучшению их производительности.
Однако Герстенхабер утверждает, что Anthropic раздвигает границы за пределы того, что могут измерить текущие тесты ИИ. "Даже если кажется, что прогресс замедляется в некоторых областях, это происходит потому, что мы открываем совершенно новые функциональные возможности, но мы исчерпали тесты и способность выполнять старые задачи," — объяснил он. Это делает всё более сложным оценку полного спектра возможностей текущих генеративных моделей ИИ.
Масштабирование и обучение
И Герстенхабер, и Карунамути подчеркнули важность масштабирования генеративных моделей ИИ для улучшения их способностей к самокоррекции. "Мы определенно наблюдаем всё большее масштабирование интеллекта," — отметил Герстенхабер. Карунамути добавил: "Одна из причин, почему мы считаем, что не упираемся в стену с планированием и рассуждением, заключается в том, что мы всё ещё учимся структурировать эти задачи так, чтобы модели могли адаптироваться к новым и разнообразным средам."
Герстенхабер согласился, заявив: "Мы находимся на ранних стадиях, изучая потребности разработчиков приложений и области, где модели не справляются, что мы затем можем интегрировать обратно в языковую модель."
Обучение и адаптация в реальном времени
Большая часть этого прогресса, по словам Герстенхабера, обусловлена быстрым темпом фундаментальных исследований в Anthropic, а также обучением в реальном времени на основе отзывов из индустрии. "Мы адаптируемся к тому, что нам говорит индустрия о своих потребностях, обучаясь в реальном времени," — сказал он.
Клиенты часто начинают с более крупных моделей, а затем переходят к более простым для конкретных целей. "Сначала они оценивают, достаточно ли модель умна, чтобы хорошо выполнить задачу, затем, достаточно ли она быстра, чтобы соответствовать потребностям их приложения, и, наконец, может ли она быть максимально экономически эффективной," — объяснил Герстенхабер.
Связанная статья
AI-управляемое создание музыки: Легко создавайте песни и видео
Создание музыки может быть сложным, требующим времени, ресурсов и опыта. Искусственный интеллект преобразил этот процесс, сделав его простым и доступным. Это руководство показывает, как ИИ позволяет к
Создание раскрасок с использованием ИИ: Полное руководство
Создание раскрасок — это увлекательное занятие, сочетающее художественное выражение с успокаивающим опытом для пользователей. Однако процесс может быть трудоемким. К счастью, инструменты ИИ упрощают с
Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам
Qodo, израильский стартап в области AI-кодирования, ориентированный на качество кода, начал сотрудничество с Google Cloud для повышения целостности программного обеспечения, созданного AI.По мере рост
Комментарии (8)
JoseRoberts
12 августа 2025 г., 18:00:59 GMT+03:00
This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?
0
WalterAnderson
31 июля 2025 г., 14:35:39 GMT+03:00
It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!
0
RonaldMartinez
22 июля 2025 г., 10:39:52 GMT+03:00
This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄
0
WillieJackson
18 апреля 2025 г., 10:00:28 GMT+03:00
La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔
0
GeorgeWilson
17 апреля 2025 г., 20:45:24 GMT+03:00
Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔
0
NicholasCarter
17 апреля 2025 г., 14:27:31 GMT+03:00
Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔
0
Большие языковые модели (LLMs) и другие генеративные технологии ИИ делают значительные шаги в области самокоррекции, что открывает путь для новых приложений, включая так называемый "агентный ИИ", согласно Майклу Герстенхаберу, вице-президенту Anthropic, ведущего разработчика моделей ИИ.
"Они становятся очень хороши в самокоррекции, саморассуждении," — поделился Герстенхабер, который руководит технологиями API в Anthropic, в интервью в Нью-Йорке с Анурагом Рана из Bloomberg Intelligence. Anthropic, создатели семейства моделей Claude, являются прямыми конкурентами моделей GPT от OpenAI. "Каждые пару месяцев мы выпускаем новую модель, которая расширяет возможности LLMs," — добавил он, подчеркивая динамичный характер отрасли, где каждая новая версия модели открывает новые потенциальные применения.
Новые возможности в моделях ИИ
Последние модели от Anthropic представили такие возможности, как планирование задач, позволяющее выполнять задачи на компьютере подобно человеку, например, заказ пиццы онлайн. "Планирование промежуточных шагов, которое вчера было невозможно, теперь стало достижимым," — отметил Герстенхабер о пошаговом выполнении задач.
Обсуждение, в котором также участвовал Виджей Карунамути, главный технолог стартапа Scale AI, было частью однодневной конференции, организованной Bloomberg Intelligence под названием "Gen AI: Может ли он оправдать обещания повышения производительности?"
Опровержение скептицизма в отношении ИИ
Выводы Герстенхабера опровергают взгляды скептиков ИИ, которые утверждают, что генеративный ИИ и область ИИ в целом "упираются в стену", предполагая уменьшение отдачи с каждой новой итерацией модели. Ученый в области ИИ Гэри Маркус, например, с 2022 года громко высказывает свои опасения, предупреждая, что простое увеличение размера моделей ИИ (больше параметров) не приведет к пропорциональному улучшению их производительности.
Однако Герстенхабер утверждает, что Anthropic раздвигает границы за пределы того, что могут измерить текущие тесты ИИ. "Даже если кажется, что прогресс замедляется в некоторых областях, это происходит потому, что мы открываем совершенно новые функциональные возможности, но мы исчерпали тесты и способность выполнять старые задачи," — объяснил он. Это делает всё более сложным оценку полного спектра возможностей текущих генеративных моделей ИИ.
Масштабирование и обучение
И Герстенхабер, и Карунамути подчеркнули важность масштабирования генеративных моделей ИИ для улучшения их способностей к самокоррекции. "Мы определенно наблюдаем всё большее масштабирование интеллекта," — отметил Герстенхабер. Карунамути добавил: "Одна из причин, почему мы считаем, что не упираемся в стену с планированием и рассуждением, заключается в том, что мы всё ещё учимся структурировать эти задачи так, чтобы модели могли адаптироваться к новым и разнообразным средам."
Герстенхабер согласился, заявив: "Мы находимся на ранних стадиях, изучая потребности разработчиков приложений и области, где модели не справляются, что мы затем можем интегрировать обратно в языковую модель."
Обучение и адаптация в реальном времени
Большая часть этого прогресса, по словам Герстенхабера, обусловлена быстрым темпом фундаментальных исследований в Anthropic, а также обучением в реальном времени на основе отзывов из индустрии. "Мы адаптируемся к тому, что нам говорит индустрия о своих потребностях, обучаясь в реальном времени," — сказал он.
Клиенты часто начинают с более крупных моделей, а затем переходят к более простым для конкретных целей. "Сначала они оценивают, достаточно ли модель умна, чтобы хорошо выполнить задачу, затем, достаточно ли она быстра, чтобы соответствовать потребностям их приложения, и, наконец, может ли она быть максимально экономически эффективной," — объяснил Герстенхабер.




This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?




It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!




This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄




La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔




Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔




Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔












