Антропическая модель AI обнаруживает свою самые умные гибридные рассуждения
Anthropic только что представила Claude 3.7 Sonnet, ознаменовав дебют своей первой "гибридной модели рассуждений". Эта новаторская модель разработана для решения более сложных задач и превосходит предыдущие версии в таких задачах, как математика и программирование.
Для дополнения этого достижения Anthropic также запускает "ограниченный исследовательский предварительный просмотр" Claude Code, агентского инструмента для программирования. Хотя Anthropic уже поддерживает решения для программирования с использованием ИИ, такие как Cursor, Claude Code позиционируется как интерактивный партнер, способный искать и читать код, изменять файлы, писать и запускать тесты, публиковать код на GitHub и использовать инструменты командной строки.
Claude 3.7 Sonnet будет доступен с понедельника в приложении Claude, а также через API Anthropic, Amazon Bedrock и Vertex AI от Google Cloud. Цены остаются такими же, как у предшественника, 3.5 Sonnet: $3 за миллион входных токенов и $15 за миллион выходных токенов.
В отличие от конкурентов, таких как OpenAI, которые предлагают отдельные модели рассуждений, Anthropic делает акцент на интеграции возможностей рассуждений непосредственно в саму модель. Как пояснила Диана Пенн, руководитель исследований продукта Anthropic, в интервью The Verge, "Мы принципиально считаем, что рассуждение — это функция ИИ, а не нечто совершенно отдельное". Например, Claude не должен испытывать трудностей с простыми запросами, такими как "Который час?", но отлично справляется с обработкой сложных запросов, таких как планирование двухнедельной поездки в Италию с учетом погодных условий.
Anthropic
Anthropic
Пенн отметила, что Claude 3.7 Sonnet демонстрирует значительные улучшения в агентском программировании, финансах и юридических вопросах. Хотя Claude пока не поддерживает поиск в реальном времени в интернете — функция, присутствующая в других моделях, — он обладает актуальной базой знаний по состоянию на октябрь 2024 года, что делает его более современным. Разработчики могут влиять на работу модели через функцию блокнота и задавать точное время ответа. "Иногда, — сказал вице-президент по продуктам Anthropic Майкл Герстенхабер, — разработчику просто нужно указать, что ответ не должен занимать более 200 миллисекунд", подчеркивая стратегическое продуктовое решение.
Внутри компании сотрудники Anthropic использовали новую модель для разработки интерфейсов веб-сайтов, создания интерактивных игр и выполнения до 45 минут программирования, таких как создание тестовых наборов и итеративное уточнение тестовых случаев, по словам Пенн.

Claude Code. Anthropic
Пенн упомянула, что Anthropic оценивает возможности своих моделей, заставляя их проходить старую видеоигру Pokémon, сопоставляя API модели с интерфейсом контроллера. Если Claude 3.5 Sonnet изначально с трудом покидал Паллет Таун, то Claude 3.7 успешно победил нескольких лидеров гимназий.
Недавнее представление Grok-3 от Илона Маска на прошлой неделе подчеркнуло стремительный темп конкуренции моделей ИИ. На данный момент Anthropic лидирует благодаря впечатляющей производительности Claude 3.7 Sonnet. Его выпуск намекает на будущее, где одна модель справляется со всеми задачами, вместо необходимости использования специализированных инструментов для разных функций.
Связанная статья
Notion превращает свое рабочее пространство в центр для ИИ-агентов
Компания Notion, разработчик программного обеспечения для повышения продуктивности, вступает в эру агентов.Во время прямой трансляции анонса продукта в среду компания Notion, наиболее известная своим
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи
WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания
Рекомендации по связанным специальным темам
Комментарии (4)
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。
Anthropic только что представила Claude 3.7 Sonnet, ознаменовав дебют своей первой "гибридной модели рассуждений". Эта новаторская модель разработана для решения более сложных задач и превосходит предыдущие версии в таких задачах, как математика и программирование.
Для дополнения этого достижения Anthropic также запускает "ограниченный исследовательский предварительный просмотр" Claude Code, агентского инструмента для программирования. Хотя Anthropic уже поддерживает решения для программирования с использованием ИИ, такие как Cursor, Claude Code позиционируется как интерактивный партнер, способный искать и читать код, изменять файлы, писать и запускать тесты, публиковать код на GitHub и использовать инструменты командной строки.
Claude 3.7 Sonnet будет доступен с понедельника в приложении Claude, а также через API Anthropic, Amazon Bedrock и Vertex AI от Google Cloud. Цены остаются такими же, как у предшественника, 3.5 Sonnet: $3 за миллион входных токенов и $15 за миллион выходных токенов.
В отличие от конкурентов, таких как OpenAI, которые предлагают отдельные модели рассуждений, Anthropic делает акцент на интеграции возможностей рассуждений непосредственно в саму модель. Как пояснила Диана Пенн, руководитель исследований продукта Anthropic, в интервью The Verge, "Мы принципиально считаем, что рассуждение — это функция ИИ, а не нечто совершенно отдельное". Например, Claude не должен испытывать трудностей с простыми запросами, такими как "Который час?", но отлично справляется с обработкой сложных запросов, таких как планирование двухнедельной поездки в Италию с учетом погодных условий.
Anthropic
Anthropic
Пенн отметила, что Claude 3.7 Sonnet демонстрирует значительные улучшения в агентском программировании, финансах и юридических вопросах. Хотя Claude пока не поддерживает поиск в реальном времени в интернете — функция, присутствующая в других моделях, — он обладает актуальной базой знаний по состоянию на октябрь 2024 года, что делает его более современным. Разработчики могут влиять на работу модели через функцию блокнота и задавать точное время ответа. "Иногда, — сказал вице-президент по продуктам Anthropic Майкл Герстенхабер, — разработчику просто нужно указать, что ответ не должен занимать более 200 миллисекунд", подчеркивая стратегическое продуктовое решение.
Внутри компании сотрудники Anthropic использовали новую модель для разработки интерфейсов веб-сайтов, создания интерактивных игр и выполнения до 45 минут программирования, таких как создание тестовых наборов и итеративное уточнение тестовых случаев, по словам Пенн.

Claude Code. Anthropic
Пенн упомянула, что Anthropic оценивает возможности своих моделей, заставляя их проходить старую видеоигру Pokémon, сопоставляя API модели с интерфейсом контроллера. Если Claude 3.5 Sonnet изначально с трудом покидал Паллет Таун, то Claude 3.7 успешно победил нескольких лидеров гимназий.
Недавнее представление Grok-3 от Илона Маска на прошлой неделе подчеркнуло стремительный темп конкуренции моделей ИИ. На данный момент Anthropic лидирует благодаря впечатляющей производительности Claude 3.7 Sonnet. Его выпуск намекает на будущее, где одна модель справляется со всеми задачами, вместо необходимости использования специализированных инструментов для разных функций.
Notion превращает свое рабочее пространство в центр для ИИ-агентов
Компания Notion, разработчик программного обеспечения для повышения продуктивности, вступает в эру агентов.Во время прямой трансляции анонса продукта в среду компания Notion, наиболее известная своим
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи
WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。





Дом






