Google утверждает, что Gemini 2.5 Pro превосходит DeepSeek R1 и Grok 3 Beta в бенчмарках кодирования

Дом

Новости

24 октября 2025 г.

RogerNelson

110

# Gemini # Google

Компания Google представила обновленную предварительную версию своей флагманской модели Gemini 2.5 Pro, которая была представлена в марте и усовершенствована в мае. Эта итерация, описанная как "самый интеллектуальный" ИИ компании на сегодняшний день, в настоящее время находится в предварительной версии, а ее общая доступность планируется в течение нескольких недель.
Теперь компании могут экспериментировать с разработкой новых приложений или модернизацией существующих, используя обновленную "редакцию I/O" Gemini 2.5 Pro. Согласно официальному заявлению Google, эта версия обеспечивает более образные ответы и демонстрирует более высокие возможности в программировании и логическом мышлении по сравнению с предыдущими версиями.

Наше последнее обновление Gemini 2.5 Pro находится в стадии предварительного просмотра.
Оно лучше в кодировании, логике, науке + математике, демонстрирует улучшенную производительность в ключевых бенчмарках (AIDER Polyglot, GPQA, HLE и др.) и лидирует в рейтинге @lmarena_ai, набрав 24 балла Elo по сравнению с предыдущей версией.
Мы также... pic.twitter.com/SVjdQ2k1tJ
- Сундар Пичаи (@sundarpichai) 5 июня 2025 г.

На своей майской конференции для разработчиков Google показала улучшения Gemini 2.5 Pro, которые превзошли предыдущий тихий релиз. Демис Хассабис, генеральный директор Google DeepMind, отметил, что версия I/O является самой передовой моделью кодирования компании на сегодняшний день.

Новая предварительная версия, получившая обозначение Gemini 2.5 Pro Preview 06-05 Thinking, превосходит возможности версии I/O. Предстоящий публичный релиз обещает производительность и масштабируемость корпоративного уровня.

Оригинальная версия I/O (gemini-2.5-pro-preview-05-06) стала доступна для разработчиков и корпораций в мае через Google AI Studio и Vertex AI. Расширенная версия Gemini 2.5 Pro Preview 06-05 Thinking доступна по тем же каналам.

Показатели производительности

Обновленный Gemini 2.5 Pro демонстрирует заметные улучшения по сравнению с предшественником.

Google сообщила о повышении производительности на 24 пункта в LMArena и на 35 пунктов в WebDevArena, где он теперь лидирует в рейтингах конкурентов. Сравнительное тестирование показало превосходство над такими моделями, как OpenAI o3, o3-mini и o4-mini, Anthropic's Claude 4 Opus, xAI's Grok 3 Beta и DeepSeek R1.

"Мы также учли отзывы о предыдущих релизах 2.5 Pro, улучшив стиль и структуру - теперь ответы могут быть более креативными и лучше отформатированными", - говорится в сообщении Google.

Что ожидает предприятия

Хотя быстрые улучшения Gemini 2.5 Pro от Google могут показаться сложными, компания позиционирует их как прямую реакцию на мнения пользователей. Цена новой версии составляет 1,25 доллара за миллион входных маркеров (без кэширования) и 10 долларов за миллион выходных маркеров.

Когда Gemini 2.5 Pro дебютировала в марте, отраслевые наблюдатели признали ее недостаточно используемой передовой моделью. С тех пор Google внедрила эту технологию в многочисленные приложения, включая функцию "Глубокое мышление", которая оценивает несколько гипотез, прежде чем генерировать ответы.

Выпуск Gemini 2.5 Pro и последующие обновления укрепили позиции Google в конкурентной среде больших языковых моделей, отвоевав внимание у конкурирующих моделей рассуждений от DeepSeek и OpenAI.

Уже через несколько часов после анонса разработчики начали тестировать обновленную Gemini 2.5 Pro. Первые впечатления подтверждают заявления Google об ускоренной производительности, хотя всесторонняя оценка ее расширенных возможностей еще продолжается.

Первый час работы с "Gemini 2.5 Pro Preview 06-05"
Положительные стороны:
- Быстрее
- Производительность выше
- Лучше воспроизведение макросов (редактирование нескольких файлов, лучший обзор)
- Структура выходных данных лучше (читабельнее)
- Он более лаконичен и менее апологетичен!!!
Раньше: "Вы абсолютно...
- Патрик Баде (@nishffx) 5 июня 2025 г.

Ребята, вы готовите, мне очень нравится конструктор приложений.
Сделал игру и протестировал ее, используя imagen для создания активов на лету. И вот она уже готова, размещена на хостинге, ею легко поделиться. Это действительно лучший конструктор без опыта работы с кодом.
Продолжайте развивать рынок приложений vibe, это может...
- bone (@boneGPT) 5 июня 2025 г.

Gemini 2.5 Pro Preview довольно хорош... использовал его вчера для глубокого исследования и результаты лучше, чем у некоторых крупных...
- Janak (@janaks09) June 5, 2025

Связанная статья

Google запускает Gemini в браузере Chrome в Индии В среду компания Google объявила о расширении интеграции Gemini в браузере Chrome на новые регионы, включая Индию, Канаду и Новую Зеландию. Это обновление позволяет пользователям настольных компьютеро

YouTube расширяет сферу применения технологии искусственного интеллекта для выявления дипфейков, распространив её на политиков, государственных чиновников и журналистов Во вторник YouTube объявил о расширении доступа к своей технологии обнаружения дипфейков для определенной группы государственных чиновников, политических кандидатов и журналистов. Этот инструмент выяв

YouTube тестирует функцию поиска на базе искусственного интеллекта с подсказками Многие пользователи обращаются к YouTube при поиске рецептов или планировании путешествий, ища подходящие видео. Теперь платформа представляет интерактивный инструмент поиска на базе искусственного ин

Рекомендации по связанным специальным темам

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai

Комментарии (1)

0/500

Пожалуйста, войдите в систему

JohnYoung

17 мая 2026 г., 3:00:11 GMT+03:00

Interesting to see Google claiming coding benchmark wins, but I'm curious about real-world dev experience. Does it handle messy legacy codebases as well as it does clean competition problems? The 'most intelligent' tag feels a bit marketing-heavy until we see more hands-on results. 🤔

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан