Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее

Google приблизилась к своей идее универсального ИИ-помощника
В этом году на мероприятии Google I/O компания представила значительные обновления серии Gemini 2.5, в частности, сфокусировавшись на улучшении ее возможностей по различным параметрам. Последние версии Gemini 2.5 Flash и 2.5 Pro стали умнее и эффективнее, чем когда-либо прежде. Эти усовершенствования приближают Google к достижению своей цели - созданию универсального ИИ-ассистента, способного понимать контекст, планировать и беспрепятственно выполнять задачи.Gemini 2.5 Pro: Поднимаем интеллект на новую высоту
Gemini 2.5 Pro, названный Google самой продвинутой моделью, может похвастаться беспрецедентным контекстным окном на миллион слов. Эта функция позволяет ИИ обрабатывать огромные объемы данных и сохранять согласованность в течение длительных разговоров. На мероприятии генеральный директор Google DeepMind Демис Хассабис выразил восторг по поводу достигнутого прогресса, заявив: "Это наша конечная цель для приложения Gemini: Персональный, проактивный и мощный ИИ". Одной из особенностей Gemini 2.5 Pro является появление "Deep Think" - экспериментального расширенного режима рассуждений. Deep Think позволяет ИИ анализировать несколько гипотез, прежде чем дать ответ, что повышает его способность принимать решения. По словам Хассабиса, эта разработка основана на опыте, полученном при создании AlphaGo, когда более длительное время обработки данных приводило к лучшим результатам.Впечатляющая производительность в бенчмарк-тестах
Deep Think уже продемонстрировал выдающиеся результаты в сложных бенчмарках. Например, он получил впечатляющие результаты на Математической олимпиаде США 2025 года (USAMO) и преуспел в LiveCodeBench, тесте, известном как проверка навыков кодирования высокого уровня. Кроме того, он набрал 84,0% в MMMU, который оценивает мультимодальное понимание и рассуждения. Несмотря на эти достижения, Google сохраняет осторожность. Хассабис отметил, что команда проводит тщательную оценку безопасности и собирает отзывы экспертов, прежде чем начать более широкое внедрение Deep Think. В настоящее время он доступен доверенным тестерам через API для обратной связи.Gemini 2.5 Flash: рабочая лошадка для повседневного использования
Наряду с Gemini 2.5 Pro компания Google также представила улучшенную версию Gemini 2.5 Flash, разработанную для обеспечения скорости, эффективности и доступности. Хассабис назвал ее "рабочей лошадкой" серии, превосходящей ее в тестах на аргументацию, мультимодальность, код и длинный контекст. Обновленная модель Flash стала примерно на 20-30 % эффективнее и требует меньше токенов для выполнения задач. Основываясь на отзывах разработчиков, Google доработала модель и сделала ее доступной для предварительного просмотра в Google AI Studio, Vertex AI и приложении Gemini. Полностью она будет внедрена в производство в начале июня.Новые функции в обеих моделях
Как Gemini 2.5 Pro, так и Flash получили несколько новых возможностей, направленных на улучшение взаимодействия с пользователем. Встроенный аудиовыход был добавлен для создания более естественного разговорного опыта, а функция преобразования текста в речь теперь поддерживает несколько голосов. Пользователи могут даже управлять тоном и стилем речи, чтобы ИИ звучал мелодраматично или мрачно. Другие экспериментальные голосовые функции включают аффективный диалог, который позволяет ИИ распознавать эмоции в голосе пользователя и реагировать соответствующим образом, и проактивное аудио, которое отфильтровывает фоновый шум. Также были введены "бюджеты мышления", позволяющие разработчикам контролировать количество вычислительных ресурсов, используемых ИИ перед ответом.Шаг навстречу будущему
Эти обновления подчеркивают стремление Google расширить границы технологий ИИ. Как отметили Кавуккуоглу и Доши в своем блоге, "мы переживаем удивительный момент в истории, когда ИИ делает возможным новое потрясающее будущее. Благодаря этим улучшениям Google, несомненно, прокладывает путь к будущему, в котором ИИ-помощники станут незаменимыми спутниками в нашей повседневной жизни".
Связанная статья
Персонализация ИИ улучшает реальность или искажает ее? Исследование скрытых рисков
Человеческая цивилизация уже становилась свидетелем когнитивных революций - рукописный почерк вытеснил память, калькуляторы автоматизировали вычисления, системы GPS заменили ориентирование на местност
ИИ Gemini от Google побеждает Pokémon Blue с помощью
Веха в развитии искусственного интеллекта от Google: Покорение классического приключения покемоновСамая продвинутая модель искусственного интеллекта Google, похоже, достигла значительного игрового про
ByteDance представляет модель ИИ Seed-Thinking-v1.5 для усиления способностей к рассуждению
Гонка за продвинутыми ИИ с функцией рассуждения началась с модели o1 от OpenAI в сентябре 2024 года, набрав обороты с запуском R1 от DeepSeek в январе 2025 года.Крупные разработчики ИИ соревнуются в с
Комментарии (0)
Google приблизилась к своей идее универсального ИИ-помощника
В этом году на мероприятии Google I/O компания представила значительные обновления серии Gemini 2.5, в частности, сфокусировавшись на улучшении ее возможностей по различным параметрам. Последние версии Gemini 2.5 Flash и 2.5 Pro стали умнее и эффективнее, чем когда-либо прежде. Эти усовершенствования приближают Google к достижению своей цели - созданию универсального ИИ-ассистента, способного понимать контекст, планировать и беспрепятственно выполнять задачи.Gemini 2.5 Pro: Поднимаем интеллект на новую высоту
Gemini 2.5 Pro, названный Google самой продвинутой моделью, может похвастаться беспрецедентным контекстным окном на миллион слов. Эта функция позволяет ИИ обрабатывать огромные объемы данных и сохранять согласованность в течение длительных разговоров. На мероприятии генеральный директор Google DeepMind Демис Хассабис выразил восторг по поводу достигнутого прогресса, заявив: "Это наша конечная цель для приложения Gemini: Персональный, проактивный и мощный ИИ". Одной из особенностей Gemini 2.5 Pro является появление "Deep Think" - экспериментального расширенного режима рассуждений. Deep Think позволяет ИИ анализировать несколько гипотез, прежде чем дать ответ, что повышает его способность принимать решения. По словам Хассабиса, эта разработка основана на опыте, полученном при создании AlphaGo, когда более длительное время обработки данных приводило к лучшим результатам.Впечатляющая производительность в бенчмарк-тестах
Deep Think уже продемонстрировал выдающиеся результаты в сложных бенчмарках. Например, он получил впечатляющие результаты на Математической олимпиаде США 2025 года (USAMO) и преуспел в LiveCodeBench, тесте, известном как проверка навыков кодирования высокого уровня. Кроме того, он набрал 84,0% в MMMU, который оценивает мультимодальное понимание и рассуждения. Несмотря на эти достижения, Google сохраняет осторожность. Хассабис отметил, что команда проводит тщательную оценку безопасности и собирает отзывы экспертов, прежде чем начать более широкое внедрение Deep Think. В настоящее время он доступен доверенным тестерам через API для обратной связи.Gemini 2.5 Flash: рабочая лошадка для повседневного использования
Наряду с Gemini 2.5 Pro компания Google также представила улучшенную версию Gemini 2.5 Flash, разработанную для обеспечения скорости, эффективности и доступности. Хассабис назвал ее "рабочей лошадкой" серии, превосходящей ее в тестах на аргументацию, мультимодальность, код и длинный контекст. Обновленная модель Flash стала примерно на 20-30 % эффективнее и требует меньше токенов для выполнения задач. Основываясь на отзывах разработчиков, Google доработала модель и сделала ее доступной для предварительного просмотра в Google AI Studio, Vertex AI и приложении Gemini. Полностью она будет внедрена в производство в начале июня.Новые функции в обеих моделях
Как Gemini 2.5 Pro, так и Flash получили несколько новых возможностей, направленных на улучшение взаимодействия с пользователем. Встроенный аудиовыход был добавлен для создания более естественного разговорного опыта, а функция преобразования текста в речь теперь поддерживает несколько голосов. Пользователи могут даже управлять тоном и стилем речи, чтобы ИИ звучал мелодраматично или мрачно. Другие экспериментальные голосовые функции включают аффективный диалог, который позволяет ИИ распознавать эмоции в голосе пользователя и реагировать соответствующим образом, и проактивное аудио, которое отфильтровывает фоновый шум. Также были введены "бюджеты мышления", позволяющие разработчикам контролировать количество вычислительных ресурсов, используемых ИИ перед ответом.Шаг навстречу будущему
Эти обновления подчеркивают стремление Google расширить границы технологий ИИ. Как отметили Кавуккуоглу и Доши в своем блоге, "мы переживаем удивительный момент в истории, когда ИИ делает возможным новое потрясающее будущее. Благодаря этим улучшениям Google, несомненно, прокладывает путь к будущему, в котором ИИ-помощники станут незаменимыми спутниками в нашей повседневной жизни".











