вариант
Дом
Новости
Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее

Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее

7 июня 2025 г.
182

Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее

Google приближается к своей цели создания универсального ассистента на основе ИИ

На мероприятии Google I/O этого года компания представила значительные обновления серии Gemini 2.5, особенно сосредоточившись на улучшении его возможностей во всех аспектах. Последние версии — Gemini 2.5 Flash и 2.5 Pro — теперь умнее и эффективнее, чем когда-либо прежде. Эти достижения приближают Google к реализации своей цели создания универсального ассистента на основе ИИ, способного понимать контекст, планировать и выполнять задачи безупречно.

Gemini 2.5 Pro: Возведение интеллекта на новую высоту

Gemini 2.5 Pro, названный Google как наиболее продвинутая модель на данный момент, обладает беспрецедентным контекстом в миллион токенов. Эта функция позволяет ИИ обрабатывать огромное количество данных и поддерживать связность в более длительных диалогах. На мероприятии Демис Хассабис, генеральный директор DeepMind Google, выразил энтузиазм относительно достигнутого прогресса, заявив: «Это наша终极ная цель для приложения Gemini: ИИ, который персонализирован, инициативен и мощен». Одной из ключевых особенностей Gemini 2.5 Pro является внедрение экспериментальной функции «Deep Think» — усовершенствованного режима анализа. Deep Think позволяет ИИ анализировать несколько гипотез перед ответом, повышая его способности принятия решений. По словам Хассабиса, это развитие стало результатом выводов, сделанных при создании AlphaGo, где более длительная обработка времени давала лучшие результаты.

Впечатляющие показатели на тестовых бенчмарках

Deep Think уже продемонстрировал впечатляющую производительность на сложных тестах. Например, он показал впечатляющие результаты на 2025 USA Mathematical Olympiad (USAMO) и преуспел на LiveCodeBench, тестировании высоких навыков программирования. Кроме того, он набрал 84.0% на MMMU, оценивающем многомодальное понимание и логическое мышление. Несмотря на эти достижения, Google остается осторожным. Хассабис отметил, что команда проводит тщательные проверки безопасности и собирает обратную связь от экспертов перед более широким внедрением Deep Think. В настоящее время доступно через API для доверенных тестеров с целью сбора отзывов.

Gemini 2.5 Flash: Работающий конь для ежедневного использования

Вместе с Gemini 2.5 Pro, Google также представил улучшенную версию Gemini 2.5 Flash, ориентированную на скорость, эффективность и доступность. Хассабис описал его как «рабочую лошадку» серии, превосходящую другие модели в тестах на логическое мышление, многомодальность, кодирование и длинный контекст. На самом деле, он занимает второе место после Gemini 2.5 Pro в рейтинге LMArena. Обновленная версия Flash примерно на 20-30% более эффективна, требуя меньше токенов для выполнения задач. На основе отзывов разработчиков, Google оптимизировал модель и сделал её доступной для предварительного просмотра в Google AI Studio, Vertex AI и приложении Gemini. Полное внедрение в производство запланировано на начало июня.

Новые возможности в обоих моделях

Обе модели Gemini 2.5 Pro и Flash получили ряд новых функций, направленных на улучшение взаимодействия пользователей. Была добавлена возможность воспроизведения звука для создания более естественных разговорных опытов, а функция текста в речь теперь поддерживает несколько голосов. Пользователи могут даже управлять тоном и стилем речи, будь то мелодраматический или суровый. Другие экспериментальные функции голоса включают эмоциональный диалог, который позволяет ИИ распознавать эмоции в голосе пользователя и реагировать соответственно, и активную фильтрацию звука. Также были внедрены бюджеты мышления, предоставляя разработчикам контроль над количеством вычислительной мощности, которую ИИ использует перед ответом.

Шаг к будущему

Эти обновления подчеркивают приверженность Google расширению границ технологии ИИ. Как отметили Кавукчуоглу и Доши в своем блоге: «Мы живём в удивительное время в истории, когда ИИ делает возможным поразительное будущее. Это неуклонный прогресс». С этими улучшениями Google, несомненно, создаёт путь к будущему, где ассистенты на основе ИИ становятся незаменимыми спутниками в нашей повседневной жизни.

Связанная статья
Чат-бот Gemini улучшает возможности редактирования изображений Чат-бот Gemini улучшает возможности редактирования изображений Приложение чат-бота Gemini от Google теперь позволяет пользователям редактировать изображения, сгенерированные ИИ или загруженные с телефонов или компьютеров, сообщила компания в блоге в среду.Встроен
Google представляет Deep Think для повышения производительности Gemini AI Google представляет Deep Think для повышения производительности Gemini AI Google совершенствует свои топовые модели Gemini AI.На Google I/O 2025 во вторник компания представила Deep Think, продвинутый режим рассуждений для своей ведущей модели Gemini 2.5 Pro. Deep Think поз
AI驱动的零售实验在Anthropic惨败 AI驱动的零售实验在Anthropic惨败 想象将一家小店交给人工智能,托付从定价到客户互动的一切。会出什么问题?Anthropic最近的一项研究于周五发布,回答了这个问题:几乎一切都出了问题。他们的AI助手Claude在旧金山办公室经营了一家小店一个月,结果堪称商学院学生的警示故事,由一个毫无现实经验的人撰写——在本例中,确实如此。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有自助结账的iPad。(来源:Anthr
Вернуться к вершине
OR