Google I/O A O 2024: открытие инноваций для следующего поколения
Google полностью принимает то, что мы называем эрой Gemini.
Прежде чем углубляться в детали, позвольте мне на минуту задуматься о том, где мы находимся. Мы более десяти лет вкладываем ресурсы в AI, расширяя границы в исследованиях, разработке продуктов и инфраструктуре. Сегодня мы расскажем обо всем этом и не только.
Мы все еще находимся в начале этого перехода к платформе AI, и потенциал огромен — для создателей, разработчиков, стартапов и всех остальных. Именно об этом эра Gemini: о продвижении этих возможностей вперед. Итак, давайте начнем.
Эра Gemini
В прошлом году на I/O мы представили наше видение Gemini: передовую модель, созданную для нативной мультимодальности с самого начала, способную обрабатывать текст, изображения, видео, код и многое другое. Это значительный шаг к преобразованию любого входного сигнала в любой выходной — «I/O» для следующего поколения.
С тех пор мы выпустили первые модели Gemini, которые установили новые стандарты в мультимодальной производительности. Всего через два месяца мы представили Gemini 1.5 Pro, которая принесла крупный прорыв в обработке длинных контекстов. Она может обрабатывать 1 миллион токенов в продакшене, опережая любую другую крупномасштабную базовую модель на сегодняшний день.
Мы стремимся к тому, чтобы каждый мог воспользоваться возможностями Gemini. Мы быстро поделились этими достижениями с вами. Сегодня более 1,5 миллиона разработчиков используют модели Gemini в наших инструментах, от отладки кода до получения новых идей и создания следующей волны приложений AI.Мы также интегрируем мощные функции Gemini в наши продукты значимыми способами. Сегодня вы увидите примеры этого в Search, Photos, Workspace, Android и не только.
Прогресс продуктов
В настоящее время все наши продукты с 2 миллиардами пользователей работают на базе Gemini.
Мы также запустили новые возможности, включая мобильное приложение, в котором вы можете напрямую взаимодействовать с Gemini, доступное на Android и iOS. А с Gemini Advanced вы получаете доступ к нашим самым продвинутым моделям. За три месяца более 1 миллиона человек зарегистрировались, чтобы попробовать это, и интерес продолжает расти.
Расширение AI Overviews в Search
Одно из самых захватывающих достижений с Gemini произошло в Google Search.
За последний год мы обработали миллиарды запросов через наш Search Generative Experience. Пользователи исследуют Search новыми способами, задавая более длинные и сложные вопросы, даже используя фотографии для поиска, и получают лучшие результаты из интернета.

Мы тестировали этот опыт за пределами Labs, и мы рады видеть не только увеличение использования Search, но и более высокую удовлетворенность пользователей.
Я рад объявить, что на этой неделе мы начнем развертывать этот полностью обновленный опыт, AI Overviews, для всех в США, а вскоре последуют и другие страны.
Благодаря Gemini мы раздвигаем границы возможного в Search, включая наши собственные продукты.
Представляем Ask Photos
Возьмем, к примеру, Google Photos, который мы запустили почти девять лет назад. Он стал основным инструментом для организации самых ценных воспоминаний, с более чем 6 миллиардами фотографий и видео, загружаемых ежедневно.
Людям нравится использовать Photos для поиска по своим воспоминаниям. С Gemini это стало еще проще.
Представьте, что вы на парковке и не помните номер своего автомобиля. Раньше вам пришлось бы искать в Photos по ключевым словам и прокручивать годы фотографий, чтобы найти его. Теперь вы можете просто спросить Photos. Оно распознает автомобили, которые вы часто используете, определяет, какой из них ваш, и выдает номерной знак.
Ask Photos также может помочь вам глубже погрузиться в воспоминания. Допустим, вы вспоминаете ранние достижения своей дочери Лусии. Вы можете спросить Photos: «Когда Лусия научилась плавать?»
Затем вы можете задать более сложный вопрос, например: «Покажи, как прогрессировало плавание Лусии».

Здесь Gemini выходит за рамки простого поиска, понимая различные контексты — от кругов в бассейне до сноркелинга в океане и текста и дат на ее сертификатах по плаванию. Photos затем собирает все это в сводку, позволяя вам пережить эти удивительные воспоминания. Мы запускаем Ask Photos этим летом, и в будущем появятся новые функции.
Раскрытие знаний с помощью мультимодальности и длинного контекста
Мультимодальность Gemini разработана для раскрытия знаний в различных форматах. Это одна модель, которая понимает и связывает различные типы входных данных.
Этот подход расширяет типы вопросов, которые мы можем задавать, и ответы, которые мы получаем. Длинный контекст идет дальше, позволяя нам обрабатывать огромные объемы информации: сотни страниц текста, часы аудио, час видео, целые репозитории кода или даже 96 меню Cheesecake Factory.
Для такого количества меню вам понадобится окно контекста в один миллион токенов, что теперь возможно с Gemini 1.5 Pro. Разработчики используют это довольно крутымиспособами.

Мы развертывали Gemini 1.5 Pro с длинным контекстом в предварительной версии в последние несколько месяцев, улучшая качество перевода, кодирования и рассуждений. Эти обновления теперь отражены в модели.
Я рад объявить, что мы делаем эту улучшенную версию Gemini 1.5 Pro доступной для всех разработчиков по всему миру. Кроме того, Gemini 1.5 Pro с контекстом в 1 миллион токенов теперь напрямую доступен для пользователей в Gemini Advanced, поддерживая 35 языков.
Расширение до 2 миллионов токенов в частной предварительной версии
Один миллион токенов открыл новые возможности, но мы не останавливаемся на этом.
Сегодня мы расширяем окно контекста до 2 миллионов токенов, доступных для разработчиков в частной предварительной версии.
Невероятно видеть, как далеко мы продвинулись всего за несколько месяцев. Это еще один шаг к нашей конечной цели — бесконечному контексту.
Внедрение Gemini 1.5 Pro в Workspace
Мы обсудили два ключевых технических достижения: мультимодальность и длинный контекст. Каждое из них мощное само по себе, но вместе они раскрывают еще более глубокие возможности и интеллект.
Это очевидно в Google Workspace.
Люди часто ищут свои электронные письма в Gmail. С Gemini это стало намного мощнее. Например, как родитель, вы хотите быть в курсе школьных мероприятий вашего ребенка. Gemini может помочь вам следить за этим.
Вы можете попросить Gemini суммировать последние письма из школы. За кулисами он определяет релевантные письма и даже анализирует вложения, такие как PDF-файлы. Вы получаете сводку ключевых моментов и задач. Если вы пропустили собрание PTA из-за поездки, и запись длится час, Gemini может выделить важные части, если это Google Meet. Если есть призыв к волонтерам, и вы свободны, Gemini может составить для вас ответ.
Есть бесчисленное множество способов упростить вашу жизнь. Gemini 1.5 Pro доступен сегодня в Workspace Labs. Aparna расскажет подробности.
Аудиовыходы в NotebookLM
Мы видели примеры с текстовыми выводами, но с мультимодальной моделью мы можем сделать гораздо больше.
Мы делаем успехи в этом направлении, и это не все. Аудиообзоры в NotebookLM демонстрируют это. Они используют Gemini 1.5 Pro для создания персонализированной и интерактивной аудио-конверсации из ваших исходных материалов.
Это потенциал мультимодальности. Скоро вы сможете комбинировать входные и выходные данные. Это то, что мы имеем в виду под «I/O» для нового поколения. Но что, если мы сможем пойти еще дальше?
Продвигаемся дальше с агентами AI
Одна из захватывающих возможностей, которые мы видим, — это агенты AI. Это интеллектуальные системы, которые могут рассуждать, планировать и запоминать. Они могут думать на несколько шагов вперед и работать с программным обеспечением и системами, чтобы выполнять задачи от вашего имени, всегда под вашим контролем.
Мы все еще на ранней стадии, но позвольте мне показать вам, какие сценарии мы разрабатываем.
Возьмем, к примеру, покупки. Покупать обувь весело, но возвращать ее, если она не подходит, не так уж приятно.
Представьте, что Gemini может выполнить все шаги за вас:
- Поиск чека в вашем почтовом ящике...
- Определение номера заказа из вашего письма...
- Заполнение формы возврата...
- Даже планирование получения посылки UPS.
Это намного проще, не так ли?
Рассмотрим более сложный сценарий. Допустим, вы только что переехали в Чикаго. Gemini и Chrome могут работать вместе, чтобы помочь вам обустроиться — организовывать, рассуждать и синтезировать информацию от вашего имени.
Вы захотите исследовать город и найти местные услуги, от химчисток до выгульщиков собак. Вам также нужно будет обновить свой новый адрес на множестве веб-сайтов.
Gemini может управлять этими задачами и будет запрашивать дополнительную информацию, когда это необходимо, гарантируя, что вы всегда контролируете ситуацию.
Это важно — разрабатывая эти возможности, мы сосредоточены на конфиденциальности, безопасности и доступности для всех.
Это простые примеры, но они иллюстрируют типы проблем, которые мы стремимся решить, создавая интеллектуальные системы, которые думают, рассуждают и планируют за вас.
Что это значит для нашей миссии
Мощь Gemini — с его мультимодальностью, длинным контекстом и агентами — приближает нас к нашей конечной цели: сделать AI полезным для всех.
Это путь, по которому мы добьемся наибольшего прогресса в нашей миссии: организовывать мировую информацию для любого входного сигнала, делать ее доступной через любой выходной сигнал и объединять мировую информацию с информацией вашего мира действительно полезным образом.
Открывая новые горизонты
Чтобы полностью реализовать потенциал AI, нам нужно раздвигать границы. Команда Google DeepMind упорно работает над этим.
Мы видели много восторгов вокруг 1.5 Pro и его длинного контекстного окна. Но разработчики также хотели что-то более быстрое и экономичное. Поэтому завтра мы представляем Gemini 1.5 Flash, более легкую модель, оптимизированную для масштаба. Она создана для задач, где важны низкая задержка и стоимость. 1.5 Flash будет доступен в AI Studio и Vertex AI во вторник.
Заглядывая вперед, мы всегда хотели создать универсального агента, полезного в повседневной жизни. Проект Astra демонстрирует мультимодальное понимание и возможности диалога в реальном времени.

Мы также сделали успехи в генерации видео и изображений с Veo и Imagen 3 и представили Gemma 2.0, наше следующее поколение открытых моделей для ответственных инноваций в AI. Подробнее об этом можно прочитать у Demis Hassabis.
Инфраструктура для эры AI: Представляем Trillium
Обучение передовых моделей требует огромной вычислительной мощности. Спрос на вычисления для машинного обучения вырос в миллион раз за последние шесть лет и увеличивается в десять раз каждый год.
Google создан для этого. На протяжении 25 лет мы инвестировали в техническую инфраструктуру мирового класса, от передового оборудования, которое поддерживает Search, до наших собственных тензорных процессоров, которые обеспечивают наши достижения в AI.
Gemini был полностью обучен и обслуживается на наших TPU четвертого и пятого поколения. Другие ведущие компании AI, включая Anthropic, также обучали свои модели на наших TPU.
Сегодня мы рады объявить о нашем шестом поколении TPU, названном Trillium. Trillium — это наш самый производительный и эффективный TPU на сегодняшний день, обеспечивающий улучшение вычислительной производительности в 4,7 раза по сравнению с предыдущим поколением, TPU v5e.
Мы сделаем Trillium доступным для наших облачных клиентов в конце 2024 года.
Наряду с нашими TPU мы гордимся тем, что предлагаем CPU и GPU для поддержки любых рабочих нагрузок. Это включает новые процессоры Axion, о которых мы объявили в прошлом месяце, наш первый кастомный процессор на базе Arm, обеспечивающий ведущую в отрасли производительность и энергоэффективность.
Мы также один из первых облачных провайдеров, предлагающих передовые GPU Blackwell от NVIDIA, которые будут доступны в начале 2025 года. Наше давнее партнерство с NVIDIA позволяет нам предоставить клиентам прорывные возможности Blackwell.
Чипы — это основа нашей интегрированной системы от начала до конца, от оптимизированного оборудования и открытого ПО до гибких моделей потребления. Все это объединяется в нашем AI Hypercomputer, революционной архитектуре суперкомпьютера.
Бизнес и разработчики используют его для решения более сложных задач, с более чем двойной эффективностью по сравнению с покупкой просто оборудования и чипов. Достижения нашего AI Hypercomputer стали возможны в том числе благодаря нашему подходу к жидкостному охлаждению в наших дата-центрах.
Мы занимаемся этим почти десять лет, задолго до того, как это стало стандартом в отрасли. Сегодня общая мощность нашего развернутого флота систем жидкостного охлаждения составляет почти 1 гигаватт и продолжает расти — это почти в 70 раз больше мощности любого другого флота.
В основе этого лежит масштаб нашей сети, которая соединяет нашу инфраструктуру по всему миру. Наша сеть охватывает более 2 миллионов миль наземного и подводного оптоволокна: это более чем в 10 раз больше, чем у ближайшего конкурента среди облачных провайдеров.
Мы продолжим инвестировать, чтобы продвигать инновации в AI и предоставлять передовые возможности.

Самая захватывающая глава Search
Одна из наших крупнейших областей инвестиций и инноваций — это наш основополагающий продукт, Search. 25 лет назад мы создали Search, чтобы помочь людям ориентироваться в потоке информации, поступающей в интернет.
С каждым переходом платформы мы предоставляли прорывы, чтобы лучше отвечать на ваши вопросы. На мобильных устройствах мы открыли новые типы вопросов и ответов — используя лучший контекст, геолокацию и информацию в реальном времени. С развитием понимания естественного языка и компьютерного зрения мы сделали возможными новые способы поиска, например, с помощью голоса или напевания, чтобы найти новую любимую песню, или с помощью изображения цветка, который вы видели на прогулке. А теперь вы даже можете использовать Circle to Search, чтобы найти крутую новую обувь, которую хотите купить. Дерзайте, вы всегда можете их вернуть!
Конечно, Search в эру Gemini выведет это на совершенно новый уровень, сочетая наши сильные стороны в инфраструктуре, новейшие возможности AI, высокие стандарты качества информации и наш многолетний опыт соединения вас с богатством интернета. Результат — продукт, который делает работу за вас.
Google Search — это генеративный AI в масштабе человеческого любопытства. И это самая захватывающая глава Search на сегодняшний день. Подробнее об эре Gemini в Search от Liz Reid.
Более интеллектуальные возможности Gemini
Gemini — это больше, чем просто чат-бот; он создан, чтобы быть вашим личным полезным помощником, который может выполнять сложные задачи и действовать от вашего имени.
Взаимодействие с Gemini должно быть разговорным и интуитивным. Поэтому мы объявляем о новом опыте Gemini под названием Live, который позволяет вести глубокую беседу с Gemini с помощью голоса. Мы также внедрим поддержку 2 миллионов токенов в Gemini Advanced позже в этом году, что позволит загружать и анализировать сверхплотные файлы, такие как видео и длинный код. Sissie Hsiao расскажет подробности.
Gemini на Android
С миллиардами пользователей Android по всему миру мы рады более глубокой интеграции Gemini в пользовательский опыт. Как ваш новый помощник AI, Gemini готов помогать вам в любое время и в любом месте. Мы интегрировали модели Gemini в Android, включая нашу последнюю модель на устройстве: Gemini Nano с мультимодальностью, которая обрабатывает текст, изображения, аудио и речь, открывая новые возможности, сохраняя при этом конфиденциальность информации на вашем устройстве. Sameer Samat делится новостями об Android здесь.
Наш ответственный подход к AI
Мы продолжаем смело подходить к возможностям AI с чувством энтузиазма. Мы также делаем это ответственно. Мы разрабатываем передовую технику под названием AI-assisted red teaming, которая опирается на прорывы Google DeepMind в играх, такие как AlphaGo, для улучшения наших моделей. Кроме того, мы расширили SynthID, наш инструмент водяных знаков, который упрощает идентификацию контента, сгенерированного AI, на два новых формата: текст и видео. James Manyika расскажет подробности.
Создаем будущее вместе
Все это показывает важный прогресс, которого мы достигаем, смело и ответственно делая AI полезным для всех.
Мы давно придерживаемся подхода AI-first. Наши десятилетия лидерства в исследованиях породили многие современные прорывы, которые движут прогресс AI, для нас и для всей отрасли. Кроме того, у нас есть:
- Ведущая в мире инфраструктура, созданная для эры AI
- Передовые инновации в Search, теперь работающие на Gemini
- Продукты, которые помогают в необыкновенном масштабе — включая 15 продуктов с полумиллиардом пользователей
- И платформы, которые позволяют всем — партнерам, клиентам, создателям и вам — изобретать будущее.
Этот прогресс возможен только благодаря нашему невероятному сообществу разработчиков. Вы делаете это реальным, создавая опыты и приложения каждый день. Итак, всем здесь, в Shoreline, и миллионам зрителей по всему миру, вот к возможностям будущего и к их совместному созданию.

Получайте больше новостей от Google в свой почтовый ящик.
Адрес электронной почтыВаши данные будут использованы в соответствии с политикой конфиденциальности Google.
ПодписатьсяГотово. Остался всего один шаг.
Проверьте свой почтовый ящик, чтобы подтвердить подписку.
Вы уже подписаны на нашу рассылку.
Вы также можете подписаться с другим адресом электронной почты.
Связанная статья
Salesforce представляет цифровых помощников с ИИ в Slack для конкуренции с Microsoft Copilot
Salesforce запустила новую стратегию ИИ для рабочего места, представив специализированных «цифровых помощников», интегрированных в беседы Slack, сообщила компания в понедельник.Новый инструмент, Agent
Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе
Oracle планирует инвестировать около $40 млрд в чипы Nvidia для нового крупного дата-центра в Техасе, разработанного OpenAI, как сообщает Financial Times. Эта сделка, одна из крупнейших по закупке чип
Приложение Meta AI представит премиум-уровень и рекламу
Приложение Meta AI вскоре может предложить платную подписку, аналогичную предложениям конкурентов, таких как OpenAI, Google и Microsoft. Во время отчета о доходах за первый квартал 2025 года генеральн
Комментарии (27)
FredGreen
21 августа 2025 г., 10:01:19 GMT+03:00
Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎
0
TimothyHernández
8 августа 2025 г., 16:00:59 GMT+03:00
Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎
0
AlbertRodriguez
25 апреля 2025 г., 1:33:43 GMT+03:00
Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀
0
StevenNelson
24 апреля 2025 г., 9:18:04 GMT+03:00
Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀
0
MatthewGonzalez
23 апреля 2025 г., 19:59:25 GMT+03:00
O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀
0
ScottWalker
22 апреля 2025 г., 15:54:29 GMT+03:00
Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀
0
Google полностью принимает то, что мы называем эрой Gemini.
Прежде чем углубляться в детали, позвольте мне на минуту задуматься о том, где мы находимся. Мы более десяти лет вкладываем ресурсы в AI, расширяя границы в исследованиях, разработке продуктов и инфраструктуре. Сегодня мы расскажем обо всем этом и не только.
Мы все еще находимся в начале этого перехода к платформе AI, и потенциал огромен — для создателей, разработчиков, стартапов и всех остальных. Именно об этом эра Gemini: о продвижении этих возможностей вперед. Итак, давайте начнем.
Эра Gemini
В прошлом году на I/O мы представили наше видение Gemini: передовую модель, созданную для нативной мультимодальности с самого начала, способную обрабатывать текст, изображения, видео, код и многое другое. Это значительный шаг к преобразованию любого входного сигнала в любой выходной — «I/O» для следующего поколения.
С тех пор мы выпустили первые модели Gemini, которые установили новые стандарты в мультимодальной производительности. Всего через два месяца мы представили Gemini 1.5 Pro, которая принесла крупный прорыв в обработке длинных контекстов. Она может обрабатывать 1 миллион токенов в продакшене, опережая любую другую крупномасштабную базовую модель на сегодняшний день.
Мы стремимся к тому, чтобы каждый мог воспользоваться возможностями Gemini. Мы быстро поделились этими достижениями с вами. Сегодня более 1,5 миллиона разработчиков используют модели Gemini в наших инструментах, от отладки кода до получения новых идей и создания следующей волны приложений AI.Мы также интегрируем мощные функции Gemini в наши продукты значимыми способами. Сегодня вы увидите примеры этого в Search, Photos, Workspace, Android и не только.
Прогресс продуктов
В настоящее время все наши продукты с 2 миллиардами пользователей работают на базе Gemini.
Мы также запустили новые возможности, включая мобильное приложение, в котором вы можете напрямую взаимодействовать с Gemini, доступное на Android и iOS. А с Gemini Advanced вы получаете доступ к нашим самым продвинутым моделям. За три месяца более 1 миллиона человек зарегистрировались, чтобы попробовать это, и интерес продолжает расти.
Расширение AI Overviews в Search
Одно из самых захватывающих достижений с Gemini произошло в Google Search.
За последний год мы обработали миллиарды запросов через наш Search Generative Experience. Пользователи исследуют Search новыми способами, задавая более длинные и сложные вопросы, даже используя фотографии для поиска, и получают лучшие результаты из интернета.
Мы тестировали этот опыт за пределами Labs, и мы рады видеть не только увеличение использования Search, но и более высокую удовлетворенность пользователей.
Я рад объявить, что на этой неделе мы начнем развертывать этот полностью обновленный опыт, AI Overviews, для всех в США, а вскоре последуют и другие страны.
Благодаря Gemini мы раздвигаем границы возможного в Search, включая наши собственные продукты.
Представляем Ask Photos
Возьмем, к примеру, Google Photos, который мы запустили почти девять лет назад. Он стал основным инструментом для организации самых ценных воспоминаний, с более чем 6 миллиардами фотографий и видео, загружаемых ежедневно.
Людям нравится использовать Photos для поиска по своим воспоминаниям. С Gemini это стало еще проще.
Представьте, что вы на парковке и не помните номер своего автомобиля. Раньше вам пришлось бы искать в Photos по ключевым словам и прокручивать годы фотографий, чтобы найти его. Теперь вы можете просто спросить Photos. Оно распознает автомобили, которые вы часто используете, определяет, какой из них ваш, и выдает номерной знак.
Ask Photos также может помочь вам глубже погрузиться в воспоминания. Допустим, вы вспоминаете ранние достижения своей дочери Лусии. Вы можете спросить Photos: «Когда Лусия научилась плавать?»
Затем вы можете задать более сложный вопрос, например: «Покажи, как прогрессировало плавание Лусии».
Здесь Gemini выходит за рамки простого поиска, понимая различные контексты — от кругов в бассейне до сноркелинга в океане и текста и дат на ее сертификатах по плаванию. Photos затем собирает все это в сводку, позволяя вам пережить эти удивительные воспоминания. Мы запускаем Ask Photos этим летом, и в будущем появятся новые функции.
Раскрытие знаний с помощью мультимодальности и длинного контекста
Мультимодальность Gemini разработана для раскрытия знаний в различных форматах. Это одна модель, которая понимает и связывает различные типы входных данных.
Этот подход расширяет типы вопросов, которые мы можем задавать, и ответы, которые мы получаем. Длинный контекст идет дальше, позволяя нам обрабатывать огромные объемы информации: сотни страниц текста, часы аудио, час видео, целые репозитории кода или даже 96 меню Cheesecake Factory.
Для такого количества меню вам понадобится окно контекста в один миллион токенов, что теперь возможно с Gemini 1.5 Pro. Разработчики используют это довольно крутымиспособами.
Мы развертывали Gemini 1.5 Pro с длинным контекстом в предварительной версии в последние несколько месяцев, улучшая качество перевода, кодирования и рассуждений. Эти обновления теперь отражены в модели.
Я рад объявить, что мы делаем эту улучшенную версию Gemini 1.5 Pro доступной для всех разработчиков по всему миру. Кроме того, Gemini 1.5 Pro с контекстом в 1 миллион токенов теперь напрямую доступен для пользователей в Gemini Advanced, поддерживая 35 языков.
Расширение до 2 миллионов токенов в частной предварительной версии
Один миллион токенов открыл новые возможности, но мы не останавливаемся на этом.
Сегодня мы расширяем окно контекста до 2 миллионов токенов, доступных для разработчиков в частной предварительной версии.
Невероятно видеть, как далеко мы продвинулись всего за несколько месяцев. Это еще один шаг к нашей конечной цели — бесконечному контексту.
Внедрение Gemini 1.5 Pro в Workspace
Мы обсудили два ключевых технических достижения: мультимодальность и длинный контекст. Каждое из них мощное само по себе, но вместе они раскрывают еще более глубокие возможности и интеллект.
Это очевидно в Google Workspace.
Люди часто ищут свои электронные письма в Gmail. С Gemini это стало намного мощнее. Например, как родитель, вы хотите быть в курсе школьных мероприятий вашего ребенка. Gemini может помочь вам следить за этим.
Вы можете попросить Gemini суммировать последние письма из школы. За кулисами он определяет релевантные письма и даже анализирует вложения, такие как PDF-файлы. Вы получаете сводку ключевых моментов и задач. Если вы пропустили собрание PTA из-за поездки, и запись длится час, Gemini может выделить важные части, если это Google Meet. Если есть призыв к волонтерам, и вы свободны, Gemini может составить для вас ответ.
Есть бесчисленное множество способов упростить вашу жизнь. Gemini 1.5 Pro доступен сегодня в Workspace Labs. Aparna расскажет подробности.
Аудиовыходы в NotebookLM
Мы видели примеры с текстовыми выводами, но с мультимодальной моделью мы можем сделать гораздо больше.
Мы делаем успехи в этом направлении, и это не все. Аудиообзоры в NotebookLM демонстрируют это. Они используют Gemini 1.5 Pro для создания персонализированной и интерактивной аудио-конверсации из ваших исходных материалов.
Это потенциал мультимодальности. Скоро вы сможете комбинировать входные и выходные данные. Это то, что мы имеем в виду под «I/O» для нового поколения. Но что, если мы сможем пойти еще дальше?
Продвигаемся дальше с агентами AI
Одна из захватывающих возможностей, которые мы видим, — это агенты AI. Это интеллектуальные системы, которые могут рассуждать, планировать и запоминать. Они могут думать на несколько шагов вперед и работать с программным обеспечением и системами, чтобы выполнять задачи от вашего имени, всегда под вашим контролем.
Мы все еще на ранней стадии, но позвольте мне показать вам, какие сценарии мы разрабатываем.
Возьмем, к примеру, покупки. Покупать обувь весело, но возвращать ее, если она не подходит, не так уж приятно.
Представьте, что Gemini может выполнить все шаги за вас:
- Поиск чека в вашем почтовом ящике...
- Определение номера заказа из вашего письма...
- Заполнение формы возврата...
- Даже планирование получения посылки UPS.
Это намного проще, не так ли?
Рассмотрим более сложный сценарий. Допустим, вы только что переехали в Чикаго. Gemini и Chrome могут работать вместе, чтобы помочь вам обустроиться — организовывать, рассуждать и синтезировать информацию от вашего имени.
Вы захотите исследовать город и найти местные услуги, от химчисток до выгульщиков собак. Вам также нужно будет обновить свой новый адрес на множестве веб-сайтов.
Gemini может управлять этими задачами и будет запрашивать дополнительную информацию, когда это необходимо, гарантируя, что вы всегда контролируете ситуацию.
Это важно — разрабатывая эти возможности, мы сосредоточены на конфиденциальности, безопасности и доступности для всех.
Это простые примеры, но они иллюстрируют типы проблем, которые мы стремимся решить, создавая интеллектуальные системы, которые думают, рассуждают и планируют за вас.
Что это значит для нашей миссии
Мощь Gemini — с его мультимодальностью, длинным контекстом и агентами — приближает нас к нашей конечной цели: сделать AI полезным для всех.
Это путь, по которому мы добьемся наибольшего прогресса в нашей миссии: организовывать мировую информацию для любого входного сигнала, делать ее доступной через любой выходной сигнал и объединять мировую информацию с информацией вашего мира действительно полезным образом.
Открывая новые горизонты
Чтобы полностью реализовать потенциал AI, нам нужно раздвигать границы. Команда Google DeepMind упорно работает над этим.
Мы видели много восторгов вокруг 1.5 Pro и его длинного контекстного окна. Но разработчики также хотели что-то более быстрое и экономичное. Поэтому завтра мы представляем Gemini 1.5 Flash, более легкую модель, оптимизированную для масштаба. Она создана для задач, где важны низкая задержка и стоимость. 1.5 Flash будет доступен в AI Studio и Vertex AI во вторник.
Заглядывая вперед, мы всегда хотели создать универсального агента, полезного в повседневной жизни. Проект Astra демонстрирует мультимодальное понимание и возможности диалога в реальном времени.
Мы также сделали успехи в генерации видео и изображений с Veo и Imagen 3 и представили Gemma 2.0, наше следующее поколение открытых моделей для ответственных инноваций в AI. Подробнее об этом можно прочитать у Demis Hassabis.
Инфраструктура для эры AI: Представляем Trillium
Обучение передовых моделей требует огромной вычислительной мощности. Спрос на вычисления для машинного обучения вырос в миллион раз за последние шесть лет и увеличивается в десять раз каждый год.
Google создан для этого. На протяжении 25 лет мы инвестировали в техническую инфраструктуру мирового класса, от передового оборудования, которое поддерживает Search, до наших собственных тензорных процессоров, которые обеспечивают наши достижения в AI.
Gemini был полностью обучен и обслуживается на наших TPU четвертого и пятого поколения. Другие ведущие компании AI, включая Anthropic, также обучали свои модели на наших TPU.
Сегодня мы рады объявить о нашем шестом поколении TPU, названном Trillium. Trillium — это наш самый производительный и эффективный TPU на сегодняшний день, обеспечивающий улучшение вычислительной производительности в 4,7 раза по сравнению с предыдущим поколением, TPU v5e.
Мы сделаем Trillium доступным для наших облачных клиентов в конце 2024 года.
Наряду с нашими TPU мы гордимся тем, что предлагаем CPU и GPU для поддержки любых рабочих нагрузок. Это включает новые процессоры Axion, о которых мы объявили в прошлом месяце, наш первый кастомный процессор на базе Arm, обеспечивающий ведущую в отрасли производительность и энергоэффективность.
Мы также один из первых облачных провайдеров, предлагающих передовые GPU Blackwell от NVIDIA, которые будут доступны в начале 2025 года. Наше давнее партнерство с NVIDIA позволяет нам предоставить клиентам прорывные возможности Blackwell.
Чипы — это основа нашей интегрированной системы от начала до конца, от оптимизированного оборудования и открытого ПО до гибких моделей потребления. Все это объединяется в нашем AI Hypercomputer, революционной архитектуре суперкомпьютера.
Бизнес и разработчики используют его для решения более сложных задач, с более чем двойной эффективностью по сравнению с покупкой просто оборудования и чипов. Достижения нашего AI Hypercomputer стали возможны в том числе благодаря нашему подходу к жидкостному охлаждению в наших дата-центрах.
Мы занимаемся этим почти десять лет, задолго до того, как это стало стандартом в отрасли. Сегодня общая мощность нашего развернутого флота систем жидкостного охлаждения составляет почти 1 гигаватт и продолжает расти — это почти в 70 раз больше мощности любого другого флота.
В основе этого лежит масштаб нашей сети, которая соединяет нашу инфраструктуру по всему миру. Наша сеть охватывает более 2 миллионов миль наземного и подводного оптоволокна: это более чем в 10 раз больше, чем у ближайшего конкурента среди облачных провайдеров.
Мы продолжим инвестировать, чтобы продвигать инновации в AI и предоставлять передовые возможности.
Самая захватывающая глава Search
Одна из наших крупнейших областей инвестиций и инноваций — это наш основополагающий продукт, Search. 25 лет назад мы создали Search, чтобы помочь людям ориентироваться в потоке информации, поступающей в интернет.
С каждым переходом платформы мы предоставляли прорывы, чтобы лучше отвечать на ваши вопросы. На мобильных устройствах мы открыли новые типы вопросов и ответов — используя лучший контекст, геолокацию и информацию в реальном времени. С развитием понимания естественного языка и компьютерного зрения мы сделали возможными новые способы поиска, например, с помощью голоса или напевания, чтобы найти новую любимую песню, или с помощью изображения цветка, который вы видели на прогулке. А теперь вы даже можете использовать Circle to Search, чтобы найти крутую новую обувь, которую хотите купить. Дерзайте, вы всегда можете их вернуть!
Конечно, Search в эру Gemini выведет это на совершенно новый уровень, сочетая наши сильные стороны в инфраструктуре, новейшие возможности AI, высокие стандарты качества информации и наш многолетний опыт соединения вас с богатством интернета. Результат — продукт, который делает работу за вас.
Google Search — это генеративный AI в масштабе человеческого любопытства. И это самая захватывающая глава Search на сегодняшний день. Подробнее об эре Gemini в Search от Liz Reid.
Более интеллектуальные возможности Gemini
Gemini — это больше, чем просто чат-бот; он создан, чтобы быть вашим личным полезным помощником, который может выполнять сложные задачи и действовать от вашего имени.
Взаимодействие с Gemini должно быть разговорным и интуитивным. Поэтому мы объявляем о новом опыте Gemini под названием Live, который позволяет вести глубокую беседу с Gemini с помощью голоса. Мы также внедрим поддержку 2 миллионов токенов в Gemini Advanced позже в этом году, что позволит загружать и анализировать сверхплотные файлы, такие как видео и длинный код. Sissie Hsiao расскажет подробности.
Gemini на Android
С миллиардами пользователей Android по всему миру мы рады более глубокой интеграции Gemini в пользовательский опыт. Как ваш новый помощник AI, Gemini готов помогать вам в любое время и в любом месте. Мы интегрировали модели Gemini в Android, включая нашу последнюю модель на устройстве: Gemini Nano с мультимодальностью, которая обрабатывает текст, изображения, аудио и речь, открывая новые возможности, сохраняя при этом конфиденциальность информации на вашем устройстве. Sameer Samat делится новостями об Android здесь.
Наш ответственный подход к AI
Мы продолжаем смело подходить к возможностям AI с чувством энтузиазма. Мы также делаем это ответственно. Мы разрабатываем передовую технику под названием AI-assisted red teaming, которая опирается на прорывы Google DeepMind в играх, такие как AlphaGo, для улучшения наших моделей. Кроме того, мы расширили SynthID, наш инструмент водяных знаков, который упрощает идентификацию контента, сгенерированного AI, на два новых формата: текст и видео. James Manyika расскажет подробности.
Создаем будущее вместе
Все это показывает важный прогресс, которого мы достигаем, смело и ответственно делая AI полезным для всех.
Мы давно придерживаемся подхода AI-first. Наши десятилетия лидерства в исследованиях породили многие современные прорывы, которые движут прогресс AI, для нас и для всей отрасли. Кроме того, у нас есть:
- Ведущая в мире инфраструктура, созданная для эры AI
- Передовые инновации в Search, теперь работающие на Gemini
- Продукты, которые помогают в необыкновенном масштабе — включая 15 продуктов с полумиллиардом пользователей
- И платформы, которые позволяют всем — партнерам, клиентам, создателям и вам — изобретать будущее.
Этот прогресс возможен только благодаря нашему невероятному сообществу разработчиков. Вы делаете это реальным, создавая опыты и приложения каждый день. Итак, всем здесь, в Shoreline, и миллионам зрителей по всему миру, вот к возможностям будущего и к их совместному созданию.
Получайте больше новостей от Google в свой почтовый ящик.
Адрес электронной почтыВаши данные будут использованы в соответствии с политикой конфиденциальности Google.
ПодписатьсяГотово. Остался всего один шаг.
Проверьте свой почтовый ящик, чтобы подтвердить подписку.
Вы уже подписаны на нашу рассылку.
Вы также можете подписаться с другим адресом электронной почты.



Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎




Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎




Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀




Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀




O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀




Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀












