"8 новых продуктов и обновлений ИИ протестированы"

На I/O мы не просто представляем список обновлений, таких как новые модели Gemini, AI-агенты и улучшения Android — мы действительно позволяем разработчикам, журналистам и партнёрам погрузиться в действие с практическими демонстрациями продуктов. В этом году я провёл день в амфитеатре Shoreline, где проходит I/O, и смог ознакомиться с множеством таких демонстраций. Вот краткий обзор некоторых из них.
Моя первая демонстрация дня была довольно крутой. Я наблюдал, как Gemini Advanced обрабатывает договор аренды недвижимости на более чем 20 страниц, полный юридического жаргона и сложных пунктов. После обработки документа я мог задавать вопросы, например, разрешит ли мой арендодатель завести собаку или есть ли дополнительные платежи, которые мне нужно будет оплатить. Я уже с нетерпением жду использования этой функции, чтобы разобраться в следующем договоре аренды, когда придёт время продлевать аренду квартиры.
Далее демонстрация стала ещё более впечатляющей. Двое сотрудников Google загрузили в Gemini PDF-файл огромного учебника по экономике — сотни страниц. Мне бы понадобились годы, чтобы его прочитать, но Gemini быстро составил краткое содержание и выделил ключевые темы для изучения. Он даже создал тест с множественным выбором, включающий один правильный ответ и три хитрых неправильных, чтобы помочь мне подготовиться к гипотетическому экзамену.
Сотрудники Google Сид Лалл (слева) и Адам Курзрок (справа) демонстрируют, как Gemini Advanced может теперь суммировать огромный учебник по экономике или тысячи страниц документов.
Обе эти демонстрации использовали Gemini 1.5 Pro, который мы представили ранее в этом году с самым длинным контекстным окном среди всех крупномасштабных базовых моделей. Теперь мы предоставляем ранний доступ к Gemini 1.5 Pro для подписчиков Gemini Advanced, позволяя им загружать документы прямо из Drive. Это означает, что они могут использовать Gemini для суммирования или анализа документов длиной до 1500 страниц.
Gemini 1.5 Pro также интегрируется в боковую панель приложений Workspace, таких как Gmail, Docs, Sheets, Slides и Drive. Я смог увидеть это в действии, используя Gemini в Gmail для суммирования образца еженедельного школьного отчёта по электронной почте, и он выделил конкретные детали, такие как мероприятия для учеников 7-го класса и список вещей для ночной поездки.
Боковая панель Gemini может помочь ответить на ключевые вопросы о вашем контенте в Gmail, Drive и других приложениях.
Улучшенное длинное контекстное окно может даже извлекать информацию из нескольких документов при ответе на один запрос. В Docs я попросил помочь написать образец письма потенциальному кандидату на работу, ссылаясь на документ с описанием вакансии и PDF-портфолио кандидата в моём Drive. Gemini мгновенно составил письмо, учитывающее детали из обоих документов.
Но Gemini 1.5 Pro — не единственный новичок. Я также смог поиграть с недавно анонсированной Imagen 3, нашей лучшей моделью для генерации изображений из текста. Одна крутая функция, которую я попробовал, — это её способность генерировать декоративный текст и буквы. Я попросил стилизованный алфавит, например, буквы из джема на тосте или серебряных воздушных шаров, парящих в небе. Imagen 3 создала полный алфавит букв, которые я затем мог использовать для создания собственных (вкусных) меню.
После весёлого опыта с Imagen 3 я вернулся к другим демонстрациям Gemini. Одна демонстрация позволила мне открыть наложение Gemini на телефоне Android и задавать вопросы о чём угодно на экране. Это показало, как мы не только расширяем возможности запросов к Gemini, но и делаем его контекстно-осведомлённым, чтобы предугадывать ваши потребности и предлагать полезные подсказки.
В качестве примера использовалось длинное руководство по духовке. Вместо того чтобы мучительно читать документ, я открыл Gemini и сразу получил предложение «Спросить этот PDF». Я задавал вопросы, например, «как обновить часы», и получал быстрые и точные ответы. Это работало так же хорошо с видео на YouTube. Вместо просмотра 20-минутного видео с тренировкой я спросил, как модифицировать планку, и получил ответ мгновенно, после чего перешёл к следующей демонстрации.
Следующая демонстрация представила новый режим разговора под названием Gemini Live, где вы можете общаться с Gemini в приложении без ввода текста. Разговор с Gemini был совсем не похож на обычный интерфейс чат-бота. Его ответы были более разговорными, а не просто параграфами текста или списками с пунктами. В моей демонстрации я попросил список детских мероприятий для летних каникул и смог прервать список, чтобы узнать больше о том, какие материалы понадобятся для окрашивания футболки методом тай-дай.
Демонстрация Project Astra вывела всё на новый уровень, показав, куда движутся наши проекты conversational AI.
Наш AI Sandbox, где разработчики и посетители пробовали демонстрации, такие как Project Astra и другие креативные эксперименты с AI, например, режим DJ в MusicFX.
Вместо того чтобы работать только с тем, что на вашем экране или что вы ввели в чат, мультимодальные возможности Astra могут одновременно понимать разговорные речевые запросы и живые видеопотоки, открывая новые виды AI-опытов.
Демонстрация аллитерации Astra началась просто: я показал камере объект, например, банан или кусок хлеба, и Gemini придумал аллитеративное предложение. По мере добавления объектов Gemini поддерживал беседу, от «Яркие бананы красиво красуются на доске» с одним фруктом до «Кулинарные творения могут привлечать взгляд», когда перед ним была целая доска с едой.
Astra создаёт аллитерации с бананами, багетами… и всем остальным, что вы можете показать.
Ещё одна демонстрация Astra позволила мне сыграть в Pictionary с Gemini. Это может звучать просто, но требовало от агента понимания изображений, запоминания того, что было нарисовано в каждом раунде, и использования общих знаний, чтобы угадать, что я рисую. В одной демонстрации Astra поняла, что одного круга недостаточно для предположения, но когда я добавил линии под ним, она быстро перешла от распознавания фигурки до определения, что человек, держащий эмодзи черепа, — это Гамлет.
Astra непобедима в Pictionary.
Перемещение по AI Sandbox и другим демонстрационным станциям ощущалось как взгляд в будущее. Это также было немного унизительно: Astra победила меня в Pictionary в нескольких раундах!
Связанная статья
Meta Усиливает Безопасность ИИ с Помощью Продвинутых Инструментов Llama
Meta выпустила новые инструменты безопасности Llama для укрепления разработки ИИ и защиты от новых угроз.Эти усовершенствованные инструменты безопасности модели ИИ Llama сочетаются с новыми ресурсами
NotebookLM представляет курируемые тетради от ведущих изданий и экспертов
Google совершенствует свой инструмент для исследований и заметок на базе ИИ, NotebookLM, чтобы сделать его всеобъемлющим центром знаний. В понедельник компания представила курируемую коллекцию тетраде
Alibaba представляет Wan2.1-VACE: Открытое решение для видео с ИИ
Alibaba представила Wan2.1-VACE, модель ИИ с открытым исходным кодом, которая призвана трансформировать процессы создания и редактирования видео.VACE является ключевым компонентом семейства видео моде
Комментарии (36)
WillWalker
31 июля 2025 г., 4:41:20 GMT+03:00
Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎
0
JeffreyThomas
21 апреля 2025 г., 4:33:38 GMT+03:00
¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓
0
GregoryRodriguez
19 апреля 2025 г., 19:24:35 GMT+03:00
I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓
0
ThomasYoung
18 апреля 2025 г., 14:13:01 GMT+03:00
Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓
0
BrianThomas
18 апреля 2025 г., 7:37:15 GMT+03:00
A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎
0
JackMartin
16 апреля 2025 г., 4:18:17 GMT+03:00
I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊
0
На I/O мы не просто представляем список обновлений, таких как новые модели Gemini, AI-агенты и улучшения Android — мы действительно позволяем разработчикам, журналистам и партнёрам погрузиться в действие с практическими демонстрациями продуктов. В этом году я провёл день в амфитеатре Shoreline, где проходит I/O, и смог ознакомиться с множеством таких демонстраций. Вот краткий обзор некоторых из них.
Моя первая демонстрация дня была довольно крутой. Я наблюдал, как Gemini Advanced обрабатывает договор аренды недвижимости на более чем 20 страниц, полный юридического жаргона и сложных пунктов. После обработки документа я мог задавать вопросы, например, разрешит ли мой арендодатель завести собаку или есть ли дополнительные платежи, которые мне нужно будет оплатить. Я уже с нетерпением жду использования этой функции, чтобы разобраться в следующем договоре аренды, когда придёт время продлевать аренду квартиры.
Далее демонстрация стала ещё более впечатляющей. Двое сотрудников Google загрузили в Gemini PDF-файл огромного учебника по экономике — сотни страниц. Мне бы понадобились годы, чтобы его прочитать, но Gemini быстро составил краткое содержание и выделил ключевые темы для изучения. Он даже создал тест с множественным выбором, включающий один правильный ответ и три хитрых неправильных, чтобы помочь мне подготовиться к гипотетическому экзамену.
Gemini 1.5 Pro также интегрируется в боковую панель приложений Workspace, таких как Gmail, Docs, Sheets, Slides и Drive. Я смог увидеть это в действии, используя Gemini в Gmail для суммирования образца еженедельного школьного отчёта по электронной почте, и он выделил конкретные детали, такие как мероприятия для учеников 7-го класса и список вещей для ночной поездки.
Улучшенное длинное контекстное окно может даже извлекать информацию из нескольких документов при ответе на один запрос. В Docs я попросил помочь написать образец письма потенциальному кандидату на работу, ссылаясь на документ с описанием вакансии и PDF-портфолио кандидата в моём Drive. Gemini мгновенно составил письмо, учитывающее детали из обоих документов.
Но Gemini 1.5 Pro — не единственный новичок. Я также смог поиграть с недавно анонсированной Imagen 3, нашей лучшей моделью для генерации изображений из текста. Одна крутая функция, которую я попробовал, — это её способность генерировать декоративный текст и буквы. Я попросил стилизованный алфавит, например, буквы из джема на тосте или серебряных воздушных шаров, парящих в небе. Imagen 3 создала полный алфавит букв, которые я затем мог использовать для создания собственных (вкусных) меню.
После весёлого опыта с Imagen 3 я вернулся к другим демонстрациям Gemini. Одна демонстрация позволила мне открыть наложение Gemini на телефоне Android и задавать вопросы о чём угодно на экране. Это показало, как мы не только расширяем возможности запросов к Gemini, но и делаем его контекстно-осведомлённым, чтобы предугадывать ваши потребности и предлагать полезные подсказки.
В качестве примера использовалось длинное руководство по духовке. Вместо того чтобы мучительно читать документ, я открыл Gemini и сразу получил предложение «Спросить этот PDF». Я задавал вопросы, например, «как обновить часы», и получал быстрые и точные ответы. Это работало так же хорошо с видео на YouTube. Вместо просмотра 20-минутного видео с тренировкой я спросил, как модифицировать планку, и получил ответ мгновенно, после чего перешёл к следующей демонстрации.
Следующая демонстрация представила новый режим разговора под названием Gemini Live, где вы можете общаться с Gemini в приложении без ввода текста. Разговор с Gemini был совсем не похож на обычный интерфейс чат-бота. Его ответы были более разговорными, а не просто параграфами текста или списками с пунктами. В моей демонстрации я попросил список детских мероприятий для летних каникул и смог прервать список, чтобы узнать больше о том, какие материалы понадобятся для окрашивания футболки методом тай-дай.
Демонстрация Project Astra вывела всё на новый уровень, показав, куда движутся наши проекты conversational AI.
Демонстрация аллитерации Astra началась просто: я показал камере объект, например, банан или кусок хлеба, и Gemini придумал аллитеративное предложение. По мере добавления объектов Gemini поддерживал беседу, от «Яркие бананы красиво красуются на доске» с одним фруктом до «Кулинарные творения могут привлечать взгляд», когда перед ним была целая доска с едой.


Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎




¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓




I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓




Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓




A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎




I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊












