Близнецы раскрывают улучшенную модель, расширенный контекст, агенты ИИ

Дом

Новости

10 апреля 2025 г.

DavidThomas

149

# ai

В декабре мы представили нашу первую мультимодальную модель Gemini 1.0, доступную в трех размерах: Ultra, Pro и Nano. Спустя несколько месяцев мы выпустили 1.5 Pro с улучшенной производительностью и прорывным окном контекста в 1 миллион токенов.

Разработчики и корпоративные клиенты используют 1.5 Pro впечатляющими способами, ценя его большое окно контекста, мощные мультимодальные рассуждения и общую выдающуюся производительность.

Отзывы пользователей показали потребность в моделях с меньшей задержкой и стоимостью, что побудило нас продолжать расширять границы. Поэтому мы рады представить сегодня Gemini 1.5 Flash. Эта модель легче, чем 1.5 Pro, разработана для скорости и эффективности, идеальна для масштабирования.

Модели 1.5 Pro и 1.5 Flash теперь находятся в публичной предварительной версии с окном контекста в 1 миллион токенов, доступны через Google AI Studio и Vertex AI. Для тех, кому нужно больше, 1.5 Pro теперь предлагает окно контекста в 2 миллиона токенов, доступное через список ожидания для разработчиков, использующих API, и клиентов Google Cloud.

Мы не останавливаемся на этом. Мы также выпускаем обновления для всей семьи Gemini, представляем следующее поколение открытых моделей Gemma 2 и делаем шаги в будущее AI-ассистентов с Project Astra.

Длины контекста ведущих базовых моделей по сравнению с возможностью Gemini 1.5 в 2 миллиона токенов

Обновления семейства моделей Gemini

Новая 1.5 Flash, оптимизированная для скорости и эффективности

Представляем 1.5 Flash, новейшего и самого быстрого члена семейства Gemini, доступного через наш API. Она разработана для задач с высокой частотой и объемом, обеспечивая экономичное масштабирование при сохранении прорывного окна контекста.

Хотя 1.5 Flash легче, чем 1.5 Pro, она не уступает. Она превосходно справляется с мультимодальными рассуждениями на больших наборах данных, обеспечивая впечатляющее качество относительно своего размера.

Новая модель Gemini 1.5 Flash оптимизирована для скорости и эффективности, обладает высокой способностью к мультимодальным рассуждениям и имеет прорывное окно контекста.

1.5 Flash выделяется в задачах, таких как суммирование, чат-приложения, подписи к изображениям и видео. Она также эффективно извлекает данные из длинных документов и таблиц. Эта универсальность обусловлена обучением через "дистилляцию" от 1.5 Pro, где основные знания и навыки большей модели передаются более эффективной меньшей модели.

Для получения подробной информации о 1.5 Flash ознакомьтесь с обновленным техническим отчетом Gemini 1.5, страницей технологий Gemini и узнайте о доступности и ценах.

Значительное улучшение 1.5 Pro

За последние месяцы мы добились значительных успехов в улучшении 1.5 Pro, нашего лидера по широкому спектру задач.

Мы расширили окно контекста до 2 миллионов токенов и улучшили возможности в генерации кода, логических рассуждениях, планировании, многоходовых диалогах, а также понимании аудио и изображений. Эти улучшения подкреплены достижениями в данных и алгоритмах, показывая значительные улучшения как на публичных, так и на внутренних тестах.

1.5 Pro теперь справляется с все более сложными и нюансированными инструкциями, включая те, которые определяют поведение на уровне продукта, такие как роль, формат и стиль. Мы усовершенствовали контроль над ответами модели для конкретных случаев использования, таких как настройка персон чат-агентов или автоматизация рабочих процессов с множественными вызовами функций. Пользователи теперь могут управлять поведением модели с помощью системных инструкций.

Мы также добавили понимание аудио в Gemini API и Google AI Studio, позволяя 1.5 Pro обрабатывать изображения и аудио из видео, загруженных в Google AI Studio. Мы интегрируем 1.5 Pro в продукты Google, такие как Gemini Advanced и приложения Workspace.

Для получения дополнительной информации о 1.5 Pro ознакомьтесь с обновленным техническим отчетом Gemini 1.5 и страницей технологий Gemini.

Gemini Nano понимает мультимодальные входные данные

Gemini Nano выходит на новый уровень, переходя от текстовых входных данных к включению изображений. Начиная с Pixel, приложения, использующие Gemini Nano с мультимодальностью, смогут интерпретировать мир более человечным способом через текст, визуальные образы, звук и устную речь.

Узнайте больше о Gemini 1.0 Nano на Android.

Следующее поколение открытых моделей

Сегодня мы также обновляем Gemma, наше семейство открытых моделей, построенных на тех же исследованиях и технологиях, что и модели Gemini.

Мы запускаем Gemma 2, наши открытые модели следующего поколения для ответственных инноваций в AI. Gemma 2 имеет новую архитектуру для превосходной производительности и эффективности и будет доступна в новых размерах.

Семейство Gemma расширяется с PaliGemma, нашей первой моделью визуально-языкового типа, вдохновленной PaLI-3. Мы также обновили наш набор инструментов Responsible Generative AI Toolkit с LLM Comparator для оценки качества ответов модели.

Для получения подробной информации посетите блог для разработчиков.

Прогресс в разработке универсальных AI-агентов

В Google DeepMind наша миссия — создавать AI ответственно на благо человечества. Мы всегда стремились к созданию универсальных AI-агентов, которые могут помогать в повседневной жизни. Поэтому мы делимся прогрессом в будущем AI-ассистентов с Project Astra (продвинутый агент, реагирующий на зрение и речь).

Чтобы AI-агент был действительно полезен, он должен понимать и реагировать на мир, как человек, воспринимая и запоминая увиденное и услышанное, чтобы улавливать контекст и действовать соответственно. Он также должен быть проактивным, обучаемым и персонализированным, обеспечивая естественные диалоги без задержек.

Хотя мы добились больших успехов в обработке мультимодальной информации, достижение времени отклика в разговоре — сложная инженерная задача. На протяжении многих лет мы совершенствовали восприятие, рассуждения и диалоги наших моделей, чтобы взаимодействия были более естественными.

На основе Gemini мы разработали прототипы агентов, которые быстрее обрабатывают информацию, непрерывно кодируя видеокадры, объединяя видео и речевые входные данные в хронологию событий и кэшируя эти данные для быстрого доступа.

Используя наши лучшие речевые модели, мы также улучшили звучание этих агентов, придав им более широкий диапазон интонаций. Они лучше понимают контекст и быстро реагируют в разговоре.

С этой технологией легко представить будущее, где у каждого есть экспертный AI-ассистент, доступный через телефон или очки. Некоторые из этих возможностей появятся в продуктах Google, таких как приложение Gemini и веб-опыт, позже в этом году.

Продолжение исследований

Мы проделали большой путь с семейством моделей Gemini и стремимся раздвигать границы еще дальше. Через неустанные инновации мы исследуем новые горизонты, открывая захватывающие новые сценарии использования для Gemini.

Чтобы узнать больше о Gemini и его возможностях, ознакомьтесь с нашими ресурсами.

Получайте больше историй от Google в ваш почтовый ящик.Получайте больше историй от Google в ваш почтовый ящик.

Адрес электронной почтыВаша информация будет использована в соответствии с политикой конфиденциальности Google.

ПодписатьсяГотово. Еще один шаг.

Проверьте ваш почтовый ящик, чтобы подтвердить подписку.

Вы уже подписаны на нашу рассылку.

Вы также можете подписаться с другим адресом электронной почты.

Связанная статья

WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания

Kakao Mobility представляет план развития автономного вождения 4-го уровня с использованием физического ИИ Компания Kakao Mobility планирует самостоятельно разрабатывать технологии автономного вождения 4-го уровня в рамках своей стратегии «физического ИИ».На конференции World IT Show 2026, прошедшей в сеу

Барри Диллер: доверие к Сэму Альтману теряет значение по мере приближения эры общей искусственной интеллигенции Миллиардер и медиа-магнат Барри Диллер не считает генерального директора OpenAI Сэма Альтмана недостойным доверия, несмотря на недавние сообщения, свидетельствующие об обратном. Выступая на этой недел

Рекомендации по связанным специальным темам

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai

Комментарии (26)

0/500

Пожалуйста, войдите в систему

GregoryWilson

27 апреля 2026 г., 23:00:25 GMT+03:00

Geminiの進化がすごいですね！長いコンテキストウィンドウは実用的なAIエージェント開発に革命をもたらしそう。でも、競争激化で倫理的なガイドラインが追いついてるか少し心配。🤔 個人的には、もっと小さなプロジェクトでも使える軽量版が早く出てくると嬉しいな。

LucasWalker

19 апреля 2025 г., 0:37:58 GMT+03:00

ジェミニの新しいモデルが100万トークンのコンテキストを持つとは信じられない！🤯 まるで何でも扱える超賢いAIを持っているようです。AIエージェントもゲームチェンジャーです。次に何を出すのか楽しみです！🚀

FrankSmith

16 апреля 2025 г., 3:37:56 GMT+03:00

젬니니의 새로운 모델 정말 멋지네요! 100만 토큰의 컨텍스트 윈도우는 정말 놀랍습니다. 마치 모든 대화를 기억하는 똑똑한 친구가 있는 것 같아요! 조금 더 빨랐으면 좋겠지만, 뭐 다 가질 수는 없죠? 🤓

JamesMiller

15 апреля 2025 г., 20:53:33 GMT+03:00

O novo modelo do Gemini é bem legal! A janela de contexto de 1 milhão de tokens é louca, é como ter um amigo superinteligente que lembra de tudo o que você já disse! Só queria que fosse um pouco mais rápido, mas, ei, não dá pra ter tudo, né? 🤓

MarkRoberts

15 апреля 2025 г., 4:25:31 GMT+03:00

El nuevo modelo Gemini es impresionante, especialmente la ventana de contexto larga. Es genial para desarrolladores, pero puede ser un poco abrumador para principiantes. Los agentes de IA son geniales, pero desearía que hubiera más documentación sobre cómo usarlos de manera efectiva.

BillyGarcia

14 апреля 2025 г., 22:20:08 GMT+03:00

O novo modelo do Gemini com um contexto de um milhão de tokens é loucura! 🤯 É como ter uma IA super inteligente que pode lidar com qualquer coisa. Os agentes de IA também são um divisor de águas. Mal posso esperar para ver o que eles vão lançar a seguir! 🚀

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан