Google Gemini представляет функцию чтения вслух для документов
В Документах Google появилась инновационная функция преобразования текста в речь с помощью искусственного интеллекта, которая превращает письменные документы в настраиваемые аудиозаписи. Новая функция позволяет пользователям генерировать естественные голосовые фрагменты из текстового контента с настраиваемыми голосами и скоростью воспроизведения.
Эта возможность преобразования звука, доступная как авторам, так и сотрудникам, отображается в разделе "Инструменты" > "Аудио" > "Прослушать эту вкладку " в общих документах. Авторы могут еще больше повысить доступность, встроив специальный аудиоплеер непосредственно в свои файлы с помощью команды "Вставка" > "Аудио", обеспечив читателям удобство прослушивания в один клик.

Хотя в апреле Google уже представил предварительную версию функции преобразования документов в подкасты, текущая реализация нацелена на практическое прослушивание по требованию. В настоящее время функция ограничена англоязычными документами на настольных платформах и представляет собой постоянное инвестирование Google в инструменты повышения производительности, основанные на искусственном интеллекте.
В настоящее время функция генерации аудио распространяется на подписчиков Workspace с тарифными планами Business, Enterprise или Education, а также на владельцев подписок AI Pro и Ultra. Такая стратегия развертывания позиционирует функцию как премиум-усовершенствование для профессиональных и образовательных пользователей, которые могут получить наибольшую выгоду от мультимодального взаимодействия с документами.
В частности, эта разработка превращает Google Docs в более универсальную платформу для работы с письменным контентом, что особенно полезно:
- занятых профессионалов, которым необходимо просматривать документы в режиме многозадачности
- Визуальным учащимся, которые лучше воспринимают информацию на слух.
- Пользователи с ограниченными возможностями доступа для читателей с нарушениями зрения
- Изучающие иностранные языки, улучшающие произношение и навыки восприятия речи на слух.
Это внедрение демонстрирует стратегическую направленность Google на интеграцию возможностей генеративного ИИ непосредственно в основные рабочие процессы, после успешного внедрения других функций ИИ, таких как "Помоги мне написать". По мере развития технологии пользователи могут ожидать расширения возможностей на другие языки и мобильные платформы в будущих обновлениях.
Связанная статья
Apple может отложить запуск следующего iPhone для выпуска складной модели
По данным The Information, Apple готовит значительную перестановку в календаре релизов iPhone на 2026 год, представив первый складной iPhone вместе с новыми моделями "Air". Как сообщается, этот страте
Veo 3 запускается с функцией генерации видео и саундтреков с помощью искусственного интеллекта
Вот переписанный HTML-контент, соответствующий всем вашим рекомендациям:Google представляет Veo 3: ИИ-генерация видео с синхронизированным звукомGoogle представила Veo 3 на своей конференции I/O 2025,
Обновления Instagram включают в себя ленту репостов и функцию, вдохновленную картами Snap
Instagram представляет обновления, вдохновленные конкурентами, и одновременно совершенствует спорную функциюПлатформа выпускает несколько нововведений, заимствованных у конкурирующих сервисов, и однов
Комментарии (0)
В Документах Google появилась инновационная функция преобразования текста в речь с помощью искусственного интеллекта, которая превращает письменные документы в настраиваемые аудиозаписи. Новая функция позволяет пользователям генерировать естественные голосовые фрагменты из текстового контента с настраиваемыми голосами и скоростью воспроизведения.
Эта возможность преобразования звука, доступная как авторам, так и сотрудникам, отображается в разделе "Инструменты" > "Аудио" > "Прослушать эту вкладку " в общих документах. Авторы могут еще больше повысить доступность, встроив специальный аудиоплеер непосредственно в свои файлы с помощью команды "Вставка" > "Аудио", обеспечив читателям удобство прослушивания в один клик.

Хотя в апреле Google уже представил предварительную версию функции преобразования документов в подкасты, текущая реализация нацелена на практическое прослушивание по требованию. В настоящее время функция ограничена англоязычными документами на настольных платформах и представляет собой постоянное инвестирование Google в инструменты повышения производительности, основанные на искусственном интеллекте.
В настоящее время функция генерации аудио распространяется на подписчиков Workspace с тарифными планами Business, Enterprise или Education, а также на владельцев подписок AI Pro и Ultra. Такая стратегия развертывания позиционирует функцию как премиум-усовершенствование для профессиональных и образовательных пользователей, которые могут получить наибольшую выгоду от мультимодального взаимодействия с документами.
В частности, эта разработка превращает Google Docs в более универсальную платформу для работы с письменным контентом, что особенно полезно:
- занятых профессионалов, которым необходимо просматривать документы в режиме многозадачности
- Визуальным учащимся, которые лучше воспринимают информацию на слух.
- Пользователи с ограниченными возможностями доступа для читателей с нарушениями зрения
- Изучающие иностранные языки, улучшающие произношение и навыки восприятия речи на слух.
Это внедрение демонстрирует стратегическую направленность Google на интеграцию возможностей генеративного ИИ непосредственно в основные рабочие процессы, после успешного внедрения других функций ИИ, таких как "Помоги мне написать". По мере развития технологии пользователи могут ожидать расширения возможностей на другие языки и мобильные платформы в будущих обновлениях.












