Дом
Speechify расширяет расширение для Chrome с голосовым набором текста и виртуальным помощником
Speechify известен прежде всего как инструмент для прослушивания статей, PDF-файлов и документов. Теперь компания дополнила свое расширение для Chrome функцией распознавания голоса, добавив функции голосового набора и разговорного голосового помощника для ответов на ваши вопросы.
В прошлом году наблюдался всплеск популярности инструментов для распознавания голоса, вызванный значительным улучшением качества моделей распознавания речи. Компания Speechify воспользовалась этой тенденцией и запустила свой собственный инструмент для диктовки, первоначально поддерживающий английский язык. Как и другие решения, голосовой набор Speechify автоматически исправляет ошибки и удаляет слова-заполнители.
Во время моего краткого тестирования, длившегося чуть больше суток, я обнаружил, что инструмент Speechify имеет значительные возможности для улучшения. Например, он хорошо работает в Gmail и Google Docs, но на таких сайтах, как WordPress, я столкнулся с проблемами при активации функции голосовой диктовки и достижении надежной работы. Компания заявила, что постепенно оптимизирует инструмент для популярных сайтов.

Image Credits:Speechify Что касается точности, то уровень ошибок в словах у инструмента оказался выше, чем у конкурирующих продуктов, таких как Wispr Flow, Willow и Monologue. Speechify отметила, что ее модель улучшается при более частом использовании, что приводит к постепенному снижению количества ошибок.
Стартап также представляет разговорный голосовой помощник, доступный из боковой панели браузера. Вы можете задавать ему вопросы о просматриваемой веб-странице, например, "какие три основных момента?" или "объясните это более простыми словами".
Хотя ChatGPT и Gemini предлагают режимы разговорного голоса, Speechify утверждает, что в этих платформах эти функции вторичны. В отличие от них, стартап позиционирует голосовое взаимодействие как основное и центральное в своем инструменте.
"Мы считаем, что текстовый чат всегда будет использоваться по умолчанию, когда пользователи открывают приложения ChatGPT или Gemini. Это то, чего ожидает их аудитория. Голосовое взаимодействие, скорее всего, останется второстепенной функцией, которая часто становится для этих провайдеров чем-то второстепенным. Наш многолетний опыт работы с Speechify показал, что значительная часть рынка, включая наших собственных пользователей, предпочитает голос в качестве основного режима по умолчанию при взаимодействии с искусственным интеллектом", - пояснил Рохан Павулури, директор по бизнесу компании, в электронном письме TechCrunch.
Мероприятие TechCrunchПрисоединяйтесь к списку ожидания Disrupt 2026
Запишите себя в список ожидания Disrupt 2026, чтобы получить приоритетный доступ к билетам Early Bird. На прошлых этапах Disrupt выступали лидеры Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla - часть из более чем 250 экспертов отрасли, которые ведут 200+ сессий, призванных ускорить ваш рост и обострить конкурентные преимущества. У вас также будет возможность пообщаться с сотнями стартапов, внедряющих инновации во всех отраслях.
Присоединяйтесь к списку ожидания Disrupt 2026
Запишите себя в список ожидания Disrupt 2026, чтобы получить приоритетный доступ к билетам Early Bird. На прошлых этапах Disrupt выступали лидеры Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla - часть из более чем 250 отраслевых экспертов, которые ведут 200+ сессий, призванных ускорить ваш рост и обострить конкурентные преимущества. У вас также будет возможность пообщаться с сотнями стартапов, внедряющих инновации во всех отраслях.
Сан-Франциско | 13-15 октября 2026 года ЗАПИСЬ НА СЕЙЧАСОдним из текущих ограничений является то, что помощник Speechify не совместим с браузерами, в которых есть встроенные боковые помощники, такие как Atlas от OpenAI, Comet от Perplexity и Dia. Стартап не слишком беспокоится об этом, поскольку его расширение предназначено в первую очередь для Chrome и его обширной пользовательской базы.
Speechify планирует поэтапно интегрировать функции голосового набора и голосового помощника во все свои настольные и мобильные приложения.
Компания также намерена разработать агентов искусственного интеллекта, способных выполнять задачи автономно. Хотя полная дорожная карта не раскрывается, в качестве примера приводится возможность агента совершать телефонные звонки, чтобы назначить встречу или ожидание в очереди в службе поддержки. Другие компании, такие как Truecaller и Cloacked, преследуют аналогичные цели.
Связанная статья
Mistral представляет модель генерации речи с открытым исходным кодом
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представила в четверг новую модель преобразования текста в речь с открытым исходным кодом, предназначенную для голосовых И
Лучшие приложения для диктовки с ИИ: обзоры экспертов и рейтинги
Приложения для диктовки на базе ИИ за относительно короткий срок добились впечатляющих успехов. Долгое время они работали медленно и часто допускали ошибки, требуя от пользователей говорить с определе
Wispr Flow делает ставку на будущее голосового ИИ в Индии, несмотря на трудности
Цифровое пространство Индии тесно связано с голосовыми технологиями — от голосовых заметок до многоязычного обмена сообщениями. Превращение этих широко распространенных привычек в масштабируемый бизне
Рекомендации по связанным специальным темам
Комментарии (1)
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅
Speechify известен прежде всего как инструмент для прослушивания статей, PDF-файлов и документов. Теперь компания дополнила свое расширение для Chrome функцией распознавания голоса, добавив функции голосового набора и разговорного голосового помощника для ответов на ваши вопросы.
В прошлом году наблюдался всплеск популярности инструментов для распознавания голоса, вызванный значительным улучшением качества моделей распознавания речи. Компания Speechify воспользовалась этой тенденцией и запустила свой собственный инструмент для диктовки, первоначально поддерживающий английский язык. Как и другие решения, голосовой набор Speechify автоматически исправляет ошибки и удаляет слова-заполнители.
Во время моего краткого тестирования, длившегося чуть больше суток, я обнаружил, что инструмент Speechify имеет значительные возможности для улучшения. Например, он хорошо работает в Gmail и Google Docs, но на таких сайтах, как WordPress, я столкнулся с проблемами при активации функции голосовой диктовки и достижении надежной работы. Компания заявила, что постепенно оптимизирует инструмент для популярных сайтов.

Что касается точности, то уровень ошибок в словах у инструмента оказался выше, чем у конкурирующих продуктов, таких как Wispr Flow, Willow и Monologue. Speechify отметила, что ее модель улучшается при более частом использовании, что приводит к постепенному снижению количества ошибок.
Стартап также представляет разговорный голосовой помощник, доступный из боковой панели браузера. Вы можете задавать ему вопросы о просматриваемой веб-странице, например, "какие три основных момента?" или "объясните это более простыми словами".
Хотя ChatGPT и Gemini предлагают режимы разговорного голоса, Speechify утверждает, что в этих платформах эти функции вторичны. В отличие от них, стартап позиционирует голосовое взаимодействие как основное и центральное в своем инструменте.
"Мы считаем, что текстовый чат всегда будет использоваться по умолчанию, когда пользователи открывают приложения ChatGPT или Gemini. Это то, чего ожидает их аудитория. Голосовое взаимодействие, скорее всего, останется второстепенной функцией, которая часто становится для этих провайдеров чем-то второстепенным. Наш многолетний опыт работы с Speechify показал, что значительная часть рынка, включая наших собственных пользователей, предпочитает голос в качестве основного режима по умолчанию при взаимодействии с искусственным интеллектом", - пояснил Рохан Павулури, директор по бизнесу компании, в электронном письме TechCrunch.
Мероприятие TechCrunchПрисоединяйтесь к списку ожидания Disrupt 2026
Запишите себя в список ожидания Disrupt 2026, чтобы получить приоритетный доступ к билетам Early Bird. На прошлых этапах Disrupt выступали лидеры Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla - часть из более чем 250 экспертов отрасли, которые ведут 200+ сессий, призванных ускорить ваш рост и обострить конкурентные преимущества. У вас также будет возможность пообщаться с сотнями стартапов, внедряющих инновации во всех отраслях.
Присоединяйтесь к списку ожидания Disrupt 2026
Запишите себя в список ожидания Disrupt 2026, чтобы получить приоритетный доступ к билетам Early Bird. На прошлых этапах Disrupt выступали лидеры Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil и Vinod Khosla - часть из более чем 250 отраслевых экспертов, которые ведут 200+ сессий, призванных ускорить ваш рост и обострить конкурентные преимущества. У вас также будет возможность пообщаться с сотнями стартапов, внедряющих инновации во всех отраслях.
Сан-Франциско | 13-15 октября 2026 года ЗАПИСЬ НА СЕЙЧАСОдним из текущих ограничений является то, что помощник Speechify не совместим с браузерами, в которых есть встроенные боковые помощники, такие как Atlas от OpenAI, Comet от Perplexity и Dia. Стартап не слишком беспокоится об этом, поскольку его расширение предназначено в первую очередь для Chrome и его обширной пользовательской базы.
Speechify планирует поэтапно интегрировать функции голосового набора и голосового помощника во все свои настольные и мобильные приложения.
Компания также намерена разработать агентов искусственного интеллекта, способных выполнять задачи автономно. Хотя полная дорожная карта не раскрывается, в качестве примера приводится возможность агента совершать телефонные звонки, чтобы назначить встречу или ожидание в очереди в службе поддержки. Другие компании, такие как Truecaller и Cloacked, преследуют аналогичные цели.
Mistral представляет модель генерации речи с открытым исходным кодом
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представила в четверг новую модель преобразования текста в речь с открытым исходным кодом, предназначенную для голосовых И
Лучшие приложения для диктовки с ИИ: обзоры экспертов и рейтинги
Приложения для диктовки на базе ИИ за относительно короткий срок добились впечатляющих успехов. Долгое время они работали медленно и часто допускали ошибки, требуя от пользователей говорить с определе
Wispr Flow делает ставку на будущее голосового ИИ в Индии, несмотря на трудности
Цифровое пространство Индии тесно связано с голосовыми технологиями — от голосовых заметок до многоязычного обмена сообщениями. Превращение этих широко распространенных привычек в масштабируемый бизне
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅











