Speechify 增強 Chrome 擴充套件的語音輸入和虛擬助理功能
Speechify 主要以聆聽文章、PDF 和文件的工具而聞名。該公司現在增強了 Chrome 擴充套件的語音偵測功能,推出了語音打字和會話語音助理來回答您問題的功能。
在語音識別模型品質大幅提升的帶動下,語音偵測工具在過去一年激增。Speechify 正把握這股趨勢,推出自己的聽寫工具,初期支援英文。與其他解決方案類似,Speechify 的語音輸入會自動糾正錯誤,並移除填充字詞。
在我短短一天多的測試中,我發現 Speechify 的工具有相當大的改善空間。例如,它在 Gmail 和 Google Docs 中運作良好,但在 WordPress 等網站上,我在啟動語音聽寫功能和實現可靠性能方面遇到了問題。該公司表示正在針對熱門網站逐步優化該工具。

圖片來源:Speechify 在準確度方面,該工具的單字錯誤率高於 Wispr Flow、Willow 和 Monologue 等競爭產品。Speechify 指出,其模型會隨著使用次數增加而改善,進而逐漸降低錯誤率。
這家新創公司也推出了會話語音助理,可從瀏覽器的側邊欄存取。您可以就正在瀏覽的網頁向它提問,例如「三個重點是什麼?
雖然 ChatGPT 和 Gemini 提供了語音會話模式,但 Speechify 認為這些功能在這些平台中是次要的。相較之下,這家新創公司將語音互動定位為自己工具的核心、前端與中心體驗。
"我們相信,當使用者開啟 ChatGPT 或 Gemini 應用程式時,以文字為基礎的聊天將永遠是預設的體驗。這是他們的受眾所期望的。語音互動可能仍會是次要功能,對這些供應商而言往往是事後的想法。該公司的首席業務官 Rohan Pavuluri 在寄給 TechCrunch 的電子郵件中解釋:「我們在 Speechify 多年的經驗顯示,包括我們自己的使用者在內,市場上有相當大的族群偏好將語音作為與 AI 互動時的主要預設模式。
Techcrunch 活動加入 Disrupt 2026 輪候名單
確定您在 Disrupt 2026 輪候名單上的位置,即可優先取得早鳥票。過往的 Disrupt 講座有來自 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 的領導人,他們是 250 多位業界專家中的一員,將帶領 200 多場專為加速您的成長和增強您的競爭優勢而設計的會議。您也將有機會與各行各業數百個推動創新的新創公司建立聯繫。
加入 Disrupt 2026 輪候名單
確保您在 Disrupt 2026 輪候名單上的位置,可優先取得早鳥門票。過往的 Disrupt 講座都有來自 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 的領導人參加,他們是超過 250 位產業專家中的一員,將帶領 200 多場專為加速您的成長和增強您的競爭優勢而設計的會議。您也將有機會與各行各業數百個推動創新的創業公司建立聯繫。
舊金山 | 2026 年 10 月 13-15 日 立即預約目前的限制之一是,Speechify 的助手與內建側邊欄助手的瀏覽器不相容,例如 OpenAI 的 Atlas、Perplexity 的 Comet 和 Dia。這家新創公司並不過於擔心,因為它的擴充功能主要是為 Chrome 瀏覽器及其龐大的使用者群所設計。
Speechify 計劃分階段在其所有桌面和行動應用程式中整合語音打字和語音助理功能。
該公司的目標還包括開發能夠自主執行任務的 AI 代理。雖然完整的路線圖並未公開,但舉出的一個例子是讓代理人撥打電話安排約會或與客服人員保持聯絡。Truecaller 和 Cloacked 等其他公司也在追求類似的目標。
相關文章
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
頂尖 AI 語音輸入應用程式:專家評測與排行榜
AI 語音輸入應用程式在相對短的時間內取得了顯著進展。長期以來,這些應用程式反應遲緩且容易出錯,要求使用者必須以特定口音清晰地發音。隨著大型語言模型(LLMs)與語音轉文字技術的進步,這種情況已然改變,如今的系統不僅能更精準地理解語音,還能運用語境來正確格式化文字。開發者已整合多項功能,可自動刪除口頭語、修正口誤並管理標點符號,產出的文字幾乎無需編輯。鑑於現今選擇眾多,我們整理了一份您現在即可使用
儘管面臨挑戰,Wispr Flow 仍看好語音 AI 在印度的未來
印度的數位生態系與語音技術緊密交織,從語音備忘錄到多語言訊息傳遞皆然。鑑於該國語言的多樣性、切換語言的慣例,以及各異的變現潛力,要將這些普遍的習慣轉化為可擴展的 AI 業務,面臨著巨大的挑戰。Wispr Flow 正積極定位自身,以把握這個複雜卻充滿前景的商機。這家總部位於灣區、專注開發 AI 驅動語音輸入軟體的新創公司表示,印度現已成為其成長最快的市場。即使該地區的語音 AI 產品仍處於早期階段
相關專題推薦
評論 (1)
0/500
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅
Speechify 主要以聆聽文章、PDF 和文件的工具而聞名。該公司現在增強了 Chrome 擴充套件的語音偵測功能,推出了語音打字和會話語音助理來回答您問題的功能。
在語音識別模型品質大幅提升的帶動下,語音偵測工具在過去一年激增。Speechify 正把握這股趨勢,推出自己的聽寫工具,初期支援英文。與其他解決方案類似,Speechify 的語音輸入會自動糾正錯誤,並移除填充字詞。
在我短短一天多的測試中,我發現 Speechify 的工具有相當大的改善空間。例如,它在 Gmail 和 Google Docs 中運作良好,但在 WordPress 等網站上,我在啟動語音聽寫功能和實現可靠性能方面遇到了問題。該公司表示正在針對熱門網站逐步優化該工具。

在準確度方面,該工具的單字錯誤率高於 Wispr Flow、Willow 和 Monologue 等競爭產品。Speechify 指出,其模型會隨著使用次數增加而改善,進而逐漸降低錯誤率。
這家新創公司也推出了會話語音助理,可從瀏覽器的側邊欄存取。您可以就正在瀏覽的網頁向它提問,例如「三個重點是什麼?
雖然 ChatGPT 和 Gemini 提供了語音會話模式,但 Speechify 認為這些功能在這些平台中是次要的。相較之下,這家新創公司將語音互動定位為自己工具的核心、前端與中心體驗。
"我們相信,當使用者開啟 ChatGPT 或 Gemini 應用程式時,以文字為基礎的聊天將永遠是預設的體驗。這是他們的受眾所期望的。語音互動可能仍會是次要功能,對這些供應商而言往往是事後的想法。該公司的首席業務官 Rohan Pavuluri 在寄給 TechCrunch 的電子郵件中解釋:「我們在 Speechify 多年的經驗顯示,包括我們自己的使用者在內,市場上有相當大的族群偏好將語音作為與 AI 互動時的主要預設模式。
Techcrunch 活動加入 Disrupt 2026 輪候名單
確定您在 Disrupt 2026 輪候名單上的位置,即可優先取得早鳥票。過往的 Disrupt 講座有來自 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 的領導人,他們是 250 多位業界專家中的一員,將帶領 200 多場專為加速您的成長和增強您的競爭優勢而設計的會議。您也將有機會與各行各業數百個推動創新的新創公司建立聯繫。
加入 Disrupt 2026 輪候名單
確保您在 Disrupt 2026 輪候名單上的位置,可優先取得早鳥門票。過往的 Disrupt 講座都有來自 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 的領導人參加,他們是超過 250 位產業專家中的一員,將帶領 200 多場專為加速您的成長和增強您的競爭優勢而設計的會議。您也將有機會與各行各業數百個推動創新的創業公司建立聯繫。
舊金山 | 2026 年 10 月 13-15 日 立即預約目前的限制之一是,Speechify 的助手與內建側邊欄助手的瀏覽器不相容,例如 OpenAI 的 Atlas、Perplexity 的 Comet 和 Dia。這家新創公司並不過於擔心,因為它的擴充功能主要是為 Chrome 瀏覽器及其龐大的使用者群所設計。
Speechify 計劃分階段在其所有桌面和行動應用程式中整合語音打字和語音助理功能。
該公司的目標還包括開發能夠自主執行任務的 AI 代理。雖然完整的路線圖並未公開,但舉出的一個例子是讓代理人撥打電話安排約會或與客服人員保持聯絡。Truecaller 和 Cloacked 等其他公司也在追求類似的目標。
Mistral 推出開源語音生成模型
法國人工智慧公司 Mistral 於週四推出一款全新的開源文字轉語音模型,專為語音 AI 助理及客戶支援等企業應用而設計。該模型使企業能夠開發用於銷售和客戶互動的語音代理,使 Mistral 成為 ElevenLabs、Deepgram 和 OpenAI 的直接競爭對手。這款名為 Voxtral TTS 的模型支援九種語言,包括英語、法語、德語、西班牙語、荷蘭語、葡萄牙語、義大利語、印地語和阿拉伯
頂尖 AI 語音輸入應用程式:專家評測與排行榜
AI 語音輸入應用程式在相對短的時間內取得了顯著進展。長期以來,這些應用程式反應遲緩且容易出錯,要求使用者必須以特定口音清晰地發音。隨著大型語言模型(LLMs)與語音轉文字技術的進步,這種情況已然改變,如今的系統不僅能更精準地理解語音,還能運用語境來正確格式化文字。開發者已整合多項功能,可自動刪除口頭語、修正口誤並管理標點符號,產出的文字幾乎無需編輯。鑑於現今選擇眾多,我們整理了一份您現在即可使用
儘管面臨挑戰,Wispr Flow 仍看好語音 AI 在印度的未來
印度的數位生態系與語音技術緊密交織,從語音備忘錄到多語言訊息傳遞皆然。鑑於該國語言的多樣性、切換語言的慣例,以及各異的變現潛力,要將這些普遍的習慣轉化為可擴展的 AI 業務,面臨著巨大的挑戰。Wispr Flow 正積極定位自身,以把握這個複雜卻充滿前景的商機。這家總部位於灣區、專注開發 AI 驅動語音輸入軟體的新創公司表示,印度現已成為其成長最快的市場。即使該地區的語音 AI 產品仍處於早期階段
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅





首頁






