OpenAI 的音訊野心挑戰矽谷的螢幕霸權

OpenAI 正大力進軍語音人工智慧領域,其目標遠不止於改善 ChatGPT 的語音表現。根據《The Information》最近的一份報導,過去兩個月來,該公司已整合多個工程、產品及研究團隊,以全面改版其語音模型。這項舉措旨在為一款預計約一年後推出的「語音優先」個人裝置做準備。
這項戰略轉向反映了科技產業的整體趨勢——邁向一個螢幕退居幕後、音訊成為主要介面的未來。智慧音箱已讓語音助理進駐超過三分之一的美國家庭。 Meta 近期為其 Ray-Ban 智慧眼鏡推出了一項新功能,利用五組麥克風陣列協助使用者在嘈雜環境中聽清對話,有效將佩戴者的臉部轉變為定向聆聽裝置。與此同時,Google 於六月開始測試「音訊概覽」(Audio Overviews),將搜尋結果轉化為語音摘要;特斯拉則正將 xAI 的 Grok 聊天機器人整合至其車輛中,打造一款能透過自然語音管理從導航到空調控制等各項功能的對話助理。
不僅是產業巨頭在押注這塊市場。眾多新創公司也懷抱著相同的核心信念湧現,儘管成果參差不齊。Humane AI Pin 的開發者耗資數億美元,但這款無螢幕穿戴裝置最終卻成了廣為流傳的警世故事。 名為「Friend AI」的項鍊,號稱能記錄生活並提供陪伴,卻引發了嚴重的隱私疑慮與存在性不安。如今,至少有兩家公司——包括 Sandbar 以及由 Pebble 創辦人 Eric Migicovsky 領軍的一家——正在開發預計於 2026 年推出的 AI 戒指,讓使用者能真正地「對手說話」。
儘管設計各異,其核心原理卻始終如一:聲音將是未來的介面。無論是居家、車內,甚至人體本身,每個環境都正被轉化為控制介面。
據報導,OpenAI 預計於 2026 年初推出的新音訊模型,將具備更自然的語音表現,能像真實對話夥伴般應對中斷,甚至能在使用者說話時同步回應——這是現行模型所缺乏的能力。據稱該公司還計劃推出一系列裝置,可能包含眼鏡或無螢幕揚聲器,其設計理念是讓這些裝置更像伴侶,而非單純的工具。
這項發展並非完全出人意料。正如《The Information》所指出的,前蘋果設計總監喬尼·艾夫(Jony Ive)——他在 OpenAI 於五月以 65 億美元收購其公司 io 後,加入了 OpenAI 的硬體計畫——一直將降低對裝置的依賴列為優先事項。他將「音訊優先」的設計視為彌補以往消費性電子產品缺點的契機。
相關文章
Google 將加大對 Anthropic 的投資,總額可能高達 400 億美元
在節奏飛快的 AI 軍備競賽中,各大科技巨頭正採取越來越大膽的舉措。根據最新報導,Google 計劃向 AI 新創公司 Anthropic 投資高達 100 億美元——而這僅僅是個開始。根據其長期戰略,總投資額最終可能達到 400 億美元。這筆巨額交易將使Anthropic的估值推升至3,500億美元的新高。就在數月前,該公司才剛完成一輪300億美元的融資。亞馬遜此前已投資50億美元,並保留了額外
免費開源 AI 國際象棋引擎 Maia 3 正式發布,旨在提升人類的棋藝表現
Maia Chess 團隊已發布一款新的開源國際象棋引擎「Maia 3」,該引擎是透過 2.5 億盤真實人類對弈數據進行訓練的。其 Elo 評分約為 1800,比前一版本高出近 300 分。 最棒的是,它完全免費且開源,支援本地部署,這代表著讓 AI 國際象棋引擎普及大眾邁出了重要一步。獨特方法:模擬人類決策過程與 AlphaZero 和 Stockfish 等頂尖引擎不同,後者旨在追求 Elo
人工智慧創投熱潮推動單季營收突破一兆元,掀起新一波創新浪潮
全球人工智慧領域的風險投資正呈現激增態勢。今年第一季,近600輪與人工智慧相關的融資案完成,總金額超過1,100億元人民幣,較去年同期增長185.4%。主要資金集中於三大關鍵領域5月,國內領先的大型模型公司如Moonshot和Step Star取得進一步進展,募資超過300億元。與此同時,具身智能領域也吸引了大量投資,新興企業VITA Dynamics和Luming Robotics在短短一週內各
相關專題推薦
評論 (0)
0/500

OpenAI 正大力進軍語音人工智慧領域,其目標遠不止於改善 ChatGPT 的語音表現。根據《The Information》最近的一份報導,過去兩個月來,該公司已整合多個工程、產品及研究團隊,以全面改版其語音模型。這項舉措旨在為一款預計約一年後推出的「語音優先」個人裝置做準備。
這項戰略轉向反映了科技產業的整體趨勢——邁向一個螢幕退居幕後、音訊成為主要介面的未來。智慧音箱已讓語音助理進駐超過三分之一的美國家庭。 Meta 近期為其 Ray-Ban 智慧眼鏡推出了一項新功能,利用五組麥克風陣列協助使用者在嘈雜環境中聽清對話,有效將佩戴者的臉部轉變為定向聆聽裝置。與此同時,Google 於六月開始測試「音訊概覽」(Audio Overviews),將搜尋結果轉化為語音摘要;特斯拉則正將 xAI 的 Grok 聊天機器人整合至其車輛中,打造一款能透過自然語音管理從導航到空調控制等各項功能的對話助理。
不僅是產業巨頭在押注這塊市場。眾多新創公司也懷抱著相同的核心信念湧現,儘管成果參差不齊。Humane AI Pin 的開發者耗資數億美元,但這款無螢幕穿戴裝置最終卻成了廣為流傳的警世故事。 名為「Friend AI」的項鍊,號稱能記錄生活並提供陪伴,卻引發了嚴重的隱私疑慮與存在性不安。如今,至少有兩家公司——包括 Sandbar 以及由 Pebble 創辦人 Eric Migicovsky 領軍的一家——正在開發預計於 2026 年推出的 AI 戒指,讓使用者能真正地「對手說話」。
儘管設計各異,其核心原理卻始終如一:聲音將是未來的介面。無論是居家、車內,甚至人體本身,每個環境都正被轉化為控制介面。
據報導,OpenAI 預計於 2026 年初推出的新音訊模型,將具備更自然的語音表現,能像真實對話夥伴般應對中斷,甚至能在使用者說話時同步回應——這是現行模型所缺乏的能力。據稱該公司還計劃推出一系列裝置,可能包含眼鏡或無螢幕揚聲器,其設計理念是讓這些裝置更像伴侶,而非單純的工具。
這項發展並非完全出人意料。正如《The Information》所指出的,前蘋果設計總監喬尼·艾夫(Jony Ive)——他在 OpenAI 於五月以 65 億美元收購其公司 io 後,加入了 OpenAI 的硬體計畫——一直將降低對裝置的依賴列為優先事項。他將「音訊優先」的設計視為彌補以往消費性電子產品缺點的契機。
Google 將加大對 Anthropic 的投資,總額可能高達 400 億美元
在節奏飛快的 AI 軍備競賽中,各大科技巨頭正採取越來越大膽的舉措。根據最新報導,Google 計劃向 AI 新創公司 Anthropic 投資高達 100 億美元——而這僅僅是個開始。根據其長期戰略,總投資額最終可能達到 400 億美元。這筆巨額交易將使Anthropic的估值推升至3,500億美元的新高。就在數月前,該公司才剛完成一輪300億美元的融資。亞馬遜此前已投資50億美元,並保留了額外
人工智慧創投熱潮推動單季營收突破一兆元,掀起新一波創新浪潮
全球人工智慧領域的風險投資正呈現激增態勢。今年第一季,近600輪與人工智慧相關的融資案完成,總金額超過1,100億元人民幣,較去年同期增長185.4%。主要資金集中於三大關鍵領域5月,國內領先的大型模型公司如Moonshot和Step Star取得進一步進展,募資超過300億元。與此同時,具身智能領域也吸引了大量投資,新興企業VITA Dynamics和Luming Robotics在短短一週內各





首頁






