OpenAI在其API中推出了語音智慧功能

OpenAI在週四宣佈,其API現已新增多項語音智慧功能,這些功能旨在幫助開發者構建能夠進行對話、轉錄和翻譯的應用程式。
該公司新推出的GPT-Realtime-2是一款語音模型,它能夠生成逼真的聲音模擬效果,從而與使用者進行交流。不過,與前代產品GPT-Realtime-1.5不同,這一版本融入了GPT-5級別的推理能力,OpenAI表示,這種能力使該模型能夠處理更復雜的使用者請求。
此外,OpenAI還推出了GPT-Realtime-Translate功能,顧名思義,它能夠提供實時翻譯服務,在使用者對話過程中實時進行語言轉換。這一功能支援超過70種輸入語言和13種輸出語言。
最後,OpenAI還引入了GPT-Realtime-Whisper這一轉錄工具,它可以實時將語音轉換為文字,從而在對話進行的過程中捕捉文字內容。
該公司表示:“我們推出的這些模型共同將實時的音訊技術從簡單的問答模式提升到了真正能夠完成實際任務的語音互動層面——它們可以傾聽、推理、翻譯、轉錄,並在對話過程中採取相應行動。”
那麼,誰會從這些更新中受益呢?顯然,那些希望提升客戶服務能力的企業會是主要受益者。不過,OpenAI也指出,這些新功能還能應用於教育、媒體、活動以及創作者平臺等多個領域。
雖然從企業的角度來看,這些工具非常有用,但它們也存在被濫用的風險。OpenAI表示,他們已經設定了相應的防護機制,以防止這些新功能被用於傳送垃圾資訊、進行欺詐或其他形式的網路濫用行為。系統中嵌入了特定的檢測機制,一旦發現某些對話違反了他們的內容規範,就會立即停止相關操作。
所有這些新的語音模型都包含在OpenAI的Realtime API中。Translate和Whisper功能是按分鐘計費的,而GPT-Realtime-2則根據所消耗的令牌數量來收費。
相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
相關專題推薦
評論 (0)
0/500

OpenAI在週四宣佈,其API現已新增多項語音智慧功能,這些功能旨在幫助開發者構建能夠進行對話、轉錄和翻譯的應用程式。
該公司新推出的GPT-Realtime-2是一款語音模型,它能夠生成逼真的聲音模擬效果,從而與使用者進行交流。不過,與前代產品GPT-Realtime-1.5不同,這一版本融入了GPT-5級別的推理能力,OpenAI表示,這種能力使該模型能夠處理更復雜的使用者請求。
此外,OpenAI還推出了GPT-Realtime-Translate功能,顧名思義,它能夠提供實時翻譯服務,在使用者對話過程中實時進行語言轉換。這一功能支援超過70種輸入語言和13種輸出語言。
最後,OpenAI還引入了GPT-Realtime-Whisper這一轉錄工具,它可以實時將語音轉換為文字,從而在對話進行的過程中捕捉文字內容。
該公司表示:“我們推出的這些模型共同將實時的音訊技術從簡單的問答模式提升到了真正能夠完成實際任務的語音互動層面——它們可以傾聽、推理、翻譯、轉錄,並在對話過程中採取相應行動。”
那麼,誰會從這些更新中受益呢?顯然,那些希望提升客戶服務能力的企業會是主要受益者。不過,OpenAI也指出,這些新功能還能應用於教育、媒體、活動以及創作者平臺等多個領域。
雖然從企業的角度來看,這些工具非常有用,但它們也存在被濫用的風險。OpenAI表示,他們已經設定了相應的防護機制,以防止這些新功能被用於傳送垃圾資訊、進行欺詐或其他形式的網路濫用行為。系統中嵌入了特定的檢測機制,一旦發現某些對話違反了他們的內容規範,就會立即停止相關操作。
所有這些新的語音模型都包含在OpenAI的Realtime API中。Translate和Whisper功能是按分鐘計費的,而GPT-Realtime-2則根據所消耗的令牌數量來收費。
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研





首頁






