選項
首頁
新聞
Qwen 3.5-Omni 以 215 項 SOTA 紀錄刷新紀錄,開啟全感官 AI 時代

Qwen 3.5-Omni 以 215 項 SOTA 紀錄刷新紀錄,開啟全感官 AI 時代

2026-04-06
123

同益實驗室(Tongyi Lab)昨晚正式推出全新多模態大型模型 Qwen3.5-Omni。相較於前代模型,該模型在理解能力、互動能力及任務執行能力方面均有顯著躍進,將人工智慧從「受限於螢幕的助理」轉變為「能理解實體世界的智能代理」。

核心突破:全模態處理與 215 項 SOTA 基準測試

Qwen3.5-Omni 採用原生「全模態」架構,能夠無縫處理文字、圖像、音訊及影片。 在涵蓋視聽分析、推理、對話及翻譯的各項評估中,該模型共取得 215 項最先進(SOTA)成績。值得注意的是,其整體語音理解與辨識能力已超越 Gemini-3.1Pro 等模型,而視覺與文本表現仍維持頂尖水準,與同規模的對應模型 Qwen3.5 並駕齊驅。

QQ20260331-090527.jpg

技術架構:混合注意力 MoE

該模型以經典的 Thinker-Talker 框架為基礎,並進行了根本性的架構革新:

Thinker(理解中心):升級為混合注意力專家混合(MoE)架構,支援長達 256K 令牌的超長上下文。這使其能處理長達 10 小時的音訊1 小時的影片,並透過 TMRoPE 技術精準捕捉長序列中的細微細節。

Talker(表達中心):整合了全新的 ARIA 技術與 RVQ 編碼,取代了運算負荷沉重的 DiT 流程。這不僅解決了音訊生成中常見的詞彙遺漏與數字發音錯誤等問題,更賦予模型強大的即時語音控制能力。

實際應用:從氛圍編碼到聲音克隆

Qwen3.5-Omni 的能力開啟了多項顛覆性的應用場景:

自然湧現的程式碼生成:該模型無需特定訓練即可展現出色的程式碼理解與生成能力,能直接根據影片邏輯產出 Python 程式碼或前端原型。

類人即時互動:支援語義中斷功能。它能區分背景噪音(如咳嗽聲)與有意中斷,使用者可透過簡單指令調整語氣(例如「開心的」)及音量。

細粒度影片分析:可生成結構化且帶時間戳的字幕,精準識別影片中的動作、背景音樂變化及鏡頭切換。

個人化語音克隆:使用者只需上傳一段短音頻樣本,即可創建高度自然的個人化「數位語音」,並支援 113 種語言。

Qwen3.5-Omni 現已於阿里雲白蓮平台推出 Plus、Flash 及 Light 版本。此外,亦可透過 ModelScope 社群存取即時對話(Realtime)API 及示範程式。

相關文章
Anthropic的收入大幅增長,其市值接近萬億美元大關 Anthropic的收入大幅增長,其市值接近萬億美元大關 有報告顯示,Anthropic在短短几個月內就實現了顯著的收入增長。該公司的年化收入現已超過300億美元,這一數字是去年底時的三倍多。這種增長可能會讓Anthropic在競爭中略佔優勢,不過直接進行比較並不容易。其主要推動力在於Claude Code和Cowork產品,以及其推理模型的代幣銷售量增加。更值得注意的是,Anthropic的利潤率也有了顯著提升。該公司的毛利率從2024年的-94%上升到了2025年的+40%,而年化收入也從不到10億美元增長到了90億美元。正是這種發展勢頭,使得A
蘋果移除了Cal AI應用程式,原因是該應用存在未經授權的店內購買行為以及欺詐性計費問題。 蘋果移除了Cal AI應用程式,原因是該應用存在未經授權的店內購買行為以及欺詐性計費問題。 蘋果最近移除了MyFitnessPal中頗受歡迎的人工智慧食物追蹤應用Cal AI,這一舉動凸顯了其對App Store關於外部支付和訂閱政策的嚴格執行。該應用每年能帶來5000萬美元的重複收入,曾因違反多項開發者指南而被暫時下架,但在解決了相關問題後已重新上線。有報道稱,儘管Epic Games訴蘋果的案件允許美國開發者連結到外部支付系統,但蘋果指出Cal AI存在嚴重的合規問題。其主要違規行為在於:該應用試圖透過嵌入Stripe等第三方支付流程來繞過蘋果的應用內購買機制以解鎖數字內容,卻未
Github Copilot的基於令牌的計費方式引發了開發者的強烈不滿 Github Copilot的基於令牌的計費方式引發了開發者的強烈不滿 微軟GitHub Copilot的黃金時代可能即將結束,尤其是對個人使用者而言。該公司正從統一的訂閱費模式轉向基於代幣的計費方式,這可能會大幅增加使用成本。雖然大型企業或許還能承受這種變化,但小型企業和自由職業者可能會發現新的收費機制讓他們的月預算難以承受。這些變更將於6月1日正式生效,屆時使用者將按照工作中消耗的代幣數量來支付費用,而不再是按每次請求收取固定費用。一些開發者受到這一財務變動的影響,在Reddit和X平臺上表達了他們對這種看似過高的成本增加的擔憂。一位Redditor最近寫道:“
相關專題推薦
迅速的 B2B 潛在客戶開發的最佳 AI 提示詞:自動化銷售外展與 CRM 話術編寫
B2B 潛在客戶開發的最佳 AI 提示詞:自動化銷售外展與 CRM 話術編寫

探索 2026 年最新、最優質的 B2B 潛在客戶開發 AI 提示語。我們精心挑選的頂級精選,能協助您自動化銷售外聯與 CRM 腳本編寫,從而提升轉換率。立即前往 XIX.AI 探索這些強大且具顛覆性的提示語,即刻掌握銷售自動化的競爭優勢。

10 個工具
xix.ai
圖像編輯 免費AI時尚模型生成器:打造逼真的服裝設計稿與模特照片
免費AI時尚模型生成器:打造逼真的服裝設計稿與模特照片

在XIX.AI上,發現2026年最優秀的免費AI時尚模型生成工具。我們精心挑選的這份列表中包含了評分最高、能夠顛覆傳統的工具,這些工具能夠幫助你建立逼真的服裝設計稿和模特穿著照片。透過每週更新的排名和實際測試結果,你可以對比免費選項和付費選項。今天就開啟你的設計優勢吧!

10 個工具
xix.ai
寫作 最佳小說 AI 情節連貫性編輯工具:自動偵測情節漏洞與時間線矛盾
最佳小說 AI 情節連貫性編輯工具:自動偵測情節漏洞與時間線矛盾

探索 2026 年最適合小說作家的 AI 情節連貫性編輯工具。我們精心篩選的頂級清單收錄了多款強大工具,能自動偵測情節漏洞與時間線矛盾。透過實際測試與每週更新的排行榜,比較免費與付費選項。找到最適合您的寫作助手,確保敘事無懈可擊。立即前往 XIX.AI 探索精選推薦。

10 個工具
xix.ai
動畫創作 頂級AI故事板生成工具:能夠自動將電影劇本轉化為動態動畫效果
頂級AI故事板生成工具:能夠自動將電影劇本轉化為動態動畫效果

在XIX.AI上,發現2026年最優秀的人工智慧故事板生成工具。我們精心挑選的這些高評分工具能夠自動將劇本轉化為電影風格的動畫效果,從而節省您的時間並提升前期製作效率。透過實際測試和每週更新的排名資訊,您可以瞭解免費選項與付費選項的差異。今天就找到最適合您的創意助手吧!

10 個工具
xix.ai
搜索引擎優化 最佳AI重定向與失效連結查詢工具:自動修復爬取錯誤,節省爬取預算
最佳AI重定向與失效連結查詢工具:自動修復爬取錯誤,節省爬取預算

在XIX.AI上,發現2026年最優秀的人工智慧重定向工具和失效連結查詢工具。我們精心挑選的這些高評分工具能夠自動修復爬取錯誤,從而幫助您節省爬取預算。透過實際測試和每週更新的排名資訊,您可以比較免費選項和付費選項,立即找到最適合您的SEO解決方案!

10 個工具
xix.ai
視頻創作 播客創作者首選的頂尖 AI 影片製作工具:將音訊波形轉化為引人入勝的談話頭像影片
播客創作者首選的頂尖 AI 影片製作工具:將音訊波形轉化為引人入勝的談話頭像影片

立即前往 XIX.AI,探索 2026 年最適合播客的頂尖 AI 影片製作工具。我們精心挑選並評選出的這份榜單,收錄了多款強大工具,能輕鬆將您的音訊轉化為引人入勝的談話頭像影片。透過實際測試與每週更新的排行榜,比較免費與付費選項的差異。立即解鎖您的視覺敘事優勢。

10 個工具
xix.ai
評論 (0)
0/500
OR