多宇宙運算推動壓縮式 AI 模型邁向主流
隨著私營企業的違約率飆升至 9.2%——創下近年來新高——風險投資公司 Lux Capital 最近建議依賴人工智慧的企業,應就其運算能力取得書面承諾。隨著金融不穩定性在人工智慧供應鏈中蔓延,Lux 警告說,僅靠口頭協議已不再足夠。
但其實還有另一種截然不同的選擇:徹底擺脫對外部運算基礎設施的依賴。那些能直接在用戶裝置上運行、無需資料中心、無需雲端服務商且無交易對手風險的小型 AI 模型,其效能已足夠強大,值得認真考量。而 Multiverse Computing 正挺身而出。
相較於某些競爭對手,這家西班牙新創公司一直保持相對低調,但隨著對 AI 效率的需求激增,這種狀況正在改變。在對 OpenAI、Meta、DeepSeek 和 Mistral AI 等主要 AI 實驗室的模型進行壓縮後,該公司推出了兩款產品:一款展示其壓縮模型能力的應用程式,以及一個 API 入口網站——這是開發者存取並基於這些模型進行開發的通道——使這些模型得以更廣泛地應用。
名為 CompactifAI 的應用程式,其名稱源自 Multiverse 受量子技術啟發的壓縮技術,是一款類似 ChatGPT 或 Mistral 的 Le Chat 的 AI 聊天工具。您提出問題,模型便會回應。不同之處在於,Multiverse 已嵌入名為 Gilda 的模型,據該公司表示,此模型極為精簡,甚至可在本地離線運行。

對終端使用者而言,這讓他們得以體驗邊緣 AI:資料從不離開裝置,且無需網路連線。然而,這其中有個限制:使用者的行動裝置必須具備足夠的記憶體與儲存空間。若裝置不符條件(許多舊款 iPhone 便無法滿足),應用程式將透過 API 切換至雲端模型。 本地與雲端處理之間的切換,由 Multiverse 稱為「Ash Nazg」的系統自動處理——托爾金迷會認出這個名字,它是對《魔戒》中「至尊魔戒」銘文的致敬。但當應用程式切換至雲端處理時,其主要的隱私優勢便不復存在。
這些限制顯示,CompactifAI 尚未準備好供消費者廣泛採用,儘管這或許從來就不是其初衷。根據 Sensor Tower 的數據,該應用程式在過去一個月的下載量不到 5,000 次。
真正的重點在於企業市場。今日,Multiverse 推出了一個自助式 API 入口網站,讓開發者和企業能直接存取其壓縮模型——無需透過 AWS Marketplace。
「CompactifAI API 入口網站 [現已] 讓開發者能直接存取壓縮模型,並具備在生產環境中運行所需的透明度與控制權,」執行長恩里克·利薩索(Enrique Lizaso)在聲明中表示。
即時使用監控是該 API 的關鍵功能,這絕非偶然。除了邊緣部署的潛在優勢外,更低的運算成本正是企業探索小型模型以替代大型語言模型(LLMs)的主要原因。
此外,小型模型的限制也遠比以往少得多。本週稍早,Mistral 透過推出 Mistral Small 4 更新了其小型模型陣容,據稱該模型針對一般聊天、編碼、代理任務及推理進行了優化。這家法國公司還推出了 Forge,這是一個允許企業構建自訂模型的系統,包括小型模型,讓企業能根據其使用案例的最佳需求來選擇權衡取捨。
Multiverse 近期取得的成果也顯示,其與大型語言模型(LLMs)的差距正在縮小。該公司最新的壓縮模型 HyperNova 60B 2602,是基於 gpt-oss-120b 建構而成——這是一款底層程式碼公開的 OpenAI 模型。 該公司聲稱,相較於原始模型,其能以更低的成本提供更快的回應速度,這項優勢對於「代理式編碼工作流程」尤為重要,在此類流程中,AI 會自主處理複雜的多步驟程式設計任務。
在確保實用性的同時,將模型縮小到足以在行動裝置上運行,是一項重大挑戰。Apple Intelligence 透過結合裝置端模型與雲端模型來迴避此難題。Multiverse 的 CompactifAI 應用程式也能透過 API 將請求轉發至 gpt-oss-120b,但其主要目標是證明像 Gilda 及其未來後繼者這樣的本地模型,除了節省成本外還具備其他優勢。
對於關鍵領域的工作人員而言,無需雲端連線即可在地運行的模型能提供更高的隱私保護與系統韌性。但更大的價值在於這所開啟的商業應用場景——例如將 AI 嵌入無人機、衛星及其他無法確保穩定連線的環境中。
該公司目前已服務全球超過 100 家客戶,包括加拿大銀行、博世(Bosch)及伊貝德羅拉(Iberdrola),但擴大客戶群有助於爭取更多資金。繼去年完成 2.15 億美元 B 輪融資後,據報導該公司目前正進行新一輪 5 億歐元的融資,估值已超過 15 億歐元。
相關文章
Cohere 推出開源多語言 AI 模型系列
企業級人工智慧公司 Cohere 在正在舉行的印度人工智慧峰會上,發表了一系列名為 Tiny Aya 的新型多語言模型。這些開放權重模型——意即其核心程式碼可供公眾使用與修改——支援超過 70 種語言,並能在無需網路連線的情況下,於筆記型電腦等日常裝置上運作。該模型由 Cohere 的研究部門 Cohere Labs 開發,支援孟加拉語、印地語、旁遮普語、烏爾都語、古吉拉特語、泰米爾語、泰盧固語及
Multiverse Computing 推出免費壓縮生成式人工智慧模型
大型語言模型面臨著重大挑戰:其龐大的體積。西班牙新創公司Multiverse Computing正透過開發壓縮模型來解決此問題,旨在彌合尖端AI能力與企業實際可負擔部署方案之間的差距。其核心創新在於「CompactifAI」壓縮技術——這項受量子運算原理啟發的技術,已被這家巴斯克公司用於優化OpenAI的模型。即日起,開發者可在Hugging Face平台免費使用Multiverse增強版的Hyp
馬斯克的 Grok:1.5 兆個參數與游標程式碼吸收——是遊戲規則的改變者,還是虛張聲勢?
伊隆·馬斯克終於有所行動。在人工智慧程式設計的競賽中,OpenAI 和 Anthropic 正加速前進,而 xAI 似乎落後了。馬斯克曾多次表示其目標是與 Claude 抗衡,然而儘管 Grok4.X 系列已進行多次更新,成果在理論上看似不錯,但在實際應用中卻未能達標,兩者之間的差距幾乎未見縮小。不過,這次他握有一張新王牌。馬斯克在 X 平台上證實,Grok 的新版本即將問世。 這款基礎模型第九版
相關專題推薦
評論 (0)
0/500
隨著私營企業的違約率飆升至 9.2%——創下近年來新高——風險投資公司 Lux Capital 最近建議依賴人工智慧的企業,應就其運算能力取得書面承諾。隨著金融不穩定性在人工智慧供應鏈中蔓延,Lux 警告說,僅靠口頭協議已不再足夠。
但其實還有另一種截然不同的選擇:徹底擺脫對外部運算基礎設施的依賴。那些能直接在用戶裝置上運行、無需資料中心、無需雲端服務商且無交易對手風險的小型 AI 模型,其效能已足夠強大,值得認真考量。而 Multiverse Computing 正挺身而出。
相較於某些競爭對手,這家西班牙新創公司一直保持相對低調,但隨著對 AI 效率的需求激增,這種狀況正在改變。在對 OpenAI、Meta、DeepSeek 和 Mistral AI 等主要 AI 實驗室的模型進行壓縮後,該公司推出了兩款產品:一款展示其壓縮模型能力的應用程式,以及一個 API 入口網站——這是開發者存取並基於這些模型進行開發的通道——使這些模型得以更廣泛地應用。
名為 CompactifAI 的應用程式,其名稱源自 Multiverse 受量子技術啟發的壓縮技術,是一款類似 ChatGPT 或 Mistral 的 Le Chat 的 AI 聊天工具。您提出問題,模型便會回應。不同之處在於,Multiverse 已嵌入名為 Gilda 的模型,據該公司表示,此模型極為精簡,甚至可在本地離線運行。

對終端使用者而言,這讓他們得以體驗邊緣 AI:資料從不離開裝置,且無需網路連線。然而,這其中有個限制:使用者的行動裝置必須具備足夠的記憶體與儲存空間。若裝置不符條件(許多舊款 iPhone 便無法滿足),應用程式將透過 API 切換至雲端模型。 本地與雲端處理之間的切換,由 Multiverse 稱為「Ash Nazg」的系統自動處理——托爾金迷會認出這個名字,它是對《魔戒》中「至尊魔戒」銘文的致敬。但當應用程式切換至雲端處理時,其主要的隱私優勢便不復存在。
這些限制顯示,CompactifAI 尚未準備好供消費者廣泛採用,儘管這或許從來就不是其初衷。根據 Sensor Tower 的數據,該應用程式在過去一個月的下載量不到 5,000 次。
真正的重點在於企業市場。今日,Multiverse 推出了一個自助式 API 入口網站,讓開發者和企業能直接存取其壓縮模型——無需透過 AWS Marketplace。
「CompactifAI API 入口網站 [現已] 讓開發者能直接存取壓縮模型,並具備在生產環境中運行所需的透明度與控制權,」執行長恩里克·利薩索(Enrique Lizaso)在聲明中表示。
即時使用監控是該 API 的關鍵功能,這絕非偶然。除了邊緣部署的潛在優勢外,更低的運算成本正是企業探索小型模型以替代大型語言模型(LLMs)的主要原因。
此外,小型模型的限制也遠比以往少得多。本週稍早,Mistral 透過推出 Mistral Small 4 更新了其小型模型陣容,據稱該模型針對一般聊天、編碼、代理任務及推理進行了優化。這家法國公司還推出了 Forge,這是一個允許企業構建自訂模型的系統,包括小型模型,讓企業能根據其使用案例的最佳需求來選擇權衡取捨。
Multiverse 近期取得的成果也顯示,其與大型語言模型(LLMs)的差距正在縮小。該公司最新的壓縮模型 HyperNova 60B 2602,是基於 gpt-oss-120b 建構而成——這是一款底層程式碼公開的 OpenAI 模型。 該公司聲稱,相較於原始模型,其能以更低的成本提供更快的回應速度,這項優勢對於「代理式編碼工作流程」尤為重要,在此類流程中,AI 會自主處理複雜的多步驟程式設計任務。
在確保實用性的同時,將模型縮小到足以在行動裝置上運行,是一項重大挑戰。Apple Intelligence 透過結合裝置端模型與雲端模型來迴避此難題。Multiverse 的 CompactifAI 應用程式也能透過 API 將請求轉發至 gpt-oss-120b,但其主要目標是證明像 Gilda 及其未來後繼者這樣的本地模型,除了節省成本外還具備其他優勢。
對於關鍵領域的工作人員而言,無需雲端連線即可在地運行的模型能提供更高的隱私保護與系統韌性。但更大的價值在於這所開啟的商業應用場景——例如將 AI 嵌入無人機、衛星及其他無法確保穩定連線的環境中。
該公司目前已服務全球超過 100 家客戶,包括加拿大銀行、博世(Bosch)及伊貝德羅拉(Iberdrola),但擴大客戶群有助於爭取更多資金。繼去年完成 2.15 億美元 B 輪融資後,據報導該公司目前正進行新一輪 5 億歐元的融資,估值已超過 15 億歐元。
Cohere 推出開源多語言 AI 模型系列
企業級人工智慧公司 Cohere 在正在舉行的印度人工智慧峰會上,發表了一系列名為 Tiny Aya 的新型多語言模型。這些開放權重模型——意即其核心程式碼可供公眾使用與修改——支援超過 70 種語言,並能在無需網路連線的情況下,於筆記型電腦等日常裝置上運作。該模型由 Cohere 的研究部門 Cohere Labs 開發,支援孟加拉語、印地語、旁遮普語、烏爾都語、古吉拉特語、泰米爾語、泰盧固語及
Multiverse Computing 推出免費壓縮生成式人工智慧模型
大型語言模型面臨著重大挑戰:其龐大的體積。西班牙新創公司Multiverse Computing正透過開發壓縮模型來解決此問題,旨在彌合尖端AI能力與企業實際可負擔部署方案之間的差距。其核心創新在於「CompactifAI」壓縮技術——這項受量子運算原理啟發的技術,已被這家巴斯克公司用於優化OpenAI的模型。即日起,開發者可在Hugging Face平台免費使用Multiverse增強版的Hyp
馬斯克的 Grok:1.5 兆個參數與游標程式碼吸收——是遊戲規則的改變者,還是虛張聲勢?
伊隆·馬斯克終於有所行動。在人工智慧程式設計的競賽中,OpenAI 和 Anthropic 正加速前進,而 xAI 似乎落後了。馬斯克曾多次表示其目標是與 Claude 抗衡,然而儘管 Grok4.X 系列已進行多次更新,成果在理論上看似不錯,但在實際應用中卻未能達標,兩者之間的差距幾乎未見縮小。不過,這次他握有一張新王牌。馬斯克在 X 平台上證實,Grok 的新版本即將問世。 這款基礎模型第九版





首頁






