中國最強大的 AI 模型服務平台正式上線,提供 300 種模型,並將通話成本降低 30%

中國移動於5月8日推出首個大規模AI模型服務平台。該平台完全由內部自主研發,目前是中國整合度最高的平台,串聯了國內300多個主流AI模型。此里程碑式成就進一步強化了中國的AI基礎設施與服務能力。
創新的「令牌聚合」技術實現智慧模型匹配
該平台引進了突破性的「標記聚合」運作模式,能智慧分析用戶任務需求,並從模型庫中自動篩選最合適的演算法。
為滿足多元應用需求,平台提供三種靈活的篩選模式:
成本優化模式:透過高效路徑執行基礎任務,將資源消耗降至最低。
效能優化模式:調用最強大的模型,以確保高品質的輸出結果。
平衡優化模式:在效率與成本之間取得最佳平衡。
這種動態篩選方法不僅能提升執行效率,更能實現更科學的資源分配。
強化安全性與效率
本平台具備強大的安全機制。若模型發生超時、流量限制或意外失敗,系統將在數秒內自動切換至備援方案。此快速故障轉移機制解決了開發人員的主要顧慮——業務中斷——確保企業應用程式的持續運作。
顯著的成本節省與效率提升
監控數據顯示資源利用率顯著提升。每令牌成本下降約 30%,資源消耗減少超過 50%。憑藉其卓越的效能,該平台現已每日處理超過 100 億次請求,成為中國快速成長的 AI 產業中關鍵的數位骨幹。
相關文章
SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心
在為即將進行的IPO提交的S-1註冊檔案中,SpaceX公佈了一系列令人矚目的業務資料,這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力:Starlink使用者數突破1000萬:截至2026年第一季度,全球付費Starlink使用者數量已達到1030萬,這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座,Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成,這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系:通
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
奔騰4的復興:這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型
最近,YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗:他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞,不僅揭示了大語言模型的基本相容性限制,還引發了眾多觀眾的思考:在人工智慧時代,摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學:將2006年的元件推向極限為了完成這項測試,Fully Buffered團隊重
相關專題推薦
評論 (0)
0/500

中國移動於5月8日推出首個大規模AI模型服務平台。該平台完全由內部自主研發,目前是中國整合度最高的平台,串聯了國內300多個主流AI模型。此里程碑式成就進一步強化了中國的AI基礎設施與服務能力。
創新的「令牌聚合」技術實現智慧模型匹配
該平台引進了突破性的「標記聚合」運作模式,能智慧分析用戶任務需求,並從模型庫中自動篩選最合適的演算法。
為滿足多元應用需求,平台提供三種靈活的篩選模式:
成本優化模式:透過高效路徑執行基礎任務,將資源消耗降至最低。
效能優化模式:調用最強大的模型,以確保高品質的輸出結果。
平衡優化模式:在效率與成本之間取得最佳平衡。
這種動態篩選方法不僅能提升執行效率,更能實現更科學的資源分配。
強化安全性與效率
本平台具備強大的安全機制。若模型發生超時、流量限制或意外失敗,系統將在數秒內自動切換至備援方案。此快速故障轉移機制解決了開發人員的主要顧慮——業務中斷——確保企業應用程式的持續運作。
顯著的成本節省與效率提升
監控數據顯示資源利用率顯著提升。每令牌成本下降約 30%,資源消耗減少超過 50%。憑藉其卓越的效能,該平台現已每日處理超過 100 億次請求,成為中國快速成長的 AI 產業中關鍵的數位骨幹。
SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心
在為即將進行的IPO提交的S-1註冊檔案中,SpaceX公佈了一系列令人矚目的業務資料,這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力:Starlink使用者數突破1000萬:截至2026年第一季度,全球付費Starlink使用者數量已達到1030萬,這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座,Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成,這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系:通
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
奔騰4的復興:這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型
最近,YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗:他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞,不僅揭示了大語言模型的基本相容性限制,還引發了眾多觀眾的思考:在人工智慧時代,摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學:將2006年的元件推向極限為了完成這項測試,Fully Buffered團隊重





首頁






