螞蟻數位推出「百靈」企業金融大型語言模型：重新定義速度與效率

首頁

新聞

2026-03-28

JuanLewis

OpenAI 的 Agent 等自主執行代理的崛起，標誌著人工智慧應用迎來重大加速，從簡單的「對話互動」轉向複雜的「任務執行」。儘管企業正迅速擁抱這股趨勢，但也面臨運算資源浪費與安全合規等挑戰。實現智慧代理的大規模、可持續部署，已成為業界的核心焦點。

3月26日，在「中關村論壇」未來產業創新論壇上，螞蟻數位大模型技術創新部總經理張鵬在演講中指出，此類代理的出現將徹底改變企業AI的範式。這一轉變將使大模型的產業部署從「參數規模競爭」轉向「令牌效率競爭」。

螞蟻數位大模型技術創新部總經理張鵬於中關村論壇發表演說。

智能代理的快速普及反映出市場對自主任務執行的強烈需求。然而，在實際工業環境中部署它們仍面臨重大障礙。由於往往缺乏對行業規則和工作流程的深刻理解，這些代理在處理複雜任務時，可能會反覆進行低效的工具調用。這導致的令牌消耗遠遠超過實際創造的價值。報告顯示，在某些高頻率場景中，代理執行的成本可能比集成解決方案高出數十倍甚至數百倍，這引發了對其廣泛工業應用的可持續性疑慮。

「大型模型工業化下一階段的核心挑戰，不在於參數數量上的競爭，而在於持續提升每代幣的效率，」張鵬指出。他認為企業應根據具體情境與需求，選擇能策略性地結合大模型與小模型的 AI 解決方案，以更低的運算成本創造更大的商業價值。

以金融業為例。該領域每日處理海量的高頻率、低延遲任務——快速識別用戶意圖、提取關鍵數據、檢索並篩選資訊。這些任務要求高並發性、快速響應時間以及極高的精準度。雖然傳統的大型推論模型功能強大，但若用於此類場景往往是「大材小用」——猶如「用大錘砸核桃」——導致成本高昂、速度緩慢且浪費資源。

「業界真正需要的，是既能確保專業性、嚴謹性與合規性，又能提供最佳成本效益與響應速度的 AI 解決方案，」張鵬解釋道。他強調，大參數模型擅長複雜推理與深度分析，而較小的模型則能為高頻率、較簡單的任務提供更低的延遲與更好的成本效益。結合兩者的混合式方法，是更有效率且經濟地解決現實世界問題的關鍵。

在中關村論壇上，螞蟻數位發布了名為「Ling-DT-Fin-Mini-2.5」的輕量級金融專用模型，這是其 Ling DT 系列的首款產品。該模型基於最新的 Ling 2.5 混合線性注意力框架，採用輕量級專家混合（MoE）架構，針對高並發、低延遲的金融任務進行了優化。該模型在維持專業性能的同時，將推論成本降至適合大規模部署的水平。相較於具備類似能力的主流通用模型，在處理同等任務量時，其推論速度提升 100%，且硬體成本顯著降低，為金融機構帶來實質的成本節省與效率提升。

事實上，隨著AI代理深入核心產業流程執行實際工作，大模型與小模型結合的策略正逐漸成為產業標準。近期，OpenAI本身也發布了兩款較小型的模型——GPT-4o mini與nano，專注於低延遲與高成本效益，作為主要執行層級的代理。

張鵬總結道，技術進步終須與產業效率的理性需求相契合。在下一階段的競爭中，代幣效率將成為評估企業AI價值的核心指標。螞蟻數位將持續聚焦於企業級AGI，計劃推出「凌DT」大模型的企業版及行業專用版本，加速智能代理在複雜商業環境中的大規模部署。

SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心在為即將進行的IPO提交的S-1註冊檔案中，SpaceX公佈了一系列令人矚目的業務資料，這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力：Starlink使用者數突破1000萬：截至2026年第一季度，全球付費Starlink使用者數量已達到1030萬，這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座，Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成，這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系：通

阿里巴巴Tuhao M890上市，憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代 2026年5月20日，在阿里雲峰會上，阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”，從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎：騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890，該晶片集訓練與推理功能於一體。效能提升：M890擁有144GB的記憶體，其效能是前代產品振武810E的三倍。

奔騰4的復興：這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型最近，YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗：他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞，不僅揭示了大語言模型的基本相容性限制，還引發了眾多觀眾的思考：在人工智慧時代，摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學：將2006年的元件推向極限為了完成這項測試，Fully Buffered團隊重

相關專題推薦

視頻創作

播客創作者首選的頂尖 AI 影片製作工具：將音訊波形轉化為引人入勝的談話頭像影片

立即前往 XIX.AI，探索 2026 年最適合播客的頂尖 AI 影片製作工具。我們精心挑選並評選出的這份榜單，收錄了多款強大工具，能輕鬆將您的音訊轉化為引人入勝的談話頭像影片。透過實際測試與每週更新的排行榜，比較免費與付費選項的差異。立即解鎖您的視覺敘事優勢。

10 個工具

xix.ai

聊天機器人

利用這些角色扮演工具，打造屬於你的 AI 愛情故事

探索 2026 年最新、評價最高的 AI 角色扮演工具，打造身臨其境的敘事體驗。XIX.AI 精心整理的清單收錄了多款功能強大、能徹底改變遊戲規則的助手，助您釋放創意敘事潛能並增添情感深度。透過實際測試，比較免費與付費選項的差異。立即展開您的獨特旅程。

10 個工具

xix.ai

文字轉語音

獨立遊戲開發者必備的頂尖 AI 配音工具：為 RPG 與視覺小說節省配音時間

探索 2026 年最適合遊戲開發者的 AI 配音工具！XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲開發模式的解決方案，助您在角色扮演遊戲（RPG）和視覺小說（Visual Novel）的配音製作上節省時間與成本。探索免費與付費版本的比較、實際測試結果，以及每週更新的排行榜。立即找到最適合您的配音工具！

10 個工具

xix.ai

教育與學習

最佳人工智慧間隔重複學習工具：幫助醫學生和法律專業學生最佳化學習計劃

探索由 XIX.AI 精心挑選的 2026 年最佳 AI 間隔重複學習工具。我們推薦的這些極具創新性的工具能幫助醫學和法律專業的學生最佳化學習計劃，從而提高知識記憶效果。透過真實案例測試和每週更新的排名資訊，你可以瞭解免費選項與付費選項之間的差異。現在就開啟你的學習優勢吧！

10 個工具

xix.ai

視頻創作

最適合劇本創作與視覺敘事的 AI 文字轉影片平台

2026 年最新最佳 AI 文字轉影片平台：頂級劇本撰寫與視覺敘事工具。探索強大且顛覆傳統的解決方案，將您的文字轉化為引人入勝的影片。透過我們每週更新的排行榜與實際測試，比較免費與付費選項。找到最適合您的平台，提升創造力與生產力。立即探索 XIX.AI 精選推薦。

10 個工具

xix.ai

聊天機器人

AI多智慧體編排器：透過自然語言設計複雜的自動化工作流程

2026最新資訊：探索最優秀的人工智慧多智慧體協調工具，透過自然語言設計複雜的自動化工作流程。我們精心挑選的列表中包含了評分最高、功能強大的平臺，這些平臺能夠實現無縫的任務自動化和智慧化的流程管理。對比免費與付費選項，並瞭解實際應用中的效果。藉助XIX.AI每週更新的專家排名，讓你在人工智慧領域取得領先優勢。

10 個工具

xix.ai