螞蟻數位推出「百靈」企業金融大型語言模型:重新定義速度與效率
OpenAI 的 Agent 等自主執行代理的崛起,標誌著人工智慧應用迎來重大加速,從簡單的「對話互動」轉向複雜的「任務執行」。儘管企業正迅速擁抱這股趨勢,但也面臨運算資源浪費與安全合規等挑戰。實現智慧代理的大規模、可持續部署,已成為業界的核心焦點。
3月26日,在「中關村論壇」未來產業創新論壇上,螞蟻數位大模型技術創新部總經理張鵬在演講中指出,此類代理的出現將徹底改變企業AI的範式。這一轉變將使大模型的產業部署從「參數規模競爭」轉向「令牌效率競爭」。

螞蟻數位大模型技術創新部總經理張鵬於中關村論壇發表演說。
智能代理的快速普及反映出市場對自主任務執行的強烈需求。然而,在實際工業環境中部署它們仍面臨重大障礙。 由於往往缺乏對行業規則和工作流程的深刻理解,這些代理在處理複雜任務時,可能會反覆進行低效的工具調用。這導致的令牌消耗遠遠超過實際創造的價值。報告顯示,在某些高頻率場景中,代理執行的成本可能比集成解決方案高出數十倍甚至數百倍,這引發了對其廣泛工業應用的可持續性疑慮。
「大型模型工業化下一階段的核心挑戰,不在於參數數量上的競爭,而在於持續提升每代幣的效率,」張鵬指出。他認為企業應根據具體情境與需求,選擇能策略性地結合大模型與小模型的 AI 解決方案,以更低的運算成本創造更大的商業價值。
以金融業為例。該領域每日處理海量的高頻率、低延遲任務——快速識別用戶意圖、提取關鍵數據、檢索並篩選資訊。這些任務要求高並發性、快速響應時間以及極高的精準度。 雖然傳統的大型推論模型功能強大,但若用於此類場景往往是「大材小用」——猶如「用大錘砸核桃」——導致成本高昂、速度緩慢且浪費資源。
「業界真正需要的,是既能確保專業性、嚴謹性與合規性,又能提供最佳成本效益與響應速度的 AI 解決方案,」張鵬解釋道。他強調,大參數模型擅長複雜推理與深度分析,而較小的模型則能為高頻率、較簡單的任務提供更低的延遲與更好的成本效益。結合兩者的混合式方法,是更有效率且經濟地解決現實世界問題的關鍵。
在中關村論壇上,螞蟻數位發布了名為「Ling-DT-Fin-Mini-2.5」的輕量級金融專用模型,這是其 Ling DT 系列的首款產品。該模型基於最新的 Ling 2.5 混合線性注意力框架,採用輕量級專家混合(MoE)架構,針對高並發、低延遲的金融任務進行了優化。 該模型在維持專業性能的同時,將推論成本降至適合大規模部署的水平。相較於具備類似能力的主流通用模型,在處理同等任務量時,其推論速度提升 100%,且硬體成本顯著降低,為金融機構帶來實質的成本節省與效率提升。
事實上,隨著AI代理深入核心產業流程執行實際工作,大模型與小模型結合的策略正逐漸成為產業標準。近期,OpenAI本身也發布了兩款較小型的模型——GPT-4o mini與nano,專注於低延遲與高成本效益,作為主要執行層級的代理。
張鵬總結道,技術進步終須與產業效率的理性需求相契合。在下一階段的競爭中,代幣效率將成為評估企業AI價值的核心指標。螞蟻數位將持續聚焦於企業級AGI,計劃推出「凌DT」大模型的企業版及行業專用版本,加速智能代理在複雜商業環境中的大規模部署。
相關文章
SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心
在為即將進行的IPO提交的S-1註冊檔案中,SpaceX公佈了一系列令人矚目的業務資料,這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力:Starlink使用者數突破1000萬:截至2026年第一季度,全球付費Starlink使用者數量已達到1030萬,這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座,Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成,這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系:通
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
奔騰4的復興:這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型
最近,YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗:他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞,不僅揭示了大語言模型的基本相容性限制,還引發了眾多觀眾的思考:在人工智慧時代,摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學:將2006年的元件推向極限為了完成這項測試,Fully Buffered團隊重
相關專題推薦
評論 (0)
0/500
OpenAI 的 Agent 等自主執行代理的崛起,標誌著人工智慧應用迎來重大加速,從簡單的「對話互動」轉向複雜的「任務執行」。儘管企業正迅速擁抱這股趨勢,但也面臨運算資源浪費與安全合規等挑戰。實現智慧代理的大規模、可持續部署,已成為業界的核心焦點。
3月26日,在「中關村論壇」未來產業創新論壇上,螞蟻數位大模型技術創新部總經理張鵬在演講中指出,此類代理的出現將徹底改變企業AI的範式。這一轉變將使大模型的產業部署從「參數規模競爭」轉向「令牌效率競爭」。

螞蟻數位大模型技術創新部總經理張鵬於中關村論壇發表演說。
智能代理的快速普及反映出市場對自主任務執行的強烈需求。然而,在實際工業環境中部署它們仍面臨重大障礙。 由於往往缺乏對行業規則和工作流程的深刻理解,這些代理在處理複雜任務時,可能會反覆進行低效的工具調用。這導致的令牌消耗遠遠超過實際創造的價值。報告顯示,在某些高頻率場景中,代理執行的成本可能比集成解決方案高出數十倍甚至數百倍,這引發了對其廣泛工業應用的可持續性疑慮。
「大型模型工業化下一階段的核心挑戰,不在於參數數量上的競爭,而在於持續提升每代幣的效率,」張鵬指出。他認為企業應根據具體情境與需求,選擇能策略性地結合大模型與小模型的 AI 解決方案,以更低的運算成本創造更大的商業價值。
以金融業為例。該領域每日處理海量的高頻率、低延遲任務——快速識別用戶意圖、提取關鍵數據、檢索並篩選資訊。這些任務要求高並發性、快速響應時間以及極高的精準度。 雖然傳統的大型推論模型功能強大,但若用於此類場景往往是「大材小用」——猶如「用大錘砸核桃」——導致成本高昂、速度緩慢且浪費資源。
「業界真正需要的,是既能確保專業性、嚴謹性與合規性,又能提供最佳成本效益與響應速度的 AI 解決方案,」張鵬解釋道。他強調,大參數模型擅長複雜推理與深度分析,而較小的模型則能為高頻率、較簡單的任務提供更低的延遲與更好的成本效益。結合兩者的混合式方法,是更有效率且經濟地解決現實世界問題的關鍵。
在中關村論壇上,螞蟻數位發布了名為「Ling-DT-Fin-Mini-2.5」的輕量級金融專用模型,這是其 Ling DT 系列的首款產品。該模型基於最新的 Ling 2.5 混合線性注意力框架,採用輕量級專家混合(MoE)架構,針對高並發、低延遲的金融任務進行了優化。 該模型在維持專業性能的同時,將推論成本降至適合大規模部署的水平。相較於具備類似能力的主流通用模型,在處理同等任務量時,其推論速度提升 100%,且硬體成本顯著降低,為金融機構帶來實質的成本節省與效率提升。
事實上,隨著AI代理深入核心產業流程執行實際工作,大模型與小模型結合的策略正逐漸成為產業標準。近期,OpenAI本身也發布了兩款較小型的模型——GPT-4o mini與nano,專注於低延遲與高成本效益,作為主要執行層級的代理。
張鵬總結道,技術進步終須與產業效率的理性需求相契合。在下一階段的競爭中,代幣效率將成為評估企業AI價值的核心指標。螞蟻數位將持續聚焦於企業級AGI,計劃推出「凌DT」大模型的企業版及行業專用版本,加速智能代理在複雜商業環境中的大規模部署。
SpaceX的IPO申請檔案重點體現了其在衛星網際網路和人工智慧領域的發展雄心
在為即將進行的IPO提交的S-1註冊檔案中,SpaceX公佈了一系列令人矚目的業務資料,這些資料凸顯了其在航空航天通訊和人工智慧領域的強大實力:Starlink使用者數突破1000萬:截至2026年第一季度,全球付費Starlink使用者數量已達到1030萬,這一數字在過去一年內翻了一番。這一增長充分證明了作為全球最大的近地軌道衛星星座,Starlink在寬頻和行動通訊領域的領先地位。目前該衛星網路由大約9600顆衛星組成,這些衛星佔在軌所有活躍衛星總數的65%。Grok與X人工智慧生態體系:通
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
奔騰4的復興:這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型
最近,YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗:他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞,不僅揭示了大語言模型的基本相容性限制,還引發了眾多觀眾的思考:在人工智慧時代,摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學:將2006年的元件推向極限為了完成這項測試,Fully Buffered團隊重





首頁






