Anthropic的Claude 4.1在編碼基準測試中表現優異，搶先GPT-5發布

首頁

新聞

2026-02-13

JoseLewis

107

# openai # gpt-5 # nlp

Anthropic的Claude 4.1在編碼基準測試中表現優異，搶先GPT-5發布

Anthropic於週一發布其旗艦人工智慧模型的升級版本，為軟體工程任務的效能樹立新標竿。此舉使這家人工智慧新創企業得以捍衛其在利潤豐厚的編碼領域的霸主地位，同時預見來自OpenAI的全新競爭挑戰。

新版Claude Opus 4.1模型在SWE-bench Verified測試中獲得74.5%的分數，該測試是評估AI系統解決真實世界軟體問題能力的權威基準。此成績超越OpenAI o3模型的69.1%及Google Gemini 2.5 Pro的67.2%，鞏固了Anthropic在AI輔助編碼領域的領先地位。

此次發布正值Anthropic業務爆發性成長之際。產業數據顯示，其年度經常性收入在短短七個月內暴增五倍，從10億美元飆升至50億美元。然而這般迅猛增長也催生了高風險的依賴性：在31億美元的API收入中，近半數（14億美元）僅來自兩大客戶——程式設計輔助工具Cursor與微軟的GitHub Copilot。

羅技資深產品經理紀堯姆·勒韋迪耶透過社群媒體評論營收集中數據時警示：「此乃極度危險的局面，任何合約變動都可能危及整個企業。」

OpenAI與Anthropic在2025年均展現驚人成長：OpenAI過去六個月經常性收入從60億美元翻倍至120億美元；Anthropic則在七個月內從10億美元飆升至50億美元，增幅達五倍。

若比較營收來源，情況頗為耐人尋味：
– OpenAI… pic.twitter.com/8OaN1RSm9E
— Peter Gostev (@petergostev) 2025年8月4日

此次更新標誌著Anthropic在OpenAI即將推出GPT-5前夕，為鞏固市場地位所做的最新戰略佈局。業界預測GPT-5將挑戰Claude在程式設計領域的霸主地位。部分觀察家質疑此舉時機是否暗示著迫切性，而非純粹的準備就緒。

「Opus 4.1看似為搶先GPT-5而倉促推出，」Alec Velikanov指出該模型在使用者介面任務上相較競爭對手存在明顯短板。此觀點呼應業界普遍推測：Anthropic正加速發布週期以捍衛市場地位。

兩大客戶如何貢獻Anthropic近半數31億美元API營收

Anthropic的業務重心日益轉向軟體開發。其Claude Code訂閱服務（企業方案月費200美元，消費者方案僅20美元）在數週內實現營收倍增，年經常性收入達4億美元，彰顯企業對AI編碼輔助工具的強勁需求。

開發者明日·阮（Minh Nhat Nguyen）指出：「Claude Code在五個月內達成4億美元業績，幾乎未投入行銷成本，這相當驚人，不是嗎？」此現象凸顯該工具在專業程式設計師群體中呈現的快速、自然擴散態勢。

好吧，Claude Code在五個月內創造4億美元營收，幾乎沒花什麼行銷費用，這簡直瘋了，對吧？https://t.co/HIy34QdLuq
— Minh Nhat Nguyen (@menhguin) 2025年8月5日

這種程式碼專精策略雖獲利豐厚卻暗藏風險。儘管OpenAI在更廣泛的消費者與企業訂閱收入領域領先，Anthropic卻在開發者市場建立起主導地位。追蹤AI企業財務的業界分析師Peter Gostev觀察到：「如今幾乎所有程式碼輔助工具都預設採用Claude 4 Sonnet。」

2018年以75億美元被微軟收購的GitHub，為Anthropic帶來特別複雜的動態。微軟持有OpenAI大量股權，形成潛在衝突——GitHub Copilot高度依賴Anthropic模型，而微軟同時正開發自有競爭性AI技術。

Perplexity商業研究員西婭·馬利對此評論道：「值得注意的是——關鍵客戶之一竟有49%股權歸屬直接競爭對手⋯⋯這無疑增添了另一重脆弱性。」此言暗指微軟的持股關係。

AI勒索測試後，Claude強化編碼能力伴隨更嚴格安全協議

除編碼能力升級外，Opus 4.1更強化Claude的研究與數據分析能力，尤其在精細細節追蹤與獨立搜索操作方面。該模型延續Anthropic的混合推理方法，融合直接處理與延伸思考，可運用高達64,000個代碼進行複雜問題解決。

然而此進展伴隨更嚴格的安全措施。Anthropic將Opus 4.1歸類於其AI安全等級3（ASL-3）框架——最高等級的嚴格規範——要求強化防護以防範模型竊取與濫用。

先前對Claude 4模型的評估曾揭露令人憂慮的行為模式，例如當AI感知到被停用的威脅時，會試圖進行勒索。在受控測試中，該模型曾威脅要洩露工程師的個人資訊以確保自身存續，展現出先進但潛在危險的推理能力。

這些安全考量並未阻礙企業採用。GitHub報告指出Claude Opus 4.1在「多檔案程式碼重構方面展現特別顯著的效能提升」。樂天集團亦讚揚該模型「能在龐大程式碼庫中精準識別修正點，避免不必要的編輯或引入錯誤」。

為何OpenAI的GPT-5對Anthropic的開發者導向策略構成生存威脅

人工智慧編碼市場已演變為價值數十億美元的高風險競技場。開發者生產力工具代表生成式人工智慧最直接且具價值的應用領域，其顯著的效率提升支撐著企業級高價策略。

Anthropic雖憑藉高度集中化的客戶組合實現豐厚利潤，但若競爭對手能挖走大客戶，其業務將面臨脆弱性。尤其在程式碼輔助領域，開發者僅需調整API即可快速測試新AI系統，使模型轉換變得輕而易舉。

「我認為Anthropic的成長高度依賴其程式編寫領域的霸主地位，」Gostev分析道：「若GPT-5挑戰此優勢，促使Cursor與GitHub Copilot等客戶轉投OpenAI，市場格局恐將重組。」

隨著硬體成本下降與推論效率提升，競爭可能加速，核心AI能力或將逐步商品化。產業分析師文卡特·拉曼預測：「即使AI實驗室不再推進模型革新，單憑硬體成本降低與推論優化，約五年內便能實現盈利。」

目前Anthropic在保持技術優勢的同時，正擴展Claude Code訂閱服務以降低對API收入的依賴。其能否在OpenAI、Google等競爭者逼近之際維持編碼領域的領導地位，將決定公司能否延續高速成長，抑或遭遇重大阻礙。

其深遠影響在於：掌控軟體開發AI工具的實體，終將主導技術進步的節奏。在這場矽谷最新一輪的贏家通吃競賽中，Anthropic已建立起仰賴兩大基石客戶的帝國——如今必須證明其能留住這些客戶。

薩提亞·納德拉準備利用與OpenAI的新合作關係週三，一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉，修訂後的OpenAI合作關係將如何影響公司的財務狀況。納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係，並確保它能夠實現雙贏。只有這樣，雙方才能保持良好的合作伙伴關係。” 他強調，微軟仍然可以使用OpenAI的智慧財產權，包括其模型和智慧體產品，但不再需要為此向OpenAI支付費用。談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術，納德拉表示：“

OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖當各國政府正竭力應對超智能機器帶來的經濟衝擊之際，OpenAI 發布了一系列政策提案，闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單，這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司，如何看待人工智慧在重塑勞動與經濟的過程

葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI 2017年8月下旬，OpenAI（當時還是一家小型非營利研究實驗室）的核心成員召開會議，商討如何成立營利實體以將其技術商業化，並籌集實現通用人工智慧（AGI）所需的資金。伊隆·馬斯克要求對公司擁有完全控制權，並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示，他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際，試圖用這份禮物來收買他們。 OpenAI的研

相關專題推薦

代碼