Claude 4 揭幕:下一代AI模型提升編碼與代理性能
Anthropic 推出了其 Claude 4 模型系列,為開發者打造尖端 AI 助理和編碼解決方案標誌著重大進展。該系列包括 Claude Opus 4,這是一款頂級性能模型,以及 Claude Sonnet 4,一款適用於多樣應用的多功能模型。
Anthropic 對其目標毫不掩飾,強調這些模型旨在「全面提升客戶的 AI 策略」。Opus 4 被定位為「編碼、研究、寫作和科學探索」的領導者,而 Sonnet 4 則被描述為「相較於 Sonnet 3.7 的重大升級」,為日常任務提供「頂級性能」。
Claude Opus 4:頂尖編碼模型
Anthropic 宣稱 Claude Opus 4 是其「迄今最先進的模型,也是全球領先的編碼模型」,這一說法得到其在 SWE-bench 上 72.5% 和 Terminal-bench 上 43.2% 的出色分數支持。
除了速度,Opus 4 在耐力上也表現卓越,專為「需要專注努力和數千步驟的長期任務提供一致性能」而設計。想像一個能「持續工作數小時」的 AI——這是 Anthropic 的承諾。
這相較於早期的 Sonnet 模型是一次重大飛躍,可能重新定義 AI 代理的範圍,應對需要持續努力的挑戰。
Claude Sonnet 4:日常使用的多功能 AI
雖然 Opus 4 是旗艦產品,Claude Sonnet 4 則作為一款動態的全能模型脫穎而出,在廣泛應用中提供顯著改進。早期用戶的初步反饋極為正面。
例如,GitHub 指出「Claude Sonnet 4 在代理場景中表現出色」,並對其印象深刻,計劃「採用它作為 GitHub Copilot 新編碼代理的基礎」。這是一個強有力的信任背書。
技術分析師 Manus 讚揚其「增強的遵循複雜指令能力,提供清晰的推理,並生成精緻的輸出」。
iGent 報告稱,Sonnet 4 在「自主多功能應用開發中表現突出,問題解決能力顯著提升,導航錯誤從 20% 降至幾乎為零」。這對開發工作流程來說是一個重大勝利。
Sourcegraph 認為這是「軟體開發的重大進展,能更長時間保持專注,更深入理解問題,並交付更乾淨的程式碼」。
Augment Code 強調「更高的成功率、精確的程式碼編輯以及對複雜任務的細緻處理」,使 Sonnet 4 成為其「首選主要模型」。
混合模式與開發者工具
Claude 4 系列的一個突出特點是其雙模態功能。Opus 4 和 Sonnet 4 均提供快速響應用於快速任務,以及深度推理模式用於複雜挑戰。
這種進階推理模式包含在 Pro、Max、Team 和 Enterprise Claude 計劃中。令人興奮的是,Sonnet 4 連同這種增強推理功能,也將對免費用戶開放,擴大了高品質 AI 的使用範圍。
Anthropic 還通過其 API 引入了強大的開發者工具,以加速高級 AI 代理的開發:
- 程式碼執行工具:使模型能夠運行程式碼,為互動和問題解決應用開啟新可能性。
- MCP 連接器:Anthropic 的新標準,用於 AI 助理與軟體環境之間的無縫上下文交換。
- 檔案 API:簡化直接檔案交互,這對實際任務至關重要。
- 提示快取:允許開發者快取提示長達一小時,提升頻繁查詢的速度和效率。
在實際應用中的頂尖性能
Anthropic 強調,其「Claude 4 模型在 SWE-bench Verified 上領先,這是一個針對真實世界軟體工程任務的基準」。除了編碼,它們在「推理、多模態能力和代理任務」中也表現出色。

儘管有這些進展,Anthropic 保持了一致的定價。Claude Opus 4 的費用為每百萬輸入標記 15 美元,每百萬輸出標記 75 美元。Claude Sonnet 4 則是更實惠的選擇,定價為每百萬輸入標記 3 美元,每百萬輸出標記 15 美元,對現有用戶來說是一大安慰。
這兩款模型均可通過 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 獲得,使全球開發者和企業能夠無縫整合它們。
Anthropic 顯然專注於增強 AI 能力,特別是在複雜編碼和自主代理任務方面。有了這些模型和工具,創新的潛力已被顯著放大。
另見:Jony Ive 的 OpenAI 設備細節浮出水面
在阿姆斯特丹、加利福尼亞和倫敦的 AI & Big Data Expo 上,從行業專家那裡了解更多關於 AI 和大數據的資訊。此活動與 Intelligent Automation Conference、BlockX、Digital Transformation Week 和 Cyber Security & Cloud Expo 同期舉辦。
查看 TechForge 即將舉辦的其他企業技術活動和網路研討會。
相關文章
微軟與 Anthropic 合作提升 Microsoft 365 應用程式的 AI 功能
微軟從今天開始將 Anthropic 的 Claude Sonnet 4 和 Claude Opus 4.1 模型整合至 Microsoft 365 Copilot,藉此擴展其人工智慧產品。此一策略性舉措讓OpenAI產品以外的模型選擇更多元化,讓微軟客戶能夠在Researcher和Microsoft Copilot Studio中利用Anthropic的技術。"微軟企業與產業 Copilot 團
Perplexity AI 出價 345 億美元競標 Chrome:策略性行動還是巧妙的公關手段?
Perplexity 大膽收購 Chrome 的舉動震撼了人工智慧產業,讓整個矽谷對於這究竟是合理的策略,還是高超的公關定位,瞠目結舌。前所未有的收購企圖Perplexity AI 主動出價 345 億美元收購 Google Chrome 瀏覽器,讓觀察家大跌眼鏡,這個驚人的數字幾乎是該公司 180 億美元估值的兩倍。這個時機似乎與目前針對 Google 瀏覽器霸權的反托拉斯訴訟策略一致。財務可行
Anthropic 對 Claude API 施加更嚴格的費率限制,引發開發人員反彈
Anthropic 今天透露,將針對 Claude 訂戶實施每週使用上限,理由是 Claude Code 平台的用戶全天候過度使用。新限制於 8 月 28 日生效,將補充現有的五小時限制,但據報僅影響 5% 的使用者。此公告一出,立即引來開發人員的批評,他們認為這項變更過度懲罰合法使用者。此外,也有人擔心管理大型專案的企業可能會更快遇到上限。"自推出以來,Claude Code 已經被廣泛採用,」
評論 (0)
0/200
Anthropic 推出了其 Claude 4 模型系列,為開發者打造尖端 AI 助理和編碼解決方案標誌著重大進展。該系列包括 Claude Opus 4,這是一款頂級性能模型,以及 Claude Sonnet 4,一款適用於多樣應用的多功能模型。
Anthropic 對其目標毫不掩飾,強調這些模型旨在「全面提升客戶的 AI 策略」。Opus 4 被定位為「編碼、研究、寫作和科學探索」的領導者,而 Sonnet 4 則被描述為「相較於 Sonnet 3.7 的重大升級」,為日常任務提供「頂級性能」。
Claude Opus 4:頂尖編碼模型
Anthropic 宣稱 Claude Opus 4 是其「迄今最先進的模型,也是全球領先的編碼模型」,這一說法得到其在 SWE-bench 上 72.5% 和 Terminal-bench 上 43.2% 的出色分數支持。
除了速度,Opus 4 在耐力上也表現卓越,專為「需要專注努力和數千步驟的長期任務提供一致性能」而設計。想像一個能「持續工作數小時」的 AI——這是 Anthropic 的承諾。
這相較於早期的 Sonnet 模型是一次重大飛躍,可能重新定義 AI 代理的範圍,應對需要持續努力的挑戰。
Claude Sonnet 4:日常使用的多功能 AI
雖然 Opus 4 是旗艦產品,Claude Sonnet 4 則作為一款動態的全能模型脫穎而出,在廣泛應用中提供顯著改進。早期用戶的初步反饋極為正面。
例如,GitHub 指出「Claude Sonnet 4 在代理場景中表現出色」,並對其印象深刻,計劃「採用它作為 GitHub Copilot 新編碼代理的基礎」。這是一個強有力的信任背書。
技術分析師 Manus 讚揚其「增強的遵循複雜指令能力,提供清晰的推理,並生成精緻的輸出」。
iGent 報告稱,Sonnet 4 在「自主多功能應用開發中表現突出,問題解決能力顯著提升,導航錯誤從 20% 降至幾乎為零」。這對開發工作流程來說是一個重大勝利。
Sourcegraph 認為這是「軟體開發的重大進展,能更長時間保持專注,更深入理解問題,並交付更乾淨的程式碼」。
Augment Code 強調「更高的成功率、精確的程式碼編輯以及對複雜任務的細緻處理」,使 Sonnet 4 成為其「首選主要模型」。
混合模式與開發者工具
Claude 4 系列的一個突出特點是其雙模態功能。Opus 4 和 Sonnet 4 均提供快速響應用於快速任務,以及深度推理模式用於複雜挑戰。
這種進階推理模式包含在 Pro、Max、Team 和 Enterprise Claude 計劃中。令人興奮的是,Sonnet 4 連同這種增強推理功能,也將對免費用戶開放,擴大了高品質 AI 的使用範圍。
Anthropic 還通過其 API 引入了強大的開發者工具,以加速高級 AI 代理的開發:
- 程式碼執行工具:使模型能夠運行程式碼,為互動和問題解決應用開啟新可能性。
- MCP 連接器:Anthropic 的新標準,用於 AI 助理與軟體環境之間的無縫上下文交換。
- 檔案 API:簡化直接檔案交互,這對實際任務至關重要。
- 提示快取:允許開發者快取提示長達一小時,提升頻繁查詢的速度和效率。
在實際應用中的頂尖性能
Anthropic 強調,其「Claude 4 模型在 SWE-bench Verified 上領先,這是一個針對真實世界軟體工程任務的基準」。除了編碼,它們在「推理、多模態能力和代理任務」中也表現出色。

儘管有這些進展,Anthropic 保持了一致的定價。Claude Opus 4 的費用為每百萬輸入標記 15 美元,每百萬輸出標記 75 美元。Claude Sonnet 4 則是更實惠的選擇,定價為每百萬輸入標記 3 美元,每百萬輸出標記 15 美元,對現有用戶來說是一大安慰。
這兩款模型均可通過 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 獲得,使全球開發者和企業能夠無縫整合它們。
Anthropic 顯然專注於增強 AI 能力,特別是在複雜編碼和自主代理任務方面。有了這些模型和工具,創新的潛力已被顯著放大。
另見:Jony Ive 的 OpenAI 設備細節浮出水面
在阿姆斯特丹、加利福尼亞和倫敦的 AI & Big Data Expo 上,從行業專家那裡了解更多關於 AI 和大數據的資訊。此活動與 Intelligent Automation Conference、BlockX、Digital Transformation Week 和 Cyber Security & Cloud Expo 同期舉辦。
查看 TechForge 即將舉辦的其他企業技術活動和網路研討會。
微軟與 Anthropic 合作提升 Microsoft 365 應用程式的 AI 功能
微軟從今天開始將 Anthropic 的 Claude Sonnet 4 和 Claude Opus 4.1 模型整合至 Microsoft 365 Copilot,藉此擴展其人工智慧產品。此一策略性舉措讓OpenAI產品以外的模型選擇更多元化,讓微軟客戶能夠在Researcher和Microsoft Copilot Studio中利用Anthropic的技術。"微軟企業與產業 Copilot 團
Anthropic 對 Claude API 施加更嚴格的費率限制,引發開發人員反彈
Anthropic 今天透露,將針對 Claude 訂戶實施每週使用上限,理由是 Claude Code 平台的用戶全天候過度使用。新限制於 8 月 28 日生效,將補充現有的五小時限制,但據報僅影響 5% 的使用者。此公告一出,立即引來開發人員的批評,他們認為這項變更過度懲罰合法使用者。此外,也有人擔心管理大型專案的企業可能會更快遇到上限。"自推出以來,Claude Code 已經被廣泛採用,」




