Claude 4 人工智能在編碼和邏輯推理任務上的表現優於前人
Anthropic 發表新一代 Claude AI 模型 - Claude Opus 4 與 Claude Sonnet 4 - 代表混合推理能力的重大進步,特別是針對程式應用與複雜的問題解決情境。
Claude Opus 4 是 Anthropic 迄今最精密的人工智慧,可長時間持續執行嚴苛的任務,展現出前所未有的耐力。在內部評估期間,該模型成功維持連續七小時的自主運作 - 這是大幅提升 AI 代理能力的里程碑。Anthropic 宣稱其編碼能力居於領導地位,基準結果顯示 Opus 4 在編程任務與工具運用 (例如網路搜尋) 方面均超越競爭對手,包括 Google 的 Gemini 2.5 Pro、OpenAI 的 o3 推理系統,以及 GPT-4.1。
對於以成本效益為優先的使用者,Claude Sonnet 4 提供最佳化的解決方案,取代二月的 3.7 版本。這款變體提供了強化的程式設計與邏輯推理效能,並改善了回應精確度。這兩種新機型在任務執行方法上都有顯著的改善 - 使用不當捷徑的可能性降低了 65%,並在允許檔案系統存取時,透過先進的記憶體保留功能,更適合進行長時間的作業。

*效能指標代表 Anthropic 的內部基準測試 - 建議進行獨立驗證*可視化 :AnthropicClaude 4 系列引進創新的「思考摘要」,可將複雜的推理過程提昇為易於消化的洞察力。實驗性「延伸思考」切換允許在分析推理與工具輔助模式之間動態切換,以提升輸出品質與精確度。
企業和開發人員可透過 Anthropic 的 API、Amazon Bedrock 和 Google Cloud Vertex AI 平台存取這兩種模型。Claude 付費方案的訂閱者可存取所有功能,包括延伸思考測試版,而免費使用者目前僅限於 Sonnet 4 功能。
Anthropic 在成功進行 beta 測試後,已將其 Claude Code agentic 指令行工具推廣至一般可用性,以補足這些版本。該公司表示,隨著主要 AI 開發者之間的競爭加劇,該公司計劃加快更新速度。
相關文章
ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案
ChatGPT 利用新的企業功能增強生產力OpenAI 發表了兩項強大的新功能,將 ChatGPT 轉型為全面的企業生產力工具:自動化會議記錄和無縫雲儲存整合。革命性的錄音功能新推出的 「記錄模式 」可自動轉錄和分析以下內容:重要的商務會議有創意的腦力激盪會議 個人思考過程此優質功能目前為 ChatGPT 團隊訂閱者專屬 (每位使用者每月 $25),可提供:精確、有時
Google 推出人工智能虛擬試穿功能
Google 正以先進的虛擬試穿體驗徹底改變線上購物,超越標準的模特兒圖像。這項創新功能現在可在美國使用者的 Search Labs 中使用,讓購物者能夠上傳個人照片,並以極高的準確度在自己的身體上觀看服裝產品。如何運作GIF:Google選擇加入實驗後,使用者只需按一下服裝搜尋結果旁的「試穿」按鈕上傳一張全身照片接收由 AI 生成的自己穿著所選服裝的圖像精密的 AI 模型會考慮到身體位置、布料特
蘋果計劃開放第三方應用程式整合的本地 AI 模型
蘋果將對開發人員開放人工智能模型的使用權據彭博社消息,科技巨頭蘋果公司正準備開放開發人員使用其 Apple Intelligence 功能的核心 AI 技術。該公司計畫先發佈 SDK,提供開發人員存取較小的、裝置上的大型語言模型,這與 Google 的做法如出一轍,Gemini Nano AI API 據報將在今天的 Google I/O 大會上發表。開發人員存取細節初期將集中於裝置上
評論 (0)
0/200
Anthropic 發表新一代 Claude AI 模型 - Claude Opus 4 與 Claude Sonnet 4 - 代表混合推理能力的重大進步,特別是針對程式應用與複雜的問題解決情境。
Claude Opus 4 是 Anthropic 迄今最精密的人工智慧,可長時間持續執行嚴苛的任務,展現出前所未有的耐力。在內部評估期間,該模型成功維持連續七小時的自主運作 - 這是大幅提升 AI 代理能力的里程碑。Anthropic 宣稱其編碼能力居於領導地位,基準結果顯示 Opus 4 在編程任務與工具運用 (例如網路搜尋) 方面均超越競爭對手,包括 Google 的 Gemini 2.5 Pro、OpenAI 的 o3 推理系統,以及 GPT-4.1。
對於以成本效益為優先的使用者,Claude Sonnet 4 提供最佳化的解決方案,取代二月的 3.7 版本。這款變體提供了強化的程式設計與邏輯推理效能,並改善了回應精確度。這兩種新機型在任務執行方法上都有顯著的改善 - 使用不當捷徑的可能性降低了 65%,並在允許檔案系統存取時,透過先進的記憶體保留功能,更適合進行長時間的作業。

Claude 4 系列引進創新的「思考摘要」,可將複雜的推理過程提昇為易於消化的洞察力。實驗性「延伸思考」切換允許在分析推理與工具輔助模式之間動態切換,以提升輸出品質與精確度。
企業和開發人員可透過 Anthropic 的 API、Amazon Bedrock 和 Google Cloud Vertex AI 平台存取這兩種模型。Claude 付費方案的訂閱者可存取所有功能,包括延伸思考測試版,而免費使用者目前僅限於 Sonnet 4 功能。
Anthropic 在成功進行 beta 測試後,已將其 Claude Code agentic 指令行工具推廣至一般可用性,以補足這些版本。該公司表示,隨著主要 AI 開發者之間的競爭加劇,該公司計劃加快更新速度。












