選項
首頁
新聞
人類揭示其最聰明的“混合推理” AI模型

人類揭示其最聰明的“混合推理” AI模型

2025-06-02
23

Anthropic剛剛宣布了Claude 3.7十四行詩,標誌著其第一個“混合推理模型”的首次亮相。這種開創性的模型旨在應對更複雜的挑戰,並在數學和編碼等任務上超越早期的迭代。

為了補充這一進步,Anthropic還啟動了Claude Code(代理編碼工具)的“有限的研究預覽”。雖然人類已經為光標等人AI編碼解決方案提供了動力,但Claude代碼被銷售為一個交互式合作夥伴,能夠搜索和讀取代碼,修改文件,編寫和運行測試,將代碼推向GitHub以及使用命令行工具。

Claude 3.7十四行詩將從周一的Claude應用程序開始,並通過Anthropic的API,Amazon Bedrock和Google Cloud的Vertex AI訪問。定價與其前身3.5十四行詩保持一致,每百萬美元投入令牌和每百萬美元產出代幣15美元。

與諸如OpenAI這樣的競爭對手(提供不同的推理模型)不同,人類強調將推理能力直接整合到模型本身中。正如擬人化產品研究負責人戴安娜·佩恩(Dianne Penn)在《邊緣》中解釋的那樣:“我們從根本上認為推理是AI的特徵,而不是完全分開的東西。”例如,克勞德(Claude)不應該在直接的查詢中掙扎太多,例如“現在幾點?”但是在處理複雜的提示中,擅長於計劃在天氣條件下進行兩週的意大利旅行。

克勞德的最新型號卡。人類
克勞德的軟件工程性能。人類
賓夕法尼亞州指出,克勞德3.7十四行詩在代理編碼,財務和法律事務方面表現出明顯改善。儘管克勞德(Claude)尚未支持實時網絡搜索(其他模型中存在的功能),但它擁有2024年10月的知識截止日期,使其更加最新。開發人員可以通過其SCRATCHPAD功能來影響模型的運作方式,並指定確切的響應時間。 “有時候,” Anthropic的產品副總裁Michael Gerstenhaber說,“開發人員只需要表明回答這個問題不應花費超過200毫秒的時間,”突出了戰略性產品決策。

佩恩說,在內部,人類的員工利用新型號來設計前端網站界面,創建互動遊戲,並最多進行45分鐘的編碼活動,例如建築測試集和迭代的測試案例。

Claude代碼的屏幕截圖。
克勞德代碼。人類

賓夕法尼亞州提到,擬人化可以通過導航老式的神奇寶貝視頻遊戲來評估其模型的功能,從而將模型的API映射到控制器接口。克勞德(Claude 3.5)十四行詩最初努力離開托盤鎮時,克勞德3.7成功擊敗了幾位體育館領導人。

埃隆·馬斯克(Elon Musk)最近在上週揭幕了Grok-3的揭幕,強調了AI模型競賽的迅速步伐。就目前而言,由於克勞德3.7 SONNET令人印象深刻的表現,眾人賽站在提前。它的發行暗示了一個未來,一個模型可以處理每個任務,而不是需要用於不同功能的專門工具。

相關文章
蘋果用戶可申請95百萬美元Siri隱私和解金 蘋果用戶可申請95百萬美元Siri隱私和解金 美國的蘋果設備擁有者現可申請分得95百萬美元的和解金,以解決Siri隱私問題。專屬網站為在2014年9月17日至2024年12月31日期間,因私人對話中意外啟動Siri的用戶提供資金分配。此和解源於2019年的一項集體訴訟,指控蘋果未經同意捕獲Siri聽到的對話並與第三方承包商分享以進行品質控制,違反了用戶隱私。蘋果發出道歉,承諾停止保留用戶錄音,並否認使用Siri數據進行針對性廣告的指控。202
Meta增強AI安全以先進Llama工具 Meta增強AI安全以先進Llama工具 Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。Llama Guard 4引入多模態功能,支持文字與圖像的安
NotebookLM推出頂尖出版物與專家精選筆記本 NotebookLM推出頂尖出版物與專家精選筆記本 Google正在增強其AI驅動的研究與筆記工具NotebookLM,使其成為一個全面的知識中心。週一,該公司推出了一個由知名作者、出版物、研究人員和非營利組織提供的精選筆記本集合,讓使用者能夠探索健康、旅遊、財經等多樣化主題。首批內容包括來自《經濟學人》、《大西洋月刊》、知名教授、作者,甚至莎士比亞作品的貢獻,展示NotebookLM在深入主題探索中的實際應用。Google解釋說,使用者可以存取原
評論 (0)
0/200
回到頂部
OR