人類揭示其最聰明的“混合推理” AI模型
Anthropic剛剛宣布了Claude 3.7十四行詩,標誌著其第一個“混合推理模型”的首次亮相。這種開創性的模型旨在應對更複雜的挑戰,並在數學和編碼等任務上超越早期的迭代。
為了補充這一進步,Anthropic還啟動了Claude Code(代理編碼工具)的“有限的研究預覽”。雖然人類已經為光標等人AI編碼解決方案提供了動力,但Claude代碼被銷售為一個交互式合作夥伴,能夠搜索和讀取代碼,修改文件,編寫和運行測試,將代碼推向GitHub以及使用命令行工具。
Claude 3.7十四行詩將從周一的Claude應用程序開始,並通過Anthropic的API,Amazon Bedrock和Google Cloud的Vertex AI訪問。定價與其前身3.5十四行詩保持一致,每百萬美元投入令牌和每百萬美元產出代幣15美元。
與諸如OpenAI這樣的競爭對手(提供不同的推理模型)不同,人類強調將推理能力直接整合到模型本身中。正如擬人化產品研究負責人戴安娜·佩恩(Dianne Penn)在《邊緣》中解釋的那樣:“我們從根本上認為推理是AI的特徵,而不是完全分開的東西。”例如,克勞德(Claude)不應該在直接的查詢中掙扎太多,例如“現在幾點?”但是在處理複雜的提示中,擅長於計劃在天氣條件下進行兩週的意大利旅行。
人類
人類
賓夕法尼亞州指出,克勞德3.7十四行詩在代理編碼,財務和法律事務方面表現出明顯改善。儘管克勞德(Claude)尚未支持實時網絡搜索(其他模型中存在的功能),但它擁有2024年10月的知識截止日期,使其更加最新。開發人員可以通過其SCRATCHPAD功能來影響模型的運作方式,並指定確切的響應時間。 “有時候,” Anthropic的產品副總裁Michael Gerstenhaber說,“開發人員只需要表明回答這個問題不應花費超過200毫秒的時間,”突出了戰略性產品決策。
佩恩說,在內部,人類的員工利用新型號來設計前端網站界面,創建互動遊戲,並最多進行45分鐘的編碼活動,例如建築測試集和迭代的測試案例。

克勞德代碼。人類
賓夕法尼亞州提到,擬人化可以通過導航老式的神奇寶貝視頻遊戲來評估其模型的功能,從而將模型的API映射到控制器接口。克勞德(Claude 3.5)十四行詩最初努力離開托盤鎮時,克勞德3.7成功擊敗了幾位體育館領導人。
埃隆·馬斯克(Elon Musk)最近在上週揭幕了Grok-3的揭幕,強調了AI模型競賽的迅速步伐。就目前而言,由於克勞德3.7 SONNET令人印象深刻的表現,眾人賽站在提前。它的發行暗示了一個未來,一個模型可以處理每個任務,而不是需要用於不同功能的專門工具。
相關文章
Billionaires Discuss Automating Jobs Away in This Week's AI Update
Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
YouTube’s TV changes include a redesign and more multiview
YouTube Expands Multiview Beyond Sports—Here’s What’s ComingLove the idea of watching multiple streams at once but wish it wasn’t just for March Madness or NFL Sunday Ticket? Good
Google Rejects Offering Publishers More Options to Opt Out of AI Search
Google's Internal Documents Reveal Publisher Control ControversyAccording to a recently disclosed internal document obtained by Bloomberg, Google considered allowing publishers more granular control over how their content is utilized in AI-driven search features. The document, authored by Google Sea
評論 (0)
0/200
Anthropic剛剛宣布了Claude 3.7十四行詩,標誌著其第一個“混合推理模型”的首次亮相。這種開創性的模型旨在應對更複雜的挑戰,並在數學和編碼等任務上超越早期的迭代。
為了補充這一進步,Anthropic還啟動了Claude Code(代理編碼工具)的“有限的研究預覽”。雖然人類已經為光標等人AI編碼解決方案提供了動力,但Claude代碼被銷售為一個交互式合作夥伴,能夠搜索和讀取代碼,修改文件,編寫和運行測試,將代碼推向GitHub以及使用命令行工具。
Claude 3.7十四行詩將從周一的Claude應用程序開始,並通過Anthropic的API,Amazon Bedrock和Google Cloud的Vertex AI訪問。定價與其前身3.5十四行詩保持一致,每百萬美元投入令牌和每百萬美元產出代幣15美元。
與諸如OpenAI這樣的競爭對手(提供不同的推理模型)不同,人類強調將推理能力直接整合到模型本身中。正如擬人化產品研究負責人戴安娜·佩恩(Dianne Penn)在《邊緣》中解釋的那樣:“我們從根本上認為推理是AI的特徵,而不是完全分開的東西。”例如,克勞德(Claude)不應該在直接的查詢中掙扎太多,例如“現在幾點?”但是在處理複雜的提示中,擅長於計劃在天氣條件下進行兩週的意大利旅行。
人類
人類
賓夕法尼亞州指出,克勞德3.7十四行詩在代理編碼,財務和法律事務方面表現出明顯改善。儘管克勞德(Claude)尚未支持實時網絡搜索(其他模型中存在的功能),但它擁有2024年10月的知識截止日期,使其更加最新。開發人員可以通過其SCRATCHPAD功能來影響模型的運作方式,並指定確切的響應時間。 “有時候,” Anthropic的產品副總裁Michael Gerstenhaber說,“開發人員只需要表明回答這個問題不應花費超過200毫秒的時間,”突出了戰略性產品決策。
佩恩說,在內部,人類的員工利用新型號來設計前端網站界面,創建互動遊戲,並最多進行45分鐘的編碼活動,例如建築測試集和迭代的測試案例。
克勞德代碼。人類
賓夕法尼亞州提到,擬人化可以通過導航老式的神奇寶貝視頻遊戲來評估其模型的功能,從而將模型的API映射到控制器接口。克勞德(Claude 3.5)十四行詩最初努力離開托盤鎮時,克勞德3.7成功擊敗了幾位體育館領導人。
埃隆·馬斯克(Elon Musk)最近在上週揭幕了Grok-3的揭幕,強調了AI模型競賽的迅速步伐。就目前而言,由於克勞德3.7 SONNET令人印象深刻的表現,眾人賽站在提前。它的發行暗示了一個未來,一個模型可以處理每個任務,而不是需要用於不同功能的專門工具。












