人類的新AI模型運行像人類這樣的計算機,包括錯誤

您是否曾夢想過一個能像人類一樣與電腦無縫互動的AI?現在,這個夢想已成為現實,這要歸功於Anthropic的最新創新。週二,他們推出了新一代Claude AI模型,名為Claude 3.5 Sonnet,它能以驚人的精細度操作電腦。目前處於beta模式,開發者可通過API進行實驗。
Anthropic自豪地將Claude 3.5 Sonnet標榜為「首個公開beta版提供電腦使用的邊疆AI模型」。這意味著開發者可編程讓它在電腦上執行多種任務,如查看螢幕、移動游標、點擊按鈕,甚至在虛擬鍵盤上輸入。目標是?模仿我們每天與電腦的互動方式。
雖然這個新AI仍處於實驗階段,但並非沒有問題。它有時可能有些笨拙且易出錯。但這正是Anthropic推出beta版的原因——收集開發者的寶貴反饋,隨時間完善模型。
為什麼我們應該關心AI使用電腦?
Anthropic給出了明確答案:「現代工作的絕大部分通過電腦完成。」通過讓AI以人類的方式與軟體互動,它們開啟了當前AI助手無法處理的大量新應用。
開發者和用戶如何受益?
Anthropic並非為每個任務創建特定工具,而是教導Claude通用的電腦技能。這讓AI能使用為人類設計的各種標準軟體程式。開發者可利用這一能力自動化重複任務、構建和測試軟體,甚至進行研究。
多家公司已開始利用Claude 3.5 Sonnet的電腦技能,包括Asana、Canva、Cognition、DoorDash、Replit和The Browser Company。例如,Replit正使用這些能力增強其Replit Agent產品。
他們如何訓練Claude使用電腦?
據Anthropic表示,訓練Claude操作電腦涉及大量試錯。這個過程需要AI理解並解釋電腦螢幕的圖像,然後根據看到的內容決定採取哪些行動。Claude 3.5 Sonnet通過分析螢幕截圖、計算像素以精確移動游標並發出滑鼠指令來實現這一點。
Claude的表現如何?
在OSWorld基準測試中,評估AI模型使用電腦的能力,Claude 3.5 Sonnet獲得14.9%的分數。雖然這遠低於人類70%-75%的表現,但幾乎是同類別中次佳AI模型7.7%的兩倍。
儘管有這些令人振奮的結果,Claude的電腦使用仍處於初級階段。它尚無法執行更複雜的任務,如拖動視窗或放大螢幕。此外,由於依賴螢幕截圖,它可能會錯過某些動作和通知。
Anthropic保持樂觀,聲明:「我們預期電腦使用將迅速改進,變得更快、更可靠且對用戶想完成的任務更有用。」他們還強調,隨著技術進步,它將對軟體開發經驗較少的人更易用,同時保持嚴格的安全措施。
Claude 3.5 Sonnet現已對所有人開放。開發者可通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI開始構建應用程式,體驗電腦使用beta版。
相關文章
AI驅動的音樂創作:探索布蘭妮·斯皮爾斯與麥可·傑克森的《Circus》
音樂產業正在經歷一場變革性的轉變,人工智慧(AI)推動了音樂創作的創新。從製作人聲到創作完整曲目,AI正在重新定義藝術可能性。本篇部落格透過創意的視角探索AI生成的音樂,聚焦於一個以布蘭妮·斯皮爾斯和AI重新想像的麥可·傑克森為特色的獨特項目。我們將深入探討這項技術的潛力、挑戰以及它引發的倫理問題,全部圍繞著一首引人入勝、充滿想像力的曲目。主要亮點AI透過生成人聲和完整曲目,正在革新音樂創作。一段
AI Comic Factory:以創意AI工具革新教育
在當今動態的教育環境中,教育工作者不斷探索創新的方式來吸引學生並激發創造力。將人工智慧(AI)融入教育為豐富學習體驗提供了變革性的機會。AI Comic Factory,搭載ChatGPT和先進AI工具,提供了一種引人入勝、互動性強且高度個人化的教育方式。本文探討了這一計畫如何重新定義學習、培養創造力,並為學生準備AI驅動的未來。主要亮點AI Comic Factory利用ChatGPT創作漫畫敘
AI驅動的美甲沙龍效率:提升運營與成長
在充滿活力的商業世界中,優化運營和提升客戶滿意度是成功的關鍵。像Tamashi美甲沙龍這樣的沙龍正轉向創新解決方案,以提高效率、降低成本並改善客戶體驗。人工智能(AI)提供了變革性的工具來應對這些挑戰,從自動化排程到提供全天候客戶支持。本文深入探討AI如何簡化運營、提高生產力並推動Tamashi美甲沙龍的成長。關鍵要點AI簡化美甲沙龍的排程。AI聊天機器人提供全天候客戶支持。AI通過自動提醒減少錯
評論 (4)
0/200
JackWilson
2025-08-04 14:01:00
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.
0
JackMitchell
2025-07-31 09:42:05
Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!
0
JohnNelson
2025-07-29 20:25:16
Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!
0
JuanLewis
2025-07-28 09:19:30
This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!
0
您是否曾夢想過一個能像人類一樣與電腦無縫互動的AI?現在,這個夢想已成為現實,這要歸功於Anthropic的最新創新。週二,他們推出了新一代Claude AI模型,名為Claude 3.5 Sonnet,它能以驚人的精細度操作電腦。目前處於beta模式,開發者可通過API進行實驗。
Anthropic自豪地將Claude 3.5 Sonnet標榜為「首個公開beta版提供電腦使用的邊疆AI模型」。這意味著開發者可編程讓它在電腦上執行多種任務,如查看螢幕、移動游標、點擊按鈕,甚至在虛擬鍵盤上輸入。目標是?模仿我們每天與電腦的互動方式。
雖然這個新AI仍處於實驗階段,但並非沒有問題。它有時可能有些笨拙且易出錯。但這正是Anthropic推出beta版的原因——收集開發者的寶貴反饋,隨時間完善模型。
為什麼我們應該關心AI使用電腦?
Anthropic給出了明確答案:「現代工作的絕大部分通過電腦完成。」通過讓AI以人類的方式與軟體互動,它們開啟了當前AI助手無法處理的大量新應用。
開發者和用戶如何受益?
Anthropic並非為每個任務創建特定工具,而是教導Claude通用的電腦技能。這讓AI能使用為人類設計的各種標準軟體程式。開發者可利用這一能力自動化重複任務、構建和測試軟體,甚至進行研究。
多家公司已開始利用Claude 3.5 Sonnet的電腦技能,包括Asana、Canva、Cognition、DoorDash、Replit和The Browser Company。例如,Replit正使用這些能力增強其Replit Agent產品。
他們如何訓練Claude使用電腦?
據Anthropic表示,訓練Claude操作電腦涉及大量試錯。這個過程需要AI理解並解釋電腦螢幕的圖像,然後根據看到的內容決定採取哪些行動。Claude 3.5 Sonnet通過分析螢幕截圖、計算像素以精確移動游標並發出滑鼠指令來實現這一點。
Claude的表現如何?
在OSWorld基準測試中,評估AI模型使用電腦的能力,Claude 3.5 Sonnet獲得14.9%的分數。雖然這遠低於人類70%-75%的表現,但幾乎是同類別中次佳AI模型7.7%的兩倍。
儘管有這些令人振奮的結果,Claude的電腦使用仍處於初級階段。它尚無法執行更複雜的任務,如拖動視窗或放大螢幕。此外,由於依賴螢幕截圖,它可能會錯過某些動作和通知。
Anthropic保持樂觀,聲明:「我們預期電腦使用將迅速改進,變得更快、更可靠且對用戶想完成的任務更有用。」他們還強調,隨著技術進步,它將對軟體開發經驗較少的人更易用,同時保持嚴格的安全措施。
Claude 3.5 Sonnet現已對所有人開放。開發者可通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI開始構建應用程式,體驗電腦使用beta版。




This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.




Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!




Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!




This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!












