選項
首頁
新聞
人類的新AI模型運行像人類這樣的計算機,包括錯誤

人類的新AI模型運行像人類這樣的計算機,包括錯誤

2025-05-09
133

人類的新AI模型運行像人類這樣的計算機,包括錯誤

您是否曾夢想過一個能像人類一樣與電腦無縫互動的AI?現在,這個夢想已成為現實,這要歸功於Anthropic的最新創新。週二,他們推出了新一代Claude AI模型,名為Claude 3.5 Sonnet,它能以驚人的精細度操作電腦。目前處於beta模式,開發者可通過API進行實驗。

Anthropic自豪地將Claude 3.5 Sonnet標榜為「首個公開beta版提供電腦使用的邊疆AI模型」。這意味著開發者可編程讓它在電腦上執行多種任務,如查看螢幕、移動游標、點擊按鈕,甚至在虛擬鍵盤上輸入。目標是?模仿我們每天與電腦的互動方式。

雖然這個新AI仍處於實驗階段,但並非沒有問題。它有時可能有些笨拙且易出錯。但這正是Anthropic推出beta版的原因——收集開發者的寶貴反饋,隨時間完善模型。

為什麼我們應該關心AI使用電腦?

Anthropic給出了明確答案:「現代工作的絕大部分通過電腦完成。」通過讓AI以人類的方式與軟體互動,它們開啟了當前AI助手無法處理的大量新應用。

開發者和用戶如何受益?

Anthropic並非為每個任務創建特定工具,而是教導Claude通用的電腦技能。這讓AI能使用為人類設計的各種標準軟體程式。開發者可利用這一能力自動化重複任務、構建和測試軟體,甚至進行研究。

多家公司已開始利用Claude 3.5 Sonnet的電腦技能,包括Asana、Canva、Cognition、DoorDash、Replit和The Browser Company。例如,Replit正使用這些能力增強其Replit Agent產品。

他們如何訓練Claude使用電腦?

據Anthropic表示,訓練Claude操作電腦涉及大量試錯。這個過程需要AI理解並解釋電腦螢幕的圖像,然後根據看到的內容決定採取哪些行動。Claude 3.5 Sonnet通過分析螢幕截圖、計算像素以精確移動游標並發出滑鼠指令來實現這一點。

Claude的表現如何?

在OSWorld基準測試中,評估AI模型使用電腦的能力,Claude 3.5 Sonnet獲得14.9%的分數。雖然這遠低於人類70%-75%的表現,但幾乎是同類別中次佳AI模型7.7%的兩倍。

儘管有這些令人振奮的結果,Claude的電腦使用仍處於初級階段。它尚無法執行更複雜的任務,如拖動視窗或放大螢幕。此外,由於依賴螢幕截圖,它可能會錯過某些動作和通知。

Anthropic保持樂觀,聲明:「我們預期電腦使用將迅速改進,變得更快、更可靠且對用戶想完成的任務更有用。」他們還強調,隨著技術進步,它將對軟體開發經驗較少的人更易用,同時保持嚴格的安全措施。

Claude 3.5 Sonnet現已對所有人開放。開發者可通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI開始構建應用程式,體驗電腦使用beta版。

相關文章
Nvidia 公布第二季營收的 39% 來自兩大客戶 Nvidia 公布第二季營收的 39% 來自兩大客戶 Nvidia 的營收集中度突顯 AI 蓬勃發展的依賴性這家晶片製造商最近向美國證券交易委員會(SEC)提交的文件顯示了驚人的客戶集中度,在 Nvidia 創紀錄的 467 億美元第二季營收中,兩家未具名客戶就佔了 39%,在 AI 基礎設施需求激增的推動下,年增幅達 56%。根據監管文件:單一客戶(「客戶 A」)貢獻了季度總營收的 23另一位買家 (「客戶 B」) 佔第二季銷售額的 16另外四位直
AI 商業計劃生成器:快速建立您的致勝策略 AI 商業計劃生成器:快速建立您的致勝策略 當 AI 解決方案能在數分鐘內提供專業品質的策略文件時,現代企業家已經無法再花費數週的時間來撰寫業務計劃。透過智慧型平台分析資料、識別機會,並比傳統方法更快速地產生可執行的計劃,商業規劃的面貌已大幅改變。本指南將探討人工智慧如何消除專業商業策略發展的障礙,讓初創公司和成熟公司都能進行精密的規劃。主要優勢閃電式快速轉換:人工智慧可在 15 分鐘內制定出適合投資人的商業計畫。Partita IVA 平
漫威延遲《復仇者聯盟》下兩部電影,調整第六階段上映時間表 漫威延遲《復仇者聯盟》下兩部電影,調整第六階段上映時間表 Marvel Studios 宣佈即將上映的《復仇者聯盟》系列電影在時間表上有重大變更。業界刊物The Hollywood Reporter透露《復仇者聯盟》將於 2026年12 月 18日上映,而非原定的 2026 年 5 月 1 日:末日危機》將於 2026 年 12 月 18 日上映,而非原定的 2026 年 5 月 1 日。其續集《復仇者聯盟:秘密戰爭》(Avengers:Secret W
評論 (5)
0/200
WalterBaker
WalterBaker 2025-08-28 01:01:33

Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!

JackWilson
JackWilson 2025-08-04 14:01:00

This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

JackMitchell
JackMitchell 2025-07-31 09:42:05

Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!

JohnNelson
JohnNelson 2025-07-29 20:25:16

Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!

JuanLewis
JuanLewis 2025-07-28 09:19:30

This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!

回到頂部
OR