Mô hình AI mới của Anthropic vận hành các máy tính như con người, bao gồm các lỗi

Bạn đã bao giờ mơ ước về một AI có thể tương tác liền mạch với máy tính của bạn, giống như một con người? Chà, giấc mơ đó giờ đây đã trở thành hiện thực, nhờ vào sự đổi mới mới nhất của Anthropic. Vào thứ Ba, họ đã công bố thế hệ mới của mô hình AI Claude, được đặt tên là Claude 3.5 Sonnet, có khả năng vận hành máy tính với sự khéo léo đáng ngạc nhiên. Hiện đang ở chế độ beta, AI này đã có sẵn để các nhà phát triển thử nghiệm thông qua API.
Anthropic tự hào gọi Claude 3.5 Sonnet là “mô hình AI tiên phong đầu tiên cung cấp khả năng sử dụng máy tính trong giai đoạn beta công khai.” Điều này có nghĩa là các nhà phát triển có thể lập trình nó để thực hiện nhiều nhiệm vụ khác nhau trên máy tính, chẳng hạn như xem màn hình, điều khiển con trỏ, nhấp vào các nút, và thậm chí gõ trên bàn phím ảo. Mục tiêu? Tái tạo cách chúng ta tương tác với máy tính hàng ngày.
Giờ đây, mặc dù AI mới này vẫn đang trong giai đoạn thử nghiệm, nó không phải là không có sai sót. Đôi khi nó có thể hơi vụng về và dễ xảy ra lỗi. Nhưng đó chính xác là lý do tại sao Anthropic phát hành nó ở phiên bản beta—để thu thập phản hồi quý giá từ các nhà phát triển và cải thiện mô hình theo thời gian.
Tại sao chúng ta nên quan tâm đến AI sử dụng máy tính?
Anthropic có câu trả lời rõ ràng cho câu hỏi đó: “Một lượng lớn công việc hiện đại diễn ra thông qua máy tính.” Bằng cách cho phép AI tương tác với phần mềm theo cách con người làm, họ mở ra vô số ứng dụng mới mà các trợ lý AI hiện tại không thể thực hiện.
Làm thế nào để các nhà phát triển và người dùng được lợi?
Thay vì tạo ra các công cụ cụ thể cho từng nhiệm vụ, Anthropic đang dạy Claude các kỹ năng máy tính chung. Điều này cho phép AI sử dụng một loạt các chương trình phần mềm tiêu chuẩn được thiết kế cho con người. Các nhà phát triển có thể khai thác khả năng này để tự động hóa các nhiệm vụ lặp đi lặp lại, xây dựng và thử nghiệm phần mềm, và thậm chí tiến hành nghiên cứu.
Một số công ty đã tận dụng kỹ năng máy tính của Claude 3.5 Sonnet, bao gồm Asana, Canva, Cognition, DoorDash, Replit, và The Browser Company. Chẳng hạn, Replit đang sử dụng những khả năng này để nâng cấp sản phẩm Replit Agent của mình.
Làm thế nào họ huấn luyện Claude để sử dụng máy tính?
Theo Anthropic, việc huấn luyện Claude để điều hướng máy tính đòi hỏi rất nhiều thử và sai. Quá trình này yêu cầu AI hiểu và diễn giải hình ảnh của màn hình máy tính, sau đó quyết định hành động nào cần thực hiện dựa trên những gì nó thấy. Claude 3.5 Sonnet thực hiện điều này bằng cách phân tích ảnh chụp màn hình, đếm pixel để di chuyển con trỏ một cách chính xác, và đưa ra các lệnh chuột.
Claude hoạt động tốt như thế nào?
Trong các bài kiểm tra đánh giá OSWorld, nhằm đo lường khả năng sử dụng máy tính của các mô hình AI, Claude 3.5 Sonnet đạt điểm số 14,9%. Mặc dù con số này thấp hơn nhiều so với mức hiệu suất 70%-75% của con người, nhưng nó gần gấp đôi điểm số 7,7% của mô hình AI tốt thứ hai trong cùng danh mục.
Bất chấp những kết quả đầy hứa hẹn này, khả năng sử dụng máy tính của Claude vẫn đang ở giai đoạn sơ khai. Nó chưa thể thực hiện các nhiệm vụ phức tạp hơn như kéo cửa sổ hoặc phóng to màn hình. Ngoài ra, vì dựa vào ảnh chụp màn hình, nó có thể bỏ sót một số hành động và thông báo.
Anthropic vẫn lạc quan, tuyên bố: “Chúng tôi hy vọng rằng việc sử dụng máy tính sẽ nhanh chóng cải thiện để trở nên nhanh hơn, đáng tin cậy hơn và hữu ích hơn cho các nhiệm vụ mà người dùng của chúng tôi muốn hoàn thành.” Họ cũng nhấn mạnh rằng khi công nghệ phát triển, nó sẽ trở nên dễ tiếp cận hơn với những người có ít kinh nghiệm phát triển phần mềm, đồng thời duy trì các biện pháp an toàn nghiêm ngặt.
Claude 3.5 Sonnet hiện đã có thể truy cập cho mọi người. Các nhà phát triển có thể bắt đầu xây dựng ứng dụng với phiên bản beta sử dụng máy tính trên Anthropic API, Amazon Bedrock, và Google Cloud’s Vertex AI.
Bài viết liên quan
Nhà Máy Truyện Tranh AI: Cách Mạng Hóa Giáo Dục với Các Công Cụ AI Sáng Tạo
Trong bối cảnh giáo dục năng động ngày nay, các nhà giáo dục không ngừng khám phá những cách sáng tạo để thu hút học sinh và khơi dậy sự sáng tạo. Việc tích hợp Trí tuệ Nhân tạo (AI) vào giáo dục mang
AI驱动的美甲沙龙效率:提升运营和增长
Trong thế giới kinh doanh năng động, tối ưu hóa hoạt động và nâng cao sự hài lòng của khách hàng là chìa khóa dẫn đến thành công. Các tiệm nail, như Tamashi Nail Salon, đang chuyển sang các giải pháp
Tạo Bài Hát Trẻ Em Bằng AI Để Kiếm Lợi Nhuận Năm 2025
Vào năm 2025, trí tuệ nhân tạo đang biến đổi ngành giải trí trẻ em. Việc sản xuất bài hát trẻ em do AI tạo ra không chỉ là một ý tưởng tiên tiến; mà còn là một cơ hội thực tiễn để tạo ra doanh thu. Hư
Nhận xét (4)
0/200
JackWilson
13:01:00 GMT+07:00 Ngày 04 tháng 8 năm 2025
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.
0
JackMitchell
08:42:05 GMT+07:00 Ngày 31 tháng 7 năm 2025
Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!
0
JohnNelson
19:25:16 GMT+07:00 Ngày 29 tháng 7 năm 2025
Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!
0
JuanLewis
08:19:30 GMT+07:00 Ngày 28 tháng 7 năm 2025
This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!
0
Bạn đã bao giờ mơ ước về một AI có thể tương tác liền mạch với máy tính của bạn, giống như một con người? Chà, giấc mơ đó giờ đây đã trở thành hiện thực, nhờ vào sự đổi mới mới nhất của Anthropic. Vào thứ Ba, họ đã công bố thế hệ mới của mô hình AI Claude, được đặt tên là Claude 3.5 Sonnet, có khả năng vận hành máy tính với sự khéo léo đáng ngạc nhiên. Hiện đang ở chế độ beta, AI này đã có sẵn để các nhà phát triển thử nghiệm thông qua API.
Anthropic tự hào gọi Claude 3.5 Sonnet là “mô hình AI tiên phong đầu tiên cung cấp khả năng sử dụng máy tính trong giai đoạn beta công khai.” Điều này có nghĩa là các nhà phát triển có thể lập trình nó để thực hiện nhiều nhiệm vụ khác nhau trên máy tính, chẳng hạn như xem màn hình, điều khiển con trỏ, nhấp vào các nút, và thậm chí gõ trên bàn phím ảo. Mục tiêu? Tái tạo cách chúng ta tương tác với máy tính hàng ngày.
Giờ đây, mặc dù AI mới này vẫn đang trong giai đoạn thử nghiệm, nó không phải là không có sai sót. Đôi khi nó có thể hơi vụng về và dễ xảy ra lỗi. Nhưng đó chính xác là lý do tại sao Anthropic phát hành nó ở phiên bản beta—để thu thập phản hồi quý giá từ các nhà phát triển và cải thiện mô hình theo thời gian.
Tại sao chúng ta nên quan tâm đến AI sử dụng máy tính?
Anthropic có câu trả lời rõ ràng cho câu hỏi đó: “Một lượng lớn công việc hiện đại diễn ra thông qua máy tính.” Bằng cách cho phép AI tương tác với phần mềm theo cách con người làm, họ mở ra vô số ứng dụng mới mà các trợ lý AI hiện tại không thể thực hiện.
Làm thế nào để các nhà phát triển và người dùng được lợi?
Thay vì tạo ra các công cụ cụ thể cho từng nhiệm vụ, Anthropic đang dạy Claude các kỹ năng máy tính chung. Điều này cho phép AI sử dụng một loạt các chương trình phần mềm tiêu chuẩn được thiết kế cho con người. Các nhà phát triển có thể khai thác khả năng này để tự động hóa các nhiệm vụ lặp đi lặp lại, xây dựng và thử nghiệm phần mềm, và thậm chí tiến hành nghiên cứu.
Một số công ty đã tận dụng kỹ năng máy tính của Claude 3.5 Sonnet, bao gồm Asana, Canva, Cognition, DoorDash, Replit, và The Browser Company. Chẳng hạn, Replit đang sử dụng những khả năng này để nâng cấp sản phẩm Replit Agent của mình.
Làm thế nào họ huấn luyện Claude để sử dụng máy tính?
Theo Anthropic, việc huấn luyện Claude để điều hướng máy tính đòi hỏi rất nhiều thử và sai. Quá trình này yêu cầu AI hiểu và diễn giải hình ảnh của màn hình máy tính, sau đó quyết định hành động nào cần thực hiện dựa trên những gì nó thấy. Claude 3.5 Sonnet thực hiện điều này bằng cách phân tích ảnh chụp màn hình, đếm pixel để di chuyển con trỏ một cách chính xác, và đưa ra các lệnh chuột.
Claude hoạt động tốt như thế nào?
Trong các bài kiểm tra đánh giá OSWorld, nhằm đo lường khả năng sử dụng máy tính của các mô hình AI, Claude 3.5 Sonnet đạt điểm số 14,9%. Mặc dù con số này thấp hơn nhiều so với mức hiệu suất 70%-75% của con người, nhưng nó gần gấp đôi điểm số 7,7% của mô hình AI tốt thứ hai trong cùng danh mục.
Bất chấp những kết quả đầy hứa hẹn này, khả năng sử dụng máy tính của Claude vẫn đang ở giai đoạn sơ khai. Nó chưa thể thực hiện các nhiệm vụ phức tạp hơn như kéo cửa sổ hoặc phóng to màn hình. Ngoài ra, vì dựa vào ảnh chụp màn hình, nó có thể bỏ sót một số hành động và thông báo.
Anthropic vẫn lạc quan, tuyên bố: “Chúng tôi hy vọng rằng việc sử dụng máy tính sẽ nhanh chóng cải thiện để trở nên nhanh hơn, đáng tin cậy hơn và hữu ích hơn cho các nhiệm vụ mà người dùng của chúng tôi muốn hoàn thành.” Họ cũng nhấn mạnh rằng khi công nghệ phát triển, nó sẽ trở nên dễ tiếp cận hơn với những người có ít kinh nghiệm phát triển phần mềm, đồng thời duy trì các biện pháp an toàn nghiêm ngặt.
Claude 3.5 Sonnet hiện đã có thể truy cập cho mọi người. Các nhà phát triển có thể bắt đầu xây dựng ứng dụng với phiên bản beta sử dụng máy tính trên Anthropic API, Amazon Bedrock, và Google Cloud’s Vertex AI.




This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.




Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!




Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!




This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!












