Anthropic tiết lộ mô hình AI 'Lý do lai' thông minh nhất của nó

Trang chủ

Tin tức

Ngày 02 tháng 6 năm 2025

JimmyWhite

# ai # News # Tech

Anthropic vừa tiết lộ Claude 3.7 Sonnet, đánh dấu sự ra mắt của "mô hình lý luận lai" đầu tiên của nó. Mô hình đột phá này được thiết kế để giải quyết các thách thức phức tạp hơn và vượt qua các lần lặp lại trước đó khi nói đến các nhiệm vụ như toán học và mã hóa.

Để bổ sung cho sự tiến bộ này, Anthropic cũng sẽ ra mắt một "bản xem trước nghiên cứu hạn chế" của Claude Code, một công cụ mã hóa tác nhân. Mặc dù nhân chủng học đã cung cấp năng lượng cho các giải pháp mã hóa AI như con trỏ, Code Code đang được bán trên thị trường như một đối tác tương tác có khả năng tìm kiếm và đọc mã, sửa đổi các tệp, viết và chạy thử nghiệm, đẩy mã sang GitHub và sử dụng các công cụ dòng lệnh.

Claude 3.7 Sonnet sẽ có thể truy cập bắt đầu từ thứ Hai trong ứng dụng Claude và thông qua API của Anthropic, Amazon Bedrock và Google Cloud's Vertex AI. Giá cả vẫn phù hợp với người tiền nhiệm, 3,5 Sonnet, ở mức 3 triệu đô la mã thông báo đầu vào và mã thông báo đầu ra 15 đô la trên một triệu đô la.

Không giống như các đối thủ cạnh tranh như OpenAI, nơi cung cấp các mô hình lý luận riêng biệt, Anthropic nhấn mạnh việc tích hợp các khả năng lý luận trực tiếp vào chính mô hình. Là Dianne Penn, người dẫn đầu nghiên cứu sản phẩm của Anthropic, đã giải thích cho The Verge , về cơ bản, chúng tôi tin rằng lý luận là một đặc điểm của AI chứ không phải là một cái gì đó hoàn toàn riêng biệt. Chẳng hạn, Claude không nên đấu tranh nhiều với các truy vấn đơn giản như là lúc mấy giờ? Nhưng vượt trội trong việc xử lý các nhắc nhở phức tạp như lên kế hoạch cho chuyến đi hai tuần tới Ý trong khi bao thanh toán trong điều kiện thời tiết.

Thẻ mô hình mới nhất của Claude. Nhân loại
Hiệu suất kỹ thuật phần mềm của Claude. Nhân loại
Penn lưu ý rằng Claude 3.7 Sonnet cho thấy sự cải thiện rõ rệt về mã hóa tác nhân, tài chính và các vấn đề pháp lý. Mặc dù Claude chưa hỗ trợ các tìm kiếm trên web thời gian thực, một khả năng có mặt trong các mô hình khác, nhưng nó tự hào có một ngày giới hạn kiến thức vào tháng 10 năm 2024, khiến nó trở nên hiện tại hơn. Các nhà phát triển có thể ảnh hưởng đến cách mô hình hoạt động thông qua tính năng Scratchpad của nó và chỉ định thời gian phản hồi chính xác. Đôi khi, cho biết, VP sản phẩm của Anthropic, Michael Gerstenhaber, nhà phát triển chỉ cần chỉ ra rằng không nên mất nhiều thời gian hơn 200 mili giây để trả lời câu hỏi này, ông nhấn mạnh quyết định sản phẩm chiến lược.

Trong nội bộ, nhân viên nhân viên đã sử dụng mô hình mới để thiết kế giao diện trang web phía trước, tạo các trò chơi tương tác và tham gia tối đa 45 phút hoạt động mã hóa, chẳng hạn như bộ kiểm tra xây dựng và tinh chỉnh các trường hợp thử nghiệm lặp đi lặp lại, theo Penn.

Một ảnh chụp màn hình của mã Claude.
Mã Claude. Nhân loại

Penn đã đề cập rằng nhân học đánh giá khả năng của các mô hình bằng cách họ điều hướng một trò chơi video Pokémon cũ, lập bản đồ API của mô hình lên giao diện bộ điều khiển. Trong khi Claude 3.5 Sonnet đấu tranh để rời khỏi Pallet Town ban đầu, Claude 3.7 đã đánh bại thành công một số nhà lãnh đạo phòng tập thể dục.

Elon Musk ra mắt gần đây về GROK-3 tuần trước đã nhấn mạnh tốc độ nhanh chóng của cuộc thi mô hình AI. Hiện tại, nhân học đứng phía trước nhờ màn trình diễn ấn tượng của Claude 3.7 Sonnet. Phát hành của nó gợi ý về một tương lai nơi một mô hình duy nhất xử lý mọi nhiệm vụ, thay vì yêu cầu các công cụ chuyên dụng cho các chức năng khác nhau.

Bài viết liên quan

Người dùng Apple có thể yêu cầu phần chia từ khoản dàn xếp bảo mật Siri 95 triệu USD Chủ sở hữu thiết bị Apple tại Mỹ giờ đây có thể nộp đơn yêu cầu một phần từ khoản dàn xếp 95 triệu USD liên quan đến các vấn đề bảo mật của Siri. Một trang web chuyên dụng hỗ trợ phân phối quỹ cho nhữ

Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m

NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu Google đang nâng cấp công cụ nghiên cứu và ghi chú dựa trên AI, NotebookLM, để trở thành một trung tâm tri thức toàn diện. Vào thứ Hai, công ty đã giới thiệu một bộ sưu tập ghi chép được chọn lọc từ c

Nhận xét (0)

0/200

Nộp

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng