Anthropic tiết lộ mô hình AI 'Lý do lai' thông minh nhất của nó
Anthropic vừa tiết lộ Claude 3.7 Sonnet, đánh dấu sự ra mắt của "mô hình lý luận lai" đầu tiên của nó. Mô hình đột phá này được thiết kế để giải quyết các thách thức phức tạp hơn và vượt qua các lần lặp lại trước đó khi nói đến các nhiệm vụ như toán học và mã hóa.
Để bổ sung cho sự tiến bộ này, Anthropic cũng sẽ ra mắt một "bản xem trước nghiên cứu hạn chế" của Claude Code, một công cụ mã hóa tác nhân. Mặc dù nhân chủng học đã cung cấp năng lượng cho các giải pháp mã hóa AI như con trỏ, Code Code đang được bán trên thị trường như một đối tác tương tác có khả năng tìm kiếm và đọc mã, sửa đổi các tệp, viết và chạy thử nghiệm, đẩy mã sang GitHub và sử dụng các công cụ dòng lệnh.
Claude 3.7 Sonnet sẽ có thể truy cập bắt đầu từ thứ Hai trong ứng dụng Claude và thông qua API của Anthropic, Amazon Bedrock và Google Cloud's Vertex AI. Giá cả vẫn phù hợp với người tiền nhiệm, 3,5 Sonnet, ở mức 3 triệu đô la mã thông báo đầu vào và mã thông báo đầu ra 15 đô la trên một triệu đô la.
Không giống như các đối thủ cạnh tranh như OpenAI, nơi cung cấp các mô hình lý luận riêng biệt, Anthropic nhấn mạnh việc tích hợp các khả năng lý luận trực tiếp vào chính mô hình. Là Dianne Penn, người dẫn đầu nghiên cứu sản phẩm của Anthropic, đã giải thích cho The Verge , về cơ bản, chúng tôi tin rằng lý luận là một đặc điểm của AI chứ không phải là một cái gì đó hoàn toàn riêng biệt. Chẳng hạn, Claude không nên đấu tranh nhiều với các truy vấn đơn giản như là lúc mấy giờ? Nhưng vượt trội trong việc xử lý các nhắc nhở phức tạp như lên kế hoạch cho chuyến đi hai tuần tới Ý trong khi bao thanh toán trong điều kiện thời tiết.
Nhân loại
Nhân loại
Penn lưu ý rằng Claude 3.7 Sonnet cho thấy sự cải thiện rõ rệt về mã hóa tác nhân, tài chính và các vấn đề pháp lý. Mặc dù Claude chưa hỗ trợ các tìm kiếm trên web thời gian thực, một khả năng có mặt trong các mô hình khác, nhưng nó tự hào có một ngày giới hạn kiến thức vào tháng 10 năm 2024, khiến nó trở nên hiện tại hơn. Các nhà phát triển có thể ảnh hưởng đến cách mô hình hoạt động thông qua tính năng Scratchpad của nó và chỉ định thời gian phản hồi chính xác. Đôi khi, cho biết, VP sản phẩm của Anthropic, Michael Gerstenhaber, nhà phát triển chỉ cần chỉ ra rằng không nên mất nhiều thời gian hơn 200 mili giây để trả lời câu hỏi này, ông nhấn mạnh quyết định sản phẩm chiến lược.
Trong nội bộ, nhân viên nhân viên đã sử dụng mô hình mới để thiết kế giao diện trang web phía trước, tạo các trò chơi tương tác và tham gia tối đa 45 phút hoạt động mã hóa, chẳng hạn như bộ kiểm tra xây dựng và tinh chỉnh các trường hợp thử nghiệm lặp đi lặp lại, theo Penn.

Mã Claude. Nhân loại
Penn đã đề cập rằng nhân học đánh giá khả năng của các mô hình bằng cách họ điều hướng một trò chơi video Pokémon cũ, lập bản đồ API của mô hình lên giao diện bộ điều khiển. Trong khi Claude 3.5 Sonnet đấu tranh để rời khỏi Pallet Town ban đầu, Claude 3.7 đã đánh bại thành công một số nhà lãnh đạo phòng tập thể dục.
Elon Musk ra mắt gần đây về GROK-3 tuần trước đã nhấn mạnh tốc độ nhanh chóng của cuộc thi mô hình AI. Hiện tại, nhân học đứng phía trước nhờ màn trình diễn ấn tượng của Claude 3.7 Sonnet. Phát hành của nó gợi ý về một tương lai nơi một mô hình duy nhất xử lý mọi nhiệm vụ, thay vì yêu cầu các công cụ chuyên dụng cho các chức năng khác nhau.
Bài viết liên quan
Billionaires Discuss Automating Jobs Away in This Week's AI Update
Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
YouTube’s TV changes include a redesign and more multiview
YouTube Expands Multiview Beyond Sports—Here’s What’s ComingLove the idea of watching multiple streams at once but wish it wasn’t just for March Madness or NFL Sunday Ticket? Good
Google Rejects Offering Publishers More Options to Opt Out of AI Search
Google's Internal Documents Reveal Publisher Control ControversyAccording to a recently disclosed internal document obtained by Bloomberg, Google considered allowing publishers more granular control over how their content is utilized in AI-driven search features. The document, authored by Google Sea
Nhận xét (0)
0/200
Anthropic vừa tiết lộ Claude 3.7 Sonnet, đánh dấu sự ra mắt của "mô hình lý luận lai" đầu tiên của nó. Mô hình đột phá này được thiết kế để giải quyết các thách thức phức tạp hơn và vượt qua các lần lặp lại trước đó khi nói đến các nhiệm vụ như toán học và mã hóa.
Để bổ sung cho sự tiến bộ này, Anthropic cũng sẽ ra mắt một "bản xem trước nghiên cứu hạn chế" của Claude Code, một công cụ mã hóa tác nhân. Mặc dù nhân chủng học đã cung cấp năng lượng cho các giải pháp mã hóa AI như con trỏ, Code Code đang được bán trên thị trường như một đối tác tương tác có khả năng tìm kiếm và đọc mã, sửa đổi các tệp, viết và chạy thử nghiệm, đẩy mã sang GitHub và sử dụng các công cụ dòng lệnh.
Claude 3.7 Sonnet sẽ có thể truy cập bắt đầu từ thứ Hai trong ứng dụng Claude và thông qua API của Anthropic, Amazon Bedrock và Google Cloud's Vertex AI. Giá cả vẫn phù hợp với người tiền nhiệm, 3,5 Sonnet, ở mức 3 triệu đô la mã thông báo đầu vào và mã thông báo đầu ra 15 đô la trên một triệu đô la.
Không giống như các đối thủ cạnh tranh như OpenAI, nơi cung cấp các mô hình lý luận riêng biệt, Anthropic nhấn mạnh việc tích hợp các khả năng lý luận trực tiếp vào chính mô hình. Là Dianne Penn, người dẫn đầu nghiên cứu sản phẩm của Anthropic, đã giải thích cho The Verge , về cơ bản, chúng tôi tin rằng lý luận là một đặc điểm của AI chứ không phải là một cái gì đó hoàn toàn riêng biệt. Chẳng hạn, Claude không nên đấu tranh nhiều với các truy vấn đơn giản như là lúc mấy giờ? Nhưng vượt trội trong việc xử lý các nhắc nhở phức tạp như lên kế hoạch cho chuyến đi hai tuần tới Ý trong khi bao thanh toán trong điều kiện thời tiết.
Nhân loại
Nhân loại
Penn lưu ý rằng Claude 3.7 Sonnet cho thấy sự cải thiện rõ rệt về mã hóa tác nhân, tài chính và các vấn đề pháp lý. Mặc dù Claude chưa hỗ trợ các tìm kiếm trên web thời gian thực, một khả năng có mặt trong các mô hình khác, nhưng nó tự hào có một ngày giới hạn kiến thức vào tháng 10 năm 2024, khiến nó trở nên hiện tại hơn. Các nhà phát triển có thể ảnh hưởng đến cách mô hình hoạt động thông qua tính năng Scratchpad của nó và chỉ định thời gian phản hồi chính xác. Đôi khi, cho biết, VP sản phẩm của Anthropic, Michael Gerstenhaber, nhà phát triển chỉ cần chỉ ra rằng không nên mất nhiều thời gian hơn 200 mili giây để trả lời câu hỏi này, ông nhấn mạnh quyết định sản phẩm chiến lược.
Trong nội bộ, nhân viên nhân viên đã sử dụng mô hình mới để thiết kế giao diện trang web phía trước, tạo các trò chơi tương tác và tham gia tối đa 45 phút hoạt động mã hóa, chẳng hạn như bộ kiểm tra xây dựng và tinh chỉnh các trường hợp thử nghiệm lặp đi lặp lại, theo Penn.
Mã Claude. Nhân loại
Penn đã đề cập rằng nhân học đánh giá khả năng của các mô hình bằng cách họ điều hướng một trò chơi video Pokémon cũ, lập bản đồ API của mô hình lên giao diện bộ điều khiển. Trong khi Claude 3.5 Sonnet đấu tranh để rời khỏi Pallet Town ban đầu, Claude 3.7 đã đánh bại thành công một số nhà lãnh đạo phòng tập thể dục.
Elon Musk ra mắt gần đây về GROK-3 tuần trước đã nhấn mạnh tốc độ nhanh chóng của cuộc thi mô hình AI. Hiện tại, nhân học đứng phía trước nhờ màn trình diễn ấn tượng của Claude 3.7 Sonnet. Phát hành của nó gợi ý về một tương lai nơi một mô hình duy nhất xử lý mọi nhiệm vụ, thay vì yêu cầu các công cụ chuyên dụng cho các chức năng khác nhau.












