lựa chọn
Trang chủ Tin tức Các nhà nghiên cứu phát triển đối thủ nguồn mở thành mô hình 'lý luận' $ 50 của Openai với giá dưới 50 đô la

Các nhà nghiên cứu phát triển đối thủ nguồn mở thành mô hình 'lý luận' $ 50 của Openai với giá dưới 50 đô la

ngày phát hành ngày phát hành Ngày 21 tháng 4 năm 2025
Tác giả Tác giả JosephWalker
quan điểm quan điểm 30

Các nhà nghiên cứu phát triển đối thủ nguồn mở thành mô hình 'lý luận' $ 50 của Openai với giá dưới 50 đô la

Thứ Sáu tuần trước, một bài báo nghiên cứu đột phá từ các chuyên gia AI tại Stanford và Đại học Washington đã xuất hiện, tiết lộ rằng họ đã phát triển một mô hình "Lý luận" AI, được đặt tên là S1, với giá dưới 50 đô la trong các khoản tín dụng tính toán đám mây. Sự tiết lộ này đang làm rung chuyển thế giới AI, vì S1 giữ chính nó chống lại các mô hình hàng đầu như O1 và Deepseek's R1 khi nói đến việc giải quyết các thử thách toán học và mã hóa.

Mô hình S1, cùng với tất cả các chi tiết ngon ngọt của dữ liệu và mã đào tạo của nó, hiện đã sẵn sàng để lấy trên GitHub. Nhóm nghiên cứu đã khởi động mọi thứ bằng một mô hình cơ sở chạy và sau đó đưa nó qua máy vắt với một kỹ thuật gọi là chưng cất. Quá trình này liên quan đến việc vắt sữa nước "lý luận" từ một mô hình AI khác bằng cách đào tạo các phản ứng của nó. Trong trường hợp này, S1 đã nhận được thông minh từ mô hình thử nghiệm suy nghĩ Flash Song Gemini 2.0 của Google. Đó là một chiến thuật tương tự như những gì các nhà nghiên cứu Berkeley đã sử dụng để đánh dấu mô hình lý luận AI của riêng họ với giá khoảng 450 đô la chỉ tháng trước.

Đối với một số người, ý tưởng rằng một nhóm nhỏ các nhà nghiên cứu vẫn có thể tạo ra sóng trong lĩnh vực AI mà không có ngân sách lớn là ly kỳ. Nhưng sự xuất hiện của S1 cũng gây ra một số câu hỏi nghiêm trọng về tương lai của sự phát triển mô hình AI. Nếu một mô hình đối thủ với những người được xây dựng với hàng triệu người có thể được nhân rộng trên ngân sách đóng băng, thì điều gì sẽ ngăn mọi người làm điều tương tự?

Không có gì đáng ngạc nhiên, những người chơi lớn trong AI không hồi hộp. Chẳng hạn, Openai đã chỉ tay vào Deepseek, cáo buộc họ sử dụng dữ liệu API của họ để nhiên liệu chưng cất mô hình. Trong khi đó, nhóm S1 đã tập trung vào việc tìm ra cách đơn giản nhất để đạt được hiệu suất lý luận vững chắc và một cái gì đó gọi là "tỷ lệ thời gian thử nghiệm", trong đó mô hình AI có nhiều thời gian hơn để suy nghĩ trước khi trả lời. Đây là những đổi mới tương tự mà mô hình O1 của Openai đã mang đến bàn, mà những người khác như Deepseek đã cố gắng bắt chước với các phương pháp của riêng họ.

Bài viết S1 cho rằng bạn có thể chắt lọc các mô hình lý luận với một bộ dữ liệu tương đối nhỏ bằng cách sử dụng một kỹ thuật được gọi là tinh chỉnh được giám sát (SFT). Điều này liên quan đến việc đào tạo mô hình AI để sao chép các hành vi cụ thể từ bộ dữ liệu và nó rẻ hơn so với việc học củng cố quy mô lớn mà Deepseek sử dụng cho mô hình R1 của họ, cạnh tranh với O1 của Openai.

Google làm cho Gemini 2.0 Flash Suy nghĩ Thử nghiệm có sẵn miễn phí thông qua nền tảng Google AI Studio của mình, mặc dù với giới hạn hàng ngày. Nhưng có một điều khoản bắt của các thuật ngữ của Google không cho phép các mô hình kỹ thuật đảo ngược tạo ra các dịch vụ cạnh tranh. Chúng tôi đang chờ đợi để nghe lại từ Google về điều này.

Bản thân mô hình S1 đã bắt đầu cuộc sống như một mô hình AI khiêm tốn, ngoài luồng từ phòng thí nghiệm Qwen của Alibaba, mà bất cứ ai cũng có thể tải xuống miễn phí. Để đào tạo S1, các nhà nghiên cứu đã đưa ra một bộ dữ liệu chỉ có 1.000 câu hỏi được lựa chọn cẩn thận, cùng với câu trả lời và quá trình "suy nghĩ" đằng sau mỗi câu hỏi, nhờ sự giúp đỡ của Gemini 2.0 của Google. Toàn bộ quá trình đào tạo chỉ mất chưa đến 30 phút trên 16 GPU NVIDIA H100. Theo Niklas Muennighoff, một nhà nghiên cứu của Stanford tham gia vào dự án, bạn có thể thực hiện điều này ngày hôm nay với giá khoảng 20 đô la chi phí tính toán.

Các nhà nghiên cứu cũng đã thực hiện một động thái thông minh để thực hiện kiểm tra kỹ tác phẩm của S1 và mở rộng thời gian "suy nghĩ" của mình, họ chỉ đơn giản bảo nó "chờ đợi". Thêm từ này trong quá trình lý luận của S1 đã giúp nó đưa ra câu trả lời chính xác hơn một chút, theo bài báo.

Nhìn về phía trước đến năm 2025, những người khổng lồ công nghệ như Meta, Google và Microsoft được thiết lập để đổ hàng trăm tỷ vào cơ sở hạ tầng AI, phần lớn sẽ hướng tới việc đào tạo làn sóng tiếp theo của các mô hình AI. Mặc dù chưng cất chứng tỏ là một cách hiệu quả để tái tạo các khả năng AI với giá rẻ, nhưng nó sẽ không dẫn đến việc tạo ra các mô hình AI hoàn toàn mới, đột phá bất cứ lúc nào sớm.

Bài viết liên quan
전 Deepseeker 및 Collaborators는 신뢰할 수있는 AI 에이전트를 훈련하기위한 새로운 방법을 발표합니다 : Ragen 전 Deepseeker 및 Collaborators는 신뢰할 수있는 AI 에이전트를 훈련하기위한 새로운 방법을 발표합니다 : Ragen AI 에이전트의 해 : 2025 년의 기대와 현실 2025를 자세히 살펴보면 AI 에이전트가 OpenAi, Anthropic, Google 및 Deepseek와 같은 회사의 고급 대형 언어 및 멀티 모달 모델로 구동되는 AI 시스템에 따라 AI 에이전트가 구체화 된 해로 많은 전문가들에 의해 예고되었습니다.
Google Search는 복잡한 다중 부분 쿼리에 대한 'AI 모드'를 소개합니다 Google Search는 복잡한 다중 부분 쿼리에 대한 'AI 모드'를 소개합니다 Google은 Perplexity AI와 경쟁하기 위해 "AI Mode"를 공개하고 ChatgptGoogle은 검색 엔진에서 실험적인 "AI 모드"기능을 시작하여 AI 경기장에서 게임을 강화하고 있습니다. Perplexity AI 및 OpenAi의 ChatGpt 검색을 좋아하는이 새로운 모드는 Wed에서 발표되었습니다.
Chatgpt의 원치 않는 사용자 이름 사용은 일부 사람들 사이에서 '소름 끼치는'우려를 불러 일으 킵니다. Chatgpt의 원치 않는 사용자 이름 사용은 일부 사람들 사이에서 '소름 끼치는'우려를 불러 일으 킵니다. Chatgpt의 일부 사용자는 최근에 이상한 새로운 기능을 발견했습니다. 챗봇은 때때로 문제를 해결하면서 자신의 이름을 사용합니다. 이것은 이전의 일반적인 행동의 일부가 아니 었으며, 많은 사용자들은 Chatgpt가 자신의 이름을 말하지 않고 자신의 이름을 언급했다고보고합니다. 에 대한 의견
Nhận xét (0)
0/200
Quay lại đầu
OR