lựa chọn
Trang chủ Tin tức Deep Cogito phát hành các mô hình AI nguồn mở và đã đứng đầu bảng xếp hạng

Deep Cogito phát hành các mô hình AI nguồn mở và đã đứng đầu bảng xếp hạng

ngày phát hành ngày phát hành Ngày 06 tháng 6 năm 2025
quan điểm quan điểm 2

Deep Cogito phát hành các mô hình AI nguồn mở và đã đứng đầu bảng xếp hạng

Deep Cogito Ra Mắt Các Mô Hình Trí Tuệ Nhân Tạo Cách Mạng

Trong một bước đi đột phá, Deep Cogito, một công ty khởi nghiệp nghiên cứu AI hàng đầu có trụ sở tại San Francisco, đã chính thức giới thiệu dòng mô hình ngôn ngữ lớn (LLMs) nguồn mở đầu tiên của mình, được đặt tên là Cogito v1. Những mô hình này, được hiệu chỉnh từ Llama 3.2 của Meta, nổi bật với khả năng suy luận lai cho phép chúng phản hồi nhanh chóng hoặc tham gia vào việc tự suy ngẫm - một tính năng gợi nhớ đến loạt mô hình "o" của OpenAI và DeepSeek R1.

Deep Cogito mong muốn vượt qua các hạn chế giám sát truyền thống của con người đối với AI bằng cách khuyến khích cải tiến tự lặp lại bên trong các mô hình của mình. Mục tiêu cuối cùng của họ là phát triển trí tuệ siêu vượt - AI vượt trội hơn con người trong mọi lĩnh vực. Tuy nhiên, công ty đảm bảo rằng tất cả các mô hình sẽ vẫn ở dạng nguồn mở.

Drishan Arora, Giám đốc điều hành và đồng sáng lập của Deep Cogito, từng là kỹ sư phần mềm cấp cao tại Google, dẫn đầu việc phát triển các mô hình ngôn ngữ lớn cho sản phẩm tìm kiếm sinh tạo của Google. Ông tự tin khẳng định trên X rằng những mô hình này là một trong những mô hình nguồn mở mạnh nhất ở quy mô của chúng, vượt trội so với đối thủ cạnh tranh như LLaMA, DeepSeek và Qwen.

Danh Sách Mô Hình

Phiên bản ban đầu bao gồm năm kích thước cơ bản - 3 tỷ, 8 tỷ, 14 tỷ, 32 tỷ và 70 tỷ tham số - và đã có sẵn trên các nền tảng như Hugging Face, Ollama và qua APIs của Fireworks và Together AI. Những mô hình này hoạt động dưới điều khoản giấy phép Llama, cho phép sử dụng thương mại cho tới 700 triệu người dùng hàng tháng trước khi cần giấy phép trả phí từ Meta.

Deep Cogito dự định tung ra các mô hình thậm chí lớn hơn trong tương lai gần, có thể đạt tới 671 tỷ tham số.

Phương Pháp Huấn Luyện: Phân Tích Và Tăng Cường Lặp Lại (IDA)

Arora giới thiệu IDA, một phương pháp mới khác biệt so với học tăng cường từ phản hồi của con người (RLHF) hoặc hiệu chỉnh từ mô hình giáo viên truyền thống. IDA tập trung vào việc phân bổ thêm tài nguyên tính toán để tạo ra các giải pháp ưu việt hơn, sau đó tích hợp khả năng suy luận được cải thiện này vào mô hình - một vòng lặp phản hồi liên tục nhằm nâng cao năng lực. Phương pháp này giống với chiến lược tự chơi của Google AlphaGo được áp dụng cho xử lý ngôn ngữ tự nhiên.

Kết Quả Đánh Giá và Kiểm Định

Deep Cogito đã trình bày kết quả đánh giá toàn diện so sánh các mô hình Cogito với các đối thủ nguồn mở trong các lĩnh vực như kiến thức tổng quát, suy luận toán học và nhiệm vụ đa ngôn ngữ. Kết quả nổi bật bao gồm:

  • Cogito 3B (Chuẩn): Vượt qua LLaMA 3.2 3B về MMLU 6.7 điểm phần trăm (65.4% so với 58.7%) và Hellaswag 18.8 điểm (81.1% so với 62.3%).
  • Cogito 3B (Chế Độ Suy Luận): Điểm 72.6% trên MMLU và 84.2% trên ARC.
  • Cogito 8B (Chuẩn): Đạt 80.5% trên MMLU, vượt qua LLaMA 3.1 8B 12.8 điểm.
  • Cogito 8B (Chế Độ Suy Luận): Điểm 83.1% trên MMLU và 92.0% trên ARC.
  • Cogito 70B (Chuẩn): Dẫn trước LLaMA 3.3 70B về MMLU 6.4 điểm (91.7% so với 85.3%) và vượt qua LLaMA 4 Scout 109B trên các chỉ số tổng hợp (54.5% so với 53.3%).

Mặc dù các mô hình Cogito tỏ ra nổi bật trong chế độ suy luận, một số đánh đổi vẫn tồn tại, đặc biệt trong các tác vụ toán học.

Gọi Công Cụ Nguyên Bản

Deep Cogito cũng đánh giá khả năng gọi công cụ gốc của các mô hình, một khía cạnh quan trọng cho các hệ thống tích hợp đại diện và API.

  • Cogito 3B: Hỗ trợ bốn tác vụ gọi công cụ và tỏ ra xuất sắc trong các cuộc gọi công cụ đơn giản và đa công cụ.
  • Cogito 8B: Thể hiện hiệu suất mạnh mẽ trên tất cả các loại gọi công cụ, vượt xa LLaMA 3.1 8B đáng kể.

Kế Hoạch Tương Lai

Nhìn về tương lai, Deep Cogito lên kế hoạch giới thiệu các mô hình lớn hơn, bao gồm các biến thể hỗn hợp chuyên gia ở 109B, 400B và 671B tham số, cùng với các bản cập nhật liên tục cho các điểm kiểm tra hiện tại. Công ty xem IDA như một con đường bền vững hướng tới việc tự cải thiện có thể mở rộng, giảm sự phụ thuộc vào các mô hình giáo viên con người hoặc tĩnh.

Arora nhấn mạnh rằng giá trị thực tiễn và khả năng thích ứng trong thế giới thực là thước đo thành công cuối cùng, nhấn mạnh rằng đây chỉ là khởi đầu của một hành trình đầy hứa hẹn. Deep Cogito hợp tác với các tổ chức nổi tiếng như Hugging Face, RunPod, Fireworks AI, Together AI và Ollama, đảm bảo tất cả các mô hình vẫn ở dạng nguồn mở và miễn phí truy cập.

Bài viết liên quan
Фонд будущего ИИ Google, возможно, должен действовать осторожно Фонд будущего ИИ Google, возможно, должен действовать осторожно Инвестиционная инициатива Google в области ИИ: стратегический поворот на фоне регуляторного вниманияОбъявление Google о создании фонда AI Futures Fund является смелым шагом в стрем
Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее Google приближается к своей цели создания универсального ассистента на основе ИИНа мероприятии Google I/O этого года компания представила значительные обновления серии Gemini 2.5,
Oura добавляет трекинг уровня глюкозы и журнал питания на основе ИИ Oura добавляет трекинг уровня глюкозы и журнал питания на основе ИИ Oura укрепляет своё обязательство в области метаболического здоровья двумя захватывающими новыми функциями.Oura повышает ставки в мире метаболического здоровья с двумя передовыми,
Nhận xét (0)
0/200
Quay lại đầu
OR