Deep Cogito phát hành các mô hình AI nguồn mở và đã đứng đầu bảng xếp hạng

Trang chủ

Tin tức

Ngày 06 tháng 6 năm 2025

RobertMartin

# ai # Google # LLMs # nlp

Deep Cogito phát hành các mô hình AI nguồn mở và đã đứng đầu bảng xếp hạng

Deep Cogito Ra Mắt Các Mô Hình Trí Tuệ Nhân Tạo Cách Mạng

Trong một bước đi đột phá, Deep Cogito, một công ty khởi nghiệp nghiên cứu AI hàng đầu có trụ sở tại San Francisco, đã chính thức giới thiệu dòng mô hình ngôn ngữ lớn (LLMs) nguồn mở đầu tiên của mình, được đặt tên là Cogito v1. Những mô hình này, được hiệu chỉnh từ Llama 3.2 của Meta, nổi bật với khả năng suy luận lai cho phép chúng phản hồi nhanh chóng hoặc tham gia vào việc tự suy ngẫm - một tính năng gợi nhớ đến loạt mô hình "o" của OpenAI và DeepSeek R1.

Deep Cogito mong muốn vượt qua các hạn chế giám sát truyền thống của con người đối với AI bằng cách khuyến khích cải tiến tự lặp lại bên trong các mô hình của mình. Mục tiêu cuối cùng của họ là phát triển trí tuệ siêu vượt - AI vượt trội hơn con người trong mọi lĩnh vực. Tuy nhiên, công ty đảm bảo rằng tất cả các mô hình sẽ vẫn ở dạng nguồn mở.

Drishan Arora, Giám đốc điều hành và đồng sáng lập của Deep Cogito, từng là kỹ sư phần mềm cấp cao tại Google, dẫn đầu việc phát triển các mô hình ngôn ngữ lớn cho sản phẩm tìm kiếm sinh tạo của Google. Ông tự tin khẳng định trên X rằng những mô hình này là một trong những mô hình nguồn mở mạnh nhất ở quy mô của chúng, vượt trội so với đối thủ cạnh tranh như LLaMA, DeepSeek và Qwen.

Danh Sách Mô Hình

Phiên bản ban đầu bao gồm năm kích thước cơ bản - 3 tỷ, 8 tỷ, 14 tỷ, 32 tỷ và 70 tỷ tham số - và đã có sẵn trên các nền tảng như Hugging Face, Ollama và qua APIs của Fireworks và Together AI. Những mô hình này hoạt động dưới điều khoản giấy phép Llama, cho phép sử dụng thương mại cho tới 700 triệu người dùng hàng tháng trước khi cần giấy phép trả phí từ Meta.

Deep Cogito dự định tung ra các mô hình thậm chí lớn hơn trong tương lai gần, có thể đạt tới 671 tỷ tham số.

Phương Pháp Huấn Luyện: Phân Tích Và Tăng Cường Lặp Lại (IDA)

Arora giới thiệu IDA, một phương pháp mới khác biệt so với học tăng cường từ phản hồi của con người (RLHF) hoặc hiệu chỉnh từ mô hình giáo viên truyền thống. IDA tập trung vào việc phân bổ thêm tài nguyên tính toán để tạo ra các giải pháp ưu việt hơn, sau đó tích hợp khả năng suy luận được cải thiện này vào mô hình - một vòng lặp phản hồi liên tục nhằm nâng cao năng lực. Phương pháp này giống với chiến lược tự chơi của Google AlphaGo được áp dụng cho xử lý ngôn ngữ tự nhiên.

Kết Quả Đánh Giá và Kiểm Định

Deep Cogito đã trình bày kết quả đánh giá toàn diện so sánh các mô hình Cogito với các đối thủ nguồn mở trong các lĩnh vực như kiến thức tổng quát, suy luận toán học và nhiệm vụ đa ngôn ngữ. Kết quả nổi bật bao gồm:

Cogito 3B (Chuẩn): Vượt qua LLaMA 3.2 3B về MMLU 6.7 điểm phần trăm (65.4% so với 58.7%) và Hellaswag 18.8 điểm (81.1% so với 62.3%).
Cogito 3B (Chế Độ Suy Luận): Điểm 72.6% trên MMLU và 84.2% trên ARC.
Cogito 8B (Chuẩn): Đạt 80.5% trên MMLU, vượt qua LLaMA 3.1 8B 12.8 điểm.
Cogito 8B (Chế Độ Suy Luận): Điểm 83.1% trên MMLU và 92.0% trên ARC.
Cogito 70B (Chuẩn): Dẫn trước LLaMA 3.3 70B về MMLU 6.4 điểm (91.7% so với 85.3%) và vượt qua LLaMA 4 Scout 109B trên các chỉ số tổng hợp (54.5% so với 53.3%).

Mặc dù các mô hình Cogito tỏ ra nổi bật trong chế độ suy luận, một số đánh đổi vẫn tồn tại, đặc biệt trong các tác vụ toán học.

Gọi Công Cụ Nguyên Bản

Deep Cogito cũng đánh giá khả năng gọi công cụ gốc của các mô hình, một khía cạnh quan trọng cho các hệ thống tích hợp đại diện và API.

Cogito 3B: Hỗ trợ bốn tác vụ gọi công cụ và tỏ ra xuất sắc trong các cuộc gọi công cụ đơn giản và đa công cụ.
Cogito 8B: Thể hiện hiệu suất mạnh mẽ trên tất cả các loại gọi công cụ, vượt xa LLaMA 3.1 8B đáng kể.

Kế Hoạch Tương Lai

Nhìn về tương lai, Deep Cogito lên kế hoạch giới thiệu các mô hình lớn hơn, bao gồm các biến thể hỗn hợp chuyên gia ở 109B, 400B và 671B tham số, cùng với các bản cập nhật liên tục cho các điểm kiểm tra hiện tại. Công ty xem IDA như một con đường bền vững hướng tới việc tự cải thiện có thể mở rộng, giảm sự phụ thuộc vào các mô hình giáo viên con người hoặc tĩnh.

Arora nhấn mạnh rằng giá trị thực tiễn và khả năng thích ứng trong thế giới thực là thước đo thành công cuối cùng, nhấn mạnh rằng đây chỉ là khởi đầu của một hành trình đầy hứa hẹn. Deep Cogito hợp tác với các tổ chức nổi tiếng như Hugging Face, RunPod, Fireworks AI, Together AI và Ollama, đảm bảo tất cả các mô hình vẫn ở dạng nguồn mở và miễn phí truy cập.

Bài viết liên quan

Google Ra Mắt Các Mô Hình AI Gemini 2.5 Sẵn Sàng Sản Xuất để Cạnh Tranh với OpenAI trên Thị Trường Doanh Nghiệp Google tăng cường chiến lược AI vào thứ Hai, ra mắt các mô hình Gemini 2.5 tiên tiến cho doanh nghiệp và giới thiệu biến thể tiết kiệm chi phí để cạnh tranh về giá và hiệu suất.Công ty thuộc sở hữu củ

Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m

NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu Google đang nâng cấp công cụ nghiên cứu và ghi chú dựa trên AI, NotebookLM, để trở thành một trung tâm tri thức toàn diện. Vào thứ Hai, công ty đã giới thiệu một bộ sưu tập ghi chép được chọn lọc từ c

Nhận xét (7)

0/200

Nộp

EricMartin

08:20:21 GMT+07:00 Ngày 28 tháng 7 năm 2025

Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀

WilliamRamirez

08:19:30 GMT+07:00 Ngày 28 tháng 7 năm 2025

Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

BrianWalker

20:03:53 GMT+07:00 Ngày 07 tháng 6 năm 2025

Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture

WalterWalker

18:30:11 GMT+07:00 Ngày 07 tháng 6 năm 2025

Deep Cogitoのモデルがもうチャートトップとは...速すぎる！🔥 オープンソースの進化が楽しみです。自分でも試してみたいな～。これからも応援してます！ #AI革命

RaymondBaker

14:25:31 GMT+07:00 Ngày 07 tháng 6 năm 2025

Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft

JonathanKing

10:19:30 GMT+07:00 Ngày 07 tháng 6 năm 2025

¡Increíble que los modelos de Deep Cogito ya estén liderando! 🚀 El código abierto está cambiando el juego en IA. Ojalá puedan mantener este ritmo. ¡A ver qué más nos sorprenderán! #IAForAll

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng