lựa chọn
Số lượng tham số mô hình
671B
Số lượng tham số mô hình
Tổ chức liên kết
DeepSeek
Tổ chức liên kết
Mã nguồn mở
Loại giấy phép
Thời gian phát hành
Ngày 19 tháng 1 năm 2025
Thời gian phát hành
Giới thiệu mô hình
DeepSeek-R1 đã sử dụng rộng rãi các kỹ thuật học tăng cường trong giai đoạn sau khi huấn luyện, nâng cao đáng kể khả năng suy luận của mô hình chỉ với một lượng nhỏ dữ liệu được đánh dấu. Về các tác vụ liên quan đến toán học, mã hóa và suy luận ngôn ngữ tự nhiên, hiệu suất của nó tương đương với phiên bản chính thức của OpenAI's o1.
Khả năng hiểu ngôn ngữ Khả năng hiểu ngôn ngữ
Khả năng hiểu ngôn ngữ
Có khả năng hiểu các bối cảnh phức tạp và tạo ra các câu mạch lạc logic, mặc dù đôi khi tắt trong kiểm soát giai điệu.
7.5
Phạm vi bảo hiểm kiến ​​thức Phạm vi bảo hiểm kiến ​​thức
Phạm vi bảo hiểm kiến ​​thức
Bao gồm hơn 200 lĩnh vực chuyên ngành, tích hợp các kết quả nghiên cứu mới nhất và kiến ​​thức đa văn hóa trong thời gian thực.
9.0
Khả năng lý luận Khả năng lý luận
Khả năng lý luận
Có thể thực hiện lý do hợp lý với hơn ba bước, mặc dù hiệu quả giảm khi xử lý các mối quan hệ phi tuyến.
8.5
Mô hình liên quan
DeepSeek-V2-Chat-0628 DeepSeek-V2 là một mô hình ngôn ngữ dạng Mixture-of-Experts (MoE) mạnh mẽ, nổi bật ở chi phí đào tạo kinh tế và suy luận hiệu quả. Nó gồm tổng cộng 236 tỷ tham số, trong đó 21 tỷ tham số được kích hoạt cho mỗi token. So với DeepSeek 67B, DeepSeek-V2 đạt hiệu suất tốt hơn đồng thời tiết kiệm 42,5% chi phí đào tạo, giảm 93,3% bộ nhớ KV cache và tăng tốc độ thông lượng tối đa lên 5,76 lần.
DeepSeek-V2.5 DeepSeek-V2.5 là phiên bản nâng cấp kết hợp giữa DeepSeek-V2-Chat và DeepSeek-Coder-V2-Instruct. Mô hình mới tích hợp các khả năng tổng quan và mã hóa của hai phiên bản trước đó.
DeepSeek-V3-0324 DeepSeek-V3 vượt trội hơn các mô hình mã nguồn mở khác như Qwen2.5-72B và Llama-3.1-405B trong nhiều đánh giá và đạt hiệu suất tương đương với các mô hình đóng hàng đầu như GPT-4 và Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, một mô hình ngôn ngữ Mixture-of-Experts (MoE) mạnh mẽ được trình bày bởi DeepSeek, DeepSeek-V2-Lite là phiên bản nhẹ của nó.
DeepSeek-V2-Chat DeepSeek-V2 là một mô hình ngôn ngữ mạnh mẽ dạng Mixture-of-Experts (MoE) đặc trưng bởi việc đào tạo tiết kiệm và suy luận hiệu quả. Nó gồm tổng cộng 236 tỷ tham số, trong đó 21 tỷ tham số được kích hoạt cho mỗi token. So với DeepSeek 67B, DeepSeek-V2 đạt hiệu suất tốt hơn đồng thời tiết kiệm 42.5% chi phí đào tạo, giảm 93.3% bộ nhớ cache KV và tăng gấp 5.76 lần tốc độ sinh tối đa.
Tài liệu liên quan
Google Gemini Code Assist nâng cao lập trình AI bằng tính năng agent Gemini Code Assist - Trợ lý lập trình AI của Google đang ra mắt các tính năng "tác nhân" mới ở chế độ xem trước. Tại hội nghị Cloud Next gần đây, Google tiết lộ cách Code Assist gi
Microsoft mã nguồn mở trình soạn thảo CLI tại Build Microsoft Dồn Lực Mã Nguồn Mở Tại Build 2025Tại hội nghị Build 2025 năm nay, Microsoft đã có những bước đi lớn trong thế giới mã nguồn mở, phát hành nhiều công cụ và ứng dụng quan
OpenAI nâng cấp mô hình AI của Operator Agent OpenAI Đưa Operator Lên Tầm Cao MớiOpenAI đang nâng cấp lớn cho trợ lý AI tự động Operator của mình. Những thay đổi sắp tới đồng nghĩa Operator sẽ sớm chạy trên mô hình o3 - một tr
Quỹ tương lai AI của Google có thể phải cẩn trọng trong hoạt động Chiến Dịch Đầu Tư Mới Của Google Vào AI: Một Sự Điều Chỉnh Chiến Lược Trước Sự Giám Sát Của Cơ Quan Quản LýThông báo gần đây của Google về Quỹ Tương Lai AI đánh dấu một bước đi dũn
AI YouTube Thumbnail Trình tạo: Tăng cường chế độ xem video của bạn Sức mạnh của AI trong bối cảnh kỹ thuật số hình thu nhỏ YouTube hôm nay, một hình thu nhỏ YouTube quyến rũ là rất quan trọng để thu hút sự chú ý của người xem. Với hàng triệu video cạnh tranh cho các nhấp chuột, một hình thu nhỏ nổi bật có thể tạo ra tất cả sự khác biệt. AI YouTube Thumbnails đã xuất hiện như một GAM
So sánh mô hình
Bắt đầu so sánh
Quay lại đầu
OR