lựa chọn
Số lượng tham số mô hình
671B
Số lượng tham số mô hình
Tổ chức liên kết
DeepSeek
Tổ chức liên kết
Mã nguồn mở
Loại giấy phép
Thời gian phát hành
Ngày 20 tháng 1 năm 2025
Thời gian phát hành
Giới thiệu mô hình
DeepSeek-R1 đã sử dụng rộng rãi các kỹ thuật học tăng cường trong giai đoạn sau khi huấn luyện, nâng cao đáng kể khả năng suy luận của mô hình chỉ với một lượng nhỏ dữ liệu được đánh dấu. Về các tác vụ liên quan đến toán học, mã hóa và suy luận ngôn ngữ tự nhiên, hiệu suất của nó tương đương với phiên bản chính thức của OpenAI's o1.
Kéo sang trái và phải để xem thêm
Khả năng hiểu ngôn ngữ Khả năng hiểu ngôn ngữ
Khả năng hiểu ngôn ngữ
Có khả năng hiểu các bối cảnh phức tạp và tạo ra các câu mạch lạc logic, mặc dù đôi khi tắt trong kiểm soát giai điệu.
7.5
Phạm vi bảo hiểm kiến ​​thức Phạm vi bảo hiểm kiến ​​thức
Phạm vi bảo hiểm kiến ​​thức
Bao gồm hơn 200 lĩnh vực chuyên ngành, tích hợp các kết quả nghiên cứu mới nhất và kiến ​​thức đa văn hóa trong thời gian thực.
9.0
Khả năng lý luận Khả năng lý luận
Khả năng lý luận
Có thể thực hiện lý do hợp lý với hơn ba bước, mặc dù hiệu quả giảm khi xử lý các mối quan hệ phi tuyến.
8.5
Mô hình liên quan
DeepSeek-V2-Chat-0628 DeepSeek-V2 là một mô hình ngôn ngữ dạng Mixture-of-Experts (MoE) mạnh mẽ, nổi bật ở chi phí đào tạo kinh tế và suy luận hiệu quả. Nó gồm tổng cộng 236 tỷ tham số, trong đó 21 tỷ tham số được kích hoạt cho mỗi token. So với DeepSeek 67B, DeepSeek-V2 đạt hiệu suất tốt hơn đồng thời tiết kiệm 42,5% chi phí đào tạo, giảm 93,3% bộ nhớ KV cache và tăng tốc độ thông lượng tối đa lên 5,76 lần.
DeepSeek-V2.5 DeepSeek-V2.5 là phiên bản nâng cấp kết hợp giữa DeepSeek-V2-Chat và DeepSeek-Coder-V2-Instruct. Mô hình mới tích hợp các khả năng tổng quan và mã hóa của hai phiên bản trước đó.
DeepSeek-V3-0324 DeepSeek-V3 vượt trội hơn các mô hình mã nguồn mở khác như Qwen2.5-72B và Llama-3.1-405B trong nhiều đánh giá và đạt hiệu suất tương đương với các mô hình đóng hàng đầu như GPT-4 và Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, một mô hình ngôn ngữ Mixture-of-Experts (MoE) mạnh mẽ được trình bày bởi DeepSeek, DeepSeek-V2-Lite là phiên bản nhẹ của nó.
DeepSeek-V2-Chat DeepSeek-V2 là một mô hình ngôn ngữ mạnh mẽ dạng Mixture-of-Experts (MoE) đặc trưng bởi việc đào tạo tiết kiệm và suy luận hiệu quả. Nó gồm tổng cộng 236 tỷ tham số, trong đó 21 tỷ tham số được kích hoạt cho mỗi token. So với DeepSeek 67B, DeepSeek-V2 đạt hiệu suất tốt hơn đồng thời tiết kiệm 42.5% chi phí đào tạo, giảm 93.3% bộ nhớ cache KV và tăng gấp 5.76 lần tốc độ sinh tối đa.
Tài liệu liên quan
Du lịch do AI điều khiển: Lập kế hoạch cho kỳ nghỉ hoàn hảo một cách dễ dàng Lên kế hoạch cho kỳ nghỉ có thể gây khó khăn, với vô số tìm kiếm và đánh giá biến sự hào hứng thành căng thẳng. Lập kế hoạch du lịch do AI hỗ trợ thay đổi điều đó, khiến quá trình trở nên suôn sẻ và t
Công cụ NoteGPT hỗ trợ AI biến đổi trải nghiệm học tập trên YouTube Trong thế giới chuyển động nhanh ngày nay, việc học tập hiệu quả là điều cần thiết. NoteGPT là một tiện ích mở rộng Chrome năng động, cách mạng hóa cách bạn tương tác với nội dung YouTube. Bằng cách k
Liên minh Cộng đồng và Google Hợp tác để Nâng cao Kỹ năng AI cho Người lao động Anh Ghi chú của Biên tập viên: Google đã hợp tác với Liên minh Cộng đồng tại Anh để thể hiện cách kỹ năng AI có thể nâng cao năng lực của cả nhân viên văn phòng và lao động vận hành. Chương trình tiên pho
Magi-1 Ra Mắt Công Nghệ Tạo Video AI Nguồn Mở Mang Tính Cách Mạng Lĩnh vực tạo video bằng AI đang tiến bộ nhanh chóng, và Magi-1 đánh dấu một cột mốc mang tính đột phá. Mô hình nguồn mở sáng tạo này cung cấp độ chính xác chưa từng có trong việc kiểm soát thời gian,
Đạo đức AI: Điều hướng Rủi ro và Trách nhiệm trong Phát triển Công nghệ Trí tuệ nhân tạo (AI) đang định hình lại các ngành công nghiệp, từ y tế đến logistics, mang lại tiềm năng to lớn cho tiến bộ. Tuy nhiên, sự phát triển nhanh chóng của nó đem lại những rủi ro đáng kể đ
So sánh mô hình
Bắt đầu so sánh
Quay lại đầu
OR