Name: DeepSeek-R1
Rating: 1 (84 reviews)
Author: DeepSeek

Heim

Liste der Al -Modelle

DeepSeek-R1

Vergleich hinzufügen

671B

Modellparametermenge

DeepSeek

Angehörige Organisation

Open Source

Lizenztyp

20. Januar 2025

Freigabezeit

Offizielle Website

Modelldokumentation

Technischer Bericht

Verwandte Personen

Zhenda Xie

Kai Dong

Qihao Zhu

Daya Guo

Liang Wenfeng

Modelleinführung

DeepSeek-R1 ist ein Modell, das durch große Skalen von verstärktem Lernen (RL) trainiert wurde und keine Überwachte Feinabstimmung (SFT) als ersten Schritt verwendet hat. Seine Leistung in Mathematik, Codierung und Deduktionsaufgaben ist mit der von OpenAI-o1 vergleichbar.

Umfassende Punktzahl Sprachdialog Wissensreserve Argumentationsvereinigung Mathematische Berechnung Code schreiben Befehlsschließend

Nach links und rechts swipen, um mehr anzuzeigen

Sprachverständnisfähigkeit

In der Lage, komplexe Kontexte zu verstehen und logisch kohärente Sätze zu erzeugen, obwohl sie gelegentlich in der Tonkontrolle ausgeschaltet werden.

7.8

Wissensabdeckung

Besitzt Kernwissen über Mainstream-Disziplinen, hat jedoch nur eine begrenzte Abdeckung der modernen interdisziplinären Bereiche.

8.9

Argumentationsfähigkeit

In der Lage, logische Rahmenbedingungen auf mehreren Ebenen aufzubauen und über eine Genauigkeit von über 99% in der komplexen mathematischen Modellierung zu erreichen.

9.1

Modellvergleich

DeepSeek-R1 vs Qwen2.5-7B-Instruct Genau wie Qwen2 unterstützen die Qwen2.5-Sprachmodelle bis zu 128K Tokens und können bis zu 8K Tokens generieren. Sie unterstützen auch die Mehrsprachigkeit für über 29 Sprachen, darunter Chinesisch, Englisch, Französisch, Spanisch, Portugiesisch, Deutsch, Italienisch, Russisch, Japanisch, Koreanisch, Vietnamesisch, Thailändisch, Arabisch und mehr.

DeepSeek-R1 vs Hunyuan-T1-20250822 Das von Tencent unabhängig entwickelte Deep-Reasoning-Modell trägt die Versionsnummer hunyuan-t1-20250822.

DeepSeek-R1 vs Spark-X1 Der durch iFlytek veröffentlichte Inferenzmodell Spark X1 führt bei nationalen mathematischen Aufgaben und vergleicht die Leistung allgemeiner Aufgaben wie Inferenz, Textgenerierung und Sprachverständnis mit OpenAI o1 und DeepSeek R1.

DeepSeek-R1 vs Doubao-Seed-1.6-thinking-250715 Die neueste Version des Seed-Serienmodells von ByteDance, das den Denkmodus unterstützt.

DeepSeek-R1 vs Doubao-Seed-1.6-251015 (Thinking) Das von ByteDance veröffentlichte Deep-Reasoning-Modell, das die manuelle Umschaltung von Deep Reasoning unterstützt, und dessen Leistung im Vergleich zu doubao-1.5 deutlich verbessert ist.

Verwandter Modell

DeepSeek-V3.2 Die neueste Version der Deepseek V3-Modellreihe.

DeepSeek-V3.2-Exp Die neueste experimentelle Version der Modelle der Deepseek V3-Serie.

DeepSeek-R1-0528 Die neueste Version von Deepseek R1.

DeepSeek-V3-0324 DeepSeek-V3 übertrifft andere Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B in mehreren Bewertungen und erreicht die Leistung von erstklassigen Closed-Source-Modellen wie GPT-4 und Claude-3.5-Sonnet.

DeepSeek-R1-0528 Die neueste Version von Deepseek R1.

Relevante Dokumente

Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac

Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter

Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen

WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr

Die experimentelle KI „Claude“ von Anthropic wickelt in einem E-Commerce-Test Verhandlungen und Transaktionen ab Angesichts der rasanten Fortschritte im Bereich der künstlichen Intelligenz hat Anthropic am vergangenen Freitag still und leise ein internes Experiment namens „Project Deal“ gestartet, um das Potenzi

Modellvergleich

Starten Sie den Vergleich