Option
Heim
Liste der Al -Modelle
DBRX-Instruct
Modellparametermenge
132B
Modellparametermenge
Angehörige Organisation
DataBricks
Angehörige Organisation
Open Source
Lizenztyp
Freigabezeit
26. März 2024
Freigabezeit
Modelleinführung
DBRX-Instruct ist ein von DataBricks von Grund auf neu trainiertes MoE-Modell, das ein Auswahlschema von 16 Experten verwendet, die 4 auswählen, mit einem aktiven Parameter-Zähler von 36B. Es wurde auf 12T Tokens vortrainiert und unterstützt einen Kontext von 32K.
Nach links und rechts swipen, um mehr anzuzeigen
Sprachverständnisfähigkeit Sprachverständnisfähigkeit
Sprachverständnisfähigkeit
Fehleinschätzt häufig semantische Fehleinschätzungen, was zu offensichtlichen logischen Trennungen in Antworten führt.
3.8
Wissensabdeckung Wissensabdeckung
Wissensabdeckung
Hat bedeutende kenntnisgebende Flecken, die häufig sachliche Fehler zeigt und veraltete Informationen wiederholt.
5.9
Argumentationsfähigkeit Argumentationsfähigkeit
Argumentationsfähigkeit
Es ist nicht möglich, kohärente Argumentationsketten aufrechtzuerhalten und häufig invertierte Kausalität oder Fehlkalkulationen zu verursachen.
2.6
Verwandter Modell
DBRX-Instruct DBRX-Instruct ist ein vom Unternehmen DataBricks von Grund auf neu trainiertes MoE-Modell, das ein Auswahlverfahren von 16 Experten mit dem Ziel von 4 nutzt und 36B aktive Parameter hat. Es wurde auf 12T Tokens vortrainiert und unterstützt einen Kontext von 32K.
Qwen2.5-7B-Instruct Genau wie Qwen2 unterstützen die Qwen2.5-Sprachmodelle bis zu 128K Tokens und können bis zu 8K Tokens generieren. Sie unterstützen auch die Mehrsprachigkeit für über 29 Sprachen, darunter Chinesisch, Englisch, Französisch, Spanisch, Portugiesisch, Deutsch, Italienisch, Russisch, Japanisch, Koreanisch, Vietnamesisch, Thailändisch, Arabisch und mehr.
Hunyuan-T1-20250822 Das von Tencent unabhängig entwickelte Deep-Reasoning-Modell trägt die Versionsnummer hunyuan-t1-20250822.
Spark-X1 Der durch iFlytek veröffentlichte Inferenzmodell Spark X1 führt bei nationalen mathematischen Aufgaben und vergleicht die Leistung allgemeiner Aufgaben wie Inferenz, Textgenerierung und Sprachverständnis mit OpenAI o1 und DeepSeek R1.
Doubao-Seed-1.6-thinking-250715 Die neueste Version des Seed-Serienmodells von ByteDance, das den Denkmodus unterstützt.
Relevante Dokumente
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Google stellt Gemini Notebooks vor und vereint NotebookLM mit einer persönlichen Wissensdatenbank Google hat kürzlich die Funktion „Notebooks“ für Gemini eingeführt, die Nutzern helfen soll, komplexe Projekte durch die Erstellung einer personalisierten Wissensdatenbank zu verwalten. Dieses Update
Luma AI stellt das autoregressive Modell „Uni-1“ vor, das gleichzeitig Text und Pixel generiert Luma Labs hat am 23. März sein Bildgenerierungsmodell Uni-1 vorgestellt – das erste öffentlich zugängliche Modell des Unternehmens, das auf der Unified-Intelligence-Architektur basiert. Auf der offizi
Xinzhou Wu von NVIDIA: Der „ChatGPT-Moment“ des autonomen Fahrens ist gekommen – die Serienproduktion von Level-4-Fahrzeugen ist kein Traum mehr Im sich rasch entwickelnden Bereich der physikalischen KI wird das autonome Fahren oft als die erste große Herausforderung angesehen, die es zu bewältigen gilt. Kürzlich skizzierte Wu Xinzhou, Vizeprä
Anthropic erhöht stillschweigend die Preise für den Claude-Code, die Tagesgebühren für Entwickler verdoppeln sich Der Kostendruck bei der KI-Programmierung wird immer deutlicher. Anthropic, ein führendes KI-Unternehmen, hat kürzlich die Preise für sein KI-Codierungstool „Claude Code“ ohne offizielle Ankündigung a
Modellvergleich
Starten Sie den Vergleich
OR