Название модели | Поставщик | Параметры |
СЧЕТ |
Дата выпуска |
СРАВНИВАТЬ |
---|---|---|---|---|---|
DeepSeek-V3 превосходит другие модели с открытым исходным кодом, такие как Qwen2.5-72B и Llama-3.1-405B, в различных оценках и соответствует производительности ведущих закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
|
DeepSeek | 671B | 5.4 | 24 марта 2025 г. | |
o4-mini в высоком режиме, который имеет более длительное время ответа и более высокую способность к рассуждению.
|
OpenAI | N/A | 6.2 | 16 апреля 2025 г. | |
Последняя модель MoE с открытым исходным кодом, выпущенная Tencent.
|
Tencent | 80B | 5.1 | 27 июня 2025 г. | |
Последняя модель, выпущенная Moonshot AI, с улучшенными возможностями кодирования и превосходной производительностью в общих задачах агента, построенная на архитектуре MoE.
|
Moonshot | 1000B | 5.5 | 11 июля 2025 г. | |
Большая языковая модель Bailing — это универсальный LLM, который прошел процесс регистрации генеративного ИИ, обученный на триллионах токенов. Онаirono Она использует номер версии Bailing-Pro-20250225.
|
Ant Group | N/A | 4.4 | 25 февраля 2025 г. | |
Модель вывода Spark X1, выпущенная компанией iFlytek, на основе лидирующих в стране математических задач сравнивает свои показатели в общих задачах, таких как вывод, генерация текста и понимание языка, с серией o от OpenAI и DeepSeek R1.
|
iFLYTEK | N/A | 5.4 | 20 июля 2025 г. | |
MiniMax-Text-01 — это мощная языковая модель с общим количеством параметров 456 миллиардов, из которых 45,9 миллиарда активируются на каждый токен. Для лучшего раскрытия возможностей обработки длинного контекста модель MiniMax-Text-01 использует гибридную архитектуру, сочетающую Lightning Attention, Softmax Attention и Mixture-of-Experts (MoE).
|
MiniMax | 456B | 3.8 | 15 января 2025 г. | |
Новая серия моделей рассуждений GLM-4.5, выпущенная GLM.
|
Zhipu AI | 110B | 5.6 | 29 июля 2025 г. | |
Первая в мире модель рассуждений с гибридным вниманием большого масштаба с открытым весом, выпущенная Minimax.
|
MiniMax | 456B | 5.5 | 17 июня 2025 г. | |
Qwen3 — это последнее поколение больших языковых моделей серии Qwen, предлагающее полный набор плотных моделей и моделей с смесью экспертов (MoE).
|
Alibaba | 235B | 5.7 | 22 июля 2025 г. |