вариант
Дом
Список моделей AL
DeepSeek-V2-Lite-Chat
Параметр модели
16B
Параметр модели
Аффилированная организация
DeepSeek
Аффилированная организация
Открытый исходный код
Тип лицензии
Время выпуска
15 мая 2024 г.
Время выпуска
Введение модели
DeepSeek-V2, сильная модель языка Mixture-of-Experts (MoE), представленная DeepSeek, DeepSeek-V2-Lite — это лёгкая версия этой модели.
Смахните влево и вправо, чтобы посмотреть больше
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Часто делает семантические ошибки, что приводит к очевидным логическим отключениям в ответах.
3.8
Объем знаний Объем знаний
Объем знаний
Имеет значительные знания слепых пятен, часто показывающих фактические ошибки и повторяющуюся устаревшую информацию.
5.3
Способность рассуждать Способность рассуждать
Способность рассуждать
Невозможно поддерживать последовательные сети рассуждений, часто вызывая инвертированную причинность или просчеты.
1.9
Сравнение модели
Связанная модель
DeepSeek-V2-Chat-0628 DeepSeek-V2 — это мощная модель языка типа Mixture-of-Experts (MoE), характеризующаяся экономичностью обучения и эффективностью вывода. Она содержит 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 демонстрирует более высокую производительность, при этом экономя 42,5% затрат на обучение, снижая объем KV-кэша на 93,3% и увеличивая максимальную пропускную способность генерации до 5,76 раз.
DeepSeek-V2.5 DeepSeek-V2.5 — это обновленная версия, объединяющая DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct. Новая модель интегрирует общие и программные возможности двух предыдущих версий.
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие открытые модели, такие как Qwen2.5-72B и Llama-3.1-405B, во множестве оценок и соответствует уровню производительности премиальных закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
DeepSeek-V2-Chat DeepSeek-V2 — мощная модель языка в формате Mixture-of-Experts (MoE), характеризующаяся экономичным обучением и эффективной инференсом. Она состоит из 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 показывает более высокую производительность, при этом экономит 42.5% затрат на обучение, снижает размер KV-кэша на 93.3% и увеличивает максимальную пропускную способность генерации в 5.76 раза.
DeepSeek-R1 DeepSeek-R1 - это модель, обученная с использованием масштабируемого усиленного обучения (RL) без применения начального шага тонкой настройки с участием supervision (SFT). Её производительность в математических, программных и логических задачах сравнима с OpenAI-o1.
Соответствующие документы
Последняя возможность поднять ваш бренд на новый уровень с помощью побочного мероприятия TechCrunch Sessions: AI Сегодня ваш последний шанс продемонстрировать ваш бренд в центре обсуждений об ИИ во время Недели TechCrunch Sessions: AI, с подачей заявок на проведение побочного мероприятия, закрывающейся сегодня в
Присоединяйтесь к TechCrunch Sessions: AI с гостем и сэкономьте 50% на его билете до 4 мая Интересуетесь будущим AI? Приглашайте друга и погружайтесь вместе!До 4 мая приобретайте билет Early Bird на TechCrunch Sessions: AI, экономьте до $210 и получайте скидку 50% на второй билет для вашего
Anthropic улучшает Claude с помощью бесшовных интеграций инструментов и продвинутых исследований Anthropic представила новые «Интеграции» для Claude, позволяющие искусственному интеллекту напрямую подключаться к вашим любимым рабочим инструментам. Компания также представила улучшенную функцию «Пр
AI驱动的用户体验设计:塑造用户体验的未来 用户体验(UX)设计领域正在经历深刻变革,这得益于人工智能(AI)的快速发展。人工智能不再是遥远的愿景,如今已成为UX设计过程中的核心支柱,重新定义了以用户为中心界面的打造方式。这一转变为设计师开辟了新机遇,同时要求他们具备新的技能和适应能力。本文探讨了人工智能时代UX设计的未来,重点介绍必备工具、关键技能及其对设计领域的影响。你准备好拥抱人工智能在UX设计中的潜力了吗?让我们一起探索!关键要点人
AI-управляемое образование: Революция в обучении на всех уровнях Искусственный интеллект (AI) трансформирует образование, предоставляя инновационные инструменты для вовлечения учащихся и персонализации обучения. Эта статья рассматривает, как педагоги могут использо
Сравнение модели
Начните сравнение
Вернуться к вершине
OR