вариант
Дом
Список моделей AL
DeepSeek-V2-Lite-Chat
Параметр модели
16B
Параметр модели
Аффилированная организация
DeepSeek
Аффилированная организация
Открытый исходный код
Тип лицензии
Время выпуска
15 мая 2024 г.
Время выпуска

Введение модели
DeepSeek-V2, сильная модель языка Mixture-of-Experts (MoE), представленная DeepSeek, DeepSeek-V2-Lite — это лёгкая версия этой модели.
Смахните влево и вправо, чтобы посмотреть больше
Способность к пониманию языка Способность к пониманию языка
Способность к пониманию языка
Часто делает семантические ошибки, что приводит к очевидным логическим отключениям в ответах.
3.8
Объем знаний Объем знаний
Объем знаний
Имеет значительные знания слепых пятен, часто показывающих фактические ошибки и повторяющуюся устаревшую информацию.
5.3
Способность рассуждать Способность рассуждать
Способность рассуждать
Невозможно поддерживать последовательные сети рассуждений, часто вызывая инвертированную причинность или просчеты.
1.9
Сравнение модели
Связанная модель
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие модели с открытым исходным кодом, такие как Qwen2.5-72B и Llama-3.1-405B, в различных оценках и соответствует производительности ведущих закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
DeepSeek-R1-0528 Последняя версия Deepseek R1.
DeepSeek-V2-Chat-0628 DeepSeek-V2 — это мощная модель языка типа Mixture-of-Experts (MoE), характеризующаяся экономичностью обучения и эффективностью вывода. Она содержит 236 миллиардов общих параметров, из которых 21 миллиард активируется для каждого токена. В сравнении с DeepSeek 67B, DeepSeek-V2 демонстрирует более высокую производительность, при этом экономя 42,5% затрат на обучение, снижая объем KV-кэша на 93,3% и увеличивая максимальную пропускную способность генерации до 5,76 раз.
DeepSeek-V2.5 DeepSeek-V2.5 — это обновленная версия, объединяющая DeepSeek-V2-Chat и DeepSeek-Coder-V2-Instruct. Новая модель интегрирует общие и программные возможности двух предыдущих версий.
DeepSeek-V3-0324 DeepSeek-V3 превосходит другие открытые модели, такие как Qwen2.5-72B и Llama-3.1-405B, во множестве оценок и соответствует уровню производительности премиальных закрытых моделей, таких как GPT-4 и Claude-3.5-Sonnet.
Соответствующие документы
Сенат США исключил мораторий на искусственный интеллект из бюджетного законопроекта на фоне разногласий Сенат подавляющим большинством голосов отменил мораторий на регулирование ИИВо вторник американские законодатели, продемонстрировав редкое двухпартийное единство, почти единогласно проголосовали за
Почему искусственный интеллект не справился с наводнением в Техасе в 2025 году: Важнейшие уроки реагирования на стихийные бедствия Вот переписанная версия:Техасские наводнения 2025 года: тревожный звонокВ июле 2025 года Техас столкнулся с катастрофическим наводнением, которое выявило критические пробелы в подготовке к стихийным б
Последний шанс получить билеты со скидкой на TechCrunch Sessions: Завтрашнее мероприятие по искусственному интеллекту Это не просто очередная технологическая конференция - в Целлербах-холле Калифорнийского университета в Беркли состоится самая важная встреча года, посвященная искусственному интеллекту. Когда завтра о
Руководство по автоматизации рассылки новостей на основе искусственного интеллекта: Оптимизируйте свой рабочий процесс с легкостью Вот мой рерайт HTML-контента с сохранением всех оригинальных тегов и структуры:Ключевые моменты Воплотите автоматизированный рабочий процесс рассылки с помощью решений Make, Notion и 0CodeKit. Програм
Гавайские пляжные эскапады: Новые связи и неожиданные повороты Представьте себя на чистейшем гавайском пляже, солнечные лучи согревают вашу кожу, а волны создают успокаивающий ритм. Для Джоша это видение стало реальностью после многих лет самоотверженной работы.
Сравнение модели
Начните сравнение
Вернуться к вершине
OR