옵션
AL 모델 목록
DeepSeek-V2-Lite-Chat
모델 매개 변수 수량
16B
모델 매개 변수 수량
제휴 조직
DeepSeek
제휴 조직
오픈 소스
라이선스 유형
출시 시간
2024년 5월 15일
출시 시간

모델 소개
DeepSeek가 발표한 강력한 MoE(Mixture-of-Experts) 언어 모델인 DeepSeek-V2의 가벼운 버전이 DeepSeek-V2-Lite입니다.
왼쪽과 오른쪽으로 스와이프하여 더 보기
언어 이해 능력 언어 이해 능력
언어 이해 능력
종종 의미 론적 잘못 판단을 내리며, 논리적 인 분리가 응답으로 이어집니다.
3.1
지식 범위 범위 지식 범위 범위
지식 범위 범위
상당한 지식 사각 지대가 있으며, 종종 사실 오류와 구식 정보를 반복하는 경우가 많습니다.
4.1
추론 능력 추론 능력
추론 능력
일관된 추론 사슬을 유지할 수 없으며 종종 역 원인 또는 오해를 유발합니다.
2.8
관련 모델
DeepSeek-V3-0324 DeepSeek-V3는 Qwen2.5-72B 및 Llama-3.1-405B와 같은 다른 오픈소스 모델을 여러 평가에서 능가하며 GPT-4 및 Claude-3.5-Sonnet과 같은 최상위 비공개 모델의 성능에 필적합니다.
DeepSeek-R1-0528 Deepseek R1의 최신 버전.
DeepSeek-V2-Chat-0628 DeepSeek-V2는 경제적인 훈련과 효율적인 추론이 특징인 강력한 혼합 전문가(Mixture-of-Experts) 언어 모델입니다. 총 2360억 개의 파라미터를 가지고 있으며, 각 토큰마다 210억 개의 파라미터가 활성화됩니다. DeepSeek 67B와 비교했을 때, DeepSeek-V2는 더 나은 성능을 제공하면서도 42.5%의 훈련 비용을 절감하고, KV 캐시를 93.3% 줄이며, 최대 생성 스루풋을 5.76배 증가시킵니다.
DeepSeek-V2.5 DeepSeek-V2.5는 DeepSeek-V2-Chat과 DeepSeek-Coder-V2-Instruct를 결합한 업그레이드된 버전입니다. 새 모델은 이전 두 버전의 일반적이고 코드 작성 능력을 통합합니다.
DeepSeek-V3-0324 여러 평가에서 DeepSeek-V3은 Qwen2.5-72B 및 Llama-3.1-405B와 같은 다른 오픈소스 모델들을 능가했으며, GPT-4 및 Claude-3.5-Sonnet과 같은 최고급 폐쇄형 소스 모델의 성능에도 필적합니다.
관련 문서
구글이 곧 출시될 안드로이드 디자인 언어의 세부 사항을 유출했습니다: Material 3 표현식 구글, I/O에서 차세대 안드로이드 디자인 시스템 공개 준비 중공개된 이벤트 일정과 실수로 유출된 블로그 게시물을 통해 밝혀진 바와 같이, 구글은 다가오는 구글 I/O 개발자 컨퍼런스에서 안드로이드 디자인 언어의 획기적인 진화를 선보일 예정입니다. '머티리얼 3'에서 '머티리얼 디자인 3 익스프레시브'로 전환되는 다음 버전에서는 UI 디자인을 통해 감성적인
구글의 제미니 AI가 포켓몬 블루를 정복하다 구글의 AI 이정표: 클래식 포켓몬 어드벤처 정복구글의 가장 진보된 AI 모델이 1996년 게임보이 타이틀인 포켓몬 블루를 완성하는 등 주목할 만한 게임 혁신을 이뤄낸 것으로 보입니다. 순다르 피차이 CEO는 소셜 미디어를 통해 이 성과를 축하했지만, 이 성과에는 중요한 맥락이 있습니다.제미니 플레이 포켓몬 생방송 프로젝트는 사실 소프트웨어 엔지니어인 조엘
테크크런치 세션에서 AI가 중심 무대를 차지합니다: AI - 지금 티켓 구매 가능 테크크런치 세션: AI 등록 시작 - AI 혁명에 동참하세요AI 환경은 빠른 속도로 진화하고 있으며, 여러분을 가장 앞자리에서 기다리고 있습니다! 테크크런치 세션의 등록이 공식적으로 시작되었습니다: 티켓 가격이 인상되기 전에 지금 바로 패스를 확보하고 최대 300달러를 절약하세요.야심찬 스타트업 창업자부터 선구적인 투자자, 호기심 많은 기술 전문가에 이르기
2D 이미지를 멋진 3D 사진으로 변환하는 AI - 궁극의 가이드 인공지능을 통해 정적인 2D 이미지를 몰입감 넘치는 3D 경험으로 변환할 수 있게 되면서 디지털 사진 환경은 혁신적인 변화를 겪고 있습니다. 이 최첨단 기술은 깊이와 원근감을 알고리즘으로 재구성하여 기존 사진에 새로운 생명을 불어넣습니다. 이 혁신의 과학적 원리와 실용적인 구현 방법, 그리고 평범한 사진을 역동적인 시각적 내러티브로 승화시키는 창의적인 애플
샘 알트먼: 최소한의 물을 사용하는 ChatGPT 쿼리 - 1/15 티스푼에 해당하는 양 화요일 블로그 게시물에서 AI의 글로벌 영향력을 탐구한 OpenAI의 CEO인 샘 알트먼은 평균 쿼리당 약 0.000085갤런의 물을 사용하며 이는 티스푼의 약 1/15에 해당한다고 언급하면서 ChatGPT의 자원 소비량에 대한 놀라운 통계를 공개했습니다. 물 사용량에 대한 논의와 함께 알트먼은 각 쿼리가 약 0.34와트시를 소비하며, 이는 오븐을 잠깐 가
위로 돌아갑니다
OR