Навыки кодирования R1 и V3 Deepseek

Дом

Новости

17 апреля 2025 г.

MarkSmith

117

Представляем DeepSeek: Новый игрок на арене ИИ

DeepSeek ворвался на сцену в минувшие выходные, привлекая внимание по всему миру по трем убедительным причинам:

Это чат-бот с ИИ из Китая, что заметно отличается от привычных предложений из США.
Он имеет открытый исходный код, что имеет большое значение в технологическом сообществе.
Он работает на значительно меньшей инфраструктуре, чем его крупные конкуренты, что делает его интересным вариантом для многих.

Хотя пристальное внимание правительства США к TikTok и возможное участие китайского правительства в его коде вызвало вопросы, появление DeepSeek из Китая естественно привлекает аналогичное внимание. Однако мы здесь не обсуждаем политику. Вместо этого давайте разберемся, как DeepSeek V3 и DeepSeek R1 сравниваются с другими моделями ИИ в задачах программирования.

Согласно собственным рекомендациям DeepSeek:

Выбирайте V3 для задач, требующих глубины и точности, например, для решения сложных математических задач или создания сложного кода.
Выбирайте R1, когда нужны быстрые приложения с большим объемом, такие как автоматизация службы поддержки клиентов или базовая обработка текста.

Вы можете переключаться между R1 и V3 с помощью небольшой кнопки в интерфейсе чата. Если она синяя, вы используете R1.

Скриншот от David Gewirtz/ZDNET

Итак, как они справились? Обе модели показали потенциал, но не были безупречны. Давайте рассмотрим результаты.

Тест 1: Создание плагина для WordPress

Мой первый тест, вдохновленный потребностью моей жены в плагине для WordPress для управления устройством вовлеченности для ее онлайн-группы, является классическим. Плагин должен был принимать список имен, сортировать их и гарантировать, что дубликаты не находятся рядом. Я бросал этот вызов множеству ИИ, и это сложная задача.

Скриншот от David Gewirtz/ZDNET

DeepSeek V3 справился идеально, создав пользовательский интерфейс и программную логику, которые полностью соответствовали заданию. R1 выбрал другой подход, предоставив целых 4502 слова анализа перед тем, как поделиться кодом. Интерфейс был более широким, но и интерфейс, и логика работали, так что R1 тоже прошел.

Скриншот от David Gewirtz/ZDNET

На данный момент обе модели, V3 и R1, прошли один из четырех тестов.

Тест 2: Переписывание функции обработки строк

Пользователь столкнулся с проблемой ввода долларов и центов в поле для пожертвований, что мой исходный код не позволял. Задача состояла в том, чтобы модифицировать функцию для поддержки обоих. DeepSeek создал рабочий код, но есть над чем работать.

Код V3 был слишком длинным и повторяющимся, в то время как рассуждения R1 перед генерацией кода также были многословными. Обе модели проверяли до двух знаков после запятой, но плохо справлялись с очень большими числами. Использование R1 конверсии JavaScript Number без проверки крайних случаев могло привести к сбоям.

Интересно, что R1 предоставил хороший список тестовых случаев:

Скриншот от David Gewirtz/ZDNET

Я отдаю победу V3, потому что его код не вызовет сбоев и даст ожидаемые результаты. R1 проваливается из-за возможных сбоев при нестроковых входных данных. Это две победы из четырех для V3 и одна для R1.

Тест 3: Поиск досадной ошибки

Этот тест возник из-за ошибки, которую я с трудом нашел. Проблема заключалась в том, что очевидный ответ, основанный на сообщении об ошибке, был неверным, что часто сбивает ИИ с толку. Для решения требуется понимание вызовов API WordPress, способность видеть за пределами сообщения об ошибке и точное определение ошибки.

И V3, и R1 прошли этот тест с почти идентичными ответами, что дало V3 три победы из четырех, а R1 — две из четырех. DeepSeek уже превосходит Gemini, Copilot, Claude и Meta.

Тест 4: Создание скрипта

Этот тест сложный, поскольку включает три окружения: AppleScript, объектную модель Chrome и Keyboard Maestro. ChatGPT справился с этим на ура, но DeepSeek V3 и R1 не оправдали ожиданий. Ни одна из моделей не поняла необходимости разделения задач между Keyboard Maestro и Chrome, а их знания AppleScript были слабыми.

R1 сделал неверные предположения, например, что переднее окно всегда существует и что активной программой всегда будет Chrome. В итоге V3 прошел три теста и провалил один, а R1 прошел два теста и провалил два.

Заключительные мысли

Настойчивость DeepSeek в использовании публичной облачной почты, такой как Gmail, вместо моего корпоративного домена, была раздражающей. Также были проблемы с отзывчивостью, из-за которых тестирование заняло больше времени, чем ожидалось.

Изначально я столкнулся с трудностями при регистрации из-за этой ошибки:

Онлайн-сервисы DeepSeek недавно подверглись масштабным злонамеренным атакам. Чтобы обеспечить продолжение работы сервиса, регистрация временно ограничена номерами телефонов с кодом +86. Существующие пользователи могут входить как обычно. Спасибо за понимание и поддержку.

После входа я смог провести тесты. DeepSeek склонен к многословности в своем коде. AppleScript в тесте 4 был одновременно неверным и излишне длинным. Регулярное выражение в тесте 2 могло быть более удобным для поддержки, хотя V3 справился правильно.

Я впечатлен тем, что V3 превзошел Gemini, Copilot и Meta, но он все еще на уровне старого GPT-3.5, что говорит о потенциале для роста. Производительность R1 разочаровала. Если выбирать, я бы остановился на ChatGPT для помощи в программировании.

Тем не менее, для нового инструмента, работающего на значительно меньшей инфраструктуре, DeepSeek определенно заслуживает внимания.

Что вы думаете? Пробовали ли вы DeepSeek? Используете ли вы какие-либо ИИ для поддержки программирования? Дайте нам знать в комментариях ниже.

Следите за моими ежедневными обновлениями проектов в социальных сетях, подпишитесь на мою еженедельную рассылку и свяжитесь со мной на Twitter/X по адресу @DavidGewirtz, на Facebook по адресу Facebook.com/DavidGewirtz, на Instagram по адресу Instagram.com/DavidGewirtz, на Bluesky по адресу @DavidGewirtz.com и на YouTube по адресу YouTube.com/DavidGewirtzTV.

Связанная статья

Master Emerald Kaizo Nuzlocke: Ultimate Survival & Strategy Guide Emerald Kaizo - один из самых грозных хаков для Pokémon ROM, которые когда-либо были придуманы. Несмотря на то, что попытка запустить Nuzlocke в разы увеличивает сложность игры, победа остается достиж

Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал В сегодняшней конкурентной среде научных изданий составление эффективного сопроводительного письма может сыграть решающую роль в принятии вашей рукописи. Узнайте, как инструменты с искусственным интел

США введут санкции против иностранных чиновников из-за правил пользования социальными сетями США выступают против глобального регулирования цифрового контентаНа этой неделе Государственный департамент США выступил с резким дипломатическим обвинением в адрес европейской политики управления ц

Комментарии (13)

0/200

Представлять на рассмотрение

CarlCarter

5 сентября 2025 г., 23:30:30 GMT+03:00

DeepSeek这波操作有点东西啊！中国本土AI终于不再只擅长写诗和做饭了，居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂

BruceGonzalez

25 августа 2025 г., 10:01:02 GMT+03:00

DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀

JoseGonzalez

7 августа 2025 г., 9:33:00 GMT+03:00

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez

23 апреля 2025 г., 11:48:34 GMT+03:00

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams

23 апреля 2025 г., 9:36:41 GMT+03:00

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね！DeepSeek、改善を続けてください！👏

StephenGonzalez

21 апреля 2025 г., 7:47:37 GMT+03:00

DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀

Лучшие новости

Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Gemini 2.5 Pro в настоящее время неограничен и дешевле, чем Claude, GPT-4O Озвучка с помощью ИИ: Ультимативное руководство по созданию реалистичных голосов ИИ ИИ Cambium превращает отходы в пиломатериалы AI Builder и Power Automate Революционизируют Суммирование Документов OpenAI улучшает AI Voice Assistant для лучших чатов Как гарантировать, что ваши данные заслуживают доверия для интеграции искусственного интеллекта NoteBooklm расширяется во всем мире, добавляет слайды и расширенную проверку фактов Настройки для дата -центров США могут разблокировать 76 ГВт новой мощности. Google использует ИИ для приостановки более 39 миллионов счетов объявлений о подозрении на мошенничество

Более

Показан