вариант
Дом
Новости
Навыки кодирования R1 и V3 Deepseek

Навыки кодирования R1 и V3 Deepseek

17 апреля 2025 г.
106

Представляем DeepSeek: Новый игрок на арене ИИ

DeepSeek ворвался на сцену в минувшие выходные, привлекая внимание по всему миру по трем убедительным причинам:

  • Это чат-бот с ИИ из Китая, что заметно отличается от привычных предложений из США.
  • Он имеет открытый исходный код, что имеет большое значение в технологическом сообществе.
  • Он работает на значительно меньшей инфраструктуре, чем его крупные конкуренты, что делает его интересным вариантом для многих.

Хотя пристальное внимание правительства США к TikTok и возможное участие китайского правительства в его коде вызвало вопросы, появление DeepSeek из Китая естественно привлекает аналогичное внимание. Однако мы здесь не обсуждаем политику. Вместо этого давайте разберемся, как DeepSeek V3 и DeepSeek R1 сравниваются с другими моделями ИИ в задачах программирования.

Согласно собственным рекомендациям DeepSeek:

  • Выбирайте V3 для задач, требующих глубины и точности, например, для решения сложных математических задач или создания сложного кода.
  • Выбирайте R1, когда нужны быстрые приложения с большим объемом, такие как автоматизация службы поддержки клиентов или базовая обработка текста.

Вы можете переключаться между R1 и V3 с помощью небольшой кнопки в интерфейсе чата. Если она синяя, вы используете R1.

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

Итак, как они справились? Обе модели показали потенциал, но не были безупречны. Давайте рассмотрим результаты.

Тест 1: Создание плагина для WordPress

Мой первый тест, вдохновленный потребностью моей жены в плагине для WordPress для управления устройством вовлеченности для ее онлайн-группы, является классическим. Плагин должен был принимать список имен, сортировать их и гарантировать, что дубликаты не находятся рядом. Я бросал этот вызов множеству ИИ, и это сложная задача.

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

DeepSeek V3 справился идеально, создав пользовательский интерфейс и программную логику, которые полностью соответствовали заданию. R1 выбрал другой подход, предоставив целых 4502 слова анализа перед тем, как поделиться кодом. Интерфейс был более широким, но и интерфейс, и логика работали, так что R1 тоже прошел.

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

На данный момент обе модели, V3 и R1, прошли один из четырех тестов.

Тест 2: Переписывание функции обработки строк

Пользователь столкнулся с проблемой ввода долларов и центов в поле для пожертвований, что мой исходный код не позволял. Задача состояла в том, чтобы модифицировать функцию для поддержки обоих. DeepSeek создал рабочий код, но есть над чем работать.

Код V3 был слишком длинным и повторяющимся, в то время как рассуждения R1 перед генерацией кода также были многословными. Обе модели проверяли до двух знаков после запятой, но плохо справлялись с очень большими числами. Использование R1 конверсии JavaScript Number без проверки крайних случаев могло привести к сбоям.

Интересно, что R1 предоставил хороший список тестовых случаев:

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

Я отдаю победу V3, потому что его код не вызовет сбоев и даст ожидаемые результаты. R1 проваливается из-за возможных сбоев при нестроковых входных данных. Это две победы из четырех для V3 и одна для R1.

Тест 3: Поиск досадной ошибки

Этот тест возник из-за ошибки, которую я с трудом нашел. Проблема заключалась в том, что очевидный ответ, основанный на сообщении об ошибке, был неверным, что часто сбивает ИИ с толку. Для решения требуется понимание вызовов API WordPress, способность видеть за пределами сообщения об ошибке и точное определение ошибки.

И V3, и R1 прошли этот тест с почти идентичными ответами, что дало V3 три победы из четырех, а R1 — две из четырех. DeepSeek уже превосходит Gemini, Copilot, Claude и Meta.

Тест 4: Создание скрипта

Этот тест сложный, поскольку включает три окружения: AppleScript, объектную модель Chrome и Keyboard Maestro. ChatGPT справился с этим на ура, но DeepSeek V3 и R1 не оправдали ожиданий. Ни одна из моделей не поняла необходимости разделения задач между Keyboard Maestro и Chrome, а их знания AppleScript были слабыми.

R1 сделал неверные предположения, например, что переднее окно всегда существует и что активной программой всегда будет Chrome. В итоге V3 прошел три теста и провалил один, а R1 прошел два теста и провалил два.

Заключительные мысли

Настойчивость DeepSeek в использовании публичной облачной почты, такой как Gmail, вместо моего корпоративного домена, была раздражающей. Также были проблемы с отзывчивостью, из-за которых тестирование заняло больше времени, чем ожидалось.

Изначально я столкнулся с трудностями при регистрации из-за этой ошибки:

Онлайн-сервисы DeepSeek недавно подверглись масштабным злонамеренным атакам. Чтобы обеспечить продолжение работы сервиса, регистрация временно ограничена номерами телефонов с кодом +86. Существующие пользователи могут входить как обычно. Спасибо за понимание и поддержку.

После входа я смог провести тесты. DeepSeek склонен к многословности в своем коде. AppleScript в тесте 4 был одновременно неверным и излишне длинным. Регулярное выражение в тесте 2 могло быть более удобным для поддержки, хотя V3 справился правильно.

Я впечатлен тем, что V3 превзошел Gemini, Copilot и Meta, но он все еще на уровне старого GPT-3.5, что говорит о потенциале для роста. Производительность R1 разочаровала. Если выбирать, я бы остановился на ChatGPT для помощи в программировании.

Тем не менее, для нового инструмента, работающего на значительно меньшей инфраструктуре, DeepSeek определенно заслуживает внимания.

Что вы думаете? Пробовали ли вы DeepSeek? Используете ли вы какие-либо ИИ для поддержки программирования? Дайте нам знать в комментариях ниже.

Следите за моими ежедневными обновлениями проектов в социальных сетях, подпишитесь на мою еженедельную рассылку и свяжитесь со мной на Twitter/X по адресу @DavidGewirtz, на Facebook по адресу Facebook.com/DavidGewirtz, на Instagram по адресу Instagram.com/DavidGewirtz, на Bluesky по адресу @DavidGewirtz.com и на YouTube по адресу YouTube.com/DavidGewirtzTV.

Связанная статья
AI-управляемое создание музыки: Легко создавайте песни и видео AI-управляемое создание музыки: Легко создавайте песни и видео Создание музыки может быть сложным, требующим времени, ресурсов и опыта. Искусственный интеллект преобразил этот процесс, сделав его простым и доступным. Это руководство показывает, как ИИ позволяет к
Создание раскрасок с использованием ИИ: Полное руководство Создание раскрасок с использованием ИИ: Полное руководство Создание раскрасок — это увлекательное занятие, сочетающее художественное выражение с успокаивающим опытом для пользователей. Однако процесс может быть трудоемким. К счастью, инструменты ИИ упрощают с
Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo, израильский стартап в области AI-кодирования, ориентированный на качество кода, начал сотрудничество с Google Cloud для повышения целостности программного обеспечения, созданного AI.По мере рост
Комментарии (11)
JoseGonzalez
JoseGonzalez 7 августа 2025 г., 9:33:00 GMT+03:00

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez
ArthurSanchez 23 апреля 2025 г., 11:48:34 GMT+03:00

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams
NicholasAdams 23 апреля 2025 г., 9:36:41 GMT+03:00

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏

StephenGonzalez
StephenGonzalez 21 апреля 2025 г., 7:47:37 GMT+03:00

DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀

BruceClark
BruceClark 20 апреля 2025 г., 21:54:30 GMT+03:00

ディープシークのR1とV3はかなりクールですが、完璧ではありません。コーディングのスキルはまあまあですが、時々レスポンスがずれることがあります。それでも、中国から新しいプレイヤーがAIの世界に参入するのは素晴らしいです。ディープシーク、改善を続けてください!👀

AnthonyHernández
AnthonyHernández 20 апреля 2025 г., 12:41:17 GMT+03:00

딥시크의 R1과 V3는 꽤 멋지지만, 완벽하진 않아요. 코딩 스킬은 괜찮은데, 가끔 응답이 좀 어긋나요. 그래도 중국에서 새로운 플레이어가 AI 게임에 참여하는 건 멋진 일이에요. 딥시크, 계속 개선하세요! 👀

Вернуться к вершине
OR