オプション
ニュース
DeepseekのR1およびV3コーディングスキルをテストしました:私たちはまだ運命づけられていません

DeepseekのR1およびV3コーディングスキルをテストしました:私たちはまだ運命づけられていません

2025年4月17日
106

DeepSeekの紹介:AIアリーナの新参者

DeepSeekは週末に突如登場し、3つの魅力的な理由で世界中の注目を集めました:

  • 中国発のAIチャットボットで、通常の米国発の製品とは一線を画しています。
  • オープンソースであり、テックコミュニティにとって大きな意味を持ちます。
  • 重量級の競合他社よりも大幅に少ないインフラで動作し、多くの人にとって魅力的な選択肢となっています。

米国政府がTikTokやそのコードに中国政府が関与している可能性について厳しい監視を行っている中、DeepSeekが中国から登場したことで当然注目が集まっています。ただし、ここでは政治には触れません。代わりに、DeepSeek V3とDeepSeek R1がコーディングタスクで他のAIモデルとどのように競合するかを見ていきましょう。

DeepSeek自身のガイダンスによると:

  • 複雑な数学問題の解決や複雑なコード生成など、深さと正確さが求められるタスクにはV3を選びましょう。
  • カスタマーサポートの自動化や基本的なテキスト処理など、迅速で大量のアプリケーションが必要な場合はR1を選びましょう。

チャットインターフェースの小さなボタンでR1とV3を切り替えることができます。ボタンが青い場合はR1を使用しています。

David Gewirtz/ZDNETによるスクリーンショット

David Gewirtz/ZDNETによるスクリーンショット

では、結果はどうだったでしょうか?両モデルとも有望な結果を示しましたが、完璧ではありませんでした。結果を探ってみましょう。

テスト1:WordPressプラグインの作成

妻がオンライングループ用の参加デバイスを管理するWordPressプラグインを必要としていたことにインスパイアされた最初のテストは、クラシックなものでした。プラグインは名前のリストを受け取り、並べ替え、重複が隣り合わないようにする必要がありました。この課題は多くのAIに投げかけてきましたが、難しいものです。

David Gewirtz/ZDNETによるスクリーンショット

David Gewirtz/ZDNETによるスクリーンショット

DeepSeek V3は完璧にクリアし、要件を完全に満たすユーザーインターフェースとプログラムロジックを作成しました。R1は異なるアプローチを取り、コードを共有する前に4502語もの分析を提供しました。UIはより広範でしたが、UIもロジックも機能したため、R1も合格しました。

David Gewirtz/ZDNETによるスクリーンショット

David Gewirtz/ZDNETによるスクリーンショット

David Gewirtz/ZDNETによるスクリーンショット

David Gewirtz/ZDNETによるスクリーンショット

これまでのところ、V3とR1は4つのテストのうち1つを合格しました。

テスト2:文字列関数の書き換え

ユーザーが寄付フィールドにドルとセントを入力するのに問題があり、元のコードではそれが許可されていませんでした。タスクは両方を許可するようにルーチンを変更することでした。DeepSeekは機能するコードを生成しましたが、改善の余地があります。

V3のコードは長すぎて繰り返しが多く、R1のコード生成前の推論も長かったです。両モデルとも小数点以下2桁まで検証しましたが、非常に大きな数値の処理は得意ではありませんでした。R1がJavaScriptのNumber変換を使用し、エッジケースをチェックしなかったため、クラッシュする可能性があります。

興味深いことに、R1はテストケースの優れたリストを提供しました:

David Gewirtz/ZDNETによるスクリーンショット

David Gewirtz/ZDNETによるスクリーンショット

V3はコードがクラッシュせず、期待通りの結果を出すため、ポイントを獲得します。R1は非文字列入力によるクラッシュの可能性があるため失敗です。これでV3は4つのテスト中2勝、R1は1勝です。

テスト3:厄介なバグの追跡

このテストは私が苦労して見つけたバグに由来します。エラーメッセージに基づく明らかな答えが間違っており、AIをしばしば騙します。解決にはWordPress APIコールを理解し、エラーメッセージを越えて見て、バグを特定する必要があります。

V3とR1はほぼ同じ答えでこのテストに合格し、V3は4つのテスト中3勝、R1は2勝となりました。DeepSeekはすでにGemini、Copilot、Claude、Metaを上回っています。

テスト4:スクリプトの作成

このテストは、AppleScript、Chromeオブジェクトモデル、Keyboard Maestroの3つの環境が関わるため難しいです。ChatGPTはこれを完璧にこなしましたが、DeepSeek V3とR1は不十分でした。どちらのモデルもKeyboard MaestroとChromeのタスク分割の必要性を理解せず、AppleScriptの知識も弱かったです。

R1は、フロントウィンドウが常に存在し、実行中のプログラムが常にChromeであるという誤った前提を立てました。これにより、V3は3つのテストに合格し1つ失敗、R1は2つのテストに合格し2つ失敗しました。

最終的な感想

DeepSeekがGmailのようなパブリッククラウドメールを使用することを強制し、企業ドメインを認めなかったのは苛立たしいものでした。テストに予想以上の時間がかかる応答性の問題もありました。

当初、このエラーでサインアップに苦労しました:

DeepSeekのオンラインサービスは最近、大規模な悪意ある攻撃に直面しています。サービスの継続を確保するため、登録は一時的に+86の電話番号に制限されています。既存のユーザーは通常通りログインできます。ご理解とご支援に感謝します。

ログイン後、テストを実行できました。DeepSeekのコードは冗長な傾向があります。テスト4のAppleScriptは不正確で不必要に長かったです。テスト2の正規表現はもっとメンテナンスしやすかったはずですが、V3は正しく処理しました。

V3がGemini、Copilot、Metaを上回ったのは印象的ですが、旧GPT-3.5レベルにとどまっており、成長の余地があります。R1のパフォーマンスは失望でした。選択肢があるなら、プログラミングの助けにはChatGPTを選びます。

それでも、はるかに少ないインフラで動作する新しいツールとして、DeepSeekは注目すべき存在です。

あなたの意見はどうですか?DeepSeekを試しましたか?プログラミング支援にAIを使っていますか?以下のコメントで教えてください。

ソーシャルメディアで私の毎日のプロジェクト更新をフォローし、毎週のニュースレターを購読し、Twitter/Xの@DavidGewirtz、FacebookのFacebook.com/DavidGewirtz、InstagramのInstagram.com/DavidGewirtz、Blueskyの@DavidGewirtz.com、YouTubeのYouTube.com/DavidGewirtzTVで私とつながってください。

関連記事
AI Voice Translator G5 Pro: シームレスなグローバルコミュニケーション AI Voice Translator G5 Pro: シームレスなグローバルコミュニケーション グローバルな接続が不可欠な世界において、言語の壁を越えることはこれまで以上に重要です。AI Voice Translator G5 Proは、リアルタイム翻訳機能により、さまざまなシナリオで実際的な解決策を提供します。新しい国を探索したり、国際ビジネスを行ったり、新しい言語を学んだりする場合、このデバイスは簡単にコミュニケーションを効率化します。この記事では、AI Voice Translator
HitPaw AI Photo Enhancerで画像を向上させる:包括的ガイド HitPaw AI Photo Enhancerで画像を向上させる:包括的ガイド 写真編集の体験を変えたいですか?最先端の人工知能のおかげで、画像の改善が今や簡単に行えます。この詳細なガイドでは、HitPaw AI Photo Enhancer、画像の品質と解像度を自動的に向上させるオフラインAIツールを探ります。プロの写真家であろうと、個人のスナップショットを磨きたい愛好家であろうと、HitPaw AI Photo Enhancerは驚くべき結果をもたらす強力な機能を提供しま
AI駆動の音楽作成:楽曲とビデオを簡単に制作 AI駆動の音楽作成:楽曲とビデオを簡単に制作 音楽作成は時間、資源、専門知識を必要とする複雑なプロセスです。人工知能はこのプロセスを変革し、シンプルで誰でも利用できるものにしました。このガイドでは、AIがどのようにして誰でも無料でユニークな楽曲やビジュアルを制作できるようにするか、新たな創造的可能性を解き放つ方法を紹介します。直感的で使いやすいインターフェースと先進的なAIを備えたプラットフォームを探索し、音楽のアイデアを高コストなしで現実に
コメント (11)
0/200
JoseGonzalez
JoseGonzalez 2025年8月7日 15:33:00 JST

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez
ArthurSanchez 2025年4月23日 17:48:34 JST

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams
NicholasAdams 2025年4月23日 15:36:41 JST

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏

StephenGonzalez
StephenGonzalez 2025年4月21日 13:47:37 JST

DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀

BruceClark
BruceClark 2025年4月21日 3:54:30 JST

ディープシークのR1とV3はかなりクールですが、完璧ではありません。コーディングのスキルはまあまあですが、時々レスポンスがずれることがあります。それでも、中国から新しいプレイヤーがAIの世界に参入するのは素晴らしいです。ディープシーク、改善を続けてください!👀

AnthonyHernández
AnthonyHernández 2025年4月20日 18:41:17 JST

딥시크의 R1과 V3는 꽤 멋지지만, 완벽하진 않아요. 코딩 스킬은 괜찮은데, 가끔 응답이 좀 어긋나요. 그래도 중국에서 새로운 플레이어가 AI 게임에 참여하는 건 멋진 일이에요. 딥시크, 계속 개선하세요! 👀

トップに戻ります
OR