メタAIは、コーディングテストでLlama、Gemini、およびChatGptと競合できません

家

ニュース

2025年6月3日

GeorgeNelson

222

AIツールはコードをどれくらいうまく書けるか？

過去1年ほどにわたり、私はいくつかの大規模言語モデルを試し、基本的なプログラミング課題にどれだけ効果的に取り組めるかをテストしてきました。これらのテストの背後にある考え方はシンプルです：基本的な課題を処理できない場合、より複雑なタスクで役立つ可能性は低いでしょう。しかし、これらの基礎的な課題で優れた結果を出せば、時間を節約したい開発者にとって貴重なパートナーになるかもしれません。

基準を確立するために、私は4つの異なるテストを使用しました。これらは、簡単なコーディング課題から、WordPressのようなフレームワークに関する深い洞察を必要とするデバッグ演習まで多岐にわたります。それぞれのテストに飛び込み、Metaの新しいAIツールが他のツールと比べてどのように立ち位置かを比較してみましょう。

テスト1：WordPressプラグインの作成

WordPressプラグインの作成には、WordPressエコシステム内でのPHPを使用したウェブ開発が含まれます。また、UIデザインもある程度必要です。AIチャットボットがこれを成功させれば、ウェブ開発者の役に立つアシスタントになる可能性があります。

結果：

Meta AI: 適切なインターフェースだが、機能面で失敗。
Meta Code Llama: 完全な失敗。
Google Gemini Advanced: 優れたインターフェースだが、機能面で失敗。
ChatGPT: クリーンなインターフェースと機能的な出力。

ここでは視覚的な比較を示します： UIテスト （注："/path-to-image/"を実際の画像ファイルのパスに置き換えてください。）

ChatGPTはより整ったインターフェースを提供し、「ランダム化」ボタンをより論理的に配置しました。しかし、実際にプラグインを実行する際、Meta AIはクラッシュし、恐ろしい「白い画面の死」を引き起こしました。

テスト2：文字列関数の書き換え

このテストでは、AIがユーティリティ関数を改善する能力を評価します。ここでの成功は、開発者にとって有用な支援の可能性を示唆し、失敗は改善の余地があることを意味します。

結果：

Meta AI: 不正確な値の修正、複数桁の小数点数の扱いの悪さ、フォーマット問題により失敗。
Meta Code Llama: 成功。
Google Gemini Advanced: 失敗。
ChatGPT: 成功。

Meta AIはこの一見簡単なタスクでつまずきましたが、Meta Code Llamaは輝きを放ち、その能力を示しました。ChatGPTも見事に実行しました。

テスト3：厄介なバグの発見

これはコードを書くことではなく、問題を診断することに関するテストです。成功するには、WordPress APIやコードベースの異なる部分間の相互作用に関する深い知識が必要です。

結果：

Meta AI: 問題を特定し、効率を高める調整を提案し、圧倒的な成功を収めました。
Meta Code Llama: 失敗。
Google Gemini Advanced: 失敗。
ChatGPT: 成功。

驚くべきことに、以前の苦戦にもかかわらず、Meta AIはここで優れ、その可能性を証明しましたが、応答の一貫性の欠如も浮き彫りにしました。

テスト4：スクリプトの作成

このテストでは、Keyboard MaestroやAppleScriptのような特殊なツールに関する知識を評価します。これらは比較的ニッチですが、プログラミングスキルの幅広い範囲を代表します。

結果：

Meta AI: Keyboard Maestroからデータを取得できず失敗。
Meta Code Llama: 同じく失敗。
Google Gemini Advanced: 成功。
ChatGPT: 成功。

GeminiとChatGPTはこれらのツールで熟練を示しましたが、Metaの提供物は不足していました。

全体の結果

モデル	成功率
Meta AI	1/4
Meta Code Llama	1/4
Google Gemini	1/4
ChatGPT	4/4

6か月間のChatGPTを使用したコーディングプロジェクトの経験に基づいて、その信頼性に自信を持っています。他のモデルはまだその一貫性と効果に匹敵していません。Meta AIは一瞬の輝きを見せましたが、全体的なパフォーマンスには多くの改善の余地があります。

これらのツールを試したことがありますか？以下のコメントであなたの考えを共有してください！

Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した人工知能（AI）が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ

DeepSeek Code、まもなくリリースへ AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek

マスク氏の「Grok」：1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか？イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX（

関連特集おすすめ

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

教育と学習

最高のAIデータサイエンスメンター：SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール

xix.ai

チャットボット

最高のAIを使ったナンパ＆会話トレーニング：社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール

xix.ai

コード

自動化ユニットテストに最適なAIツール：ワンクリックでJest、PyTest、JUnitのテストケースを生成する

2026年に登場した、自動化ユニットテスト用の最高評価を受けたAIツールを発見してください。当社が厳選したこれらのツールは、Jest、PyTest、JUnitのテストケースを瞬時に生成するための強力で革新的なソリューションです。XIX.AIでは、無料オプションと有料オプションを実際のテストデータと共に比較し、毎週更新されるランキングもご覧いただけます。今すぐAIの力を活用して、開発生産性を向上させましょう。

10 ツール

xix.ai

コメント (6)

0/500

最初にログインしてください

OliverPhillips

2026年5月14日 11:00:09 JST

Interesting test! I've been using ChatGPT for coding help and it's been decent, but honestly I'm more curious about the open-source alternatives like Llama. Meta's AI being behind isn't a huge shock, but it makes you wonder if they're focusing on different strengths. Maybe coding isn't their main goal? 🤔 Still, competition is good for us users!

BillyWilson

2025年9月30日 17:30:37 JST

Meta AI 코딩 테스트 결과는 참 실망스럽네요 😅 다른 경쟁사들보다 확실히 뒤처지는 모습인데... 그래도 아직 초기 단계니까 차차 나아지지 않을까요? 물론 빠르게 따라잡아야 하지만 말이죠!

ChristopherTaylor

2025年8月13日 0:00:59 JST

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris

2025年8月1日 22:47:34 JST

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez

2025年7月28日 10:20:02 JST

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts

2025年7月22日 10:25:03 JST

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表企業のAI導入は頭打ち、ランプのデータで明らかに Bing Image Creator チュートリアル: AIアート生成ガイドあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場エンボディッド・インテリジェンス、無秩序な拡大を抑制するための初の業界標準を発表

もっと

特集