选项
首页
新闻
Meta AI在编码测试中未能与Llama,Gemini和Chatgpt竞争

Meta AI在编码测试中未能与Llama,Gemini和Chatgpt竞争

2025-06-03
222

AI工具写代码的表现如何?

过去一年左右,我测试了多个大型语言模型,看它们如何应对基本编程挑战。测试的思路很简单:如果连基础都处理不好,复杂任务就更不用说了。但如果它们在基础挑战上表现良好,可能成为开发者节省时间的得力助手。

为了建立基准,我使用了四种不同测试。从简单的编码任务到需要深入了解WordPress等框架的调试练习。让我们逐一分析每个测试,比较Meta的新AI工具与其他工具的表现。

测试1:编写WordPress插件

创建WordPress插件涉及使用PHP进行Web开发,需在WordPress生态系统中操作,还需要一些UI设计。如果AI聊天机器人能完成这个任务,就能成为Web开发者的有用助手。

结果:

  • Meta AI:界面尚可,但功能失败。
  • Meta Code Llama:完全失败。
  • Google Gemini Advanced:界面良好,功能失败。
  • ChatGPT:界面简洁,功能正常。

以下是视觉比较: 界面测试(注:将“/path-to-image/”替换为实际图片文件路径。)

ChatGPT提供了更简洁的界面,“随机”按钮位置更合理。然而,在实际运行插件时,Meta AI崩溃,出现可怕的“白屏死机”。

测试2:重写字符串函数

此测试评估AI改进实用函数的能力。成功表明可为开发者提供帮助,失败则说明有改进空间。

结果:

  • Meta AI:因值校正错误、多小数点数字处理不当及格式问题失败。
  • Meta Code Llama:成功。
  • Google Gemini Advanced:失败。
  • ChatGPT:成功。

Meta AI在这个看似简单的任务上失误,而Meta Code Llama表现出色,展现了能力。ChatGPT也表现优异。

测试3:查找烦人错误

这不是写代码,而是诊断问题。成功需要深入了解WordPress API及代码库各部分交互。

结果:

  • Meta AI:表现出色,识别问题并提出效率提升建议。
  • Meta Code Llama:失败。
  • Google Gemini Advanced:失败。
  • ChatGPT:通过。

令人惊讶的是,尽管之前表现不佳,Meta AI在此表现出色,证明其潜力,但也凸显其响应的不一致性。

测试4:编写脚本

此测试评估对Keyboard Maestro和AppleScript等专业工具的知识。这两者较为小众,但代表更广泛的编程技能。

结果:

  • Meta AI:无法从Keyboard Maestro检索数据。
  • Meta Code Llama:同样失败。
  • Google Gemini Advanced:成功。
  • ChatGPT:成功。

Gemini和ChatGPT展示了对这些工具的熟练掌握,而Meta的产品表现不佳。

总体结果

模型成功率
Meta AI1/4
Meta Code Llama1/4
Google Gemini1/4
ChatGPT4/4

基于我六个月使用ChatGPT进行编码项目的经验,我对其可靠性仍充满信心。其他模型尚未能匹敌其一致性和有效性。Meta AI虽有亮点,但整体表现仍有很大改进空间。

你试过这些工具吗?在下方评论中分享你的想法!

相关文章
耀科传媒首部AIGC剧集《秦岭青铜之谜》今日上线,主演均由AI生成 耀科传媒首部AIGC剧集《秦岭青铜之谜》今日上线,主演均由AI生成 今日,耀科传媒的AIGC奇幻悬疑短剧《秦岭青铜秘闻》正式上线。该剧由公司签约的首批两位AI演员秦凌月和林西妍主演,故事背景设定在神秘的秦岭矿区。 剧中,退役情报官秦月率队深入该区域,揭开了一起尘封已久的矿难真相,以及跨越两代人的血祭之谜——这个真相就隐藏在受限的地下区域,那里是科学探索与古代巫术交汇之地。作为中国最早完全由AI数字人支撑的影视作品之一,该剧在筹备阶段便引发了业界热烈讨论,而关于其A
萨提亚·纳德拉准备利用与OpenAI的新合作关系 萨提亚·纳德拉准备利用与OpenAI的新合作关系 周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能 WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能 广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
相关专题推荐
商业 最佳 AI 费用追踪工具:扫描收据并自动分类企业开支
最佳 AI 费用追踪工具:扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具:广受好评的解决方案,可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案,助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南,助您找到最适合的工具。通过XIX.AI的专家精选,释放您的AI优势。

10 个工具
xix.ai
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
教育与学习 最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程
最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师,帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单,获得强大而具有变革性的指导。通过对比免费和付费选项,并结合实际应用案例进行了解,今天就开启你的数据科学精通之路吧。

10 个工具
xix.ai
聊天机器人 最佳AI调情与对话训练工具:实时提升社交魅力与自信
最佳AI调情与对话训练工具:实时提升社交魅力与自信

在 XIX.AI 上探索 2026 年最优秀的 AI 调情与对话训练工具。我们精心挑选的高评分工具助您实时提升社交魅力与自信。探索这些必试的、颠覆性的工具,查看免费版与付费版的对比,并了解每周更新的排行榜。立即开启您的社交优势。

10 个工具
xix.ai
评论 (6)
0/500
OliverPhillips
OliverPhillips 2026-05-14 10:00:09

Interesting test! I've been using ChatGPT for coding help and it's been decent, but honestly I'm more curious about the open-source alternatives like Llama. Meta's AI being behind isn't a huge shock, but it makes you wonder if they're focusing on different strengths. Maybe coding isn't their main goal? 🤔 Still, competition is good for us users!

BillyWilson
BillyWilson 2025-09-30 16:30:37

Meta AI 코딩 테스트 결과는 참 실망스럽네요 😅 다른 경쟁사들보다 확실히 뒤처지는 모습인데... 그래도 아직 초기 단계니까 차차 나아지지 않을까요? 물론 빠르게 따라잡아야 하지만 말이죠!

ChristopherTaylor
ChristopherTaylor 2025-08-12 23:00:59

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris
PaulHarris 2025-08-01 21:47:34

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez
MarkGonzalez 2025-07-28 09:20:02

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts
TerryRoberts 2025-07-22 09:25:03

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

OR