Grok của X vượt qua kỳ vọng trong các bài kiểm tra mã hóa AI

Trang chủ

Tin tức

Ngày 17 tháng 4 năm 2025

JamesLopez

111

Grok của X vượt qua kỳ vọng trong các bài kiểm tra mã hóa AI

Khi X lần đầu ra mắt chatbot của mình, nó bị giấu sau một bức tường trả phí. Nhưng, như câu nói, chẳng có bữa trưa nào miễn phí (TANSTAAFL), cho đến gần đây khi X quyết định mở Grok cho mọi người. Tò mò về khả năng của nó, tôi quyết định thử nghiệm nó qua các bài kiểm tra lập trình của mình.

Tôi luôn có cảm tình với Grok, nhờ cái tên của nó, được Robert Heinlein, một trong những tác giả khoa học viễn tưởng yêu thích mọi thời đại của tôi, đặt ra. Các tác phẩm của Heinlein đóng vai trò quan trọng trong việc hình thành tư duy của tôi khi còn trẻ. Cha mẹ tôi, vốn rất nghiêm khắc về các phương tiện truyền thông tôi tiếp xúc, đã cho phép tôi đắm mình trong khoa học viễn tưởng tại thư viện địa phương, với giả định rằng bất cứ thứ gì được gắn nhãn 'khoa học' chắc chắn phải mang tính giáo dục.

Những câu chuyện của Heinlein không chỉ giải trí; chúng còn kích thích tư duy, thách thức các chuẩn mực xã hội và lồng ghép các chủ đề khoa học với bình luận xã hội. Thuật ngữ "grok," được giới thiệu trong *Stranger in a Strange Land*, thể hiện sự hiểu biết sâu sắc, cơ bản, khiến nó trở thành một cái tên phù hợp cho một chatbot AI.

Tuy nhiên, có một vấn đề...

Khi tôi hỏi về mô hình ngôn ngữ lớn (LLM) mà Grok sử dụng, nó nhắc đến việc được truyền cảm hứng từ sự hóm hỉnh và tinh thần nổi loạn của *Hitchhiker's Guide to the Galaxy*. Mặc dù *Hitchhiker's* chắc chắn có sức hấp dẫn riêng, nhưng nó thực sự không sử dụng thuật ngữ "grok." Nhưng hãy chuyển sang các bài kiểm tra lập trình.

1. Viết Plugin WordPress

Bài kiểm tra này yêu cầu AI thể hiện kỹ năng lập trình PHP và kiến thức về phát triển plugin WordPress. Nó bắt nguồn từ một yêu cầu thực tế từ vợ tôi, người cần một công cụ để ngẫu nhiên hóa tên cho thiết bị tham gia hàng tháng trên trang thương mại điện tử của cô ấy. Điều đặc biệt là một số người dùng có thể có nhiều mục nhập, nên công cụ ngẫu nhiên cần đảm bảo những cái tên này không được đặt cạnh nhau.

Mã code cũng phải thân thiện với người dùng, cho phép cô ấy chỉ cần dán tên, nhấp vào một nút và nhận được danh sách. Grok đã vượt qua bài kiểm tra này một cách xuất sắc. Giao diện sạch sẽ, chức năng và làm đúng những gì nó phải làm.

2. Viết lại Hàm Chuỗi

Bài kiểm tra thứ hai liên quan đến việc sửa lỗi do người dùng báo cáo với một hàm được dùng để xác thực số tiền đô la và cent. Mã gốc của tôi chỉ chấp nhận số nguyên, nên $5 là hợp lệ, nhưng $5.25 thì không. Grok đã viết lại biểu thức chính quy, gần như đạt được chiến thắng. Tuy nhiên, nó không nhận ra các số như .5 là tiền tệ hợp lệ và sử dụng một phương pháp không hiệu quả với việc chuyển đổi kép. Vì vậy, đây là một thất bại.

3. Tìm Lỗi Khó Chịu

Bài kiểm tra này yêu cầu hiểu khung WordPress và API để xác định một lỗi tinh vi. Nhiều LLM, bao gồm cả tôi ban đầu, đã gặp khó khăn với điều này. Nhưng Grok đã làm xuất sắc, cung cấp một giải pháp đúng và hữu ích. Đó là hai chiến thắng trong ba bài kiểm tra.

4. Viết Script

Bài kiểm tra cuối cùng là một thử thách khó, yêu cầu kiến thức về Keyboard Maestro, một công cụ lập trình kịch bản Mac chuyên biệt, và khả năng viết mã cho nhiều môi trường đồng thời: Keyboard Maestro, Chrome và AppleScript. Trước đây chỉ có Google Gemini và ChatGPT với GPT-4 hoặc cao hơn vượt qua bài kiểm tra này. Tuy nhiên, Grok đã xuất sắc vượt qua, giành được ba chiến thắng trong bốn bài kiểm tra.

Suy Nghĩ Cuối Cùng

Grok đã thể hiện tốt trong các bài kiểm tra này. Nếu nó chỉ cho phép các giá trị tiền tệ mà không cần số không đứng đầu, nó đã có thể hoàn hảo. Mặc dù tôi có cảm xúc lẫn lộn về những thay đổi tại X kể từ khi nó thay thế Twitter, Grok đã chứng minh là một chatbot mạnh mẽ, đặc biệt về kỹ năng lập trình.

Bạn nghĩ gì về Grok? Bạn đã thử nó chưa? Và còn về *Stranger in a Strange Land* hay *Hitchhiker's Guide to the Galaxy* thì sao? Chia sẻ suy nghĩ của bạn trong phần bình luận bên dưới. Tạm biệt, và cảm ơn vì tất cả những con cá!

Bài viết liên quan

TechCrunch Disrupt 2025: Tiết kiệm đến $900 cho Vé trước Hạn chót 25 tháng 5 Nhanh lên! Tiết kiệm đến $900 cho vé tham dự TechCrunch Disrupt 2025 trước khi giá tăng. Mua vé Early Bird ngay bây giờ và nhận vé thứ hai giảm 90% — ưu đãi có thời hạn.Các ưu đãi độc quyền này kết th

Làm Chủ Việc Tạo Nội Dung SEO với Các Công Cụ AI Miễn Phí: Hướng Dẫn Từng Bước Trong thế giới kỹ thuật số phát triển nhanh chóng, nội dung chất lượng cao, tối ưu hóa SEO là chìa khóa để thu hút khách truy cập và cuốn hút khán giả của bạn. Hướng dẫn này tiết lộ cách tận dụng các

Tạo Hình Ảnh và Video AI Tuyệt Đẹp với Mô Hình Flux và Nhân Vật Đồng Nhất Trong thời đại kỹ thuật số hiện nay, việc tạo hình ảnh bằng AI trở nên dễ tiếp cận hơn bao giờ hết. Hướng dẫn này khám phá việc sử dụng mô hình Flux và các công cụ khác để tạo ra các hình ảnh do AI tạ

Nhận xét (21)

0/200

Nộp

EdwardJackson

08:20:21 GMT+07:00 Ngày 28 tháng 7 năm 2025

Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?

WalterLee

18:43:55 GMT+07:00 Ngày 20 tháng 4 năm 2025

ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀

JonathanKing

17:14:26 GMT+07:00 Ngày 20 tháng 4 năm 2025

¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀

BruceClark

18:37:49 GMT+07:00 Ngày 19 tháng 4 năm 2025

Grokのコード能力は驚異的です！まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね！🚀

WalterWhite

14:26:45 GMT+07:00 Ngày 19 tháng 4 năm 2025

Grokのコーディングテスト結果にびっくり！簡単なスクリプト書いてもらったけど、めっちゃ速くて正確。AIの進化、ちょっと怖いね😅

KennethKing

13:13:21 GMT+07:00 Ngày 19 tháng 4 năm 2025

O Grok da X está impressionante! Lida com problemas complexos como um profissional e suas sugestões são quase sempre precisas. Às vezes é um pouco detalhista demais, mas de forma geral, é uma ferramenta excelente para desenvolvedores!

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói

Hơn

Đặc trưng