вариант
Дом
Новости
X Grok превосходит ожидания в тестах на кодирование искусственного интеллекта

X Grok превосходит ожидания в тестах на кодирование искусственного интеллекта

17 апреля 2025 г.
132

X Grok превосходит ожидания в тестах на кодирование искусственного интеллекта

Когда X впервые запустил свой чат-бот, он был скрыт за платным доступом. Но, как говорится, бесплатного обеда не бывает (TANSTAAFL), пока недавно X не решил открыть Grok для всех. Заинтересовавшись его возможностями, я решил протестировать его на своих программистских задачах.

Я всегда питал слабость к Grok, благодаря его названию, которое придумал Роберт Хайнлайн, один из моих любимых авторов научной фантастики. Произведения Хайнлайна сыграли значительную роль в формировании моего юного ума. Мои родители, которые строго следили за тем, какие медиа я потребляю, разрешали мне погружаться в научную фантастику в нашей местной библиотеке, считая, что всё, помеченное как «наука», должно быть образовательным.

Рассказы Хайнлайна были не только развлекательными; они заставляли задуматься, бросали вызов общественным нормам и сочетали научные темы с социальными комментариями. Термин «grok», введённый в романе *Чужак в чужой стране*, олицетворяет глубокое, фундаментальное понимание, что делает его подходящим названием для чат-бота с ИИ.

Однако есть одно «но»...

Когда я спросил о большой языковой модели (LLM), которую использует Grok, он упомянул, что вдохновлялся остроумием и бунтарством *Автостопом по галактике*. Хотя *Автостоп* определённо обладает своим шармом, в нём на самом деле не используется термин «grok». Но перейдём к программистским тестам.

1. Написание плагина для WordPress

Этот тест требовал от ИИ продемонстрировать навыки программирования на PHP и знания разработки плагинов для WordPress. Задача возникла из реального запроса моей жены, которой нужен был инструмент для случайного выбора имён для ежемесячного устройства вовлечения на её сайте электронной коммерции. Особенность заключалась в том, что некоторые пользователи могли иметь несколько записей, поэтому генератор случайных чисел должен был гарантировать, что эти имена не будут располагаться рядом.

Код также должен был быть удобным для пользователя, позволяя ей просто вставлять имена, нажимать кнопку и получать список. Grok блестяще справился с этим тестом. Интерфейс был чистым, функциональным и делал именно то, что от него требовалось.

2. Переписывание строковой функции

Второй тест заключался в исправлении проблемы, о которой сообщил пользователь, с функцией, предназначенной для проверки сумм в долларах и центах. Мой исходный код принимал только целые числа, так что $5 считалось допустимым, а $5.25 — нет. Grok переписал регулярное выражение, почти одержав победу. Однако он не распознал числа вроде .5 как действительную валюту и использовал неэффективный метод с двойным преобразованием. Так что в этом тесте он проиграл.

3. Поиск раздражающей ошибки

Этот тест требовал понимания фреймворка и API WordPress, чтобы обнаружить тонкую ошибку. Многие LLM, включая меня самого на начальном этапе, с этим справились с трудом. Но Grok справился идеально, предоставив правильное и полезное решение. Это два победных результата из трёх.

4. Написание скрипта

Последний тест был сложным, требовал знания Keyboard Maestro, нишевого инструмента для скриптов на Mac, и способности писать код одновременно для нескольких сред: Keyboard Maestro, Chrome и AppleScript. Ранее этот тест прошли только Google Gemini и ChatGPT с GPT-4 или выше. Однако Grok справился с ним на ура, обеспечив три победы из четырёх.

Заключительные мысли

Grok хорошо показал себя в этих тестах. Если бы он только разрешил валютные значения без ведущего нуля, результат был бы идеальным. Несмотря на мои смешанные чувства по поводу изменений в X с тех пор, как он заменил Twitter, Grok доказал, что является надёжным чат-ботом, особенно в плане программистских навыков.

Каково ваше мнение о Grok? Пробовали ли вы его? А что насчёт *Чужака в чужой стране* или *Автостопа по галактике*? Поделитесь своими мыслями в комментариях ниже. Пока, и спасибо за всю рыбу!

Связанная статья
Lalal.ai: Профессиональный инструмент для извлечения вокала и инструментов для разделения аудио Lalal.ai: Профессиональный инструмент для извлечения вокала и инструментов для разделения аудио Индустрия музыкального производства стремительно развивается, а возможности выделения вокала с помощью искусственного интеллекта революционизируют творческие рабочие процессы. Lalal.ai стоит на передн
AGI совершит революцию в человеческом мышлении благодаря прорыву в области универсального языка AGI совершит революцию в человеческом мышлении благодаря прорыву в области универсального языка Появление искусственного интеллекта общего назначения несет в себе трансформационный потенциал для изменения человеческой коммуникации путем создания универсальной языковой базы. В отличие от узкоспец
Обновление резюме и сопроводительного письма с помощью технологий искусственного интеллекта в 2025 году Обновление резюме и сопроводительного письма с помощью технологий искусственного интеллекта в 2025 году На современном высококонкурентном рынке труда в 2025 году инструменты на базе искусственного интеллекта стали незаменимы для создания профессиональных резюме и сопроводительных писем, привлекающих вни
Комментарии (23)
SamuelEvans
SamuelEvans 27 августа 2025 г., 18:01:28 GMT+03:00

Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?

JosephScott
JosephScott 23 августа 2025 г., 4:01:25 GMT+03:00

Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎

EdwardJackson
EdwardJackson 28 июля 2025 г., 4:20:21 GMT+03:00

Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?

WalterLee
WalterLee 20 апреля 2025 г., 14:43:55 GMT+03:00

ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀

JonathanKing
JonathanKing 20 апреля 2025 г., 13:14:26 GMT+03:00

¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀

BruceClark
BruceClark 19 апреля 2025 г., 14:37:49 GMT+03:00

Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀

Вернуться к вершине
OR