X Grok превосходит ожидания в тестах на кодирование искусственного интеллекта

Когда X впервые запустил свой чат-бот, он был скрыт за платным доступом. Но, как говорится, бесплатного обеда не бывает (TANSTAAFL), пока недавно X не решил открыть Grok для всех. Заинтересовавшись его возможностями, я решил протестировать его на своих программистских задачах.
Я всегда питал слабость к Grok, благодаря его названию, которое придумал Роберт Хайнлайн, один из моих любимых авторов научной фантастики. Произведения Хайнлайна сыграли значительную роль в формировании моего юного ума. Мои родители, которые строго следили за тем, какие медиа я потребляю, разрешали мне погружаться в научную фантастику в нашей местной библиотеке, считая, что всё, помеченное как «наука», должно быть образовательным.
Рассказы Хайнлайна были не только развлекательными; они заставляли задуматься, бросали вызов общественным нормам и сочетали научные темы с социальными комментариями. Термин «grok», введённый в романе *Чужак в чужой стране*, олицетворяет глубокое, фундаментальное понимание, что делает его подходящим названием для чат-бота с ИИ.
Однако есть одно «но»...
Когда я спросил о большой языковой модели (LLM), которую использует Grok, он упомянул, что вдохновлялся остроумием и бунтарством *Автостопом по галактике*. Хотя *Автостоп* определённо обладает своим шармом, в нём на самом деле не используется термин «grok». Но перейдём к программистским тестам.
1. Написание плагина для WordPress
Этот тест требовал от ИИ продемонстрировать навыки программирования на PHP и знания разработки плагинов для WordPress. Задача возникла из реального запроса моей жены, которой нужен был инструмент для случайного выбора имён для ежемесячного устройства вовлечения на её сайте электронной коммерции. Особенность заключалась в том, что некоторые пользователи могли иметь несколько записей, поэтому генератор случайных чисел должен был гарантировать, что эти имена не будут располагаться рядом.
Код также должен был быть удобным для пользователя, позволяя ей просто вставлять имена, нажимать кнопку и получать список. Grok блестяще справился с этим тестом. Интерфейс был чистым, функциональным и делал именно то, что от него требовалось.
2. Переписывание строковой функции
Второй тест заключался в исправлении проблемы, о которой сообщил пользователь, с функцией, предназначенной для проверки сумм в долларах и центах. Мой исходный код принимал только целые числа, так что $5 считалось допустимым, а $5.25 — нет. Grok переписал регулярное выражение, почти одержав победу. Однако он не распознал числа вроде .5 как действительную валюту и использовал неэффективный метод с двойным преобразованием. Так что в этом тесте он проиграл.
3. Поиск раздражающей ошибки
Этот тест требовал понимания фреймворка и API WordPress, чтобы обнаружить тонкую ошибку. Многие LLM, включая меня самого на начальном этапе, с этим справились с трудом. Но Grok справился идеально, предоставив правильное и полезное решение. Это два победных результата из трёх.
4. Написание скрипта
Последний тест был сложным, требовал знания Keyboard Maestro, нишевого инструмента для скриптов на Mac, и способности писать код одновременно для нескольких сред: Keyboard Maestro, Chrome и AppleScript. Ранее этот тест прошли только Google Gemini и ChatGPT с GPT-4 или выше. Однако Grok справился с ним на ура, обеспечив три победы из четырёх.
Заключительные мысли
Grok хорошо показал себя в этих тестах. Если бы он только разрешил валютные значения без ведущего нуля, результат был бы идеальным. Несмотря на мои смешанные чувства по поводу изменений в X с тех пор, как он заменил Twitter, Grok доказал, что является надёжным чат-ботом, особенно в плане программистских навыков.
Каково ваше мнение о Grok? Пробовали ли вы его? А что насчёт *Чужака в чужой стране* или *Автостопа по галактике*? Поделитесь своими мыслями в комментариях ниже. Пока, и спасибо за всю рыбу!
Связанная статья
Инструменты ИИ преобразуют текст в бесплатные звуковые эффекты для творческих проектов
Создание звуковых эффектов ранее требовало дорогостоящего оборудования и опытных звукорежиссеров. Теперь инструменты на базе ИИ меняют процесс создания аудио, генерируя звуки из простых текстовых опис
AI Comic Factory: Создавайте потрясающие комиксы с легкостью с помощью ИИ
Искусственный интеллект преобразил создание комиксов, сделав его проще и доступнее, чем когда-либо. С инструментами, такими как AI Comic Factory, любой может создавать захватывающие комиксы без продви
TechCrunch Disrupt 2025: Сэкономьте до $900 на билетах до дедлайна 25 мая
Спешите! Сэкономьте до $900 на билетах TechCrunch Disrupt 2025 до повышения цен. Приобретите билет Early Bird сейчас и получите второй со скидкой 90% — предложение ограничено по времени.Эти эксклюзивн
Комментарии (21)
EdwardJackson
28 июля 2025 г., 4:20:21 GMT+03:00
Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?
0
WalterLee
20 апреля 2025 г., 14:43:55 GMT+03:00
ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀
0
JonathanKing
20 апреля 2025 г., 13:14:26 GMT+03:00
¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀
0
BruceClark
19 апреля 2025 г., 14:37:49 GMT+03:00
Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀
0
WalterWhite
19 апреля 2025 г., 10:26:45 GMT+03:00
Grokのコーディングテスト結果にびっくり!簡単なスクリプト書いてもらったけど、めっちゃ速くて正確。AIの進化、ちょっと怖いね😅
0
KennethKing
19 апреля 2025 г., 9:13:21 GMT+03:00
O Grok da X está impressionante! Lida com problemas complexos como um profissional e suas sugestões são quase sempre precisas. Às vezes é um pouco detalhista demais, mas de forma geral, é uma ferramenta excelente para desenvolvedores!
0
Когда X впервые запустил свой чат-бот, он был скрыт за платным доступом. Но, как говорится, бесплатного обеда не бывает (TANSTAAFL), пока недавно X не решил открыть Grok для всех. Заинтересовавшись его возможностями, я решил протестировать его на своих программистских задачах.
Я всегда питал слабость к Grok, благодаря его названию, которое придумал Роберт Хайнлайн, один из моих любимых авторов научной фантастики. Произведения Хайнлайна сыграли значительную роль в формировании моего юного ума. Мои родители, которые строго следили за тем, какие медиа я потребляю, разрешали мне погружаться в научную фантастику в нашей местной библиотеке, считая, что всё, помеченное как «наука», должно быть образовательным.
Рассказы Хайнлайна были не только развлекательными; они заставляли задуматься, бросали вызов общественным нормам и сочетали научные темы с социальными комментариями. Термин «grok», введённый в романе *Чужак в чужой стране*, олицетворяет глубокое, фундаментальное понимание, что делает его подходящим названием для чат-бота с ИИ.
Однако есть одно «но»...
Когда я спросил о большой языковой модели (LLM), которую использует Grok, он упомянул, что вдохновлялся остроумием и бунтарством *Автостопом по галактике*. Хотя *Автостоп* определённо обладает своим шармом, в нём на самом деле не используется термин «grok». Но перейдём к программистским тестам.
1. Написание плагина для WordPress
Этот тест требовал от ИИ продемонстрировать навыки программирования на PHP и знания разработки плагинов для WordPress. Задача возникла из реального запроса моей жены, которой нужен был инструмент для случайного выбора имён для ежемесячного устройства вовлечения на её сайте электронной коммерции. Особенность заключалась в том, что некоторые пользователи могли иметь несколько записей, поэтому генератор случайных чисел должен был гарантировать, что эти имена не будут располагаться рядом.
Код также должен был быть удобным для пользователя, позволяя ей просто вставлять имена, нажимать кнопку и получать список. Grok блестяще справился с этим тестом. Интерфейс был чистым, функциональным и делал именно то, что от него требовалось.
2. Переписывание строковой функции
Второй тест заключался в исправлении проблемы, о которой сообщил пользователь, с функцией, предназначенной для проверки сумм в долларах и центах. Мой исходный код принимал только целые числа, так что $5 считалось допустимым, а $5.25 — нет. Grok переписал регулярное выражение, почти одержав победу. Однако он не распознал числа вроде .5 как действительную валюту и использовал неэффективный метод с двойным преобразованием. Так что в этом тесте он проиграл.
3. Поиск раздражающей ошибки
Этот тест требовал понимания фреймворка и API WordPress, чтобы обнаружить тонкую ошибку. Многие LLM, включая меня самого на начальном этапе, с этим справились с трудом. Но Grok справился идеально, предоставив правильное и полезное решение. Это два победных результата из трёх.
4. Написание скрипта
Последний тест был сложным, требовал знания Keyboard Maestro, нишевого инструмента для скриптов на Mac, и способности писать код одновременно для нескольких сред: Keyboard Maestro, Chrome и AppleScript. Ранее этот тест прошли только Google Gemini и ChatGPT с GPT-4 или выше. Однако Grok справился с ним на ура, обеспечив три победы из четырёх.
Заключительные мысли
Grok хорошо показал себя в этих тестах. Если бы он только разрешил валютные значения без ведущего нуля, результат был бы идеальным. Несмотря на мои смешанные чувства по поводу изменений в X с тех пор, как он заменил Twitter, Grok доказал, что является надёжным чат-ботом, особенно в плане программистских навыков.
Каково ваше мнение о Grok? Пробовали ли вы его? А что насчёт *Чужака в чужой стране* или *Автостопа по галактике*? Поделитесь своими мыслями в комментариях ниже. Пока, и спасибо за всю рыбу!




Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?




ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀




¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀




Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀




Grokのコーディングテスト結果にびっくり!簡単なスクリプト書いてもらったけど、めっちゃ速くて正確。AIの進化、ちょっと怖いね😅




O Grok da X está impressionante! Lida com problemas complexos como um profissional e suas sugestões são quase sempre precisas. Às vezes é um pouco detalhista demais, mas de forma geral, é uma ferramenta excelente para desenvolvedores!












