X의 Grok은 AI 코딩 테스트에서 기대치를 능가합니다

X가 처음 챗봇을 출시했을 때, 이는 유료 장벽 뒤에 숨겨져 있었습니다. 하지만 속담에 있듯이, 공짜 점심은 없다는(TANSTAAFL) 말이 최근까지 유효했죠. X가 Grok을 모두에게 개방하기로 결정하면서 말이죠. 그 기능이 궁금했던 저는 프로그래밍 테스트를 통해 Grok을 시험해보기로 했습니다.
저는 항상 Grok에 애정을 가지고 있었는데, 그 이름 덕분입니다. 이 이름은 제게 가장 좋아하는 SF 작가 중 한 명인 Robert Heinlein이 만들어낸 것입니다. Heinlein의 작품은 제 어린 시절을 형성하는 데 큰 역할을 했습니다. 제가 소비하는 미디어에 대해 꽤 엄격했던 부모님은 지역 도서관에서 SF를 읽는 것을 허락했는데, '과학'이라는 라벨이 붙은 것은 교육적일 거라는 가정 아래였죠.
Heinlein의 이야기는 단순히 재미있을 뿐 아니라, 사회적 규범에 도전하고 과학적 주제를 사회적 논평과 엮으며 생각을 자극했습니다. *낯선 땅의 이방인*에서 소개된 "grok"이라는 용어는 깊고 근본적인 이해를 상징하며, AI 챗봇의 이름으로 적합합니다.
하지만 여기엔 함정이 있습니다...
Grok이 사용하는 대형 언어 모델(LLM)에 대해 물었을 때, Grok은 *은하수를 여행하는 히치하이커를 위한 안내서*의 재치와 반항적인 태도에서 영감을 받았다고 했습니다. *히치하이커*는 확실히 매력이 있지만, 실제로 "grok"이라는 용어를 사용하지는 않습니다. 하지만 이제 프로그래밍 테스트로 넘어가겠습니다.
1. WordPress 플러그인 작성
이 테스트는 AI가 PHP 프로그래밍 기술과 WordPress 플러그인 개발 지식을 보여줄 것을 요구했습니다. 이는 제 아내가 전자상거래 사이트의 월간 참여 장치를 위해 이름을 무작위로 섞는 도구가 필요했던 실제 요청에서 비롯되었습니다. 조건은 일부 사용자가 여러 번 입력될 수 있으므로, 무작위화 도구는 이 이름들이 나란히 배치되지 않도록 해야 했습니다.
코드는 또한 사용자 친화적이어야 했으며, 아내가 단순히 이름을 붙여넣고 버튼을 클릭하면 목록을 얻을 수 있도록 해야 했습니다. Grok은 이 테스트를 훌륭히 통과했습니다. 인터페이스는 깔끔하고 기능적이었으며, 요구된 대로 정확히 작동했습니다.
2. 문자열 함수 재작성
두 번째 테스트는 달러와 센트 금액을 검증하는 함수에서 사용자 제보로 발견된 문제를 수정하는 것이었습니다. 제 원래 코드는 정수만 받아들여서 $5는 유효했지만, $5.25는 유효하지 않았습니다. Grok은 정규 표현식을 재작성하여 거의 성공에 가까웠지만, .5 같은 숫자를 유효한 통화로 인식하지 못했고, 이중 변환을 사용하는 비효율적인 방법을 썼습니다. 그래서 이건 실패입니다.
3. 성가신 버그 찾기
이 테스트는 WordPress 프레임워크와 API를 이해하여 미묘한 버그를 찾아내는 것이었습니다. 저를 포함한 많은 LLM이 처음에 이에 어려움을 겪었지만, Grok은 이를 정확히 해결하며 유용한 솔루션을 제공했습니다. 세 번 중 두 번 승리했습니다.
4. 스크립트 작성
마지막 테스트는 까다로운 테스트로, 틈새 Mac 스크립팅 도구인 Keyboard Maestro에 대한 지식과 Keyboard Maestro, Chrome, AppleScript 등 여러 환경에서 동시에 코드를 작성하는 능력이 필요했습니다. 이전에는 Google Gemini과 GPT-4 이상의 ChatGPT만 이 테스트를 통과했습니다. 하지만 Grok은 이를 완벽히 해내어 네 번 중 세 번 승리했습니다.
최종 생각
Grok은 이 테스트들에서 잘 버텼습니다. 선행 0 없는 통화 값을 허용했더라면 완벽했을 것입니다. X가 Twitter를 대체한 이후의 변화에 대해 복잡한 감정을 가지고 있지만, Grok은 특히 프로그래밍 기술 면에서 견고한 챗봇임을 증명했습니다.
Grok에 대한 당신의 생각은 어떤가요? 사용해보셨나요? 그리고 *낯선 땅의 이방인*이나 *은하수를 여행하는 히치하이커를 위한 안내서*는 어떤가요? 아래 댓글에서 당신의 생각을 공유해주세요. 그럼, 모든 물고기에 감사하며!
관련 기사
최고의 AI 연구소, 인류가 AI 시스템에 대한 이해력을 잃어가고 있다고 경고하다
전례 없는 단결력을 보여준 OpenAI, Google DeepMind, Anthropic, Meta의 연구원들은 경쟁적 차이를 제쳐두고 책임감 있는 AI 개발에 대한 공동의 경고를 발표했습니다. 일반적으로 라이벌 관계에 있는 이들 조직의 40여 명의 선도적인 과학자들은 AI 의사결정 과정의 투명성을 보장하기 위해 빠르게 닫혀가는 창을 강조하는 획기적인 연구
마이크로소프트, 예산 친화적인 Xbox 클라우드 게임 구독 서비스 공개
Microsoft, Xbox 클라우드 게임을 위한 경제적인 옵션 모색새로운 소식에 따르면 Microsoft는 Xbox 클라우드 게임을 보다 경제적으로 이용할 수 있도록 하는 계획을 추진하고 있습니다. 잠재적인 무료 광고 지원 버전에 대한 이전 보도에 이어, 회사 경영진은 이제 스트리밍 서비스에 대한 더 광범위한 접근성 옵션을 암시하고 있습니다.Microso
AI 스토리텔링: InferKit으로 설득력 있는 소설 만들기(단어 수: 90)
빠르게 진화하는 디지털 환경에서 인공지능은 크리에이티브 산업, 특히 스토리텔링을 혁신하고 있습니다. InferKit은 작가가 몰입도 높은 소설을 만들고, 다차원적인 캐릭터를 개발하며, 매력적인 내러티브를 구성할 수 있도록 지원하는 고급 AI 텍스트 생성 플랫폼으로서 이러한 혁신의 선두에 서 있습니다. 이 가이드에서는 스토리텔링 기술을 향상하고, 창작의 한계
의견 (23)
0/200
SamuelEvans
2025년 8월 28일 오전 12시 1분 28초 GMT+09:00
Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?
0
JosephScott
2025년 8월 23일 오전 10시 1분 25초 GMT+09:00
Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎
0
EdwardJackson
2025년 7월 28일 오전 10시 20분 21초 GMT+09:00
Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?
0
WalterLee
2025년 4월 20일 오후 8시 43분 55초 GMT+09:00
ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀
0
JonathanKing
2025년 4월 20일 오후 7시 14분 26초 GMT+09:00
¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀
0
BruceClark
2025년 4월 19일 오후 8시 37분 49초 GMT+09:00
Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀
0
X가 처음 챗봇을 출시했을 때, 이는 유료 장벽 뒤에 숨겨져 있었습니다. 하지만 속담에 있듯이, 공짜 점심은 없다는(TANSTAAFL) 말이 최근까지 유효했죠. X가 Grok을 모두에게 개방하기로 결정하면서 말이죠. 그 기능이 궁금했던 저는 프로그래밍 테스트를 통해 Grok을 시험해보기로 했습니다.
저는 항상 Grok에 애정을 가지고 있었는데, 그 이름 덕분입니다. 이 이름은 제게 가장 좋아하는 SF 작가 중 한 명인 Robert Heinlein이 만들어낸 것입니다. Heinlein의 작품은 제 어린 시절을 형성하는 데 큰 역할을 했습니다. 제가 소비하는 미디어에 대해 꽤 엄격했던 부모님은 지역 도서관에서 SF를 읽는 것을 허락했는데, '과학'이라는 라벨이 붙은 것은 교육적일 거라는 가정 아래였죠.
Heinlein의 이야기는 단순히 재미있을 뿐 아니라, 사회적 규범에 도전하고 과학적 주제를 사회적 논평과 엮으며 생각을 자극했습니다. *낯선 땅의 이방인*에서 소개된 "grok"이라는 용어는 깊고 근본적인 이해를 상징하며, AI 챗봇의 이름으로 적합합니다.
하지만 여기엔 함정이 있습니다...
Grok이 사용하는 대형 언어 모델(LLM)에 대해 물었을 때, Grok은 *은하수를 여행하는 히치하이커를 위한 안내서*의 재치와 반항적인 태도에서 영감을 받았다고 했습니다. *히치하이커*는 확실히 매력이 있지만, 실제로 "grok"이라는 용어를 사용하지는 않습니다. 하지만 이제 프로그래밍 테스트로 넘어가겠습니다.
1. WordPress 플러그인 작성
이 테스트는 AI가 PHP 프로그래밍 기술과 WordPress 플러그인 개발 지식을 보여줄 것을 요구했습니다. 이는 제 아내가 전자상거래 사이트의 월간 참여 장치를 위해 이름을 무작위로 섞는 도구가 필요했던 실제 요청에서 비롯되었습니다. 조건은 일부 사용자가 여러 번 입력될 수 있으므로, 무작위화 도구는 이 이름들이 나란히 배치되지 않도록 해야 했습니다.
코드는 또한 사용자 친화적이어야 했으며, 아내가 단순히 이름을 붙여넣고 버튼을 클릭하면 목록을 얻을 수 있도록 해야 했습니다. Grok은 이 테스트를 훌륭히 통과했습니다. 인터페이스는 깔끔하고 기능적이었으며, 요구된 대로 정확히 작동했습니다.
2. 문자열 함수 재작성
두 번째 테스트는 달러와 센트 금액을 검증하는 함수에서 사용자 제보로 발견된 문제를 수정하는 것이었습니다. 제 원래 코드는 정수만 받아들여서 $5는 유효했지만, $5.25는 유효하지 않았습니다. Grok은 정규 표현식을 재작성하여 거의 성공에 가까웠지만, .5 같은 숫자를 유효한 통화로 인식하지 못했고, 이중 변환을 사용하는 비효율적인 방법을 썼습니다. 그래서 이건 실패입니다.
3. 성가신 버그 찾기
이 테스트는 WordPress 프레임워크와 API를 이해하여 미묘한 버그를 찾아내는 것이었습니다. 저를 포함한 많은 LLM이 처음에 이에 어려움을 겪었지만, Grok은 이를 정확히 해결하며 유용한 솔루션을 제공했습니다. 세 번 중 두 번 승리했습니다.
4. 스크립트 작성
마지막 테스트는 까다로운 테스트로, 틈새 Mac 스크립팅 도구인 Keyboard Maestro에 대한 지식과 Keyboard Maestro, Chrome, AppleScript 등 여러 환경에서 동시에 코드를 작성하는 능력이 필요했습니다. 이전에는 Google Gemini과 GPT-4 이상의 ChatGPT만 이 테스트를 통과했습니다. 하지만 Grok은 이를 완벽히 해내어 네 번 중 세 번 승리했습니다.
최종 생각
Grok은 이 테스트들에서 잘 버텼습니다. 선행 0 없는 통화 값을 허용했더라면 완벽했을 것입니다. X가 Twitter를 대체한 이후의 변화에 대해 복잡한 감정을 가지고 있지만, Grok은 특히 프로그래밍 기술 면에서 견고한 챗봇임을 증명했습니다.
Grok에 대한 당신의 생각은 어떤가요? 사용해보셨나요? 그리고 *낯선 땅의 이방인*이나 *은하수를 여행하는 히치하이커를 위한 안내서*는 어떤가요? 아래 댓글에서 당신의 생각을 공유해주세요. 그럼, 모든 물고기에 감사하며!




Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?




Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎




Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?




ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀




¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀




Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀












