옵션
뉴스
X의 Grok은 AI 코딩 테스트에서 기대치를 능가합니다

X의 Grok은 AI 코딩 테스트에서 기대치를 능가합니다

2025년 4월 17일
194

X의 Grok은 AI 코딩 테스트에서 기대치를 능가합니다

X가 처음 챗봇을 출시했을 때, 이는 유료 장벽 뒤에 숨겨져 있었습니다. 하지만 속담에 있듯이, 공짜 점심은 없다는(TANSTAAFL) 말이 최근까지 유효했죠. X가 Grok을 모두에게 개방하기로 결정하면서 말이죠. 그 기능이 궁금했던 저는 프로그래밍 테스트를 통해 Grok을 시험해보기로 했습니다.

저는 항상 Grok에 애정을 가지고 있었는데, 그 이름 덕분입니다. 이 이름은 제게 가장 좋아하는 SF 작가 중 한 명인 Robert Heinlein이 만들어낸 것입니다. Heinlein의 작품은 제 어린 시절을 형성하는 데 큰 역할을 했습니다. 제가 소비하는 미디어에 대해 꽤 엄격했던 부모님은 지역 도서관에서 SF를 읽는 것을 허락했는데, '과학'이라는 라벨이 붙은 것은 교육적일 거라는 가정 아래였죠.

Heinlein의 이야기는 단순히 재미있을 뿐 아니라, 사회적 규범에 도전하고 과학적 주제를 사회적 논평과 엮으며 생각을 자극했습니다. *낯선 땅의 이방인*에서 소개된 "grok"이라는 용어는 깊고 근본적인 이해를 상징하며, AI 챗봇의 이름으로 적합합니다.

하지만 여기엔 함정이 있습니다...

Grok이 사용하는 대형 언어 모델(LLM)에 대해 물었을 때, Grok은 *은하수를 여행하는 히치하이커를 위한 안내서*의 재치와 반항적인 태도에서 영감을 받았다고 했습니다. *히치하이커*는 확실히 매력이 있지만, 실제로 "grok"이라는 용어를 사용하지는 않습니다. 하지만 이제 프로그래밍 테스트로 넘어가겠습니다.

1. WordPress 플러그인 작성

이 테스트는 AI가 PHP 프로그래밍 기술과 WordPress 플러그인 개발 지식을 보여줄 것을 요구했습니다. 이는 제 아내가 전자상거래 사이트의 월간 참여 장치를 위해 이름을 무작위로 섞는 도구가 필요했던 실제 요청에서 비롯되었습니다. 조건은 일부 사용자가 여러 번 입력될 수 있으므로, 무작위화 도구는 이 이름들이 나란히 배치되지 않도록 해야 했습니다.

코드는 또한 사용자 친화적이어야 했으며, 아내가 단순히 이름을 붙여넣고 버튼을 클릭하면 목록을 얻을 수 있도록 해야 했습니다. Grok은 이 테스트를 훌륭히 통과했습니다. 인터페이스는 깔끔하고 기능적이었으며, 요구된 대로 정확히 작동했습니다.

2. 문자열 함수 재작성

두 번째 테스트는 달러와 센트 금액을 검증하는 함수에서 사용자 제보로 발견된 문제를 수정하는 것이었습니다. 제 원래 코드는 정수만 받아들여서 $5는 유효했지만, $5.25는 유효하지 않았습니다. Grok은 정규 표현식을 재작성하여 거의 성공에 가까웠지만, .5 같은 숫자를 유효한 통화로 인식하지 못했고, 이중 변환을 사용하는 비효율적인 방법을 썼습니다. 그래서 이건 실패입니다.

3. 성가신 버그 찾기

이 테스트는 WordPress 프레임워크와 API를 이해하여 미묘한 버그를 찾아내는 것이었습니다. 저를 포함한 많은 LLM이 처음에 이에 어려움을 겪었지만, Grok은 이를 정확히 해결하며 유용한 솔루션을 제공했습니다. 세 번 중 두 번 승리했습니다.

4. 스크립트 작성

마지막 테스트는 까다로운 테스트로, 틈새 Mac 스크립팅 도구인 Keyboard Maestro에 대한 지식과 Keyboard Maestro, Chrome, AppleScript 등 여러 환경에서 동시에 코드를 작성하는 능력이 필요했습니다. 이전에는 Google Gemini과 GPT-4 이상의 ChatGPT만 이 테스트를 통과했습니다. 하지만 Grok은 이를 완벽히 해내어 네 번 중 세 번 승리했습니다.

최종 생각

Grok은 이 테스트들에서 잘 버텼습니다. 선행 0 없는 통화 값을 허용했더라면 완벽했을 것입니다. X가 Twitter를 대체한 이후의 변화에 대해 복잡한 감정을 가지고 있지만, Grok은 특히 프로그래밍 기술 면에서 견고한 챗봇임을 증명했습니다.

Grok에 대한 당신의 생각은 어떤가요? 사용해보셨나요? 그리고 *낯선 땅의 이방인*이나 *은하수를 여행하는 히치하이커를 위한 안내서*는 어떤가요? 아래 댓글에서 당신의 생각을 공유해주세요. 그럼, 모든 물고기에 감사하며!

관련 기사
WordPress.com에서는 이제 AI 에이전트가 게시물을 작성하고 게시할 수 있게 되었으며, 그 외에도 다양한 기능이 추가되었습니다 WordPress.com에서는 이제 AI 에이전트가 게시물을 작성하고 게시할 수 있게 되었으며, 그 외에도 다양한 기능이 추가되었습니다 인기 웹 호스팅 및 게시 플랫폼인 WordPress.com이 이제 AI 에이전트를 도입하고 있으며, 이는 웹의 모습과 사용 경험을 재편할 수 있는 움직임입니다. 이 회사는 금요일, AI 에이전트가 고객 웹사이트에서 콘텐츠를 작성, 편집 및 게시할 뿐만 아니라 댓글을 관리하고, 메타데이터를 업데이트 및 수정하며, 태그와 카테고리를 통해 콘텐츠를 정리할 수 있
Anthropic의 실험용 AI ‘클로드(Claude)’가 전자상거래 테스트에서 협상과 거래를 성공적으로 완료했다 Anthropic의 실험용 AI ‘클로드(Claude)’가 전자상거래 테스트에서 협상과 거래를 성공적으로 완료했다 인공지능이 급속도로 발전하는 가운데, 앤트로픽(Anthropic)은 지난 금요일 ‘프로젝트 딜(Project Deal)’이라는 내부 실험을 조용히 시작하며 전자상거래 분야에서 AI의 잠재력을 선보였다. 이 실험에서는 AI 모델 ‘클로드(Claude)’가 실제 금융 거래가 이루어지는 폐쇄형 시장 환경 내에서 구매, 판매, 가격 협상을 자율적으로 수행했다.실험
DeepSeek Code, 출시를 앞두고 있다 DeepSeek Code, 출시를 앞두고 있다 AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code
관련 특별 주제 추천
사업 최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요
최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구
xix.ai
사업 최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화
최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구
xix.ai
생산력 AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상
AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구
xix.ai
챗봇 최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요
최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구
xix.ai
교육 및 학습 최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기
최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구
xix.ai
챗봇 최고의 AI 유혹 및 대화 트레이너: 실시간으로 사회적 매력과 자신감을 높여보세요
최고의 AI 유혹 및 대화 트레이너: 실시간으로 사회적 매력과 자신감을 높여보세요

XIX.AI에서 2026년 최고의 AI 플러팅 및 대화 트레이너를 만나보세요. 엄선된 최고 평점의 제품들을 통해 실시간으로 사회적 매력과 자신감을 키울 수 있습니다. 무료와 유료 버전을 비교하고 매주 업데이트되는 순위를 확인하며, 꼭 사용해봐야 할 획기적인 도구들을 탐색해 보세요. 지금 바로 여러분의 사회적 경쟁력을 한 단계 높여보세요.

10 도구
xix.ai
의견 (23)
0/500
SamuelEvans
SamuelEvans 2025년 8월 28일 오전 12시 1분 28초 GMT+09:00

Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?

JosephScott
JosephScott 2025년 8월 23일 오전 10시 1분 25초 GMT+09:00

Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎

EdwardJackson
EdwardJackson 2025년 7월 28일 오전 10시 20분 21초 GMT+09:00

Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?

WalterLee
WalterLee 2025년 4월 20일 오후 8시 43분 55초 GMT+09:00

ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀

JonathanKing
JonathanKing 2025년 4월 20일 오후 7시 14분 26초 GMT+09:00

¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀

BruceClark
BruceClark 2025년 4월 19일 오후 8시 37분 49초 GMT+09:00

Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀

OR