xAI의 Grok, 발더스 게이트 쿼리 처리 능력 크게 향상

다양한 AI 연구실들은 각기 다른 목표를 추구합니다. 예를 들어, OpenAI는 역사적으로 소비자 애플리케이션에 주력해 온 반면, 경쟁사 Anthropic은 주로 기업 시장을 겨냥해 왔습니다. 최근 보도에 따르면, 일론 머스크의 xAI는 특히 비디오 게임 공략 가이드 개발을 최우선 과제로 삼고 있습니다.
지난 금요일 비즈니스 인사이더의 그레이스 케이 기자는 스페이스X가 최근 인수한 인공지능 스타트업 xAI에 대한 포괄적인 조사 결과를 발표하며, 머스크가 직원들에게 제기하는 것으로 알려진 문제점들을 부각시켰다. 특히 눈에 띄는 세부 사항은 다음과 같다:
상황에 정통한 소식통에 따르면, 지난해 머스크가 비디오 게임 '발더스 게이트'에 대한 복잡한 질문에 챗봇이 내놓은 답변에 불만을 품어 모델 출시가 며칠간 연기된 적이 있다. 출시 전 이 답변들을 다듬기 위해 다른 프로젝트에서 시니어 엔지니어들이 재배치된 것으로 알려졌다.
당연히 기계 지능의 심오한 과제를 해결할 것으로 기대했던 숙련된 엔지니어가 54세 남성의 비디오 게임 진행을 돕는 일로 방향을 전환해야 했다는 점에 공감할 수 있다. 그러나 이 이야기는 더 즉각적인 의문을 불러일으킨다: 머스크는 결국 그가 원했던 게임 전문성을 얻었는가?
이를 확인하기 위해 사내 RPG 전문가 람 아이어(Ram Iyer)가 '발더스 게이트'에 관한 다섯 가지 일반적 질문을 작성했다. 우리는 이를 xAI의 '그록(Grok)'과 주요 AI 모델 3종에 제시하며 '발더벤치(BaldurBench)'라 명명한 비공식 테스트를 진행했다.
투명성을 위해 모든 대화 기록은 공개적으로 확인할 수 있습니다: 그록, 챗GPT, 클로드, 제미니.
먼저 긍정적인 결과부터: 그록은 상당히 탄탄한 정보를 제공한다. 답변에 게임 용어가 다소 과도하게 사용되긴 했다(예: 단순 '저장' 대신 '세이브 스커밍', 피해량에 'DPS' 사용). 하지만 전문 용어를 이해한다면 유용하고 지식이 풍부한 안내였다. 예상대로 그록은 표와 이론적 분석을 특히 선호하는 모습을 보였다.
발더스 게이트 가이드가 다수 존재하며, 모델들은 대체로 유사한 출처에서 정보를 가져오므로 스타일적 차이가 주요 구별점이 됩니다. ChatGPT는 글머리 기호 목록과 간결한 문구를 선호하는 반면, Gemini는 핵심 용어를 굵게 표시하여 강조합니다.
테크크런치 행사TechCrunch Founder Summit에서 최대 300달러 또는 30% 할인
2026 테크크런치 창업자 서밋에서 1,000명 이상의 창업자와 투자자와 함께 현실 세계에서의 성장, 실행, 확장이라는 주제에 집중하는 하루를 보내세요. 업계를 선도해 온 창업자와 투자자들로부터 통찰력을 얻으세요. 비슷한 성장 단계의 동료들과 네트워킹하세요. 즉시 실행 가능한 전략을 가지고 돌아가세요.
혜택은 3월 13일까지입니다.
TechCrunch Founder Summit에서 최대 $300 또는 30% 할인
테크크런치 창업자 서밋 2026에서 1,000명 이상의 창업자와 투자자와 함께 현실 세계에서의 성장, 실행, 확장이라는 주제에 집중하는 하루를 보내세요. 해당 분야를 선도해 온 창업자와 투자자들로부터 통찰력을 얻으세요. 비슷한 성장 단계의 동료들과 네트워킹하세요. 즉시 실행 가능한 전략을 가지고 돌아가세요.
혜택은 3월 13일까지입니다.
매사추세츠주 보스턴 | 2026년 6월 9일 지금 등록하세요가장 예상치 못한 답변은 게임의 서프라이즈를 망칠 수 있는 세부 정보 공유에 특히 신중한 클로드(Claude)에게서 나왔습니다. 최적의 파티 구성에 대해 묻자, 클로드는 "너무 스트레스 받지 말고 그냥 재미있어 보이는 대로 플레이하세요"라는 조언으로 결론을 내렸습니다. 고마워요, 클로드!
비즈니스 인사이더 보도에 따르면, xAI가 경쟁사들과의 격차를 좁히기 위해 집중적으로 노력한 특정 영역이라는 점을 기억하는 것이 중요합니다. 따라서 집중적인 작업 끝에 Grok의 조언이 다른 모델들과 비슷한 수준이 되었다는 사실을 과도하게 해석해서는 안 됩니다. 그럼에도 불구하고 xAI가 자원을 집중할 때 성과를 낼 수 있다는 점은 안심이 됩니다.
플레이어 로딩 중…
관련 기사
트레이스, 기업용 AI 에이전트 도입의 장애물 극복을 위해 300만 달러 조달
비록 인공지능 에이전트들이 큰 잠재력을 가지고 있음에도 불구하고, 기업 환경에서 그들이 제대로 자리잡기는 어려웠습니다. 한 신생 스타트업은 이러한 문제의 핵심이 바로 ‘맥락의 부족’에 있다고 믿고 있습니다.2025년 여름 Y Combinator 프로그램의 일환으로 출시된 Trace는 이러한 격차를 메우기 위해 설계된 워크플로우 오케스트레이션 스타트업입니다. 이 회사는 복잡한 기업 환경과 프로세스를 분석하여, 인공지능 에이전트들이 빠르게 성장할
Hightouch, AI 기반 마케팅 도구로 연간 반복 매출(ARR) 1억 달러 달성
과거에는 마케터들이 맞춤형 온라인 광고 캠페인을 위한 이미지나 동영상을 제작하기 위해 디자이너나 기타 크리에이티브 전문가들에게 의존해야 했습니다.2024년 말, 설립 7년 차 스타트업 하이터치(Hightouch)는 마케팅 전문가들이 도미노피자, 차임(Chime), 펫스마트(PetSmart), 스포티파이(Spotify)와 같은 브랜드를 위한 맞춤형 콘텐츠를
메타의 천연가스 수요 급증으로 사우스다코타주 전력망에 활력을 불어넣을 수 있다
데이터 센터의 규모가 워낙 거대해져서, 현재 그 전력 소비량은 미국 내 한 주 전체의 소비량에 맞먹습니다. 메타(Meta)의 하이페리온(Hyperion) AI 데이터 센터를 예로 들어보겠습니다. 이 시설이 완공되면 사우스다코타주만큼의 전력을 소비하게 될 것입니다.메타는 최근 270억 달러 규모의 데이터 센터 운영을 지원하기 위해, 이미 계획된 3곳 외에도
관련 특별 주제 추천
의견 (0)
0/500

다양한 AI 연구실들은 각기 다른 목표를 추구합니다. 예를 들어, OpenAI는 역사적으로 소비자 애플리케이션에 주력해 온 반면, 경쟁사 Anthropic은 주로 기업 시장을 겨냥해 왔습니다. 최근 보도에 따르면, 일론 머스크의 xAI는 특히 비디오 게임 공략 가이드 개발을 최우선 과제로 삼고 있습니다.
지난 금요일 비즈니스 인사이더의 그레이스 케이 기자는 스페이스X가 최근 인수한 인공지능 스타트업 xAI에 대한 포괄적인 조사 결과를 발표하며, 머스크가 직원들에게 제기하는 것으로 알려진 문제점들을 부각시켰다. 특히 눈에 띄는 세부 사항은 다음과 같다:
상황에 정통한 소식통에 따르면, 지난해 머스크가 비디오 게임 '발더스 게이트'에 대한 복잡한 질문에 챗봇이 내놓은 답변에 불만을 품어 모델 출시가 며칠간 연기된 적이 있다. 출시 전 이 답변들을 다듬기 위해 다른 프로젝트에서 시니어 엔지니어들이 재배치된 것으로 알려졌다.
당연히 기계 지능의 심오한 과제를 해결할 것으로 기대했던 숙련된 엔지니어가 54세 남성의 비디오 게임 진행을 돕는 일로 방향을 전환해야 했다는 점에 공감할 수 있다. 그러나 이 이야기는 더 즉각적인 의문을 불러일으킨다: 머스크는 결국 그가 원했던 게임 전문성을 얻었는가?
이를 확인하기 위해 사내 RPG 전문가 람 아이어(Ram Iyer)가 '발더스 게이트'에 관한 다섯 가지 일반적 질문을 작성했다. 우리는 이를 xAI의 '그록(Grok)'과 주요 AI 모델 3종에 제시하며 '발더벤치(BaldurBench)'라 명명한 비공식 테스트를 진행했다.
투명성을 위해 모든 대화 기록은 공개적으로 확인할 수 있습니다: 그록, 챗GPT, 클로드, 제미니.
먼저 긍정적인 결과부터: 그록은 상당히 탄탄한 정보를 제공한다. 답변에 게임 용어가 다소 과도하게 사용되긴 했다(예: 단순 '저장' 대신 '세이브 스커밍', 피해량에 'DPS' 사용). 하지만 전문 용어를 이해한다면 유용하고 지식이 풍부한 안내였다. 예상대로 그록은 표와 이론적 분석을 특히 선호하는 모습을 보였다.
발더스 게이트 가이드가 다수 존재하며, 모델들은 대체로 유사한 출처에서 정보를 가져오므로 스타일적 차이가 주요 구별점이 됩니다. ChatGPT는 글머리 기호 목록과 간결한 문구를 선호하는 반면, Gemini는 핵심 용어를 굵게 표시하여 강조합니다.
테크크런치 행사TechCrunch Founder Summit에서 최대 300달러 또는 30% 할인
2026 테크크런치 창업자 서밋에서 1,000명 이상의 창업자와 투자자와 함께 현실 세계에서의 성장, 실행, 확장이라는 주제에 집중하는 하루를 보내세요. 업계를 선도해 온 창업자와 투자자들로부터 통찰력을 얻으세요. 비슷한 성장 단계의 동료들과 네트워킹하세요. 즉시 실행 가능한 전략을 가지고 돌아가세요.
혜택은 3월 13일까지입니다.
TechCrunch Founder Summit에서 최대 $300 또는 30% 할인
테크크런치 창업자 서밋 2026에서 1,000명 이상의 창업자와 투자자와 함께 현실 세계에서의 성장, 실행, 확장이라는 주제에 집중하는 하루를 보내세요. 해당 분야를 선도해 온 창업자와 투자자들로부터 통찰력을 얻으세요. 비슷한 성장 단계의 동료들과 네트워킹하세요. 즉시 실행 가능한 전략을 가지고 돌아가세요.
혜택은 3월 13일까지입니다.
매사추세츠주 보스턴 | 2026년 6월 9일 지금 등록하세요가장 예상치 못한 답변은 게임의 서프라이즈를 망칠 수 있는 세부 정보 공유에 특히 신중한 클로드(Claude)에게서 나왔습니다. 최적의 파티 구성에 대해 묻자, 클로드는 "너무 스트레스 받지 말고 그냥 재미있어 보이는 대로 플레이하세요"라는 조언으로 결론을 내렸습니다. 고마워요, 클로드!
비즈니스 인사이더 보도에 따르면, xAI가 경쟁사들과의 격차를 좁히기 위해 집중적으로 노력한 특정 영역이라는 점을 기억하는 것이 중요합니다. 따라서 집중적인 작업 끝에 Grok의 조언이 다른 모델들과 비슷한 수준이 되었다는 사실을 과도하게 해석해서는 안 됩니다. 그럼에도 불구하고 xAI가 자원을 집중할 때 성과를 낼 수 있다는 점은 안심이 됩니다.
플레이어 로딩 중…
트레이스, 기업용 AI 에이전트 도입의 장애물 극복을 위해 300만 달러 조달
비록 인공지능 에이전트들이 큰 잠재력을 가지고 있음에도 불구하고, 기업 환경에서 그들이 제대로 자리잡기는 어려웠습니다. 한 신생 스타트업은 이러한 문제의 핵심이 바로 ‘맥락의 부족’에 있다고 믿고 있습니다.2025년 여름 Y Combinator 프로그램의 일환으로 출시된 Trace는 이러한 격차를 메우기 위해 설계된 워크플로우 오케스트레이션 스타트업입니다. 이 회사는 복잡한 기업 환경과 프로세스를 분석하여, 인공지능 에이전트들이 빠르게 성장할
Hightouch, AI 기반 마케팅 도구로 연간 반복 매출(ARR) 1억 달러 달성
과거에는 마케터들이 맞춤형 온라인 광고 캠페인을 위한 이미지나 동영상을 제작하기 위해 디자이너나 기타 크리에이티브 전문가들에게 의존해야 했습니다.2024년 말, 설립 7년 차 스타트업 하이터치(Hightouch)는 마케팅 전문가들이 도미노피자, 차임(Chime), 펫스마트(PetSmart), 스포티파이(Spotify)와 같은 브랜드를 위한 맞춤형 콘텐츠를
메타의 천연가스 수요 급증으로 사우스다코타주 전력망에 활력을 불어넣을 수 있다
데이터 센터의 규모가 워낙 거대해져서, 현재 그 전력 소비량은 미국 내 한 주 전체의 소비량에 맞먹습니다. 메타(Meta)의 하이페리온(Hyperion) AI 데이터 센터를 예로 들어보겠습니다. 이 시설이 완공되면 사우스다코타주만큼의 전력을 소비하게 될 것입니다.메타는 최근 270억 달러 규모의 데이터 센터 운영을 지원하기 위해, 이미 계획된 3곳 외에도





집






