옵션
뉴스
긴 맥락 이해 창 : 주요 통찰력

긴 맥락 이해 창 : 주요 통찰력

2025년 4월 10일
153

어제, 우리는 Gemini 1.5 모델로 AI 기술의 최신 돌파구를 공개했습니다. 이 새로운 버전은 속도와 효율성에서 상당한 향상을 가져왔지만, 진정한 혁신은 혁신적인 긴 문맥 창입니다. 이 기능은 모델이 전례 없는 수의 토큰 — 단어, 이미지, 또는 비디오를 구성하는 기본 단위 — 을 한 번에 처리할 수 있게 합니다. 이 발전에 대해 더 알아보기 위해, 우리는 긴 문맥 창이 무엇이며 이것이 개발자들의 작업 방식을 어떻게 혁신할 수 있는지에 대한 통찰을 얻기 위해 Google DeepMind 프로젝트 팀에 문의했습니다.

긴 문맥 창을 이해하는 것은 AI 모델이 세션 전반에 걸쳐 정보를 유지하고 회상할 수 있게 하기 때문에 중요합니다. 대화에서 이름이 언급된 지 몇 분 만에 그 이름을 기억하려고 노력하거나, 전화번호를 잊기 전에 급히 적어두려는 상황을 상상해보세요. AI 모델도 비슷한 도전에 직면하며, 몇 번의 상호작용 후에 세부사항을 "잊어버리는" 경우가 많습니다. 긴 문맥 창은 모델이 더 많은 정보를 "메모리"에 유지할 수 있도록 하여 이 문제를 해결합니다.

이전에는 Gemini 모델이 최대 32,000개의 토큰을 동시에 처리할 수 있었습니다. 하지만 1.5 Pro의 초기 테스트용 출시로, 우리는 현재까지 가장 큰 문맥 창인 놀라운 100만 토큰으로 한계를 확장했습니다. 우리의 연구는 심지어 이를 넘어 1,000만 토큰까지 성공적으로 테스트했습니다. 문맥 창이 클수록 모델이 처리할 수 있는 데이터 — 텍스트, 이미지, 오디오, 코드, 또는 비디오 — 의 다양성과 양이 더 많아집니다.

Google DeepMind 연구 과학자이자 긴 문맥 프로젝트의 리더 중 한 명인 Nikolay Savinov는 다음과 같이 말했습니다: "우리의 초기 목표는 128,000 토큰에 도달하는 것이었지만, 더 높은 목표를 설정하는 것이 유익할 것이라고 생각하여 100만 토큰을 제안했습니다. 그리고 이제, 우리의 연구는 이를 10배 초과했습니다."

이 도약을 달성하기 위해 일련의 딥러닝 혁신이 필요했습니다. Pranav Shyam의 초기 탐구는 우리의 연구를 이끄는 중요한 통찰을 제공했습니다. Google DeepMind 엔지니어인 Denis Teplyashin은 "각각의 돌파구가 또 다른 돌파구로 이어져 새로운 가능성을 열었습니다. 이러한 혁신들이 결합되었을 때, 우리는 128,000 토큰에서 512,000, 그리고 100만, 최근에는 내부 연구에서 1,000만 토큰으로 확장된 결과에 놀랐습니다."라고 설명했습니다.

1.5 Pro의 확장된 용량은 흥미로운 새로운 응용 프로그램을 열어줍니다. 예를 들어, 수십 페이지 분량의 문서를 요약하는 대신, 이제 수천 페이지에 달하는 문서를 처리할 수 있습니다. 이전 모델이 수천 줄의 코드를 분석할 수 있었다면, 1.5 Pro는 이제 수만 줄의 코드를 한 번에 처리할 수 있습니다.

또 다른 Google DeepMind 연구 과학자인 Machel Reid는 몇 가지 매력적인 테스트 결과를 공유했습니다: "한 테스트에서는 전체 코드베이스를 모델에 입력했고, 모델은 이에 대한 포괄적인 문서를 생성했는데, 이는 놀라웠습니다. 또 다른 테스트에서는 1924년 영화 Sherlock Jr.을 45분 전체를 '시청'한 후 이에 대한 질문에 정확히 답변했습니다."

1.5 Pro는 또한 프롬프트 내 데이터에 걸친 추론에서 탁월합니다. Machel은 전 세계적으로 200명 미만이 사용하는 희귀 언어 Kalamang을 포함한 예를 강조했습니다. "모델은 자체적으로 Kalamang으로 번역할 수 없지만, 긴 문맥 창을 통해 전체 문법 매뉴얼과 예문들을 포함할 수 있었습니다. 그러자 모델은 동일한 자료로 학습한 사람과 비슷한 수준으로 영어에서 Kalamang으로 번역을 배웠습니다."

Gemini 1.5 Pro는 표준 128K 토큰 문맥 창과 함께 제공되지만, 선택된 개발자 및 기업 고객 그룹은 AI Studio와 Vertex AI를 통해 비공개 프리뷰에서 100만 토큰 문맥 창에 접근할 수 있습니다. 이렇게 큰 문맥 창을 관리하는 것은 계산적으로 매우 집중적이며, 우리는 이를 확장하면서 지연 시간을 줄이기 위해 최적화 작업을 적극적으로 진행 중입니다.

앞으로 팀은 안전을 우선으로 하여 모델을 더 빠르고 효율적으로 만드는 데 집중하고 있습니다. 또한 긴 문맥 창을 더욱 확장하고, 기본 아키텍처를 개선하며, 새로운 하드웨어 개선 사항을 활용하는 방법을 탐구하고 있습니다. Nikolay는 "1,000만 토큰을 한 번에 처리하는 것은 우리의 Tensor Processing Unit의 열 한계에 가까워지고 있습니다. 아직 한계가 어디인지 확실하지 않으며, 하드웨어가 계속 발전함에 따라 모델은 더 많은 것을 처리할 수 있을지도 모릅니다."라고 말했습니다.

팀은 개발자와 더 넓은 커뮤니티가 이 새로운 기능으로 만들어낼 혁신적인 응용 프로그램을 기대하고 있습니다. Machel은 "처음에 100만 토큰 문맥을 보았을 때, '이걸 도대체 어디에 쓰지?'라고 생각했습니다. 하지만 이제는 사람들의 상상력이 확장되어 이 새로운 기능들을 더 창의적으로 사용할 것이라고 믿습니다."

[ttpp][yyxx]

관련 기사
Salesforce, Slack에서 Microsoft Copilot과 경쟁하는 AI 디지털 팀메이트 공개 Salesforce, Slack에서 Microsoft Copilot과 경쟁하는 AI 디지털 팀메이트 공개 Salesforce는 새로운 직장 AI 전략을 공개하며 월요일, Slack 대화에 통합된 전문화된 “디지털 팀메이트”를 소개했습니다.새 도구인 Slack의 Agentforce는 기업이 직장 대화를 검색하고, 회사 데이터에 접근하며, 직원들이 매일 사용하는 메시징 플랫폼 내에서 작업을 실행하는 작업별 AI 에이전트를 만들고 배포할 수 있게 합니다.“전문화된
Oracle의 400억 달러 Nvidia 칩 투자로 텍사스 AI 데이터센터 강화 Oracle의 400억 달러 Nvidia 칩 투자로 텍사스 AI 데이터센터 강화 Oracle은 Financial Times에 따르면 OpenAI가 개발한 텍사스 주요 신규 데이터센터를 지원하기 위해 Nvidia 칩에 약 400억 달러를 투자할 예정입니다. 이는 지금까지 가장 큰 칩 인수 거래 중 하나로, AI 컴퓨팅 자원에 대한 급증하는 수요를 보여줍니다.텍사스 애빌린에 위치한 이 시설은 미국 최초의 “Stargate” 데이터센터입니다
Meta AI 앱, 프리미엄 티어 및 광고 도입 Meta AI 앱, 프리미엄 티어 및 광고 도입 Meta의 AI 앱은 OpenAI, Google, Microsoft와 같은 경쟁사의 제품과 유사하게 유료 구독 서비스를 곧 선보일 예정입니다. 2025년 1분기 실적 발표에서 Meta CEO Mark Zuckerberg는 프리미엄 서비스 계획을 밝히며, 이를 통해 사용자가 Meta AI에서 향상된 컴퓨팅 파워나 추가 기능을 이용할 수 있다고 전했습니다.Ch
의견 (28)
0/200
KeithSmith
KeithSmith 2025년 8월 17일 오후 4시 0분 59초 GMT+09:00

Super cool to see Gemini 1.5's long context window in action! 😎 Makes me wonder how it'll handle massive datasets compared to older models.

RobertSanchez
RobertSanchez 2025년 7월 31일 오전 10시 41분 19초 GMT+09:00

Wow, the long context window in Gemini 1.5 sounds like a game-changer! I'm curious how it'll handle massive datasets in real-world apps. Excited to see where this takes AI! 🚀

DavidGonzález
DavidGonzález 2025년 7월 28일 오전 10시 19분 30초 GMT+09:00

The long context window in Gemini 1.5 sounds like a game-changer! I'm curious how it'll handle massive datasets in real-world apps. Any cool examples out there yet? 🤔

RobertRoberts
RobertRoberts 2025년 4월 17일 오전 8시 56분 25초 GMT+09:00

Cửa sổ ngữ cảnh dài của Gemini 1.5 thực sự là một bước tiến lớn! Thật đáng kinh ngạc khi nó có thể xử lý nhiều hơn so với các mô hình cũ. Chỉ mong nó nhanh hơn một chút. Tuy nhiên, đây là một bước tiến lớn! 💪

MatthewGonzalez
MatthewGonzalez 2025년 4월 17일 오전 12시 41분 59초 GMT+09:00

A janela de contexto longo do Gemini 1.5 é revolucionária, sem dúvida! Mas às vezes parece que está tentando fazer muito de uma vez, o que pode atrasar as coisas. Ainda assim, para processar grandes quantidades de dados, é imbatível. Vale a pena conferir! 🚀

NicholasRoberts
NicholasRoberts 2025년 4월 15일 오전 7시 59분 46초 GMT+09:00

Gemini 1.5's long context window is a game-changer, no doubt! But sometimes it feels like it's trying to do too much at once, which can slow things down. Still, for processing huge chunks of data, it's unbeatable. Worth checking out! 🚀

위로 돌아갑니다
OR