옵션
뉴스
긴 맥락 이해 창 : 주요 통찰력

긴 맥락 이해 창 : 주요 통찰력

2025년 4월 10일
231

어제, 우리는 Gemini 1.5 모델로 AI 기술의 최신 돌파구를 공개했습니다. 이 새로운 버전은 속도와 효율성에서 상당한 향상을 가져왔지만, 진정한 혁신은 혁신적인 긴 문맥 창입니다. 이 기능은 모델이 전례 없는 수의 토큰 — 단어, 이미지, 또는 비디오를 구성하는 기본 단위 — 을 한 번에 처리할 수 있게 합니다. 이 발전에 대해 더 알아보기 위해, 우리는 긴 문맥 창이 무엇이며 이것이 개발자들의 작업 방식을 어떻게 혁신할 수 있는지에 대한 통찰을 얻기 위해 Google DeepMind 프로젝트 팀에 문의했습니다.

긴 문맥 창을 이해하는 것은 AI 모델이 세션 전반에 걸쳐 정보를 유지하고 회상할 수 있게 하기 때문에 중요합니다. 대화에서 이름이 언급된 지 몇 분 만에 그 이름을 기억하려고 노력하거나, 전화번호를 잊기 전에 급히 적어두려는 상황을 상상해보세요. AI 모델도 비슷한 도전에 직면하며, 몇 번의 상호작용 후에 세부사항을 "잊어버리는" 경우가 많습니다. 긴 문맥 창은 모델이 더 많은 정보를 "메모리"에 유지할 수 있도록 하여 이 문제를 해결합니다.

이전에는 Gemini 모델이 최대 32,000개의 토큰을 동시에 처리할 수 있었습니다. 하지만 1.5 Pro의 초기 테스트용 출시로, 우리는 현재까지 가장 큰 문맥 창인 놀라운 100만 토큰으로 한계를 확장했습니다. 우리의 연구는 심지어 이를 넘어 1,000만 토큰까지 성공적으로 테스트했습니다. 문맥 창이 클수록 모델이 처리할 수 있는 데이터 — 텍스트, 이미지, 오디오, 코드, 또는 비디오 — 의 다양성과 양이 더 많아집니다.

Google DeepMind 연구 과학자이자 긴 문맥 프로젝트의 리더 중 한 명인 Nikolay Savinov는 다음과 같이 말했습니다: "우리의 초기 목표는 128,000 토큰에 도달하는 것이었지만, 더 높은 목표를 설정하는 것이 유익할 것이라고 생각하여 100만 토큰을 제안했습니다. 그리고 이제, 우리의 연구는 이를 10배 초과했습니다."

이 도약을 달성하기 위해 일련의 딥러닝 혁신이 필요했습니다. Pranav Shyam의 초기 탐구는 우리의 연구를 이끄는 중요한 통찰을 제공했습니다. Google DeepMind 엔지니어인 Denis Teplyashin은 "각각의 돌파구가 또 다른 돌파구로 이어져 새로운 가능성을 열었습니다. 이러한 혁신들이 결합되었을 때, 우리는 128,000 토큰에서 512,000, 그리고 100만, 최근에는 내부 연구에서 1,000만 토큰으로 확장된 결과에 놀랐습니다."라고 설명했습니다.

1.5 Pro의 확장된 용량은 흥미로운 새로운 응용 프로그램을 열어줍니다. 예를 들어, 수십 페이지 분량의 문서를 요약하는 대신, 이제 수천 페이지에 달하는 문서를 처리할 수 있습니다. 이전 모델이 수천 줄의 코드를 분석할 수 있었다면, 1.5 Pro는 이제 수만 줄의 코드를 한 번에 처리할 수 있습니다.

또 다른 Google DeepMind 연구 과학자인 Machel Reid는 몇 가지 매력적인 테스트 결과를 공유했습니다: "한 테스트에서는 전체 코드베이스를 모델에 입력했고, 모델은 이에 대한 포괄적인 문서를 생성했는데, 이는 놀라웠습니다. 또 다른 테스트에서는 1924년 영화 Sherlock Jr.을 45분 전체를 '시청'한 후 이에 대한 질문에 정확히 답변했습니다."

1.5 Pro는 또한 프롬프트 내 데이터에 걸친 추론에서 탁월합니다. Machel은 전 세계적으로 200명 미만이 사용하는 희귀 언어 Kalamang을 포함한 예를 강조했습니다. "모델은 자체적으로 Kalamang으로 번역할 수 없지만, 긴 문맥 창을 통해 전체 문법 매뉴얼과 예문들을 포함할 수 있었습니다. 그러자 모델은 동일한 자료로 학습한 사람과 비슷한 수준으로 영어에서 Kalamang으로 번역을 배웠습니다."

Gemini 1.5 Pro는 표준 128K 토큰 문맥 창과 함께 제공되지만, 선택된 개발자 및 기업 고객 그룹은 AI Studio와 Vertex AI를 통해 비공개 프리뷰에서 100만 토큰 문맥 창에 접근할 수 있습니다. 이렇게 큰 문맥 창을 관리하는 것은 계산적으로 매우 집중적이며, 우리는 이를 확장하면서 지연 시간을 줄이기 위해 최적화 작업을 적극적으로 진행 중입니다.

앞으로 팀은 안전을 우선으로 하여 모델을 더 빠르고 효율적으로 만드는 데 집중하고 있습니다. 또한 긴 문맥 창을 더욱 확장하고, 기본 아키텍처를 개선하며, 새로운 하드웨어 개선 사항을 활용하는 방법을 탐구하고 있습니다. Nikolay는 "1,000만 토큰을 한 번에 처리하는 것은 우리의 Tensor Processing Unit의 열 한계에 가까워지고 있습니다. 아직 한계가 어디인지 확실하지 않으며, 하드웨어가 계속 발전함에 따라 모델은 더 많은 것을 처리할 수 있을지도 모릅니다."라고 말했습니다.

팀은 개발자와 더 넓은 커뮤니티가 이 새로운 기능으로 만들어낼 혁신적인 응용 프로그램을 기대하고 있습니다. Machel은 "처음에 100만 토큰 문맥을 보았을 때, '이걸 도대체 어디에 쓰지?'라고 생각했습니다. 하지만 이제는 사람들의 상상력이 확장되어 이 새로운 기능들을 더 창의적으로 사용할 것이라고 믿습니다."

[ttpp][yyxx]

관련 기사
배리 딜러: AGI 시대가 다가옴에 따라 샘 알트먼에 대한 신뢰는 무의미하다 배리 딜러: AGI 시대가 다가옴에 따라 샘 알트먼에 대한 신뢰는 무의미하다 억만장자 미디어 거물 배리 딜러는 최근 보도에서 달리 제기된 주장에도 불구하고, 오픈AI의 샘 알트만 CEO가 신뢰할 수 없는 인물이라고 생각하지 않는다고 밝혔다. 이번 주 월스트리트저널(WSJ)이 주최한 ‘Future of Everything’ 컨퍼런스에서 연설한 딜러는, 일부 전직 동료들과 이사회 구성원들로부터 때때로 교묘하게 조종하거나 기만적이라는 비
유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대 유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대 화요일, 유튜브는 딥페이크 탐지 기술을 일부 정부 관계자, 정치 후보자 및 언론인 대상으로 확대한다고 발표했다. 이 도구는 AI로 생성된 유사 영상을 식별하며, 시범 운영 참여자들은 유튜브 정책을 위반한다고 판단되는 무단 콘텐츠의 삭제를 요청할 수 있다.이 탐지 시스템은 초기 테스트 단계를 거친 후, 작년 유튜브 파트너 프로그램에 가입된 약 400만 명의
진정한 차이: 한 가지가 아니라 다른 것 진정한 차이: 한 가지가 아니라 다른 것 때로는 어떤 것이 한 가지 의미만 가진 것이 아니라 또 다른 의미도 지닐 때가 있습니다. “이것뿐만 아니라 저것도 있다”는 표현은 AI가 생성한 글에서 너무나 흔해져서, 이제는 단순히 합성 콘텐츠라는 암시를 넘어 거의 확실한 증거가 되었습니다.그래서 기업 커뮤니케이션에서 이 문장 구조가 급증했다는 배런스(Barron's)의 보고서를 접했을 때, 나는 단순히
관련 특별 주제 추천
글쓰기 최고의 AI 선협·무협 조력자: 장대한 수련 성장 스토리와 무술 연출을 작성하세요
최고의 AI 선협·무협 조력자: 장대한 수련 성장 스토리와 무술 연출을 작성하세요

2026년 최고의 AI 어시스턴트를 만나보세요. 장대한 선협(仙侠) 및 무협(武侠) 이야기를 창작하는 데 도움을 줄 수 있는 도구들입니다. XIX.AI가 엄선한 이 목록에는 수련 과정과 무술 연출을 완벽하게 구현할 수 있는 최고 평점을 받은 혁신적인 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 창의력을 마음껏 발휘하고 오늘 바로 집필을 시작해 보세요!

10 도구
xix.ai
암호 AI 모바일 앱 코딩 도구: 프롬프트를 기반으로 크로스플랫폼용 Flutter 및 React Native 코드를 생성합니다.
AI 모바일 앱 코딩 도구: 프롬프트를 기반으로 크로스플랫폼용 Flutter 및 React Native 코드를 생성합니다.

2026년 최고의 AI 모바일 앱 개발 도구를 발견해 보세요. Flutter 및 React Native에 적합한 이 도구들은 강력하며, 사용자의 요청에 따라 크로스플랫폼 코드를 자동으로 생성해 줍니다. 무료 옵션과 유료 옵션을 실제 사용 사례를 통해 비교해 보세요. 더 빠른 개발이 가능해지며, 더 나은 앱을 만들 수 있습니다. 지금 바로 XIX.AI에서 순위를 확인해 보세요!

10 도구
xix.ai
암호 최고의 AI 크롬 확장 프로그램 생성기: 코딩 경험 없이도 나만의 브라우저 확장 프로그램 만들기
최고의 AI 크롬 확장 프로그램 생성기: 코딩 경험 없이도 나만의 브라우저 확장 프로그램 만들기

XIX.AI에서 2026년 최고의 AI 크롬 확장 프로그램 생성기를 만나보세요. 저희가 엄선한 이 목록에는 코딩 없이도 나만의 브라우저 확장 프로그램을 만들 수 있는, 평점이 높고 꼭 사용해봐야 할 도구들이 포함되어 있습니다. 무료 버전과 유료 버전을 비교하고, 실제 테스트 결과를 확인하며, 업무 효율을 극대화해 보세요. 최신 순위를 살펴보고 오늘 바로 나에게 딱 맞는 도구를 찾아보세요!

10 도구
xix.ai
텍스트 음성 변환 최고의 AI 다국어 TTS: 50개 이상의 언어로 진짜 원어민 발음을 생성합니다.
최고의 AI 다국어 TTS: 50개 이상의 언어로 진짜 원어민 발음을 생성합니다.

2026년 최고의 AI 다국어 TTS 도구들을 발견해 보세요. 50개 이상의 언어로 원어민과 같은 발음을 구현할 수 있습니다. 저희가 선정한 최고의 도구들을 무료 및 유료 버전으로 비교해 보고, 실제 사용 테스트 결과도 확인해 보세요. XIX.AI에서 자신에게 가장 적합한 음성 도구를 찾아내고 오늘 바로 전 세계적인 커뮤니케이션을 시작해 보세요.

10 도구
xix.ai
회의 도우미 더 스마트하고 빠른 협업을 위한 최고의 AI 회의 자동화 도구들
더 스마트하고 빠른 협업을 위한 최고의 AI 회의 자동화 도구들

2026년에 출시된 최신이자 인기 있는 AI 회의 자동화 도구들을 발견해 보세요. 이 도구들을 활용하면 더 스마트하고 빠르게 협업할 수 있습니다. 저희가 엄선한 목록에는 메모, 요약 내용, 실행 항목들을 자동화해 주는 강력하고 혁신적인 솔루션이 포함되어 있습니다. 무료 옵션과 유료 옵션을 실제 사용 사례를 통해 비교해 보고, 매주 업데이트되는 순위를 확인하세요. XIX.AI에서 지금 바로 최고의 도구들을 살펴보세요.

10 도구
xix.ai
즉각적인 인프라-어스-코드(Infrastructure-as-Code)를 위한 AI 프롬프트: Terraform 및 Docker 구성을 안전하게 배포하기
인프라-어스-코드(Infrastructure-as-Code)를 위한 AI 프롬프트: Terraform 및 Docker 구성을 안전하게 배포하기

2026년 최신 최고 평점을 받은 ‘인프라스트럭처-어즈-코드(Infrastructure-as-Code)’용 AI 프롬프트를 확인해 보세요. XIX.AI가 엄선한 이 프롬프트들은 Terraform 및 Docker 구성을 안전하게 배포하고, 클라우드 설정을 자동화하며, DevOps 생산성을 높이는 데 도움을 줍니다. 실제 테스트를 통해 무료 옵션과 유료 옵션을 비교해 보세요. 지금 바로 살펴보고 AI의 경쟁력을 확보하세요.

10 도구
xix.ai
의견 (30)
0/500
EdwardTaylor
EdwardTaylor 2025년 11월 15일 오전 9시 30분 35초 GMT+09:00

すごい!長文コンテキストの機能が実用化されたら、研究やビジネス文書の分析が一気に楽になりそう🤩。でもこれ、倫理面でどうなんだろう?膨大なデータを読み込むということは、プライバシー問題も発生しそうで少し不安…。他社は今後どう追従するのか気になるなぁ。開発スピード速すぎて置いていかれそう!

NicholasYoung
NicholasYoung 2025년 11월 11일 오후 11시 30분 38초 GMT+09:00

長いコンテキストウィンドウって確かに便利そうだけど、処理速度とどっちを取るか難しい選択かも…🤔 実際に使ってみないとわからないな。でもPDFとか長文読ませるにはいいかも!

KeithSmith
KeithSmith 2025년 8월 17일 오후 4시 0분 59초 GMT+09:00

Super cool to see Gemini 1.5's long context window in action! 😎 Makes me wonder how it'll handle massive datasets compared to older models.

RobertSanchez
RobertSanchez 2025년 7월 31일 오전 10시 41분 19초 GMT+09:00

Wow, the long context window in Gemini 1.5 sounds like a game-changer! I'm curious how it'll handle massive datasets in real-world apps. Excited to see where this takes AI! 🚀

DavidGonzález
DavidGonzález 2025년 7월 28일 오전 10시 19분 30초 GMT+09:00

The long context window in Gemini 1.5 sounds like a game-changer! I'm curious how it'll handle massive datasets in real-world apps. Any cool examples out there yet? 🤔

RobertRoberts
RobertRoberts 2025년 4월 17일 오전 8시 56분 25초 GMT+09:00

Cửa sổ ngữ cảnh dài của Gemini 1.5 thực sự là một bước tiến lớn! Thật đáng kinh ngạc khi nó có thể xử lý nhiều hơn so với các mô hình cũ. Chỉ mong nó nhanh hơn một chút. Tuy nhiên, đây là một bước tiến lớn! 💪

OR