Deepmind CEO Demis Hassabis는 Google의 Gemini 및 Veo AI 모델의 향후 통합을 발표했습니다.

최근 팟캐스트 Possible 에피소드에서 LinkedIn 공동 창립자 Reid Hoffman이 공동 진행자로 출연한 가운데, Google DeepMind CEO Demis Hassabis가 Google의 계획에 대한 흥미로운 소식을 전했습니다. 그는 Google이 Gemini AI 모델을 Veo 비디오 생성 모델과 통합하려고 한다고 밝혔습니다. 이 융합은 Gemini가 물리적 세계를 더 잘 이해하도록 하여 실생활의 역학을 더 효과적으로 파악할 수 있게 하는 것을 목표로 합니다.
Hassabis는 Gemini가 처음부터 다중 모달로 설계되었다고 강조했습니다. "우리는 항상 우리의 기반 모델인 Gemini를 처음부터 다중 모달로 구축해왔습니다,"라고 그는 설명했습니다. 이 접근 방식의 동기는? 일상생활에서 진정으로 도움을 줄 수 있는 범용 디지털 비서를 만들겠다는 비전입니다. "실제 세상에서 … 당신을 실제로 돕는 비서,"라고 Hassabis는 자세히 설명했습니다.
AI 산업은 소위 "옴니" 모델—다양한 유형의 미디어를 처리하고 종합할 수 있는 모델—을 향해 꾸준히 발전하고 있습니다. 예를 들어, Google의 최신 Gemini 버전은 텍스트뿐만 아니라 오디오와 이미지도 생성할 수 있습니다. 한편, OpenAI의 ChatGPT 기본 모델은 즉석에서 이미지를 생성할 수 있으며, Studio Ghibli 스타일의 매력적인 예술 작품도 포함됩니다. Amazon도 뒤처지지 않고 있으며, 올해 말에 "모든 것에서 모든 것으로" 모델을 출시할 계획입니다.
이러한 옴니 모델은 이미지, 비디오, 오디오, 텍스트 등 막대한 양의 훈련 데이터를 요구합니다. Hassabis는 Veo의 비디오 데이터가 주로 YouTube에서 온다고 암시했습니다. YouTube는 Google이 소유한 보물 창고입니다. "기본적으로 YouTube 비디오를—아주 많은 YouTube 비디오를—보면서 [Veo 2]가 세상의 물리학을 파악할 수 있습니다,"라고 그는 언급했습니다.
Google은 이전에 TechCrunch에 자사 모델이 YouTube 크리에이터들과의 계약에 따라 "일부" YouTube 콘텐츠로 훈련될 수 있다고 언급한 바 있습니다. 작년에 Google이 AI 모델 훈련을 위해 더 많은 데이터에 접근하기 위해 서비스 약관을 확대한 점도 주목할 만합니다.
관련 기사
Google, AI 모드 및 Veo 3 공개로 검색과 비디오 제작 혁신
Google은 최근 웹 검색과 디지털 콘텐츠 제작을 재편할 두 가지 혁신적인 기술인 AI 모드와 Veo 3를 출시했습니다. AI 모드는 사용자 맥락, 의도, 선호도를 이해하여 기존의 키워드 기반 검색을 초월하는 맞춤형 AI 강화 검색 경험을 제공하며, 더 빠르고 직관적인 정보 검색을 가능하게 합니다.한편, Veo 3는 최첨단 AI를 활용해 사실적인 비디오를
Gemini Chatbot Enhances Image Editing Capabilities
구글의 Gemini 챗봇 앱은 이제 사용자가 휴대폰이나 컴퓨터에서 AI로 생성된 이미지와 업로드된 이미지를 편집할 수 있게 한다고 회사가 수요일 블로그 포스트에서 발표했습니다.Gemini의 내장 이미지 편집 기능은 오늘부터 출시되기 시작하며, 앞으로 몇 주 안에 대부분의 국가로 확대되고 45개 이상의 언어를 지원할 계획입니다.이는 구글이 3월에 AI Stu
Google, Gemini AI 성능 향상을 위해 Deep Think 공개
Google이 최상위 Gemini AI 모델을 발전시키고 있습니다.2025년 Google I/O에서 화요일, 회사는 프리미어 Gemini 2.5 Pro 모델을 위한 고급 추론 모드인 Deep Think를 소개했습니다. Deep Think는 모델이 답변하기 전에 여러 응답을 평가하여 특정 벤치마크에서 결과를 개선합니다.“Deep Think는 모델의 역량을 극
의견 (1)
0/200
RalphSanchez
2025년 8월 1일 오전 11시 48분 18초 GMT+09:00
Wow, merging Gemini with Veo sounds like a game-changer! Can't wait to see how this powers up video creation. But, like, is Google trying to dominate every AI corner now? 😅
0
최근 팟캐스트 Possible 에피소드에서 LinkedIn 공동 창립자 Reid Hoffman이 공동 진행자로 출연한 가운데, Google DeepMind CEO Demis Hassabis가 Google의 계획에 대한 흥미로운 소식을 전했습니다. 그는 Google이 Gemini AI 모델을 Veo 비디오 생성 모델과 통합하려고 한다고 밝혔습니다. 이 융합은 Gemini가 물리적 세계를 더 잘 이해하도록 하여 실생활의 역학을 더 효과적으로 파악할 수 있게 하는 것을 목표로 합니다.
Hassabis는 Gemini가 처음부터 다중 모달로 설계되었다고 강조했습니다. "우리는 항상 우리의 기반 모델인 Gemini를 처음부터 다중 모달로 구축해왔습니다,"라고 그는 설명했습니다. 이 접근 방식의 동기는? 일상생활에서 진정으로 도움을 줄 수 있는 범용 디지털 비서를 만들겠다는 비전입니다. "실제 세상에서 … 당신을 실제로 돕는 비서,"라고 Hassabis는 자세히 설명했습니다.
AI 산업은 소위 "옴니" 모델—다양한 유형의 미디어를 처리하고 종합할 수 있는 모델—을 향해 꾸준히 발전하고 있습니다. 예를 들어, Google의 최신 Gemini 버전은 텍스트뿐만 아니라 오디오와 이미지도 생성할 수 있습니다. 한편, OpenAI의 ChatGPT 기본 모델은 즉석에서 이미지를 생성할 수 있으며, Studio Ghibli 스타일의 매력적인 예술 작품도 포함됩니다. Amazon도 뒤처지지 않고 있으며, 올해 말에 "모든 것에서 모든 것으로" 모델을 출시할 계획입니다.
이러한 옴니 모델은 이미지, 비디오, 오디오, 텍스트 등 막대한 양의 훈련 데이터를 요구합니다. Hassabis는 Veo의 비디오 데이터가 주로 YouTube에서 온다고 암시했습니다. YouTube는 Google이 소유한 보물 창고입니다. "기본적으로 YouTube 비디오를—아주 많은 YouTube 비디오를—보면서 [Veo 2]가 세상의 물리학을 파악할 수 있습니다,"라고 그는 언급했습니다.
Google은 이전에 TechCrunch에 자사 모델이 YouTube 크리에이터들과의 계약에 따라 "일부" YouTube 콘텐츠로 훈련될 수 있다고 언급한 바 있습니다. 작년에 Google이 AI 모델 훈련을 위해 더 많은 데이터에 접근하기 위해 서비스 약관을 확대한 점도 주목할 만합니다.



Wow, merging Gemini with Veo sounds like a game-changer! Can't wait to see how this powers up video creation. But, like, is Google trying to dominate every AI corner now? 😅












