Deepmind CEO Demis Hassabis는 Google의 Gemini 및 Veo AI 모델의 향후 통합을 발표했습니다.

Google Deepmind의 CEO 인 Demis Hassabis는 Linkedin의 공동 창립자 인 Reid Hoffman이 공동 주최 한 Podcast Polect 의 최근 에피소드에서 Google의 계획에 대한 흥미로운 소식을 공유했습니다. 그는 Google이 Gemini AI 모델을 VEO 비디오 생성 모델과 합병하려고한다고 밝혔다. 이 퓨전은 쌍둥이 자리의 물리적 세계에 대한 쌍둥이 자리를 향상시켜 실제 역학을 이해하는 데 더 능숙합니다.
Hassabis는 Get-Go에서 Gemini가 멀티 모달로 설계되었다고 강조했습니다. "우리는 항상 우리의 기초 모델 인 Gemini를 처음부터 멀티 모달로 만들었습니다."라고 그는 설명했습니다. 이 접근법의 동기는? 일상 생활을 진정으로 도울 수있는 보편적 인 디지털 어시스턴트의 비전. Hassabis는“실제로 현실 세계에서 당신을 도와주는 조수입니다.
AI 산업은 다양한 유형의 미디어를 처리하고 합성 할 수있는 "Omni"모델이라고 할 수있는 것으로 꾸준히 발전하고 있습니다. 예를 들어 Google의 최신 Gemini 반복은 텍스트뿐만 아니라 오디오 및 이미지도 생성 할 수 있습니다. 한편, OpenAi의 ChatGpt 기본 모델은 유쾌한 스튜디오 Ghibli 스타일 아트를 포함하여 그 자리에서 이미지를 채울 수 있습니다. 아마존은 올해 말에 "일대일"모델을 출시 할 계획과 함께 멀지 않습니다.
이 Omni 모델에는 이미지, 비디오, 오디오 및 텍스트를 생각해냅니다. Hassabis는 Veo의 비디오 데이터가 주로 Google이 소유 한 보물 창고 인 YouTube에서 나온다고 암시했습니다. "기본적으로, YouTube 비디오 (많은 YouTube 동영상)를 보면 [Veo 2]는 세계의 물리학을 알아낼 수 있습니다."
Google은 이전에 TechCrunch에 모델이 YouTube 제작자와의 계약과 일치하는 YouTube 컨텐츠 "에 대한"YouTube 컨텐츠에 "교육을받을 수 있다고 언급했습니다. 작년에 Google은 AI 모델을 교육하기위한 더 많은 데이터에 액세스하기 위해 서비스 약관을 확장했다는 점은 주목할 가치가 있습니다.
관련 기사
구글의 AI 도약 속内幕: Gemini 2.5는 더 깊이 생각하고, 더 영리하게 말하며, 더 빠르게 코딩한다
구글, 보편적인 AI 어시스턴트 비전 실현에 한 걸음 더 다가서다올해 구글 I/O 행사에서 구글은 Gemini 2.5 시리즈의 중요한 업데이트를 공개했다. 특히 다양한 차원에서 기능을 개선하는 데 초점을 맞췄다. 최신 버전인 Gemini 2.5 Flash와 2.5 Pro는 이제 더 지능적이며 효율적이다. 이러한 발전은 구
구글, 크롬에서 제미니 통합 론칭
Chrome에서 Gemini 통합 소개: AI 기반 브라우징의 새로운 시대2025년 구글 I/O에서 구글은 Chrome 브라우저에 획기적인 추가 기능을 발표하며 파장을 일으켰습니다. 바로 Gemini 통합입니다. 이 움직임은 사용자가 웹과 상호작용하는 방식에 큰 변화를 가져오며, 방문한 페이지에서 답변, 요약, 통찰을 쉽
I/O 이벤트의 상위 100 개 발표
AI로 검색 혁신 : Google의 최신 획기적인 BreakthroughSat 어제 Google I/O 이벤트 에서이 회사는 AI 중심 제품 제품군에서 획기적인 업데이트를 공개했습니다. 강화 된 검색 기능에서 창의성과 생산성을 공급하기 위해 설계된 새로운 도구에 이르기까지 Google은 분명히 밀고 있습니다.
의견 (0)
0/200
Google Deepmind의 CEO 인 Demis Hassabis는 Linkedin의 공동 창립자 인 Reid Hoffman이 공동 주최 한 Podcast Polect 의 최근 에피소드에서 Google의 계획에 대한 흥미로운 소식을 공유했습니다. 그는 Google이 Gemini AI 모델을 VEO 비디오 생성 모델과 합병하려고한다고 밝혔다. 이 퓨전은 쌍둥이 자리의 물리적 세계에 대한 쌍둥이 자리를 향상시켜 실제 역학을 이해하는 데 더 능숙합니다.
Hassabis는 Get-Go에서 Gemini가 멀티 모달로 설계되었다고 강조했습니다. "우리는 항상 우리의 기초 모델 인 Gemini를 처음부터 멀티 모달로 만들었습니다."라고 그는 설명했습니다. 이 접근법의 동기는? 일상 생활을 진정으로 도울 수있는 보편적 인 디지털 어시스턴트의 비전. Hassabis는“실제로 현실 세계에서 당신을 도와주는 조수입니다.
AI 산업은 다양한 유형의 미디어를 처리하고 합성 할 수있는 "Omni"모델이라고 할 수있는 것으로 꾸준히 발전하고 있습니다. 예를 들어 Google의 최신 Gemini 반복은 텍스트뿐만 아니라 오디오 및 이미지도 생성 할 수 있습니다. 한편, OpenAi의 ChatGpt 기본 모델은 유쾌한 스튜디오 Ghibli 스타일 아트를 포함하여 그 자리에서 이미지를 채울 수 있습니다. 아마존은 올해 말에 "일대일"모델을 출시 할 계획과 함께 멀지 않습니다.
이 Omni 모델에는 이미지, 비디오, 오디오 및 텍스트를 생각해냅니다. Hassabis는 Veo의 비디오 데이터가 주로 Google이 소유 한 보물 창고 인 YouTube에서 나온다고 암시했습니다. "기본적으로, YouTube 비디오 (많은 YouTube 동영상)를 보면 [Veo 2]는 세계의 물리학을 알아낼 수 있습니다."
Google은 이전에 TechCrunch에 모델이 YouTube 제작자와의 계약과 일치하는 YouTube 컨텐츠 "에 대한"YouTube 컨텐츠에 "교육을받을 수 있다고 언급했습니다. 작년에 Google은 AI 모델을 교육하기위한 더 많은 데이터에 액세스하기 위해 서비스 약관을 확장했다는 점은 주목할 가치가 있습니다.












