구글의 제미니 AI, 사진-비디오 변환 기능 공개
Google의 최신 Gemini 업데이트에서는 Veo 3 모델을 통해 획기적인 사진-동영상 변환 기능이 도입되었습니다. 이 혁신적인 기능은 정지된 이미지를 주변 소리, 배경 소음, 합성 음성 등 AI가 생성한 오디오 요소로 강화된 8초짜리 동영상 클립으로 변환합니다. 현재 일부 지역의 Gemini Ultra 및 Pro 가입자를 대상으로 출시되었으며, 웹 버전은 오늘 출시되고 모바일 버전은 이번 주에 출시될 예정입니다.
구현 세부 사항
새로운 애니메이션 기능은 Gemini의 기존 워크플로우에 원활하게 통합됩니다. 사용자는 다음과 같이 기능을 활성화할 수 있습니다:
- 프롬프트 인터페이스에서 '도구' 옵션을 선택합니다.
- '동영상' 제작 모드 선택
- 소스 이미지를 업로드하고 이동 지침을 제공합니다.
- 선택적으로 대화 및 환경 소리에 대한 오디오 설명을 추가합니다.

기술 사양
시스템은 다음과 같은 기술 파라미터로 처리된 동영상을 제공합니다:
- 파일 형식 MP4 컨테이너
- 해상도 720p HD
- 화면 비율: 16:9 가로 방향
- 길이: 8초 고정 길이
크리에이티브 애플리케이션
Google은 이 기술의 몇 가지 매력적인 사용 사례를 강조합니다:
- 일러스트레이션과 그림에 생명력 불어넣기
- 개성이 있는 무생물 애니메이션 제작
- 풍경 사진에 역동적인 움직임 추가

콘텐츠 인증
생성된 모든 동영상에는 이중 워터마킹 시스템이 포함됩니다:
- AI 출처를 나타내는 가시적 워터마크
- 검증을 위한 내장된 SynthID 디지털 워터마크
플랫폼 확장
이전에는 Google의 독립형 Flow 애플리케이션에도 유사한 기능이 있었지만, 이번 통합을 통해 애니메이션 도구가 Gemini의 에코시스템에 직접 추가되었습니다. 이와 동시에, Google은 영화 제작 도구를 75개 국가에서 추가로 사용할 수 있도록 하여 Gemini의 동영상 기능 출시와 함께 Flow의 지리적 확장을 발표했습니다.

접근성 및 가용성
이 기능의 단계적 출시는 다음 타임라인을 따릅니다:
- 웹 출시: 즉시 사용 가능
- 모바일 배포: 이번 주 내 출시
- 구독 요구 사항: 지원되는 지역의 Gemini Ultra/Pro 티어
관련 기사
Notion, 워크스페이스를 AI 에이전트의 허브로 탈바꿈하다
생산성 소프트웨어 기업 노션(Notion)이 ‘에이전트(agents)’ 시대에 진입하고 있다.수요일 진행된 라이브 스트리밍 제품 발표회에서, 협업형 노트 작성 앱으로 잘 알려진 노션은 자체 AI 에이전트의 기능을 확장하고 외부 에이전트와 연동하며, 팀이 어떤 데이터베이스에서든 데이터를 가져올 수 있는 자동화된 다단계 워크플로를 구축할 수 있게 해주는 새로운
ElevenLabs, 블랙록·제이미 폭스·에바 롱고리아를 신규 투자자로 선정
음성 AI 기업 일레븐랩스(ElevenLabs)는 지난 2월에 처음 발표했던 5억 달러 규모의 시리즈 D 투자 라운드에 참여한 추가 투자자들을 공개했다. 이번 투자자 명단에는 블랙록(BlackRock), 웰링턴(Wellington), D.E. 쇼(D.E. Shaw), 슈로더(Schroders)와 같은 기관 투자자들과 엔비디아(NVIDIA), 세일즈포스(Sa
Google I/O 2026, Gmail 수신함과의 음성 상호작용 기능 공개
구글은 계속해서 AI를 사용자의 수신함에 통합하고 있습니다. 화요일 열린 IO 2026 개발자 컨퍼런스에서 구글은 대화형 AI를 통해 Gmail의 ‘AI 수신함’ 기능을 확장했으며, 이를 통해 사용자는 검색어에만 의존하지 않고 수신함의 내용에 대해 직접 질문할 수 있게 되었습니다.구글에 따르면, 'Gmail Live'라는 이름의 이 제미니(Gemini) A
관련 특별 주제 추천
의견 (0)
0/500
Google의 최신 Gemini 업데이트에서는 Veo 3 모델을 통해 획기적인 사진-동영상 변환 기능이 도입되었습니다. 이 혁신적인 기능은 정지된 이미지를 주변 소리, 배경 소음, 합성 음성 등 AI가 생성한 오디오 요소로 강화된 8초짜리 동영상 클립으로 변환합니다. 현재 일부 지역의 Gemini Ultra 및 Pro 가입자를 대상으로 출시되었으며, 웹 버전은 오늘 출시되고 모바일 버전은 이번 주에 출시될 예정입니다.
구현 세부 사항
새로운 애니메이션 기능은 Gemini의 기존 워크플로우에 원활하게 통합됩니다. 사용자는 다음과 같이 기능을 활성화할 수 있습니다:
- 프롬프트 인터페이스에서 '도구' 옵션을 선택합니다.
- '동영상' 제작 모드 선택
- 소스 이미지를 업로드하고 이동 지침을 제공합니다.
- 선택적으로 대화 및 환경 소리에 대한 오디오 설명을 추가합니다.

기술 사양
시스템은 다음과 같은 기술 파라미터로 처리된 동영상을 제공합니다:
- 파일 형식 MP4 컨테이너
- 해상도 720p HD
- 화면 비율: 16:9 가로 방향
- 길이: 8초 고정 길이
크리에이티브 애플리케이션
Google은 이 기술의 몇 가지 매력적인 사용 사례를 강조합니다:
- 일러스트레이션과 그림에 생명력 불어넣기
- 개성이 있는 무생물 애니메이션 제작
- 풍경 사진에 역동적인 움직임 추가

콘텐츠 인증
생성된 모든 동영상에는 이중 워터마킹 시스템이 포함됩니다:
- AI 출처를 나타내는 가시적 워터마크
- 검증을 위한 내장된 SynthID 디지털 워터마크
플랫폼 확장
이전에는 Google의 독립형 Flow 애플리케이션에도 유사한 기능이 있었지만, 이번 통합을 통해 애니메이션 도구가 Gemini의 에코시스템에 직접 추가되었습니다. 이와 동시에, Google은 영화 제작 도구를 75개 국가에서 추가로 사용할 수 있도록 하여 Gemini의 동영상 기능 출시와 함께 Flow의 지리적 확장을 발표했습니다.

접근성 및 가용성
이 기능의 단계적 출시는 다음 타임라인을 따릅니다:
- 웹 출시: 즉시 사용 가능
- 모바일 배포: 이번 주 내 출시
- 구독 요구 사항: 지원되는 지역의 Gemini Ultra/Pro 티어
Notion, 워크스페이스를 AI 에이전트의 허브로 탈바꿈하다
생산성 소프트웨어 기업 노션(Notion)이 ‘에이전트(agents)’ 시대에 진입하고 있다.수요일 진행된 라이브 스트리밍 제품 발표회에서, 협업형 노트 작성 앱으로 잘 알려진 노션은 자체 AI 에이전트의 기능을 확장하고 외부 에이전트와 연동하며, 팀이 어떤 데이터베이스에서든 데이터를 가져올 수 있는 자동화된 다단계 워크플로를 구축할 수 있게 해주는 새로운
ElevenLabs, 블랙록·제이미 폭스·에바 롱고리아를 신규 투자자로 선정
음성 AI 기업 일레븐랩스(ElevenLabs)는 지난 2월에 처음 발표했던 5억 달러 규모의 시리즈 D 투자 라운드에 참여한 추가 투자자들을 공개했다. 이번 투자자 명단에는 블랙록(BlackRock), 웰링턴(Wellington), D.E. 쇼(D.E. Shaw), 슈로더(Schroders)와 같은 기관 투자자들과 엔비디아(NVIDIA), 세일즈포스(Sa
Google I/O 2026, Gmail 수신함과의 음성 상호작용 기능 공개
구글은 계속해서 AI를 사용자의 수신함에 통합하고 있습니다. 화요일 열린 IO 2026 개발자 컨퍼런스에서 구글은 대화형 AI를 통해 Gmail의 ‘AI 수신함’ 기능을 확장했으며, 이를 통해 사용자는 검색어에만 의존하지 않고 수신함의 내용에 대해 직접 질문할 수 있게 되었습니다.구글에 따르면, 'Gmail Live'라는 이름의 이 제미니(Gemini) A





집






