구글 I/O 2025, 제너레이티브 미디어의 실제 적용 사례 소개

I/O 2025에서 유니티는 제너레이티브 AI에 대한 접근 방식을 프레젠테이션과 실제 애플리케이션을 통해 그 기능을 시연하는 방식으로 진행했습니다. 유니티는 최신 비디오 및 이미지 생성 모델인 Veo 3와 Imagen 4에 대한 흥미로운 업데이트를 공개하고 Lyria 2에 대한 액세스를 확대했습니다. 또한 최첨단 생성 모델을 사용해 시네마틱 클립, 장면, 일관된 내러티브를 원활하게 제작할 수 있는 AI 영화 제작 도구인 Flow를 소개했습니다.
또한 이러한 툴을 대표적인 연례 행사에 통합했습니다: 메인 I/O 기조연설의 219개 슬라이드가 AI로 생성되었고, 기조연설 비주얼의 48%가 Imagen을 사용하여 제작되었으며, 비디오의 80%가 어떤 형태로든 Veo 또는 Imagen을 통합했습니다. 프롬프트 작성 프로세스를 비롯한 자체 AI 도구를 활용하여 I/O 2025에 활기를 불어넣은 방법을 자세히 살펴보세요:
Veo 2: 스타일리시한 연사 타이틀 카드 디자인하기
검색 부사장 겸 검색 책임자인 엘리자베스 리드가 무대에 올라 주요 검색 업데이트를 공유하자, 화면에는 리즈가 손을 펴서 손바닥 바로 위에서 회전하며 공중에 떠 있는 섬세한 오렌지색 종이학이 나타나는 짧은 동영상이 재생되었습니다.
이 영상과 다른 스피커 소개 영상을 제작하기 위해 Veo 2 기반의 AI Studio와 Vertex AI Studio의 이미지-투-비디오 기능을 사용했습니다. 우리는 프롬프트에 포함하기 위해 스피커의 헤드샷과 관심사 및 취미에 대한 세부 정보를 수집했습니다. 다음은 연구 과학자 제이슨 볼드리지의 타이틀 카드를 위해 만든 프롬프트입니다:
다음은 간단한 애니메이션으로 개선된 Veo 2의 원시 결과물과 청중이 무대에서 본 내용입니다:
Imagen 4와 Veo 3: 스토리보드 제작 및 영화 제작
I/O에서 상영된 여러 영화는 제작에 AI 도구를 활용했습니다. 오프닝 영상은 시청자들을 서부풍의 마을을 통과하는 스릴 넘치는 여정으로 안내한 후, "I/O에 오신 것을 환영합니다"라고 적힌 형형색색의 풍선을 띄우며 기조연설의 시작을 알렸습니다.
제작팀은 이 영상을 제작하기 위해 다양한 AI 툴을 사용했습니다. 먼저 Imagen 4를 사용하여 비디오 프롬프트에 사용할 이미지를 생성했습니다. 또한 구글 딥마인드 팀과 협력하여 제미니를 사용하여 프롬프트를 다듬고 원하는 결과를 얻기 위한 적절한 언어를 찾는 데 도움을 주었습니다. 첫 번째 장면에 사용된 프롬프트는 다음과 같습니다:
이것이 그들이 생성한 것입니다:
그런 다음 팀은 이 이미지를 Veo 3 프롬프트에 통합하여 다음과 같은 지침을 포함했습니다:
이미지와 세련된 프롬프트가 준비되자 팀은 최신 Veo 3 기술(Google AI Ultra 요금제를 통해 사용 가능!)을 사용하여 영화 제작을 시작했습니다. 또한 결과물을 검토하면서 오버헤드 샷, 더 넓은 앵글, 다양한 비주얼을 추가하는 등 실시간 조정을 위해 Veo 3를 사용했습니다. 장면을 재촬영해야 하는 기존 영화 제작과는 달리 팀은 훨씬 빠르게 반복 작업을 진행할 수 있었습니다. 일부 팀원은 코드 기반 편집을 위해 Colab 기능을 사용했지만, 다른 많은 팀원은 자연어로 편집 및 요청 사항을 설명하는 텍스트-비디오 프롬프트에 의존했습니다.
다음은 영화의 마지막 장면 중 하나를 만드는 데 사용된 프롬프트입니다:
리리아 리얼타임: 토로 이 모이와 실시간으로 재밍하기
I/O 프리쇼에서 아티스트 토로 이 모이는 라이브 뮤지컬 세트에서 라이리아 리얼타임을 사용하여 모델의 최신 기능을 시연했습니다. 라이리아 리얼타임은 실시간으로 생성 음악을 만들고, 제어하고, 연주할 수 있는 인터랙티브 음악 생성 모델입니다. 악기, 사운드, 장르 등을 혼합하고 변형할 수 있습니다. "이것은 공연이자 실험이 될 것입니다."라고 그는 시작하기 전에 설명했습니다. "제가 연주하는 모든 것은 완전히 즉흥적입니다. 저는 컴퓨터와 잼을 주고 컴퓨터는 저와 잼을 주고받으며 연주합니다."
공연 전 몇 주 동안 팀은 토로 이 모이에게 리리아 리얼타임 프로토타입을 제공하여 그가 프롬프트를 테스트하고 다듬을 수 있도록 했습니다. 이를 통해 그는 공연 중에 사용할 창의적인 콘셉트와 프롬프트를 개발할 수 있었습니다. 그는 '카오틱 콩가 플레이어', '피치 시프트 영국 정글 드럼' 등 16개의 사운드 프롬프트를 만들어 실제 MIDI 컨트롤러의 노브에 할당했습니다.
MIDI 컨트롤러를 통해 라이리아 리얼타임을 로컬에서 실행함으로써 토로 이 모이는 무대에서 모델을 사용할 수 있었고, 관객은 인터페이스가 작동하는 모습을 실시간으로 볼 수 있었습니다.
공연 중에는 Lyria RealTime API로 구축되어 MIDI 컨트롤러에서 실행되는 앱이 토로 이 모이 뒤에 표시되었습니다. 관객들은 토로 이 모이가 키보드와 보컬 장식을 레이어링하는 동안 그가 사용한 프롬프트와 함께 연속적인 음악 스트림을 생성하고 제어하는 앱의 옵션을 확인할 수 있었습니다.
AI 스튜디오에서 Lyria 실시간 API를 사용하여 직접 사용해 보세요.
AI 스튜디오: AI로 생성된 스웩 만들기
모델을 빠르게 테스트하고 프롬프트를 실험할 수 있는 무료 인터페이스인 Google AI Studio에서 여러 Gemini 모델을 사용하여 새로운 맞춤형 로고가 새겨진 올해의 I/O 셔츠를 디자인했습니다. 셔츠의 태그에서 알 수 있듯이 창의적인 프롬프트는 다음과 같습니다: "땅에 녹아드는 구글 I/O 로고, 무지개 색상, 일러스트레이션, 스튜디오 조명"이었습니다. 제작 방법은 다음과 같습니다:
먼저 팀은 AI Studio에서 Gemini 2.5 Pro를 선택하고 자세한 시스템 지침 프롬프트를 통해 목표를 정의했습니다.
이러한 지침을 설정한 후 앞서 언급한 크리에이티브 프롬프트를 입력했습니다. 그런 다음 Gemini 2.5 Pro는 원하는 이미지 출력물에 대한 요구 사항과 스타일 아이디어 목록을 생성했습니다. 예를 들어 "핵심 모양: 세 가지 기본 도형(전체 직사각형, 얇은 슬래시/직사각형, 원통형)의 기본 기하학적 형태는 측면에 멜팅 효과를 적용하더라도 여전히 명확하게 인식할 수 있고 시각적으로 구분되어야 합니다. 멜팅 페인트 효과 이상으로 핵심 구조가 왜곡되지 않아야 합니다."
이러한 지침이 작성된 후, 팀은 이미지 생성 기능이 있는 주력 모델인 Gemini 2.0 플래시로 전환하여 생성된 목록에 따라 다양한 이미지 옵션을 제작했습니다.
광범위한 실험을 거쳐 이 디자인을 포함한 몇 가지 최종 디자인을 선택했습니다.
또한 팀은 초기 프롬프트 재작성 작업을 Gemini 2.5 Pro로 건너뛰고 AI Studio의 Gemini 2.0 Flash로 직접 시도했습니다. 원하는 결과물에 근접했지만, 2.5 Pro 재작성을 사용하면 더 창의적인 디테일로 일관되게 더 나은 결과를 얻을 수 있었습니다. 결과는? 정말 멋진 티셔츠가 탄생했습니다!
요약할 준비가 되셨나요? 여기에서 I/O 2025의 주요 발표 내용을 확인하고, I/O 퀴즈를 통해 지식을 테스트해 보세요.
관련 기사
카카오 모빌리티, 물리적 AI를 위한 레벨 4 자율주행 로드맵 제시
카카오모빌리티는 물리적 AI 전략의 일환으로 레벨 4 자율주행 기술을 자체 개발할 계획이다.서울 코엑스에서 열린 '2026 월드 IT 쇼' 컨퍼런스에서 카카오모빌리티의 김진규 부사장 겸 피지컬 AI 사업본부장은 로드맵을 발표했다. 그의 발표는 피지컬 AI 시대의 모빌리티 플랫폼을 기반으로 한 자율주행 서비스에 중점을 두었다.연합뉴스에 따르면, '아이디어
배리 딜러: AGI 시대가 다가옴에 따라 샘 알트먼에 대한 신뢰는 무의미하다
억만장자 미디어 거물 배리 딜러는 최근 보도에서 달리 제기된 주장에도 불구하고, 오픈AI의 샘 알트만 CEO가 신뢰할 수 없는 인물이라고 생각하지 않는다고 밝혔다. 이번 주 월스트리트저널(WSJ)이 주최한 ‘Future of Everything’ 컨퍼런스에서 연설한 딜러는, 일부 전직 동료들과 이사회 구성원들로부터 때때로 교묘하게 조종하거나 기만적이라는 비
유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대
화요일, 유튜브는 딥페이크 탐지 기술을 일부 정부 관계자, 정치 후보자 및 언론인 대상으로 확대한다고 발표했다. 이 도구는 AI로 생성된 유사 영상을 식별하며, 시범 운영 참여자들은 유튜브 정책을 위반한다고 판단되는 무단 콘텐츠의 삭제를 요청할 수 있다.이 탐지 시스템은 초기 테스트 단계를 거친 후, 작년 유튜브 파트너 프로그램에 가입된 약 400만 명의
관련 특별 주제 추천
의견 (1)
0/500
Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅

I/O 2025에서 유니티는 제너레이티브 AI에 대한 접근 방식을 프레젠테이션과 실제 애플리케이션을 통해 그 기능을 시연하는 방식으로 진행했습니다. 유니티는 최신 비디오 및 이미지 생성 모델인 Veo 3와 Imagen 4에 대한 흥미로운 업데이트를 공개하고 Lyria 2에 대한 액세스를 확대했습니다. 또한 최첨단 생성 모델을 사용해 시네마틱 클립, 장면, 일관된 내러티브를 원활하게 제작할 수 있는 AI 영화 제작 도구인 Flow를 소개했습니다.
또한 이러한 툴을 대표적인 연례 행사에 통합했습니다: 메인 I/O 기조연설의 219개 슬라이드가 AI로 생성되었고, 기조연설 비주얼의 48%가 Imagen을 사용하여 제작되었으며, 비디오의 80%가 어떤 형태로든 Veo 또는 Imagen을 통합했습니다. 프롬프트 작성 프로세스를 비롯한 자체 AI 도구를 활용하여 I/O 2025에 활기를 불어넣은 방법을 자세히 살펴보세요:
Veo 2: 스타일리시한 연사 타이틀 카드 디자인하기
검색 부사장 겸 검색 책임자인 엘리자베스 리드가 무대에 올라 주요 검색 업데이트를 공유하자, 화면에는 리즈가 손을 펴서 손바닥 바로 위에서 회전하며 공중에 떠 있는 섬세한 오렌지색 종이학이 나타나는 짧은 동영상이 재생되었습니다.
이 영상과 다른 스피커 소개 영상을 제작하기 위해 Veo 2 기반의 AI Studio와 Vertex AI Studio의 이미지-투-비디오 기능을 사용했습니다. 우리는 프롬프트에 포함하기 위해 스피커의 헤드샷과 관심사 및 취미에 대한 세부 정보를 수집했습니다. 다음은 연구 과학자 제이슨 볼드리지의 타이틀 카드를 위해 만든 프롬프트입니다:
다음은 간단한 애니메이션으로 개선된 Veo 2의 원시 결과물과 청중이 무대에서 본 내용입니다:
Imagen 4와 Veo 3: 스토리보드 제작 및 영화 제작
I/O에서 상영된 여러 영화는 제작에 AI 도구를 활용했습니다. 오프닝 영상은 시청자들을 서부풍의 마을을 통과하는 스릴 넘치는 여정으로 안내한 후, "I/O에 오신 것을 환영합니다"라고 적힌 형형색색의 풍선을 띄우며 기조연설의 시작을 알렸습니다.
제작팀은 이 영상을 제작하기 위해 다양한 AI 툴을 사용했습니다. 먼저 Imagen 4를 사용하여 비디오 프롬프트에 사용할 이미지를 생성했습니다. 또한 구글 딥마인드 팀과 협력하여 제미니를 사용하여 프롬프트를 다듬고 원하는 결과를 얻기 위한 적절한 언어를 찾는 데 도움을 주었습니다. 첫 번째 장면에 사용된 프롬프트는 다음과 같습니다:
이것이 그들이 생성한 것입니다:
그런 다음 팀은 이 이미지를 Veo 3 프롬프트에 통합하여 다음과 같은 지침을 포함했습니다:
이미지와 세련된 프롬프트가 준비되자 팀은 최신 Veo 3 기술(Google AI Ultra 요금제를 통해 사용 가능!)을 사용하여 영화 제작을 시작했습니다. 또한 결과물을 검토하면서 오버헤드 샷, 더 넓은 앵글, 다양한 비주얼을 추가하는 등 실시간 조정을 위해 Veo 3를 사용했습니다. 장면을 재촬영해야 하는 기존 영화 제작과는 달리 팀은 훨씬 빠르게 반복 작업을 진행할 수 있었습니다. 일부 팀원은 코드 기반 편집을 위해 Colab 기능을 사용했지만, 다른 많은 팀원은 자연어로 편집 및 요청 사항을 설명하는 텍스트-비디오 프롬프트에 의존했습니다.
다음은 영화의 마지막 장면 중 하나를 만드는 데 사용된 프롬프트입니다:
리리아 리얼타임: 토로 이 모이와 실시간으로 재밍하기
I/O 프리쇼에서 아티스트 토로 이 모이는 라이브 뮤지컬 세트에서 라이리아 리얼타임을 사용하여 모델의 최신 기능을 시연했습니다. 라이리아 리얼타임은 실시간으로 생성 음악을 만들고, 제어하고, 연주할 수 있는 인터랙티브 음악 생성 모델입니다. 악기, 사운드, 장르 등을 혼합하고 변형할 수 있습니다. "이것은 공연이자 실험이 될 것입니다."라고 그는 시작하기 전에 설명했습니다. "제가 연주하는 모든 것은 완전히 즉흥적입니다. 저는 컴퓨터와 잼을 주고 컴퓨터는 저와 잼을 주고받으며 연주합니다."
공연 전 몇 주 동안 팀은 토로 이 모이에게 리리아 리얼타임 프로토타입을 제공하여 그가 프롬프트를 테스트하고 다듬을 수 있도록 했습니다. 이를 통해 그는 공연 중에 사용할 창의적인 콘셉트와 프롬프트를 개발할 수 있었습니다. 그는 '카오틱 콩가 플레이어', '피치 시프트 영국 정글 드럼' 등 16개의 사운드 프롬프트를 만들어 실제 MIDI 컨트롤러의 노브에 할당했습니다.
MIDI 컨트롤러를 통해 라이리아 리얼타임을 로컬에서 실행함으로써 토로 이 모이는 무대에서 모델을 사용할 수 있었고, 관객은 인터페이스가 작동하는 모습을 실시간으로 볼 수 있었습니다.
공연 중에는 Lyria RealTime API로 구축되어 MIDI 컨트롤러에서 실행되는 앱이 토로 이 모이 뒤에 표시되었습니다. 관객들은 토로 이 모이가 키보드와 보컬 장식을 레이어링하는 동안 그가 사용한 프롬프트와 함께 연속적인 음악 스트림을 생성하고 제어하는 앱의 옵션을 확인할 수 있었습니다.
AI 스튜디오에서 Lyria 실시간 API를 사용하여 직접 사용해 보세요.
AI 스튜디오: AI로 생성된 스웩 만들기
모델을 빠르게 테스트하고 프롬프트를 실험할 수 있는 무료 인터페이스인 Google AI Studio에서 여러 Gemini 모델을 사용하여 새로운 맞춤형 로고가 새겨진 올해의 I/O 셔츠를 디자인했습니다. 셔츠의 태그에서 알 수 있듯이 창의적인 프롬프트는 다음과 같습니다: "땅에 녹아드는 구글 I/O 로고, 무지개 색상, 일러스트레이션, 스튜디오 조명"이었습니다. 제작 방법은 다음과 같습니다:
먼저 팀은 AI Studio에서 Gemini 2.5 Pro를 선택하고 자세한 시스템 지침 프롬프트를 통해 목표를 정의했습니다.
이러한 지침을 설정한 후 앞서 언급한 크리에이티브 프롬프트를 입력했습니다. 그런 다음 Gemini 2.5 Pro는 원하는 이미지 출력물에 대한 요구 사항과 스타일 아이디어 목록을 생성했습니다. 예를 들어 "핵심 모양: 세 가지 기본 도형(전체 직사각형, 얇은 슬래시/직사각형, 원통형)의 기본 기하학적 형태는 측면에 멜팅 효과를 적용하더라도 여전히 명확하게 인식할 수 있고 시각적으로 구분되어야 합니다. 멜팅 페인트 효과 이상으로 핵심 구조가 왜곡되지 않아야 합니다."
이러한 지침이 작성된 후, 팀은 이미지 생성 기능이 있는 주력 모델인 Gemini 2.0 플래시로 전환하여 생성된 목록에 따라 다양한 이미지 옵션을 제작했습니다.
광범위한 실험을 거쳐 이 디자인을 포함한 몇 가지 최종 디자인을 선택했습니다.
또한 팀은 초기 프롬프트 재작성 작업을 Gemini 2.5 Pro로 건너뛰고 AI Studio의 Gemini 2.0 Flash로 직접 시도했습니다. 원하는 결과물에 근접했지만, 2.5 Pro 재작성을 사용하면 더 창의적인 디테일로 일관되게 더 나은 결과를 얻을 수 있었습니다. 결과는? 정말 멋진 티셔츠가 탄생했습니다!
요약할 준비가 되셨나요? 여기에서 I/O 2025의 주요 발표 내용을 확인하고, I/O 퀴즈를 통해 지식을 테스트해 보세요.
배리 딜러: AGI 시대가 다가옴에 따라 샘 알트먼에 대한 신뢰는 무의미하다
억만장자 미디어 거물 배리 딜러는 최근 보도에서 달리 제기된 주장에도 불구하고, 오픈AI의 샘 알트만 CEO가 신뢰할 수 없는 인물이라고 생각하지 않는다고 밝혔다. 이번 주 월스트리트저널(WSJ)이 주최한 ‘Future of Everything’ 컨퍼런스에서 연설한 딜러는, 일부 전직 동료들과 이사회 구성원들로부터 때때로 교묘하게 조종하거나 기만적이라는 비
유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대
화요일, 유튜브는 딥페이크 탐지 기술을 일부 정부 관계자, 정치 후보자 및 언론인 대상으로 확대한다고 발표했다. 이 도구는 AI로 생성된 유사 영상을 식별하며, 시범 운영 참여자들은 유튜브 정책을 위반한다고 판단되는 무단 콘텐츠의 삭제를 요청할 수 있다.이 탐지 시스템은 초기 테스트 단계를 거친 후, 작년 유튜브 파트너 프로그램에 가입된 약 400만 명의
Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅





집






