"8 개의 새로운 AI 제품 및 업데이트 테스트"

I/O에서 우리는 새로운 Gemini 모델, AI 에이전트, Android 조정과 같은 업데이트 목록을 단순히 발표하는 데 그치지 않고, 개발자, 기자, 파트너들이 실제로 제품 데모를 통해 직접 체험할 수 있도록 합니다. 올해 저는 I/O가 열리는 Shoreline Amphitheatre에서 하루를 보내고 여러 데모를 살펴볼 기회를 가졌습니다. 여기 몇 가지 데모에 대한 간략한 소개입니다.
첫 번째 데모는 정말 멋졌습니다. 저는 Gemini Advanced가 법률 용어와 까다로운 조항으로 가득한 20페이지가 넘는 부동산 임대 계약서를 처리하는 모습을 보았습니다. 문서를 처리한 후, 저는 집주인이 반려견을 키우도록 허락하는지 또는 추가로 지불해야 할 수수료가 있는지와 같은 질문을 할 수 있었습니다. 저는 이미 다음 아파트 갱신 시 이 기능을 사용해 임대 계약서를 이해할 날을 기대하고 있습니다.
다음으로 데모는 더욱 인상적이었습니다. 두 명의 Googlers가 수백 페이지에 달하는 방대한 경제학 교과서 PDF를 Gemini에 입력했습니다. 저라면 읽는 데 엄청난 시간이 걸렸겠지만, Gemini는 순식간에 요약을 작성하고 공부해야 할 주요 주제를 지적했습니다. 심지어 가상 시험 준비를 돕기 위해 정답 하나와 까다로운 오답 세 개로 구성된 다지선다 퀴즈까지 만들어 냈습니다.
Googlers Sid Lall (왼쪽)과 Adam Kurzrok (오른쪽)이 Gemini Advanced가 방대한 경제학 교과서나 수천 페이지의 문서를 요약할 수 있는 방법을 시연합니다.
이 두 데모 모두 올해 초 우리가 소개한, 대규모 기반 모델 중 가장 긴 컨텍스트 윈도우를 가진 Gemini 1.5 Pro를 활용했습니다. 이제 Gemini Advanced 구독자를 위해 Gemini 1.5 Pro에 대한 조기 액세스를 제공하며, Drive에서 문서를 직접 업로드할 수 있습니다. 즉, 최대 1,500페이지에 달하는 문서를 요약하거나 분석하는 데 Gemini를 사용할 수 있습니다.
Gemini 1.5 Pro는 Gmail, Docs, Sheets, Slides, Drive와 같은 Workspace 앱의 사이드 패널에도 적용되고 있습니다. 저는 Gmail에서 Gemini를 사용해 샘플 주간 학교 보고 이메일을 요약하는 모습을 보았고, 7학년 학생들을 위한 활동이나 하룻밤 여행을 위한 짐 목록 같은 구체적인 세부 사항을 추출했습니다.
Gemini의 사이드 패널은 Gmail, Drive 등에서 콘텐츠에 대한 주요 질문에 답변하는 데 도움을 줄 수 있습니다.
개선된 긴 컨텍스트 윈도우는 단일 프롬프트에 응답할 때 여러 문서에서 정보를 추출할 수도 있습니다. Docs에서 저는 잠재적 구직자에게 보내는 샘플 편지를 작성하는 데 도움을 요청하며, Drive에 있는 직무 설명 문서와 지원자의 PDF 포트폴리오를 링크했습니다. Gemini는 두 문서의 세부 사항을 고려해 즉시 이메일 초안을 작성했습니다.
하지만 Gemini 1.5 Pro만 새롭게 등장한 것은 아닙니다. 저는 새로 발표된 Imagen 3, 즉 지금까지 최고의 텍스트-이미지 모델도 사용해 보았습니다. 제가 시도한 멋진 기능 중 하나는 장식적인 텍스트와 글자를 생성하는 능력이었습니다. 저는 잼이 발린 토스트나 하늘에 떠 있는 은색 풍선으로 만든 글자와 같은 스타일화된 알파벳을 요청했습니다. Imagen 3는 전체 알파벳을 생성해 냈고, 이를 사용해 저만의 (맛있는) 메뉴를 만들 수 있었습니다.
Imagen 3로 즐거운 시간을 보낸 후, 다시 Gemini 데모로 돌아갔습니다. 한 데모에서는 Android 폰에서 Gemini의 오버레이를 띄워 화면에 있는 어떤 것에 대해 질문할 수 있었습니다. 이는 우리가 Gemini에 질문할 수 있는 범위를 확장할 뿐만 아니라, 사용자의 필요를 예측하고 유용한 제안을 제공하기 위해 컨텍스트를 인식하도록 만드는 방법을 보여주었습니다.
데모는 긴 오븐 설명서를 예로 사용했습니다. 문서를 힘들게 읽는 대신, Gemini를 띄우자마자 "이 PDF에 질문하기" 제안이 나타났습니다. 저는 "시계를 어떻게 업데이트하나요?" 같은 질문을 했고 빠르고 정확한 답변을 받았습니다. YouTube 비디오에서도 마찬가지로 잘 작동했습니다. 20분짜리 운동 비디오를 보는 대신, 플랭크를 수정하는 방법을 묻자 즉시 답변을 받아 다음 데모로 넘어갔습니다.
다음 데모는 Gemini Live라는 새로운 대화 모드를 소개했는데, 앱에서 타이핑 없이 Gemini와 대화할 수 있습니다. Gemini와 대화하는 것은 일반적인 챗봇 인터페이스와는 다른 느낌이었습니다. 답변은 단락이나 목록 형식이 아닌 더 대화적인 방식이었습니다. 데모에서 저는 여름 휴가를 위한 어린이 활동 목록을 요청했고, 목록을 중단하고 셔츠 염색에 필요한 재료에 대해 더 물어볼 수 있었습니다.
Project Astra 데모는 대화형 AI 프로젝트의 미래를 보여주며 한 단계 더 나아갔습니다.
우리의 AI Sandbox에서는 개발자와 참석자들이 Project Astra 및 MusicFX의 DJ 모드와 같은 창의적인 AI 실험 데모를 체험했습니다.
화면에 표시된 내용이나 입력한 텍스트만 다루는 대신, Astra의 다중 모달 기능은 대화형 음성 프롬프트와 실시간 비디오 피드를 동시에 이해하여 새로운 종류의 AI 경험을 가능하게 합니다.
Astra의 동음이의어 데모는 간단하게 시작했습니다. 저는 카메라에 바나나나 빵 조각 같은 물체를 보여주었고, Gemini는 동음이의어 문장을 만들어 냈습니다. 물체를 더 추가하자 Gemini는 대화를 이어갔고, 단일 과일에 대해 "밝은 바나나가 보드 위에서 아름답게 빛난다"에서부터 뷔페 보드를 보여주자 "요리 창작물이 눈길을 사로잡는다"로 발전했습니다.
Astra는 바나나, 바게트… 그리고 보여줄 수 있는 모든 것과 동음이의어를 만듭니다.
또 다른 Astra 데모에서는 Gemini와 픽셔너리 게임을 즐겼습니다. 간단해 보일 수 있지만, 에이전트가 이미지를 이해하고, 매 라운드에서 그려진 것을 기억하며, 일반 지식을 사용해 제가 그린 것을 추측해야 했습니다. 한 데모에서 Astra는 원만으로는 추측할 수 없었지만, 아래에 선을 추가하자 빠르게 스틱 피겨로 인식하고, 두개골 이모지를 든 사람이 Hamlet임을 알아챘습니다.
Astra는 픽셔너리에서 무패입니다.
AI Sandbox와 다른 데모 스테이션을 둘러보며 미래를 엿보는 기분이 들었습니다. 또한 Astra가 여러 라운드에서 저를 픽셔너리에서 이긴 것은 조금 겸허한 경험이었습니다!
관련 기사
Meta, 고급 Llama 도구로 AI 보안 강화
Meta는 AI 개발을 강화하고 새로운 위협으로부터 보호하기 위해 새로운 Llama 보안 도구를 출시했습니다.이러한 업그레이드된 Llama AI 모델 보안 도구는 Meta의 새로운 리소스와 함께 제공되어 사이버 보안 팀이 AI를 방어에 활용할 수 있도록 지원하며, 모든 AI 이해관계자의 안전을 강화하는 것을 목표로 합니다.Llama 모델을 사용하는 개발자는
NotebookLM, 최고 출판사 및 전문가로부터 선별된 노트북 공개
구글은 AI 기반 연구 및 메모 도구인 NotebookLM을 강화하여 포괄적인 지식 허브로 제공합니다. 월요일, 회사는 저명한 저자, 출판사, 연구자, 비영리 단체로부터 선별된 노트북 컬렉션을 소개하며, 사용자가 건강, 여행, 금융 등 다양한 주제를 탐색할 수 있도록 했습니다.초기 세트는 The Economist, The Atlantic, 유명 교수, 저자
Alibaba, Wan2.1-VACE 공개: 오픈소스 AI 비디오 솔루션
Alibaba가 Wan2.1-VACE를 공개, 비디오 제작 및 편집 프로세스를 혁신할 오픈소스 AI 모델.VACE는 Alibaba의 Wan2.1 비디오 AI 모델 패밀리의 핵심 구성 요소로, 회사는 이를 업계 최초의 다양한 비디오 생성 및 편집 작업을 위한 포괄적 솔루션을 제공하는 오픈소스 모델이라고 주장.Alibaba가 비디오 제작 프로세스를 간소화하고
의견 (36)
0/200
WillWalker
2025년 7월 31일 오전 10시 41분 20초 GMT+09:00
Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎
0
JeffreyThomas
2025년 4월 21일 오전 10시 33분 38초 GMT+09:00
¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓
0
GregoryRodriguez
2025년 4월 20일 오전 1시 24분 35초 GMT+09:00
I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓
0
ThomasYoung
2025년 4월 18일 오후 8시 13분 1초 GMT+09:00
Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓
0
BrianThomas
2025년 4월 18일 오후 1시 37분 15초 GMT+09:00
A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎
0
JackMartin
2025년 4월 16일 오전 10시 18분 17초 GMT+09:00
I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊
0
I/O에서 우리는 새로운 Gemini 모델, AI 에이전트, Android 조정과 같은 업데이트 목록을 단순히 발표하는 데 그치지 않고, 개발자, 기자, 파트너들이 실제로 제품 데모를 통해 직접 체험할 수 있도록 합니다. 올해 저는 I/O가 열리는 Shoreline Amphitheatre에서 하루를 보내고 여러 데모를 살펴볼 기회를 가졌습니다. 여기 몇 가지 데모에 대한 간략한 소개입니다.
첫 번째 데모는 정말 멋졌습니다. 저는 Gemini Advanced가 법률 용어와 까다로운 조항으로 가득한 20페이지가 넘는 부동산 임대 계약서를 처리하는 모습을 보았습니다. 문서를 처리한 후, 저는 집주인이 반려견을 키우도록 허락하는지 또는 추가로 지불해야 할 수수료가 있는지와 같은 질문을 할 수 있었습니다. 저는 이미 다음 아파트 갱신 시 이 기능을 사용해 임대 계약서를 이해할 날을 기대하고 있습니다.
다음으로 데모는 더욱 인상적이었습니다. 두 명의 Googlers가 수백 페이지에 달하는 방대한 경제학 교과서 PDF를 Gemini에 입력했습니다. 저라면 읽는 데 엄청난 시간이 걸렸겠지만, Gemini는 순식간에 요약을 작성하고 공부해야 할 주요 주제를 지적했습니다. 심지어 가상 시험 준비를 돕기 위해 정답 하나와 까다로운 오답 세 개로 구성된 다지선다 퀴즈까지 만들어 냈습니다.
Gemini 1.5 Pro는 Gmail, Docs, Sheets, Slides, Drive와 같은 Workspace 앱의 사이드 패널에도 적용되고 있습니다. 저는 Gmail에서 Gemini를 사용해 샘플 주간 학교 보고 이메일을 요약하는 모습을 보았고, 7학년 학생들을 위한 활동이나 하룻밤 여행을 위한 짐 목록 같은 구체적인 세부 사항을 추출했습니다.
개선된 긴 컨텍스트 윈도우는 단일 프롬프트에 응답할 때 여러 문서에서 정보를 추출할 수도 있습니다. Docs에서 저는 잠재적 구직자에게 보내는 샘플 편지를 작성하는 데 도움을 요청하며, Drive에 있는 직무 설명 문서와 지원자의 PDF 포트폴리오를 링크했습니다. Gemini는 두 문서의 세부 사항을 고려해 즉시 이메일 초안을 작성했습니다.
하지만 Gemini 1.5 Pro만 새롭게 등장한 것은 아닙니다. 저는 새로 발표된 Imagen 3, 즉 지금까지 최고의 텍스트-이미지 모델도 사용해 보았습니다. 제가 시도한 멋진 기능 중 하나는 장식적인 텍스트와 글자를 생성하는 능력이었습니다. 저는 잼이 발린 토스트나 하늘에 떠 있는 은색 풍선으로 만든 글자와 같은 스타일화된 알파벳을 요청했습니다. Imagen 3는 전체 알파벳을 생성해 냈고, 이를 사용해 저만의 (맛있는) 메뉴를 만들 수 있었습니다.
Imagen 3로 즐거운 시간을 보낸 후, 다시 Gemini 데모로 돌아갔습니다. 한 데모에서는 Android 폰에서 Gemini의 오버레이를 띄워 화면에 있는 어떤 것에 대해 질문할 수 있었습니다. 이는 우리가 Gemini에 질문할 수 있는 범위를 확장할 뿐만 아니라, 사용자의 필요를 예측하고 유용한 제안을 제공하기 위해 컨텍스트를 인식하도록 만드는 방법을 보여주었습니다.
데모는 긴 오븐 설명서를 예로 사용했습니다. 문서를 힘들게 읽는 대신, Gemini를 띄우자마자 "이 PDF에 질문하기" 제안이 나타났습니다. 저는 "시계를 어떻게 업데이트하나요?" 같은 질문을 했고 빠르고 정확한 답변을 받았습니다. YouTube 비디오에서도 마찬가지로 잘 작동했습니다. 20분짜리 운동 비디오를 보는 대신, 플랭크를 수정하는 방법을 묻자 즉시 답변을 받아 다음 데모로 넘어갔습니다.
다음 데모는 Gemini Live라는 새로운 대화 모드를 소개했는데, 앱에서 타이핑 없이 Gemini와 대화할 수 있습니다. Gemini와 대화하는 것은 일반적인 챗봇 인터페이스와는 다른 느낌이었습니다. 답변은 단락이나 목록 형식이 아닌 더 대화적인 방식이었습니다. 데모에서 저는 여름 휴가를 위한 어린이 활동 목록을 요청했고, 목록을 중단하고 셔츠 염색에 필요한 재료에 대해 더 물어볼 수 있었습니다.
Project Astra 데모는 대화형 AI 프로젝트의 미래를 보여주며 한 단계 더 나아갔습니다.
Astra의 동음이의어 데모는 간단하게 시작했습니다. 저는 카메라에 바나나나 빵 조각 같은 물체를 보여주었고, Gemini는 동음이의어 문장을 만들어 냈습니다. 물체를 더 추가하자 Gemini는 대화를 이어갔고, 단일 과일에 대해 "밝은 바나나가 보드 위에서 아름답게 빛난다"에서부터 뷔페 보드를 보여주자 "요리 창작물이 눈길을 사로잡는다"로 발전했습니다.


Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎




¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓




I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓




Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓




A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎




I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊












