"8 sản phẩm AI mới và cập nhật đã được thử nghiệm"

Tại I/O, chúng tôi không chỉ công bố danh sách các cập nhật như các mô hình Gemini mới, tác nhân AI và những điều chỉnh cho Android—chúng tôi thực sự để các nhà phát triển, phóng viên và đối tác trải nghiệm trực tiếp với các bản demo sản phẩm. Năm nay, tôi đã dành cả ngày tại Nhà hát ngoài trời Shoreline, nơi diễn ra I/O, và tôi đã được thử một loạt các bản demo này. Dưới đây là tóm tắt về một vài trong số đó.
Bản demo đầu tiên trong ngày của tôi khá ấn tượng. Tôi đã xem Gemini Advanced xử lý một hợp đồng thuê tài sản dài hơn 20 trang, đầy rẫy thuật ngữ pháp lý và các điều khoản phức tạp. Sau khi xử lý tài liệu, tôi có thể đặt câu hỏi về nó, như liệu chủ nhà có cho phép tôi nuôi chó hay không hoặc liệu có phí bổ sung nào tôi cần trả hay không. Tôi đã rất mong chờ sử dụng tính năng này để hiểu rõ hơn về hợp đồng thuê nhà tiếp theo khi căn hộ của tôi đến hạn gia hạn.
Tiếp theo, bản demo còn ấn tượng hơn nữa. Hai nhân viên Google đã cung cấp cho Gemini một tệp PDF của một cuốn sách giáo khoa kinh tế khổng lồ—dài hàng trăm trang. Tôi sẽ mất rất nhiều thời gian để đọc hết nó, nhưng Gemini đã nhanh chóng tạo ra một bản tóm tắt và chỉ ra các chủ đề chính cần nghiên cứu trong thời gian ngắn. Nó thậm chí còn tạo ra một bài kiểm tra trắc nghiệm, với một đáp án đúng và ba đáp án sai khó nhằn, để giúp tôi chuẩn bị cho một kỳ thi giả định.
Nhân viên Google Sid Lall (bên trái) và Adam Kurzrok (bên phải) thể hiện cách Gemini Advanced có thể tóm tắt một cuốn sách giáo khoa kinh tế đồ sộ hoặc hàng ngàn trang tài liệu.
Cả hai bản demo này đều sử dụng Gemini 1.5 Pro, mà chúng tôi đã giới thiệu đầu năm nay với cửa sổ ngữ cảnh dài nhất trong số các mô hình nền tảng quy mô lớn. Chúng tôi hiện đang triển khai quyền truy cập sớm vào Gemini 1.5 Pro cho các thuê bao Gemini Advanced, cho phép họ tải tài liệu trực tiếp từ Drive. Điều này có nghĩa là họ có thể sử dụng Gemini để tóm tắt hoặc phân tích các tài liệu dài đến 1.500 trang.
Gemini 1.5 Pro cũng đang được tích hợp vào bảng điều khiển bên của các ứng dụng Workspace như Gmail, Docs, Sheets, Slides và Drive. Tôi đã được chứng kiến điều này trong thực tế khi sử dụng Gemini trong Gmail để tóm tắt một email báo cáo trường học hàng tuần mẫu, và nó đã rút ra các chi tiết cụ thể như các hoạt động cho học sinh lớp 7 và danh sách đồ cần chuẩn bị cho chuyến đi qua đêm.
Bảng điều khiển bên của Gemini có thể giúp bạn trả lời các câu hỏi chính về nội dung của bạn trong Gmail, Drive và hơn thế nữa.
Cửa sổ ngữ cảnh dài được cải tiến thậm chí có thể lấy thông tin từ nhiều tài liệu khi trả lời một yêu cầu duy nhất. Trong Docs, tôi đã yêu cầu trợ giúp viết một thư mẫu cho một ứng viên công việc tiềm năng, liên kết đến tài liệu mô tả công việc và danh mục PDF của ứng viên trong Drive của tôi. Gemini ngay lập tức soạn thảo một email có tính đến các chi tiết từ cả hai tài liệu.
Nhưng Gemini 1.5 Pro không phải là sản phẩm mới duy nhất. Tôi cũng được thử nghiệm với Imagen 3 vừa được công bố, mô hình văn bản sang hình ảnh tốt nhất của chúng tôi từ trước đến nay. Một tính năng thú vị mà tôi đã thử là khả năng tạo văn bản và chữ cái trang trí. Tôi đã yêu cầu một bảng chữ cái cách điệu, như các chữ cái được làm từ mứt trên bánh mì nướng hoặc bóng bay bạc lơ lửng trên bầu trời. Imagen 3 đã tạo ra một bảng chữ cái đầy đủ, mà sau đó tôi có thể sử dụng để tạo các thực đơn (ngon miệng) của riêng mình.
Sau khi vui chơi với Imagen 3, tôi quay lại với các bản demo Gemini khác. Một bản demo cho phép tôi mở lớp phủ của Gemini trên điện thoại Android và đặt câu hỏi về bất cứ thứ gì trên màn hình. Điều này cho thấy chúng tôi không chỉ mở rộng những gì bạn có thể hỏi Gemini, mà còn làm cho nó nhận biết ngữ cảnh để dự đoán nhu cầu của bạn và đưa ra các gợi ý hữu ích.
Bản demo sử dụng một tài liệu hướng dẫn lò nướng dài dòng làm ví dụ. Thay vì phải đọc lướt qua tài liệu, tôi đã mở Gemini và nhận được gợi ý "Hỏi PDF này" ngay lập tức. Tôi đã đặt các câu hỏi như "làm thế nào để cập nhật đồng hồ" và nhận được câu trả lời nhanh chóng, chính xác. Nó cũng hoạt động tốt với các video YouTube. Thay vì xem một video tập luyện dài 20 phút, tôi đã hỏi cách sửa đổi bài tập plank và nhận được câu trả lời ngay lập tức, sau đó chuyển sang bản demo tiếp theo.
Bản demo tiếp theo giới thiệu một chế độ hội thoại mới gọi là Gemini Live, nơi bạn có thể nói chuyện với Gemini trong ứng dụng mà không cần gõ. Nói chuyện với Gemini mang lại cảm giác khác biệt so với giao diện chatbot thông thường. Câu trả lời của nó mang tính hội thoại hơn, không chỉ là các đoạn văn hoặc danh sách gạch đầu dòng. Trong bản demo của tôi, tôi đã yêu cầu một danh sách các hoạt động cho trẻ em trong kỳ nghỉ hè và có thể ngắt lời danh sách để hỏi thêm về những vật liệu tôi cần để nhuộm áo thun.
Bản demo Project Astra đưa mọi thứ lên một tầm cao mới, cho thấy các dự án AI hội thoại của chúng tôi đang hướng tới.
Hộp cát AI của chúng tôi, nơi các nhà phát triển và người tham dự đã thử các bản demo như Project Astra và các thí nghiệm AI sáng tạo khác, như Chế độ DJ của MusicFX.
Thay vì chỉ làm việc với những gì trên màn hình của bạn hoặc những gì bạn đã nhập vào hộp trò chuyện, khả năng đa phương thức của Astra có thể hiểu các yêu cầu bằng giọng nói hội thoại và luồng video trực tiếp cùng một lúc, mở ra các loại trải nghiệm AI mới.
Bản demo điệp âm của Astra bắt đầu đơn giản: Tôi cho máy ảnh xem một vật, như một quả chuối hoặc một mẩu bánh mì, và Gemini đưa ra một câu điệp âm. Khi tôi thêm nhiều vật hơn, Gemini tiếp tục cuộc hội thoại, từ "Những quả chuối sáng bóng rực rỡ trên bảng" với một loại trái cây đến "Những sáng tạo ẩm thực có thể thu hút ánh nhìn" khi được trình bày với cả một bàn tiệc.
Astra tạo điệp âm với chuối, bánh mì baguette… và bất cứ thứ gì bạn có thể cho nó xem.
Một bản demo Astra khác cho phép tôi chơi Pictionary với Gemini. Nghe có vẻ đơn giản, nhưng nó yêu cầu tác nhân hiểu hình ảnh, nhớ những gì đã được vẽ mỗi vòng, và sử dụng kiến thức chung để đoán tôi đang vẽ gì. Trong một bản demo, Astra biết rằng một hình tròn không đủ để đưa ra phán đoán, nhưng khi tôi thêm các đường bên dưới, nó nhanh chóng chuyển từ nhận diện một hình người que đến nhận ra một người cầm biểu tượng cảm xúc hộp sọ là Hamlet.
Astra bất bại tại Pictionary.
Di chuyển qua Hộp cát AI và các trạm demo khác cảm giác như một cái nhìn thoáng qua vào tương lai. Nó cũng hơi khiến tôi cảm thấy khiêm tốn: Astra đã đánh bại tôi tại Pictionary trong nhiều vòng!
Bài viết liên quan
Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao
Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m
NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu
Google đang nâng cấp công cụ nghiên cứu và ghi chú dựa trên AI, NotebookLM, để trở thành một trung tâm tri thức toàn diện. Vào thứ Hai, công ty đã giới thiệu một bộ sưu tập ghi chép được chọn lọc từ c
Alibaba Công Bố Wan2.1-VACE: Giải Pháp Video AI Mã Nguồn Mở
Alibaba đã giới thiệu Wan2.1-VACE, một mô hình AI mã nguồn mở được thiết kế để thay đổi quy trình tạo và chỉnh sửa video.VACE là thành phần cốt lõi của gia đình mô hình video AI Wan2.1 của Alibaba, vớ
Nhận xét (36)
0/200
WillWalker
08:41:20 GMT+07:00 Ngày 31 tháng 7 năm 2025
Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎
0
JeffreyThomas
08:33:38 GMT+07:00 Ngày 21 tháng 4 năm 2025
¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓
0
GregoryRodriguez
23:24:35 GMT+07:00 Ngày 19 tháng 4 năm 2025
I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓
0
ThomasYoung
18:13:01 GMT+07:00 Ngày 18 tháng 4 năm 2025
Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓
0
BrianThomas
11:37:15 GMT+07:00 Ngày 18 tháng 4 năm 2025
A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎
0
JackMartin
08:18:17 GMT+07:00 Ngày 16 tháng 4 năm 2025
I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊
0
Tại I/O, chúng tôi không chỉ công bố danh sách các cập nhật như các mô hình Gemini mới, tác nhân AI và những điều chỉnh cho Android—chúng tôi thực sự để các nhà phát triển, phóng viên và đối tác trải nghiệm trực tiếp với các bản demo sản phẩm. Năm nay, tôi đã dành cả ngày tại Nhà hát ngoài trời Shoreline, nơi diễn ra I/O, và tôi đã được thử một loạt các bản demo này. Dưới đây là tóm tắt về một vài trong số đó.
Bản demo đầu tiên trong ngày của tôi khá ấn tượng. Tôi đã xem Gemini Advanced xử lý một hợp đồng thuê tài sản dài hơn 20 trang, đầy rẫy thuật ngữ pháp lý và các điều khoản phức tạp. Sau khi xử lý tài liệu, tôi có thể đặt câu hỏi về nó, như liệu chủ nhà có cho phép tôi nuôi chó hay không hoặc liệu có phí bổ sung nào tôi cần trả hay không. Tôi đã rất mong chờ sử dụng tính năng này để hiểu rõ hơn về hợp đồng thuê nhà tiếp theo khi căn hộ của tôi đến hạn gia hạn.
Tiếp theo, bản demo còn ấn tượng hơn nữa. Hai nhân viên Google đã cung cấp cho Gemini một tệp PDF của một cuốn sách giáo khoa kinh tế khổng lồ—dài hàng trăm trang. Tôi sẽ mất rất nhiều thời gian để đọc hết nó, nhưng Gemini đã nhanh chóng tạo ra một bản tóm tắt và chỉ ra các chủ đề chính cần nghiên cứu trong thời gian ngắn. Nó thậm chí còn tạo ra một bài kiểm tra trắc nghiệm, với một đáp án đúng và ba đáp án sai khó nhằn, để giúp tôi chuẩn bị cho một kỳ thi giả định.
Gemini 1.5 Pro cũng đang được tích hợp vào bảng điều khiển bên của các ứng dụng Workspace như Gmail, Docs, Sheets, Slides và Drive. Tôi đã được chứng kiến điều này trong thực tế khi sử dụng Gemini trong Gmail để tóm tắt một email báo cáo trường học hàng tuần mẫu, và nó đã rút ra các chi tiết cụ thể như các hoạt động cho học sinh lớp 7 và danh sách đồ cần chuẩn bị cho chuyến đi qua đêm.
Cửa sổ ngữ cảnh dài được cải tiến thậm chí có thể lấy thông tin từ nhiều tài liệu khi trả lời một yêu cầu duy nhất. Trong Docs, tôi đã yêu cầu trợ giúp viết một thư mẫu cho một ứng viên công việc tiềm năng, liên kết đến tài liệu mô tả công việc và danh mục PDF của ứng viên trong Drive của tôi. Gemini ngay lập tức soạn thảo một email có tính đến các chi tiết từ cả hai tài liệu.
Nhưng Gemini 1.5 Pro không phải là sản phẩm mới duy nhất. Tôi cũng được thử nghiệm với Imagen 3 vừa được công bố, mô hình văn bản sang hình ảnh tốt nhất của chúng tôi từ trước đến nay. Một tính năng thú vị mà tôi đã thử là khả năng tạo văn bản và chữ cái trang trí. Tôi đã yêu cầu một bảng chữ cái cách điệu, như các chữ cái được làm từ mứt trên bánh mì nướng hoặc bóng bay bạc lơ lửng trên bầu trời. Imagen 3 đã tạo ra một bảng chữ cái đầy đủ, mà sau đó tôi có thể sử dụng để tạo các thực đơn (ngon miệng) của riêng mình.
Sau khi vui chơi với Imagen 3, tôi quay lại với các bản demo Gemini khác. Một bản demo cho phép tôi mở lớp phủ của Gemini trên điện thoại Android và đặt câu hỏi về bất cứ thứ gì trên màn hình. Điều này cho thấy chúng tôi không chỉ mở rộng những gì bạn có thể hỏi Gemini, mà còn làm cho nó nhận biết ngữ cảnh để dự đoán nhu cầu của bạn và đưa ra các gợi ý hữu ích.
Bản demo sử dụng một tài liệu hướng dẫn lò nướng dài dòng làm ví dụ. Thay vì phải đọc lướt qua tài liệu, tôi đã mở Gemini và nhận được gợi ý "Hỏi PDF này" ngay lập tức. Tôi đã đặt các câu hỏi như "làm thế nào để cập nhật đồng hồ" và nhận được câu trả lời nhanh chóng, chính xác. Nó cũng hoạt động tốt với các video YouTube. Thay vì xem một video tập luyện dài 20 phút, tôi đã hỏi cách sửa đổi bài tập plank và nhận được câu trả lời ngay lập tức, sau đó chuyển sang bản demo tiếp theo.
Bản demo tiếp theo giới thiệu một chế độ hội thoại mới gọi là Gemini Live, nơi bạn có thể nói chuyện với Gemini trong ứng dụng mà không cần gõ. Nói chuyện với Gemini mang lại cảm giác khác biệt so với giao diện chatbot thông thường. Câu trả lời của nó mang tính hội thoại hơn, không chỉ là các đoạn văn hoặc danh sách gạch đầu dòng. Trong bản demo của tôi, tôi đã yêu cầu một danh sách các hoạt động cho trẻ em trong kỳ nghỉ hè và có thể ngắt lời danh sách để hỏi thêm về những vật liệu tôi cần để nhuộm áo thun.
Bản demo Project Astra đưa mọi thứ lên một tầm cao mới, cho thấy các dự án AI hội thoại của chúng tôi đang hướng tới.
Bản demo điệp âm của Astra bắt đầu đơn giản: Tôi cho máy ảnh xem một vật, như một quả chuối hoặc một mẩu bánh mì, và Gemini đưa ra một câu điệp âm. Khi tôi thêm nhiều vật hơn, Gemini tiếp tục cuộc hội thoại, từ "Những quả chuối sáng bóng rực rỡ trên bảng" với một loại trái cây đến "Những sáng tạo ẩm thực có thể thu hút ánh nhìn" khi được trình bày với cả một bàn tiệc.


Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎




¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓




I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓




Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓




A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎




I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊












