opción
Hogar
Noticias
"8 nuevos productos y actualizaciones de IA probados"

"8 nuevos productos y actualizaciones de IA probados"

10 de abril de 2025
131

"8 nuevos productos y actualizaciones de IA probados"

En I/O, no solo presentamos una lista de actualizaciones como nuevos modelos de Gemini, agentes de IA y ajustes de Android, sino que realmente permitimos que los desarrolladores, reporteros y socios se sumerjan en la acción con demostraciones prácticas de productos. Este año, tuve la oportunidad de pasar el día en el Anfiteatro Shoreline, donde se lleva a cabo I/O, y pude explorar varias de estas demostraciones. Aquí está el resumen de algunas de ellas.

Mi primera demostración del día fue bastante genial. Observé cómo Gemini Advanced manejaba un contrato de arrendamiento de más de 20 páginas, lleno de jerga legal y cláusulas complicadas. Después de que procesó el documento, pude hacer preguntas al respecto, como si mi casero me permitiría tener un perro como mascota o si había alguna tarifa adicional que tuviera que pagar. Ya estoy deseando usar esta función para entender mi próximo contrato de arrendamiento cuando se renueve mi apartamento.

A continuación, la demostración se volvió aún más impresionante. Dos Googlers alimentaron a Gemini con un PDF de un enorme libro de texto de economía, de cientos de páginas. Me habría tomado una eternidad leerlo, pero Gemini elaboró un resumen y señaló los temas clave para estudiar en poco tiempo. Incluso creó un cuestionario de opción múltiple, completo con una respuesta correcta y tres incorrectas complicadas, para ayudarme a prepararme para un examen hipotético.

Los Googlers Sid Lall (izquierda) y Adam Kurzrok (derecha) demuestran cómo Gemini Advanced ahora puede resumir un voluminoso libro de texto de economía o miles de páginas de documentos.

Ambas demostraciones hicieron uso de Gemini 1.5 Pro, que presentamos a principios de este año con la ventana de contexto más larga de cualquier modelo fundacional a gran escala. Ahora estamos implementando el acceso anticipado a Gemini 1.5 Pro para los suscriptores de Gemini Advanced, permitiéndoles cargar documentos directamente desde Drive. Esto significa que pueden usar Gemini para resumir o analizar documentos de hasta 1,500 páginas.

Gemini 1.5 Pro también está llegando al panel lateral de las aplicaciones de Workspace como Gmail, Docs, Sheets, Slides y Drive. Pude verlo en acción usando Gemini en Gmail para resumir un correo electrónico de informe escolar semanal de muestra, y extrajo detalles específicos como actividades para estudiantes de séptimo grado y la lista de empaque para un viaje nocturno.

El panel lateral de Gemini puede ayudarte a responder preguntas clave sobre tu contenido en Gmail, Drive y más.

La ventana de contexto largo mejorada incluso puede extraer información de múltiples documentos al responder a un solo prompt. En Docs, pedí ayuda para escribir una carta de muestra para un posible candidato a un empleo, vinculando el documento de descripción del trabajo y el portafolio en PDF del solicitante en mi Drive. Gemini redactó instantáneamente un correo electrónico que tomaba en cuenta detalles de ambos documentos.

Pero Gemini 1.5 Pro no es el único novato en la escena. También pude experimentar con el recién anunciado Imagen 3, nuestro mejor modelo de texto a imagen hasta ahora. Una función genial que probé fue su capacidad para generar texto y letras decorativas. Pedí un alfabeto estilizado, como letras hechas de mermelada en una tostada o globos plateados flotando en el cielo. Imagen 3 generó un alfabeto completo de letras, que luego pude usar para crear mis propios menús (deliciosos).

Después de mi diversión con Imagen 3, volví a más demostraciones de Gemini. Una demostración me permitió activar la superposición de Gemini en un teléfono Android y hacer preguntas sobre cualquier cosa en la pantalla. Esto mostró cómo no solo estamos expandiendo lo que puedes preguntarle a Gemini, sino también haciéndolo consciente del contexto para anticipar tus necesidades y ofrecer sugerencias útiles.

La demostración usó un extenso manual de horno como ejemplo. En lugar de revisar el documento tediosamente, activé Gemini y obtuve una sugerencia de "Preguntar sobre este PDF" de inmediato. Hice preguntas como "cómo actualizo el reloj" y obtuve respuestas rápidas y precisas. Funcionó igual de bien con videos de YouTube. En lugar de ver un video de entrenamiento de 20 minutos, pregunté cómo modificar las planchas y obtuve una respuesta en un instante, luego pasé a la siguiente demostración.

Esta siguiente demostración presentó un nuevo modo de conversación llamado Gemini Live, donde puedes hablar con Gemini en la aplicación sin escribir. Hablar con Gemini fue una experiencia diferente a la interfaz habitual de chatbot. Sus respuestas eran más conversacionales, no solo párrafos de texto o listas con viñetas. En mi demostración, pedí una lista de actividades para niños para unas vacaciones de verano y pude interrumpir la lista para preguntar más sobre qué materiales necesitaría para teñir una camiseta.

La demostración de Project Astra llevó las cosas al siguiente nivel, mostrando hacia dónde se dirigen nuestros proyectos de IA conversacional.

Nuestro AI Sandbox, donde los desarrolladores y asistentes probaron demostraciones como Project Astra y otros experimentos creativos de IA, como el modo DJ de MusicFX.

En lugar de solo trabajar con lo que está en tu pantalla o lo que has escrito en un cuadro de chat, las capacidades multimodales de Astra pueden entender prompts de voz conversacional y transmisiones de video en vivo al mismo tiempo, desbloqueando nuevos tipos de experiencias de IA.

La demostración de aliteración de Astra comenzó de manera simple: mostré a la cámara un objeto, como un plátano o un pedazo de pan, y Gemini creó una oración aliterativa. A medida que añadía más objetos, Gemini mantenía la conversación, desde "Plátanos brillantes brillan bellamente en la tabla" con una sola fruta hasta "Creaciones culinarias captan la atención" cuando se presentaba con un tablero de bufé completo.

Astra alitera con plátanos, baguettes… y cualquier otra cosa que puedas mostrarle.

Otra demostración de Astra me permitió jugar a Pictionary con Gemini. Puede sonar simple, pero requería que el agente entendiera imágenes, recordara lo que se había dibujado en cada ronda y usara conocimiento general para adivinar qué estaba dibujando. En una demostración, Astra sabía que un círculo no era suficiente para basar una suposición, pero a medida que añadía líneas debajo, rápidamente pasó de identificar una figura de palitos a reconocer que una persona sosteniendo un emoji de calavera era Hamlet.

Astra es imbatible en Pictionary.

Moverse por el AI Sandbox y otras estaciones de demostración se sintió como un vistazo al futuro. También fue un poco humillante: ¡Astra me venció en Pictionary en múltiples rondas!

Artículo relacionado
Meta Mejora la Seguridad de la IA con Herramientas Avanzadas de Llama Meta Mejora la Seguridad de la IA con Herramientas Avanzadas de Llama Meta ha lanzado nuevas herramientas de seguridad de Llama para fortalecer el desarrollo de la IA y proteger contra amenazas emergentes.Estas herramientas de seguridad mejoradas del modelo de IA Llama
NotebookLM Presenta Cuadernos Curados de Publicaciones y Expertos de Renombre NotebookLM Presenta Cuadernos Curados de Publicaciones y Expertos de Renombre Google está mejorando su herramienta de investigación y toma de notas impulsada por IA, NotebookLM, para que sirva como un centro de conocimiento integral. El lunes, la compañía presentó una colección
Alibaba presenta Wan2.1-VACE: solución de video de IA de código abierto Alibaba presenta Wan2.1-VACE: solución de video de IA de código abierto Alibaba ha presentado Wan2.1-VACE, un modelo de IA de código abierto diseñado para transformar los procesos de creación y edición de videos.VACE es un componente clave de la familia de modelos de IA d
comentario (36)
0/200
WillWalker
WillWalker 31 de julio de 2025 03:41:20 GMT+02:00

Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎

JeffreyThomas
JeffreyThomas 21 de abril de 2025 03:33:38 GMT+02:00

¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓

GregoryRodriguez
GregoryRodriguez 19 de abril de 2025 18:24:35 GMT+02:00

I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓

ThomasYoung
ThomasYoung 18 de abril de 2025 13:13:01 GMT+02:00

Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓

BrianThomas
BrianThomas 18 de abril de 2025 06:37:15 GMT+02:00

A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎

JackMartin
JackMartin 16 de abril de 2025 03:18:17 GMT+02:00

I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊

Volver arriba
OR