opción
Hogar
Noticias
"8 nuevos productos y actualizaciones de IA probados"

"8 nuevos productos y actualizaciones de IA probados"

10 de abril de 2025
103

"8 nuevos productos y actualizaciones de IA probados"

En E/S, no solo lanzamos una lista de actualizaciones como nuevos modelos Gemini, agentes de IA y ajustes de Android, en realidad dejamos que los desarrolladores, reporteros y socios se sumerjan en la acción con demostraciones prácticas de productos. Este año, pude pasar el día en el anfiteatro Shoreline, donde tiene lugar la E/S, y tuve que ver un montón de estas demostraciones. Aquí está el bajo en algunos de ellos. Mi primera demostración del día fue genial. Vi a Gemini Advanced enfrentar un arrendamiento de propiedades de más de 20 páginas, lleno de jerga legal y cláusulas complicadas. Después de procesar el documento, podría hacer preguntas al respecto, como si mi arrendador me permitiera tener un perro mascota o si hubiera tarifas adicionales que debía pagar. Ya estoy deseando usar esta función para darle sentido a mi próximo contrato de arrendamiento cuando mi apartamento se renova. A continuación, la demostración se volvió aún más impresionante. Dos Googlers alimentaron a Géminis un PDF de un libro de texto de economía masiva, cientos de páginas. Me habría llevado años leerlo, pero Gemini preparó un resumen y señaló los temas clave para estudiar en poco tiempo. Incluso arrojó un cuestionario de opción múltiple, completa con una respuesta correcta y tres malos incorrectos, para ayudarme a prepararme para un examen hipotético. Los Googlers Sid Lall (izquierda) y Adam Kurzrok (derecha) demuestran cómo Géminis avanzado ahora puede resumir un libro de texto económico considerable o miles de páginas de documentos. Ambas demostraciones hicieron uso de Gemini 1.5 Pro, que presentamos a principios de este año con la ventana de contexto más larga de cualquier modelo de base a gran escala. Ahora estamos lanzando acceso temprano a Gemini 1.5 Pro para suscriptores avanzados de Gemini, permitiéndoles cargar documentos directamente desde la unidad. Esto significa que pueden usar Gemini para resumir o analizar documentos de hasta 1.500 páginas de largo. Gemini 1.5 Pro también está llegando al panel lateral de aplicaciones del espacio de trabajo como Gmail, documentos, sábanas, diapositivas y discos. Pude ver esto en acción usando Gemini en Gmail para resumir un correo electrónico de informe de la escuela semanal, y extrajo detalles específicos como actividades para estudiantes de 7º grado y la lista de embalaje para un viaje nocturno. El panel lateral de Gemini puede ayudarlo a responder preguntas clave sobre su contenido en Gmail, Drive y más. La ventana de contexto largo mejorado puede incluso extraer información de múltiples documentos al responder a un solo mensaje. En Docs, solicité ayuda para escribir una carta de muestra a un candidato de trabajo potencial, vinculado al documento de descripción del trabajo y la cartera de PDF del solicitante en mi unidad. Gemini redactó instantáneamente un correo electrónico que tuvo en cuenta los detalles de ambos documentos. Pero Gemini 1.5 Pro no es el único niño nuevo en el bloque. También pude jugar con el recién anunciado Imagen 3, nuestro mejor modelo de texto a imagen hasta ahora. Una característica genial que probé fue su capacidad para generar texto y letras decorativas. Pedí un alfabeto estilizado, como letras hechas de mermelada en tostadas o globos plateados que flotaban en el cielo. Imagen 3 produjo un alfabeto completo de letras, que luego podría usar para crear mis propios menús (sabrosos). Después de mi diversión con Imagen 3, volví a más demostraciones de Géminis. Una demostración me deja sacar la superposición de Gemini en un teléfono Android y hacer preguntas sobre cualquier cosa en la pantalla. Esto mostró cómo no solo estamos expandiendo lo que puede preguntarle a Gemini, sino también haciéndole un contexto anticipado para anticipar sus necesidades y ofrecer sugerencias útiles. La demostración utilizó un manual de horno largo como ejemplo. En lugar de atravesar el documento, detuve a Géminis y obtuve una sugerencia de "preguntar este pdf" de inmediato. Hice preguntas como "¿Cómo actualizo el reloj" y obtuve respuestas rápidas y precisas? Funcionó igual de bien con videos de YouTube. En lugar de ver un video de entrenamiento de 20 minutos, pregunté cómo modificar las tablas y obtuve una respuesta en un instante, luego pasé a la siguiente demostración. Esta próxima demostración presentó un nuevo modo de conversación llamado Gemini Live, donde puedes hablar con Gemini en la aplicación sin escribir. Hablar con Gemini fue un ambiente diferente de la interfaz de chatbot habitual. Sus respuestas fueron más conversacionales, no solo párrafos de texto o listas puntiagudas de bala. En mi demostración, solicité una lista de actividades para niños para unas vacaciones de verano y pude interrumpir la lista para preguntar más sobre qué materiales necesitaría para morir una camisa. La demostración del Proyecto Astra llevó las cosas al siguiente nivel, mostrando hacia dónde se dirigen nuestros proyectos de IA conversacionales. Nuestro AI Sandbox, donde los desarrolladores y los asistentes probaron demostraciones como Project Astra y otros experimentos creativos de IA, como el modo DJ de MusicFX. En lugar de trabajar con lo que está en su pantalla o lo que ha escrito en una caja de chat, las capacidades multimodales de Astra pueden comprender las indicaciones del habla conversacionales y los alimentos en videos en vivo al mismo tiempo, desbloqueando nuevos tipos de experiencias de IA. La demostración de aliteración de Astra comenzó simple: le mostré a la cámara un objeto, como un plátano o un pedazo de pan, y a Gemini se le ocurrió una oración aliterativa. Mientras agregué más objetos, Gemini mantuvo la conversación, desde "plátanos brillantes disfruté maravillosamente en el tablero" con una sola fruta hasta "Las creaciones culinarias pueden llamar la atención" cuando se les presenta un tablero de buffet completo. Astra aliterados con plátanos, baguettes ... y cualquier otra cosa que puedas mostrarlo. Otra demostración de Astra me dejó tocar el Pictory con Géminis. Puede sonar simple, pero requirió que el agente entendiera las imágenes, recuerde lo que se había dibujado en cada ronda y usar el conocimiento general para adivinar lo que estaba dibujando. En una demostración, Astra sabía que un círculo no era suficiente para basar una suposición, pero cuando agregué líneas debajo, rápidamente pasó de identificar una figura de palo a reconocer que una persona que sostenía un emoji de calavera era aldea. Astra está invicto en Pictionary. Moverse a través de AI Sandbox y otras estaciones de demostración se sintió como un vistazo al futuro. También fue un poco humillante: ¡Astra me ganó en Pictionary en múltiples rondas!
Artículo relacionado
Billionaires Discuss Automating Jobs Away in This Week's AI Update Billionaires Discuss Automating Jobs Away in This Week's AI Update Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
Google’s AI Futures Fund may have to tread carefully Google’s AI Futures Fund may have to tread carefully Google’s New AI Investment Initiative: A Strategic Shift Amid Regulatory ScrutinyGoogle's recent announcement of an AI Futures Fund marks a bold move in the tech giant's ongoing qu
comentario (35)
0/200
JosephWalker
JosephWalker 11 de abril de 2025 00:00:00 GMT

The hands-on demos at I/O were cool, but some of the AI products felt a bit overhyped. I tried out the new Gemini models and they're impressive, but not groundbreaking. Still, it was fun to play around with the latest tech!

KeithGonzález
KeithGonzález 11 de abril de 2025 00:00:00 GMT

I/Oでのハンズオンデモは面白かったけど、いくつかのAI製品は少し過大評価されている感じがした。新しいGeminiモデルを試してみたけど、感動的というほどではなかった。それでも、最新の技術を触るのは楽しかったよ!

GeorgeTaylor
GeorgeTaylor 11 de abril de 2025 00:00:00 GMT

I/O에서의 핸즈온 데모는 재미있었지만, 일부 AI 제품은 약간 과대평가된 느낌이 들었어요. 새로운 Gemini 모델을 시도해봤는데, 혁신적이지는 않았어요. 그래도 최신 기술을 만져보는 건 즐거웠어요!

NicholasNelson
NicholasNelson 11 de abril de 2025 00:00:00 GMT

Os demos práticos no I/O foram legais, mas alguns dos produtos de IA pareceram um pouco superestimados. Testei os novos modelos Gemini e são impressionantes, mas não revolucionários. Ainda assim, foi divertido brincar com a tecnologia mais recente!

GaryWalker
GaryWalker 11 de abril de 2025 00:00:00 GMT

Las demostraciones prácticas en I/O fueron geniales, pero algunos de los productos de IA me parecieron un poco sobrevalorados. Probé los nuevos modelos Gemini y son impresionantes, pero no revolucionarios. Aún así, fue divertido jugar con la tecnología más reciente!

EricMartin
EricMartin 11 de abril de 2025 00:00:00 GMT

The hands-on demos at I/O were awesome! Got to try out the new Gemini models and AI agents. The Android tweaks were cool too, but some of the AI stuff felt a bit overhyped. Still, it was a fun day at Shoreline Amphitheatre. Wish they had more time for us to play around though!

Volver arriba
OR