

Dentro del salto en la IA de Google: Gemini 2.5 piensa más profundamente, habla más inteligente y codifica más rápido

Google se Acerca a su Visión de un Asistente de IA Universal
En el evento Google I/O de este año, la empresa reveló importantes actualizaciones de su serie Gemini 2.5, centrándose particularmente en mejorar sus capacidades en varias dimensiones. Las últimas versiones—Gemini 2.5 Flash y 2.5 Pro—son ahora más inteligentes y eficientes que nunca. Estas mejoras acercan a Google a lograr su visión de crear un asistente de IA universal capaz de comprender contexto, planificar y ejecutar tareas de manera fluida. ### Gemini 2.5 Pro: Elevando la Inteligencia a Nuevos Niveles
Gemini 2.5 Pro, descrito por Google como su modelo más avanzado hasta la fecha, cuenta con una ventana de contexto de un millón de tokens sin precedentes. Esta función permite al IA manejar grandes cantidades de datos y mantener la coherencia durante conversaciones largas. En el evento, el director ejecutivo de Google DeepMind, Demis Hassabis, expresó su entusiasmo por el progreso realizado, declarando: “Este es nuestro objetivo final para la aplicación Gemini: Un IA personal, proactiva y poderosa.” Una de las características destacadas de Gemini 2.5 Pro es la introducción de 'Deep Think', un modo de razonamiento mejorado experimental. Deep Think permite al IA analizar múltiples hipótesis antes de proporcionar una respuesta, mejorando sus habilidades de toma de decisiones. Según Hassabis, este desarrollo proviene de las lecciones aprendidas durante la creación de AlphaGo, donde tiempos de procesamiento más largos arrojaron mejores resultados. #### Resultados Impresionantes en Pruebas de Referencia
Deep Think ya ha demostrado un rendimiento impresionante en pruebas desafiantes. Por ejemplo, obtuvo puntuaciones impresionantes en el Olimpiada Matemática de EE.UU. de 2025 (USAMO) y destacó en LiveCodeBench, una prueba conocida por evaluar habilidades avanzadas de codificación. Además, logró un 84.0% en MMMU, que evalúa la comprensión y razonamiento multimodal. A pesar de estos logros, Google sigue siendo cauteloso. Hassabis mencionó que el equipo está realizando evaluaciones de seguridad exhaustivas y recopilando retroalimentación de expertos antes de implementar Deep Think de manera más amplia. Actualmente, está disponible para testers confiables a través de la API con fines de retroalimentación. ### Gemini 2.5 Flash: Una Trabaja para el Uso Diario
Junto con Gemini 2.5 Pro, Google también presentó una versión mejorada de Gemini 2.5 Flash, diseñada para velocidad, eficiencia y asequibilidad. Hassabis la describió como el “caballo de batalla” de la serie, destacando en pruebas de razonamiento, multimodalidad, código y contexto largo. De hecho, ocupa el segundo lugar en el tablero LMArena. El modelo actualizado de Flash es aproximadamente 20 a 30% más eficiente, requiriendo menos tokens para realizar tareas. Basándose en el feedback de los desarrolladores, Google ha afinado el modelo y lo ha puesto a disposición para previsualización en Google AI Studio, Vertex AI y la aplicación Gemini. Será lanzado completamente para producción a principios de junio. ### Nuevas Funcionalidades en Ambos Modelos
Ambos modelos, Gemini 2.5 Pro y Flash, recibieron varias nuevas capacidades destinadas a mejorar la interacción del usuario. Se añadió salida de audio nativa para crear experiencias conversacionales más naturales, mientras que la funcionalidad de texto a voz ahora admite múltiples voces. Los usuarios incluso pueden guiar el tono y estilo de la voz, ya sea que quieran que el IA suene dramático o sombrío. Otras características experimentales de voz incluyen diálogos afectivos, que permiten al IA reconocer emociones en la voz del usuario y responder adecuadamente, y audio proactivo, que filtra el ruido de fondo. También se introdujeron presupuestos de pensamiento, otorgando a los desarrolladores control sobre cuánta potencia computacional utiliza el IA antes de responder. ### Un Paso Hacia el Futuro
Estas actualizaciones subrayan el compromiso de Google por superar los límites de la tecnología de IA. Como Kavukcuoglu y Doshi señalaron en su publicación de blog, “Estamos viviendo un momento increíble en la historia donde la IA está haciendo posible un futuro maravilloso. Ha sido un progreso constante.” Con estas mejoras, Google sin duda está trazando el camino hacia un futuro donde los asistentes de IA se conviertan en compañeros indispensables en nuestra vida diaria.
Artículo relacionado
딥 코그니토, 최고 순위 오픈소스 AI 모델 출시
딥 코지토, 혁명적인 AI 모델 출시샌프란시스코에 본사를 두고 있는 선도적인 AI 연구 스타트업 딥 코지토는 공식적으로 첫 번째 오픈 소스 대규모 언어 모델(Large Language Models, LLMs)인 '코지토 v1' 라인업을 발표했습니다. 이 모델들은 메타의 Llama 3.2에서 미세조정되었으며, 하이브리드 추
마이크로소프트, 빌드 2025에서 '自律형 웹'을 위한 50개 이상의 AI 도구 발표
마이크로소프트, 빌드 컨퍼런스에서 오픈 에이전틱 웹 비전 공개오늘 아침, 마이크로소프트는 연례 빌드 컨퍼런스를 시작하면서 대담한 선언을 내놓았다: "오픈 에이전틱 웹"의 탄생이다. 50개 이상의 발표를 통해 이 거대 기술사는 이 변혁적인 운동의 중심에 서겠다는 종합적인 전략을 밝혔다. GitHub, Azure부터 Wind
구글, 크롬에서 제미니 통합 론칭
Chrome에서 Gemini 통합 소개: AI 기반 브라우징의 새로운 시대2025년 구글 I/O에서 구글은 Chrome 브라우저에 획기적인 추가 기능을 발표하며 파장을 일으켰습니다. 바로 Gemini 통합입니다. 이 움직임은 사용자가 웹과 상호작용하는 방식에 큰 변화를 가져오며, 방문한 페이지에서 답변, 요약, 통찰을 쉽
comentario (0)
0/200
Google se Acerca a su Visión de un Asistente de IA Universal
En el evento Google I/O de este año, la empresa reveló importantes actualizaciones de su serie Gemini 2.5, centrándose particularmente en mejorar sus capacidades en varias dimensiones. Las últimas versiones—Gemini 2.5 Flash y 2.5 Pro—son ahora más inteligentes y eficientes que nunca. Estas mejoras acercan a Google a lograr su visión de crear un asistente de IA universal capaz de comprender contexto, planificar y ejecutar tareas de manera fluida. ### Gemini 2.5 Pro: Elevando la Inteligencia a Nuevos Niveles
Gemini 2.5 Pro, descrito por Google como su modelo más avanzado hasta la fecha, cuenta con una ventana de contexto de un millón de tokens sin precedentes. Esta función permite al IA manejar grandes cantidades de datos y mantener la coherencia durante conversaciones largas. En el evento, el director ejecutivo de Google DeepMind, Demis Hassabis, expresó su entusiasmo por el progreso realizado, declarando: “Este es nuestro objetivo final para la aplicación Gemini: Un IA personal, proactiva y poderosa.” Una de las características destacadas de Gemini 2.5 Pro es la introducción de 'Deep Think', un modo de razonamiento mejorado experimental. Deep Think permite al IA analizar múltiples hipótesis antes de proporcionar una respuesta, mejorando sus habilidades de toma de decisiones. Según Hassabis, este desarrollo proviene de las lecciones aprendidas durante la creación de AlphaGo, donde tiempos de procesamiento más largos arrojaron mejores resultados. #### Resultados Impresionantes en Pruebas de Referencia
Deep Think ya ha demostrado un rendimiento impresionante en pruebas desafiantes. Por ejemplo, obtuvo puntuaciones impresionantes en el Olimpiada Matemática de EE.UU. de 2025 (USAMO) y destacó en LiveCodeBench, una prueba conocida por evaluar habilidades avanzadas de codificación. Además, logró un 84.0% en MMMU, que evalúa la comprensión y razonamiento multimodal. A pesar de estos logros, Google sigue siendo cauteloso. Hassabis mencionó que el equipo está realizando evaluaciones de seguridad exhaustivas y recopilando retroalimentación de expertos antes de implementar Deep Think de manera más amplia. Actualmente, está disponible para testers confiables a través de la API con fines de retroalimentación. ### Gemini 2.5 Flash: Una Trabaja para el Uso Diario
Junto con Gemini 2.5 Pro, Google también presentó una versión mejorada de Gemini 2.5 Flash, diseñada para velocidad, eficiencia y asequibilidad. Hassabis la describió como el “caballo de batalla” de la serie, destacando en pruebas de razonamiento, multimodalidad, código y contexto largo. De hecho, ocupa el segundo lugar en el tablero LMArena. El modelo actualizado de Flash es aproximadamente 20 a 30% más eficiente, requiriendo menos tokens para realizar tareas. Basándose en el feedback de los desarrolladores, Google ha afinado el modelo y lo ha puesto a disposición para previsualización en Google AI Studio, Vertex AI y la aplicación Gemini. Será lanzado completamente para producción a principios de junio. ### Nuevas Funcionalidades en Ambos Modelos
Ambos modelos, Gemini 2.5 Pro y Flash, recibieron varias nuevas capacidades destinadas a mejorar la interacción del usuario. Se añadió salida de audio nativa para crear experiencias conversacionales más naturales, mientras que la funcionalidad de texto a voz ahora admite múltiples voces. Los usuarios incluso pueden guiar el tono y estilo de la voz, ya sea que quieran que el IA suene dramático o sombrío. Otras características experimentales de voz incluyen diálogos afectivos, que permiten al IA reconocer emociones en la voz del usuario y responder adecuadamente, y audio proactivo, que filtra el ruido de fondo. También se introdujeron presupuestos de pensamiento, otorgando a los desarrolladores control sobre cuánta potencia computacional utiliza el IA antes de responder. ### Un Paso Hacia el Futuro
Estas actualizaciones subrayan el compromiso de Google por superar los límites de la tecnología de IA. Como Kavukcuoglu y Doshi señalaron en su publicación de blog, “Estamos viviendo un momento increíble en la historia donde la IA está haciendo posible un futuro maravilloso. Ha sido un progreso constante.” Con estas mejoras, Google sin duda está trazando el camino hacia un futuro donde los asistentes de IA se conviertan en compañeros indispensables en nuestra vida diaria.












