opción
Hogar
Noticias
2024: el año de notable crecimiento e innovación de AI

2024: el año de notable crecimiento e innovación de AI

10 de abril de 2025
89

2024: el año de notable crecimiento e innovación de AI

Al entrar en 2025, es emocionante reflexionar sobre los increíbles avances que logramos en 2024. Desde el lanzamiento de los modelos Gemini 2.0 diseñados para la era agentiva hasta el empoderamiento de la expresión creativa, y desde el diseño de nuevos enlazadores de proteínas hasta el avance en neurociencia habilitada por IA y computación cuántica, hemos estado empujando los límites de la inteligencia artificial de manera responsable y audaz. Todos estos esfuerzos están orientados a aprovechar la IA para el mayor bienestar de la humanidad.

Como mencionamos en nuestro ensayo *Por qué nos enfocamos en la IA* hace dos años, nuestro enfoque en el desarrollo de la IA está arraigado en nuestra misión fundacional de organizar la información del mundo y hacerla universalmente accesible y útil. Esta misión impulsa nuestro compromiso de mejorar la vida de tantas personas como sea posible, un objetivo que sigue siendo nuestra estrella polar.

En nuestra Revisión del Año 2024, celebramos los notables logros de los numerosos equipos talentosos en Google que han trabajado incansablemente para avanzar en nuestra misión. Sus esfuerzos han preparado el escenario para desarrollos aún más emocionantes en el año que viene.

Innovación implacable en modelos, productos y tecnologías

2024 fue todo sobre experimentación, implementación rápida y llevar nuestras últimas tecnologías a las manos de los desarrolladores. En diciembre, presentamos los primeros modelos de nuestra serie experimental Gemini 2.0, diseñados específicamente para la era agentiva. Comenzamos con Gemini 2.0 Flash, nuestro caballo de batalla versátil, seguido de prototipos de vanguardia de nuestra investigación agentiva. Estos incluyen un Proyecto Astra actualizado, que explora el potencial de un asistente de IA universal; Proyecto Mariner, un prototipo temprano capaz de realizar acciones en Chrome como una extensión experimental; y Jules, un agente de código impulsado por IA. Estamos ansiosos por integrar las capacidades de Gemini 2.0 en nuestros productos insignia, y ya hemos comenzado a probar en AI Overviews dentro de Search, utilizado por más de mil millones de personas para explorar nuevos tipos de preguntas.

También lanzamos Deep Research, una nueva función agentiva en Gemini Advanced que ahorra horas de investigación al crear y ejecutar planes de múltiples pasos para responder preguntas complejas. Además, introdujimos Gemini 2.0 Flash Thinking Experimental, un modelo que muestra de manera transparente su proceso de pensamiento.

A principios de año, logramos avances significativos al integrar las capacidades de Gemini en más productos de Google y lanzar Gemini 1.5 Pro y Gemini 1.5 Flash. Este último, optimizado para velocidad y eficiencia, se convirtió en nuestro modelo más popular entre los desarrolladores gracias a su tamaño compacto y rentabilidad.

También mejoramos AI Studio, haciéndolo disponible como una aplicación web progresiva (PWA) instalable en escritorio, iOS y Android, proporcionando a los desarrolladores un conjunto robusto de recursos. La respuesta del público a las nuevas funciones en NotebookLM, como Audio Overviews, ha sido fantástica. Estas funciones pueden generar discusiones profundas a partir de material fuente subido, haciendo que el aprendizaje sea más atractivo.

La entrada y salida de voz continúan siendo refinadas en productos como Gemini Live, Proyecto Astra, Journey Voices y el doblaje automático de YouTube, mejorando la interacción del usuario.

En línea con nuestra tradición de contribuir a la comunidad abierta, lanzamos dos nuevos modelos de Gemma, nuestro modelo abierto de última generación, construido con la misma investigación y tecnología que Gemini. Gemma superó a modelos de tamaño similar en áreas como respuesta a preguntas, razonamiento y codificación. También lanzamos Gemma Scope, una herramienta para ayudar a los investigadores a entender el funcionamiento interno de Gemma 2.

Hicimos avances en mejorar la factualidad de nuestros modelos y reducir alucinaciones. En diciembre, publicamos FACTS Grounding, un punto de referencia desarrollado en colaboración con Google DeepMind, Google Research y Kaggle, para evaluar qué tan bien los modelos de lenguaje grandes fundamentan sus respuestas en el material fuente proporcionado y evitan alucinaciones.

El conjunto de datos FACTS Grounding, con 1,719 ejemplos, está diseñado para probar respuestas de forma larga fundamentadas en documentos de contexto. Probamos los principales LLMs usando FACTS Grounding, y estamos orgullosos de informar que Gemini 2.0 Flash Experimental, Gemini 1.5 Flash y Gemini 1.5 Pro lograron las tres mejores puntuaciones de factualidad, con Gemini-2.0-flash-exp obteniendo un impresionante 83.6%.

También mejoramos la eficiencia de ML mediante técnicas innovadoras como decodificación paralela por bloques, aplazamiento basado en confianza y decodificación especulativa, que aceleran los tiempos de inferencia de LLMs. Estas mejoras benefician a los productos de Google y establecen estándares de la industria.

En deportes, lanzamos TacticAI, un sistema de IA para tácticas de fútbol que proporciona información táctica, particularmente en saques de esquina.

Nuestro compromiso con el liderazgo en investigación sigue siendo fuerte. Una encuesta de WIPO de 2010-2023 sobre citas de IA generativa mostró que Google, incluyendo Google Research y Google DeepMind, recibió más del doble de citas que la segunda institución más citada.

Este gráfico de WIPO, basado en datos de enero de 2024 de The Lens, destaca las contribuciones significativas de Alphabet a la investigación de IA generativa durante la última década. Finalmente, hicimos progresos con Proyecto Starline, nuestra tecnología de "ventana mágica", asociándonos con HP para comercializarla, con el objetivo de integrarla en servicios de videoconferencia como Google Meet y Zoom.

Empoderando la visión creativa con IA generativa

Creemos que la IA puede desbloquear nuevos reinos de creatividad, haciendo que la expresión creativa sea más accesible y ayudando a las personas a realizar sus visiones artísticas. En 2024, introdujimos una serie de actualizaciones a nuestras herramientas de medios generativos, cubriendo imágenes, música y video.

A principios de año, lanzamos ImageFX y MusicFX, herramientas de IA generativa que crean imágenes y clips de audio de hasta 70 segundos a partir de prompts de texto. En I/O, presentamos MusicFX DJ, diseñado para hacer que la creación de música en vivo sea más accesible. En octubre, trabajamos con Jacob Collier para simplificar MusicFX DJ para músicos nuevos y aspirantes. También actualizamos nuestro kit de herramientas de IA musical, Music AI Sandbox, y evolucionamos nuestro experimento Dream Track, permitiendo a creadores de EE. UU. generar bandas sonoras instrumentales en varios géneros usando modelos de texto a música.

Más adelante en el año, lanzamos Veo 2 e Imagen 3, nuestros últimos modelos de imagen y video. Imagen 3, nuestro modelo de texto a imagen de mayor calidad, genera imágenes con detalles superiores, iluminación y menos artefactos. Veo 2 demostró una mejor comprensión de la física del mundo real y el movimiento humano, mejorando el realismo. Veo 2 marca un avance significativo en la generación de videos de alta calidad.

Continuamos explorando el potencial de la IA en la edición, usándola para controlar atributos como la transparencia y la rugosidad de los objetos.

Estos ejemplos muestran la capacidad de la IA para editar propiedades de materiales usando generación de datos sintéticos.

En la generación de audio, mejoramos la tecnología de video a audio (V2A), generando paisajes sonoros dinámicos a partir de prompts de texto basados en la acción en pantalla, que se pueden combinar con video generado por IA desde Veo.

Los juegos ofrecen un campo de juego perfecto para la exploración creativa y el entrenamiento de agentes encarnados. En 2024, introdujimos Genie 2, un modelo mundial de fundación que genera entornos 3D diversos y jugables para entrenar y evaluar agentes encarnados. Esto siguió al lanzamiento de SIMA, que puede seguir instrucciones en lenguaje natural en varios entornos de videojuegos.

La arquitectura de la inteligencia: avances en robótica, hardware y computación

A medida que nuestros modelos multimodales se vuelven más adeptos a entender la física del mundo, están permitiendo avances emocionantes en robótica. Estamos más cerca de nuestro objetivo de robots más capaces y útiles.

Con ALOHA Unleashed, nuestro robot dominó tareas como atar cordones, colgar camisas, reparar otros robots, insertar engranajes y limpiar cocinas.

A principios de año, introdujimos AutoRT, SARA-RT y RT-Trajectory, extensiones de nuestro trabajo en Transformers de Robótica para ayudar a los robots a navegar mejor sus entornos y tomar decisiones más rápidas. También lanzamos ALOHA Unleashed, enseñando a los robots a coordinar dos brazos, y DemoStart, que utiliza aprendizaje por refuerzo para mejorar el rendimiento en el mundo real en una mano robótica multifingida usando simulaciones.

Robotic Transformer 2 (RT-2) aprende de datos web y robóticos, permitiéndole realizar tareas como colocar una fresa en un tazón. Más allá de la robótica, nuestro método de aprendizaje por refuerzo AlphaChip está revolucionando la planificación de pisos de chips para centros de datos y teléfonos inteligentes. Lanzamos un punto de control preentrenado para facilitar la adopción externa de la versión de código abierto de AlphaChip. También hicimos que Trillium, nuestro TPU de sexta generación, estuviera disponible para los clientes de Google Cloud, mostrando cómo la IA puede mejorar el diseño de chips. AlphaChip aprende a optimizar diseños de chips, mejorando con cada diseño que crea.

Nuestra investigación también abordó la corrección de errores en computadoras cuánticas. En noviembre, lanzamos AlphaQubit, un decodificador basado en IA que identifica errores de computación cuántica con alta precisión. Esta colaboración entre Google DeepMind y Google Research aceleró el progreso hacia computadoras cuánticas confiables. En pruebas, AlphaQubit redujo los errores en un 6% en comparación con los métodos de red de tensores y en un 30% en comparación con la correspondencia correlacionada.

En diciembre, el equipo de Google Quantum AI presentó Willow, nuestro último chip cuántico. Willow puede realizar un cálculo de referencia en menos de cinco minutos que le tomaría a los supercomputadores más rápidos de hoy 10 septillones de años. Usando corrección de errores cuánticos, Willow redujo a la mitad la tasa de errores, logrando un hito conocido como "por debajo del umbral" y ganando el Premio al Avance en Física del Año.

Willow muestra un rendimiento de última generación en computación cuántica.

Descubriendo nuevas soluciones: progreso en ciencia, biología y matemáticas

Continuamos acelerando el progreso científico con IA, lanzando herramientas y artículos que demuestran el poder de la IA para avanzar en la ciencia y las matemáticas. Aquí algunos puntos destacados:

En enero, introdujimos AlphaGeometry, un sistema de IA para resolver problemas geométricos complejos. Nuestra AlphaGeometry 2 actualizada y AlphaProof, un sistema basado en aprendizaje por refuerzo para razonamiento matemático formal, lograron un rendimiento de medallista de plata en la Olimpiada Internacional de Matemáticas de julio de 2024.

AlphaGeometry 2 resolvió el Problema 4 de la Olimpiada Internacional de Matemáticas de julio de 2024 en solo 19 segundos, demostrando que ∠KIL + ∠XPY es igual a 180°. En colaboración con Isomorphic Labs, introdujimos AlphaFold 3, que predice la estructura y las interacciones de las moléculas de la vida, con el objetivo de transformar nuestra comprensión de la biología y el descubrimiento de fármacos.La arquitectura avanzada y el entrenamiento de AlphaFold 3 cubren todas las moléculas de la vida, desde proteínas hasta ADN. También logramos avances significativos en el diseño de proteínas con AlphaProteo, un sistema de IA para crear enlazadores de proteínas de alta resistencia, que podrían conducir a nuevos fármacos y biosensores.AlphaProteo puede diseñar nuevos enlazadores de proteínas para varios objetivos proteicos.

En colaboración con el Lichtman Lab de Harvard, producimos un mapeo a nanoescala de una pieza del cerebro humano, el primero de su tipo, y lo hicimos disponible para los investigadores. Esto sigue a nuestro esfuerzo de una década en conectómica, ahora extendiéndose al mapeo del cerebro humano.

Este proyecto de mapeo cerebral revela grupos de células en imagen especular en la capa más profunda de la corteza.

A finales de noviembre, coorganizamos el Foro de IA para la Ciencia con la Royal Society, discutiendo temas clave como la predicción de estructuras de proteínas, el mapeo del cerebro humano y el uso de IA para la predicción y detección de incendios forestales. También organizamos una sesión de preguntas y respuestas con cuatro laureados con el Nobel en el foro, disponible en el podcast de Google DeepMind.

2024 también fue un año histórico, ya que Demis Hassabis, John Jumper y David Baker recibieron el Premio Nobel de Química por su trabajo en AlphaFold 2, reconocido por revolucionar el diseño de proteínas. Geoffrey Hinton, junto con John Hopfield, recibió el Premio Nobel de Física por su trabajo fundacional en aprendizaje automático con redes neuronales artificiales.

Google también recibió reconocimientos adicionales, incluyendo los Premios al Artículo de Prueba del Tiempo de NeurIPS 2024 y el Premio Beale—Orchard-Hays por Programación Lineal Primal-Dual (PDLP), ahora parte de Google OR Tools, ayudando en la programación lineal a gran escala con aplicaciones en el mundo real.

IA para el beneficio de la humanidad

Este año, logramos avances significativos en productos e investigaciones publicadas que demuestran cómo la IA puede beneficiar directamente e inmediatamente a las personas en áreas como la salud, la preparación para desastres y la educación.

En salud, la IA promete democratizar la atención de calidad, particularmente en la detección temprana de enfermedades cardiovasculares. Nuestra investigación mostró que un dispositivo simple de punta de dedo, combinado con metadatos básicos, puede predecir riesgos para la salud del corazón. También avanzamos en diagnósticos habilitados por IA para la tuberculosis, mostrando cómo la IA puede evaluar poblaciones con altas tasas de TB y VIH de manera efectiva.

Med-Gemini logró una nueva puntuación de vanguardia en el punto de referencia MedQA, superando nuestro mejor resultado anterior, Med-PaLM 2, por un 4.6%. Nuestro modelo Gemini es una herramienta versátil para profesionales, y estamos desarrollando modelos afinados para dominios específicos. Med-Gemini, por ejemplo, combina entrenamiento en datos médicos desidentificados con las capacidades de Gemini, logrando un 91.1% de precisión en el punto de referencia de preguntas estilo USMLE de MedQA.

También estamos explorando cómo el aprendizaje automático puede abordar la escasez de experiencia en imágenes en campos como radiología, dermatología y patología. Lanzamos Derm Foundation y Path Foundation para tareas de diagnóstico y descubrimiento de biomarcadores, colaboramos con Stanford Medicine en el conjunto de datos Skin Condition Image Network (SCIN) y presentamos CT Foundation para la investigación en imágenes médicas.

En educación, introdujimos LearnLM, una familia de modelos afinados para el aprendizaje, mejorando experiencias en Search, YouTube y Gemini. LearnLM superó a otros modelos de IA líderes, y lo hicimos disponible para desarrolladores en AI Studio. Nuestro compañero de aprendizaje conversacional, LearnAbout, y la herramienta de discusión de audio, Illuminate, enriquecen aún más las experiencias de aprendizaje.

En la predicción y preparación para desastres, introdujimos GenCast, mejorando la predicción del clima y eventos extremos, y NeuralGCM, capaz de simular miles de días de condiciones atmosféricas. GraphCast, que ganó el Premio MacRobert 2024, proporciona predicciones meteorológicas detalladas.

Las predicciones de GraphCast durante 10 días muestran humedad específica, temperatura de superficie y velocidad del viento.

Mejoramos nuestro modelo de predicción de inundaciones para predecir inundaciones con siete días de antelación, ampliando la cobertura a 100 países y 700 millones de personas.

Nuestro modelo de predicción de inundaciones ahora cubre más de 100 países, con medidores virtuales en 150 países donde no hay medidores físicos disponibles. La IA también ayuda en la detección y mitigación de incendios forestales. Nuestros Mapas de Límites de Incendios Forestales ahora están disponibles en 22 países, y creamos FireSat, una constelación de satélites que puede detectar pequeños incendios forestales en 20 minutos.

Ampliamos Google Translate para incluir 110 nuevos idiomas, ayudando a derribar barreras a la información y la oportunidad para más de 614 millones de hablantes.

Estos nuevos idiomas en Google Translate representan el 8% de la población mundial.

Ayudando a establecer el estándar en IA responsable

Continuamos con nuestra investigación líder en la industria en seguridad de IA, desarrollando nuevas herramientas y técnicas e integrándolas en nuestros últimos modelos. Estamos comprometidos a colaborar para abordar los riesgos.

Nuestra investigación sobre el mal uso encontró que los deep fakes y los jailbreaks son los problemas más comunes. En mayo, introdujimos The Frontier Safety Framework para identificar capacidades emergentes en nuestros modelos de IA avanzados y lanzamos nuestro marco de Ciclo de Vida de Responsabilidad de IA. En octubre, ampliamos nuestro Kit de Herramientas de GenAI Responsable para trabajar con cualquier LLM, ayudando a los desarrolladores a construir IA de manera responsable.

Lanzamos un artículo sobre La Ética de los Asistentes de IA Avanzados, examinando el paisaje técnico y moral de los asistentes de IA y las oportunidades y riesgos que presentan.

Ampliamos las capacidades de SynthID para marcar con agua el texto generado por IA en la aplicación y experiencia web de Gemini y video en Veo. Para mejorar la transparencia en línea, nos unimos a la Coalición para la Procedencia y Autenticidad del Contenido (C2PA) y trabajamos en una nueva versión más segura del estándar de Credenciales de Contenido.

SynthID ajusta las puntuaciones de probabilidad de los tokens predichos para garantizar calidad, precisión y creatividad en el contenido generado por IA.

Más allá de los LLMs, compartimos nuestro enfoque de bioseguridad para AlphaFold 3, trabajamos con socios de la industria para lanzar la Coalición para una IA Segura (CoSAI) y participamos en la Cumbre de IA de Seúl para contribuir a la gobernanza internacional de la IA.

A medida que desarrollamos nuevas tecnologías como agentes de IA, continuaremos explorando preguntas de seguridad, protección y privacidad. Guiados por nuestros Principios de IA, estamos adoptando un enfoque deliberado y gradual, realizando investigaciones extensas, entrenamientos de seguridad y evaluaciones de riesgos con probadores confiables y expertos externos.

Mirando hacia 2025

2024 fue un año de progreso y emoción increíbles en IA. Estamos aún más emocionados por lo que viene en 2025.

A medida que continuamos empujando los límites de la investigación de IA en productos, ciencia, salud y creatividad, debemos considerar cuidadosamente cómo y cuándo desplegar estas tecnologías. Al priorizar prácticas de IA responsables y fomentar la colaboración, continuaremos desempeñando un papel crucial en la construcción de un futuro donde la IA beneficie a la humanidad.

Artículo relacionado
Salesforce Presenta Compañeros Digitales de IA en Slack para Competir con Microsoft Copilot Salesforce Presenta Compañeros Digitales de IA en Slack para Competir con Microsoft Copilot Salesforce lanzó una nueva estrategia de IA para el lugar de trabajo, presentando “compañeros digitales” especializados integrados en las conversaciones de Slack, según reveló la compañía el lunes.La
Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Oracle planea invertir aproximadamente $40 mil millones en chips Nvidia para alimentar un importante centro de datos nuevo en Texas, desarrollado por OpenAI, según informó el Financial Times. Este acu
Aplicación de Meta AI para Introducir un Nivel Premium y Anuncios Aplicación de Meta AI para Introducir un Nivel Premium y Anuncios La aplicación de IA de Meta pronto podría incluir una suscripción de pago, siguiendo el modelo de competidores como OpenAI, Google y Microsoft. Durante una llamada de resultados del primer trimestre d
comentario (25)
0/200
FrankSmith
FrankSmith 23 de abril de 2025 03:42:56 GMT+02:00

¡2024 fue un año increíble para la IA! Desde Gemini 2.0 hasta la computación cuántica, es impresionante. Parece que estamos viviendo en una película de ciencia ficción. ¡No puedo esperar a ver qué nos trae 2025! 🚀

RalphGarcia
RalphGarcia 19 de abril de 2025 19:10:39 GMT+02:00

2024年のAIの進歩は本当に驚きでしたね!ジェミニ2.0から量子コンピューティングまで、まるでSF映画みたいです。2025年が楽しみです。🚀

CarlLewis
CarlLewis 18 de abril de 2025 13:58:13 GMT+02:00

2024 was insane with AI! From Gemini 2.0 to quantum computing, it felt like living in a sci-fi movie. The creativity boost was real, but sometimes I felt overwhelmed by the rapid changes. Still, it's exciting to see where AI will take us next! 🚀

RogerRoberts
RogerRoberts 15 de abril de 2025 00:22:16 GMT+02:00

¡2024 fue una locura con la IA! Desde Gemini 2.0 hasta la computación cuántica, parecía estar viviendo en una película de ciencia ficción. El impulso de creatividad fue real, pero a veces me sentí abrumado por los cambios rápidos. Aún así, ¡es emocionante ver a dónde nos llevará la IA a continuación! 🚀

RobertMartin
RobertMartin 13 de abril de 2025 12:55:17 GMT+02:00

2024年のAIの進歩は本当に驚きだった!ジェミニ2.0から量子コンピューティングまで、まるでSF映画にいるようだった。創造性の向上は確かにあったけど、急速な変化に圧倒されることもあった。それでも、AIが次にどこへ導いてくれるのか楽しみだよ!🚀

JimmyGarcia
JimmyGarcia 13 de abril de 2025 08:54:46 GMT+02:00

2024 foi louco com IA! Do Gemini 2.0 ao computador quântico, parecia estar vivendo em um filme de ficção científica. O aumento da criatividade foi real, mas às vezes me senti sobrecarregado com as mudanças rápidas. Ainda assim, é emocionante ver para onde a IA nos levará em seguida! 🚀

Volver arriba
OR