Mejoras de IA y Accesibilidad para Android, Chrome
22 de mayo de 2025
JustinWilliams
0
Al celebrar el Día Mundial de la Conciencia sobre la Accesibilidad, estamos emocionados de anunciar actualizaciones significativas en nuestros productos para Android y Chrome, junto con nuevos recursos para desarrolladores que trabajan en herramientas de reconocimiento de voz. Estos avances en IA están haciendo nuestro mundo digital más accesible e inclusivo.
Más innovación impulsada por IA con Android
Estamos llevando nuestro compromiso con la accesibilidad más lejos al integrar la IA de Google y Gemini en la experiencia móvil, especialmente para la visión y la audición.
Mejorando los detalles con Gemini y TalkBack
El año pasado, integramos las capacidades de Gemini en TalkBack, el lector de pantalla de Android, que proporcionó descripciones generadas por IA para imágenes, incluso cuando faltaba el texto alternativo. Ahora, estamos expandiendo esta función. Los usuarios pueden hacer preguntas sobre las imágenes que reciben, como la nueva guitarra de un amigo. Puedes preguntar sobre la marca, el color u otros elementos dentro de la foto. Además, puedes obtener descripciones y hacer preguntas sobre toda tu pantalla. Por ejemplo, mientras buscas ofertas en una aplicación de compras, puedes preguntarle a Gemini sobre el material de un artículo o verificar si hay descuentos disponibles.

Entendiendo más de la emoción detrás de los subtítulos
Con los Subtítulos Expresivos, tu dispositivo Android ahora proporciona subtítulos en tiempo real en la mayoría de las aplicaciones, capturando no solo lo que se dice, sino también cómo se dice. Hemos añadido una nueva función de duración que resalta cuando las palabras se alargan, como escuchar un "disparo amaaaazing" en una transmisión deportiva o un "nooooo" prolongado en un mensaje de video. También obtendrás más etiquetas para sonidos, como silbidos o aclararse la garganta. Esta actualización está disponible en inglés para dispositivos que ejecutan Android 15 y superior en EE. UU., Reino Unido, Canadá y Australia.

Mejorando el reconocimiento de voz en todo el mundo
Desde el lanzamiento de Project Euphonia en 2019, nuestro objetivo ha sido hacer que el reconocimiento de voz sea más accesible para aquellos con patrones de habla no estándar. Ahora estamos expandiendo el soporte para desarrolladores y organizaciones en todo el mundo, ayudándolos a adaptar esta tecnología a más idiomas y contextos culturales.
Nuevos recursos para desarrolladores
Para fomentar un ecosistema global de herramientas accesibles, estamos ofreciendo a los desarrolladores acceso a nuestros repositorios de código abierto a través de la página de GitHub de Project Euphonia. Esto les permite desarrollar herramientas de audio personalizadas para investigación o entrenar sus modelos para reconocer patrones de habla diversos.
Apoyo a nuevos proyectos en África
A principios de este año, nos asociamos con Google.org para apoyar a University College London en el establecimiento del Centro para la Inclusión Digital del Lenguaje (CDLI). El CDLI se enfoca en mejorar la tecnología de reconocimiento de voz para hablantes no ingleses en África. Están creando conjuntos de datos de código abierto en 10 idiomas africanos, desarrollando nuevos modelos de reconocimiento de voz y apoyando a la comunidad más amplia de organizaciones y desarrolladores en este campo.
Expandiendo las opciones de accesibilidad para estudiantes
Las herramientas de accesibilidad juegan un papel crucial para los estudiantes con discapacidades, desde usar gestos faciales para navegar en Chromebooks con Face Control hasta personalizar su experiencia de lectura con el Modo de Lectura. Ahora, al usar Chromebooks con la aplicación de prueba Bluebook de College Board para los exámenes SAT y de Colocación Avanzada, los estudiantes tendrán acceso a todas las funciones de accesibilidad integradas de Google, incluyendo el lector de pantalla ChromeVox y la Dictación, junto con las propias herramientas de prueba digital de College Board.
Haciendo Chrome más accesible
Con más de 2 mil millones de usuarios diarios, estamos trabajando constantemente para mejorar la accesibilidad de Chrome. Funciones como Subtítulos en Vivo y descripciones de imágenes para usuarios de lectores de pantalla forman parte de este esfuerzo.
Accediendo a PDFs más fácilmente en Chrome
Anteriormente, los PDFs escaneados no eran accesibles para los lectores de pantalla en Chrome de escritorio. Ahora, con el Reconocimiento Óptico de Caracteres (OCR), Chrome puede reconocer estos PDFs, permitiéndote resaltar, copiar, buscar texto y usar tu lector de pantalla para leerlos.
Leyendo con facilidad con Zoom de Página
El Zoom de Página en Chrome para Android ahora te permite aumentar el tamaño del texto sin alterar el diseño de la página web o tu experiencia de navegación, similar a cómo funciona en Chrome de escritorio. Puedes establecer tus preferencias de zoom para que se apliquen a todas las páginas o a unas específicas.

Para usar esta función, simplemente toca el menú de tres puntos en la esquina superior derecha de Chrome y ajusta tus configuraciones de zoom.
Artículo relacionado
Adobe AI-Agenten verbessern Photoshop und Premiere Pro
Adobe bringt in der Kreativwelt mit der Einführung von KI-Agenten, die darauf ausgelegt sind, die Nutzung von Photoshop und Premiere Pro zu revolutionieren, neue Dynamik. In einem
Ex-OpenAI-CEO warnt vor Schmeichelei und Kriecherei von KI
Die beunruhigende Realität von übertrieben zustimmenden KI-SystemenStellen Sie sich einen KI-Assistenten vor, der allem zustimmt, was Sie sagen, egal wie abwegig oder schädlich Ihr
Microsoft stellt Recall und AI-verbesserte Suche für Copilot Plus PCs vor
Microsoft rollt heute endlich Recall für alle Copilot Plus PCs aus, nach langer Vorfreude und mehreren Verzögerungen. Diese Funktion, die Screenshots von fast allem, was Sie auf Ih
comentario (0)
0/200






Al celebrar el Día Mundial de la Conciencia sobre la Accesibilidad, estamos emocionados de anunciar actualizaciones significativas en nuestros productos para Android y Chrome, junto con nuevos recursos para desarrolladores que trabajan en herramientas de reconocimiento de voz. Estos avances en IA están haciendo nuestro mundo digital más accesible e inclusivo.
Más innovación impulsada por IA con Android
Estamos llevando nuestro compromiso con la accesibilidad más lejos al integrar la IA de Google y Gemini en la experiencia móvil, especialmente para la visión y la audición.
Mejorando los detalles con Gemini y TalkBack
El año pasado, integramos las capacidades de Gemini en TalkBack, el lector de pantalla de Android, que proporcionó descripciones generadas por IA para imágenes, incluso cuando faltaba el texto alternativo. Ahora, estamos expandiendo esta función. Los usuarios pueden hacer preguntas sobre las imágenes que reciben, como la nueva guitarra de un amigo. Puedes preguntar sobre la marca, el color u otros elementos dentro de la foto. Además, puedes obtener descripciones y hacer preguntas sobre toda tu pantalla. Por ejemplo, mientras buscas ofertas en una aplicación de compras, puedes preguntarle a Gemini sobre el material de un artículo o verificar si hay descuentos disponibles.
Entendiendo más de la emoción detrás de los subtítulos
Con los Subtítulos Expresivos, tu dispositivo Android ahora proporciona subtítulos en tiempo real en la mayoría de las aplicaciones, capturando no solo lo que se dice, sino también cómo se dice. Hemos añadido una nueva función de duración que resalta cuando las palabras se alargan, como escuchar un "disparo amaaaazing" en una transmisión deportiva o un "nooooo" prolongado en un mensaje de video. También obtendrás más etiquetas para sonidos, como silbidos o aclararse la garganta. Esta actualización está disponible en inglés para dispositivos que ejecutan Android 15 y superior en EE. UU., Reino Unido, Canadá y Australia.
Mejorando el reconocimiento de voz en todo el mundo
Desde el lanzamiento de Project Euphonia en 2019, nuestro objetivo ha sido hacer que el reconocimiento de voz sea más accesible para aquellos con patrones de habla no estándar. Ahora estamos expandiendo el soporte para desarrolladores y organizaciones en todo el mundo, ayudándolos a adaptar esta tecnología a más idiomas y contextos culturales.
Nuevos recursos para desarrolladores
Para fomentar un ecosistema global de herramientas accesibles, estamos ofreciendo a los desarrolladores acceso a nuestros repositorios de código abierto a través de la página de GitHub de Project Euphonia. Esto les permite desarrollar herramientas de audio personalizadas para investigación o entrenar sus modelos para reconocer patrones de habla diversos.
Apoyo a nuevos proyectos en África
A principios de este año, nos asociamos con Google.org para apoyar a University College London en el establecimiento del Centro para la Inclusión Digital del Lenguaje (CDLI). El CDLI se enfoca en mejorar la tecnología de reconocimiento de voz para hablantes no ingleses en África. Están creando conjuntos de datos de código abierto en 10 idiomas africanos, desarrollando nuevos modelos de reconocimiento de voz y apoyando a la comunidad más amplia de organizaciones y desarrolladores en este campo.
Expandiendo las opciones de accesibilidad para estudiantes
Las herramientas de accesibilidad juegan un papel crucial para los estudiantes con discapacidades, desde usar gestos faciales para navegar en Chromebooks con Face Control hasta personalizar su experiencia de lectura con el Modo de Lectura. Ahora, al usar Chromebooks con la aplicación de prueba Bluebook de College Board para los exámenes SAT y de Colocación Avanzada, los estudiantes tendrán acceso a todas las funciones de accesibilidad integradas de Google, incluyendo el lector de pantalla ChromeVox y la Dictación, junto con las propias herramientas de prueba digital de College Board.
Haciendo Chrome más accesible
Con más de 2 mil millones de usuarios diarios, estamos trabajando constantemente para mejorar la accesibilidad de Chrome. Funciones como Subtítulos en Vivo y descripciones de imágenes para usuarios de lectores de pantalla forman parte de este esfuerzo.
Accediendo a PDFs más fácilmente en Chrome
Anteriormente, los PDFs escaneados no eran accesibles para los lectores de pantalla en Chrome de escritorio. Ahora, con el Reconocimiento Óptico de Caracteres (OCR), Chrome puede reconocer estos PDFs, permitiéndote resaltar, copiar, buscar texto y usar tu lector de pantalla para leerlos.
Leyendo con facilidad con Zoom de Página
El Zoom de Página en Chrome para Android ahora te permite aumentar el tamaño del texto sin alterar el diseño de la página web o tu experiencia de navegación, similar a cómo funciona en Chrome de escritorio. Puedes establecer tus preferencias de zoom para que se apliquen a todas las páginas o a unas específicas.
Para usar esta función, simplemente toca el menú de tres puntos en la esquina superior derecha de Chrome y ajusta tus configuraciones de zoom.












