Apple presenta RubiCap AI para la descripción de imágenes en medio de las preocupaciones sobre su rendimiento

Hogar

Noticias

23 de mayo de 2026

AlbertSanchez

En el campo de la visión artificial, lograr que la IA observe y describa cada detalle de una imagen con una precisión similar a la humana ha sido durante mucho tiempo un reto fundamental. Recientemente, Apple, en colaboración con la Universidad de Wisconsin-Madison, ha presentado oficialmente un novedoso marco de entrenamiento de IA denominado RubiCap.

Este marco está diseñado específicamente para la «descripción densa de imágenes», con el objetivo de capacitar a la IA para captar y expresar con precisión detalles muy específicos —como «una manzana roja sobre la mesa de madera» o «un peatón en la distancia»— en lugar de ofrecer solo resúmenes genéricos.

Aprendizaje por refuerzo con gran impacto: Qwen2.5 actúa como «árbitro»

La generación de subtítulos de imágenes tradicional suele depender de costosas anotaciones humanas o de grandes modelos propensos a la alucinación, lo que da lugar a una calidad de datos inconsistente. El equipo de investigación de Apple abordó este problema con un innovador enfoque de aprendizaje por refuerzo. El sistema utiliza primero GPT-4 y Gemini 1.5 Pro para generar descripciones candidatas. A continuación, Gemini 1.5 Pro refina los criterios de puntuación, mientras que el modelo Qwen2.5 actúa como árbitro, proporcionando puntuaciones y comentarios.

Esta retroalimentación estructurada y precisa permite al modelo de entrenamiento identificar y corregir claramente los errores, logrando una mayor precisión descriptiva incluso con un menor número de parámetros.

La ventaja del modelo compacto: las tasas de alucinación más bajas superan a los modelos de un billón de parámetros

Los modelos de la serie RubiCap (que van de 2 000 a 7 000 millones de parámetros) entrenados en este marco demostraron una eficiencia excepcional en las evaluaciones. Los datos experimentales revelan que el modelo RubiCap de 7000 millones de parámetros obtuvo las mejores puntuaciones en pruebas a ciegas, con una tasa de error de alucinaciones inferior a la de un modelo grande líder de 720 000 millones de parámetros. Sorprendentemente, la versión mini de 3000 millones de parámetros superó incluso a su homólogo de 7000 millones de parámetros en ciertas métricas.

Artículo relacionado

Zhiyuan WITA pone fin a la interacción «desnuda» con robots con la presentación de su primera declaración de cumplimiento El sector de la inteligencia incorporada ha alcanzado un hito significativo. Según el último comunicado de la Administración del Ciberespacio de Shanghái, el modelo a gran escala WITA, desarrollado po

Un estudio antropológico relaciona el contenido generado por IA con una disminución del pensamiento humano Cuando ves que la IA genera al instante un código o un documento bien estructurado y lógicamente claro, ¿te sientes tentado a confiar en él sin pensarlo dos veces? Según AIbase, la empresa líder en IA

Los ministerios del Gobierno británico discrepan sobre las necesidades energéticas de los centros de datos de IA El Gobierno del Reino Unido se enfrenta a un gran reto: impulsar las energías limpias al tiempo que aspira a convertirse en líder mundial en inteligencia artificial. Sin embargo, se observan graves di

Recomendaciones de temas especiales relacionados

Creación de cómics

Las mejores herramientas de coloración automática con IA para manga: aplica colores planos sin ningún error de coherencia

Descubre las mejores herramientas de coloración automática con IA para manga de 2026 en XIX.AI. Nuestra lista seleccionada incluye soluciones revolucionarias y mejor valoradas que aplican colores planos sin ningún error de consistencia, lo que potencia tu productividad. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones actualizadas semanalmente para encontrar la opción perfecta para ti. Aprovecha hoy mismo las ventajas de la IA.

10 herramientas

xix.ai

escribiendo

Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes

Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.

10 herramientas

xix.ai

Negocio

El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda

Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.

10 herramientas

xix.ai

código

Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados

Descubre los mejores revisores de código con IA de 2026 en XIX.AI. Nuestra lista seleccionada incluye herramientas de primera categoría y revolucionarias para automatizar el cumplimiento de las normas de código limpio y refactorizar archivos de repositorios heredados. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo tu ventaja con la IA.

10 herramientas

xix.ai

Texto a voz

Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes

Descubre las mejores aplicaciones de TTS con IA de 2026, seleccionadas específicamente para ayudar a las personas con dislexia. Nuestra clasificación, elaborada por expertos, compara herramientas gratuitas y de pago, y destaca sus potentes funciones para mejorar la eficiencia en la lectura y el aprendizaje. Explora soluciones innovadoras e imprescindibles para liberar el potencial de los estudiantes. Empieza tu viaje en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía

Descubre los mejores generadores de IA para manga shonen de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas para crear secuencias de acción trepidantes y efectos energéticos dinámicos. Compara las opciones gratuitas con las de pago mediante pruebas reales. ¡Libera tu potencial creativo y empieza a crear manga épico hoy mismo!

15 herramientas

xix.ai