Cohere presenta el modelo AIA AI mejor calificado

Hogar

Noticias

10 de abril de 2025

DanielAllen

201

# Open AI # Cohere

El laboratorio de investigación sin fines de lucro de Cohere acaba de lanzar un nuevo modelo de IA multimodal llamado Aya Vision, y lo califican como el mejor en su clase. Este modelo es bastante impresionante: puede generar subtítulos para imágenes, responder preguntas sobre fotos, traducir texto e incluso resumir contenido en 23 idiomas principales. Además, Cohere está poniendo Aya Vision a disposición de forma gratuita en WhatsApp, diciendo que es un gran paso para llevar estos avances tecnológicos a las manos de investigadores de todo el mundo.

En su publicación de blog, Cohere señaló que, aunque la IA ha estado avanzando, todavía existe una gran brecha en cómo los modelos manejan diferentes idiomas, especialmente cuando se combinan texto e imágenes. Ahí es donde entra Aya Vision, con el objetivo de cerrar esa brecha.

Aya Vision viene en dos versiones: la más robusta Aya Vision 32B y la más ligera Aya Vision 8B. La versión 32B, según Cohere, está estableciendo una "nueva frontera", superando a modelos el doble de grandes, como Llama-3.2 90B Vision de Meta, en algunas pruebas de comprensión visual. ¿Y la versión 8B? Se mantiene firme frente a modelos que son 10 veces más grandes.

Puedes obtener ambos modelos desde Hugging Face bajo una licencia Creative Commons 4.0, pero hay una condición: no son para uso comercial.

Cohere entrenó a Aya Vision usando una mezcla de conjuntos de datos en inglés, que tradujeron y convirtieron en anotaciones sintéticas. Estas anotaciones, o etiquetas, ayudan al modelo a entender los datos durante el entrenamiento. Por ejemplo, si estás entrenando un modelo de reconocimiento de imágenes, podrías usar anotaciones para marcar objetos o añadir subtítulos sobre lo que hay en la imagen.

Cohere Aya Vision

El modelo Aya Vision de Cohere puede realizar una variedad de tareas de comprensión visual. Créditos de la imagen: Cohere

El uso de anotaciones sintéticas está muy de moda ahora, aunque tiene sus inconvenientes. Grandes actores como OpenAI también están subiendo al carro de los datos sintéticos, ya que los datos del mundo real son cada vez más difíciles de conseguir. Gartner estima que el año pasado, el 60% de los datos utilizados para proyectos de IA y análisis fueron sintéticos.

Cohere dice que entrenar a Aya Vision con anotaciones sintéticas les permitió usar menos recursos mientras obtenían resultados de primera calidad. Todo se trata de eficiencia y hacer más con menos, dicen, lo cual es una gran noticia para los investigadores que no siempre tienen acceso a grandes recursos computacionales.

Junto con Aya Vision, Cohere lanzó un nuevo conjunto de pruebas llamado AyaVisionBench. Está diseñado para evaluar las habilidades de un modelo en tareas como detectar diferencias entre imágenes y convertir capturas de pantalla en código.

El mundo de la IA ha estado lidiando con lo que algunos llaman una "crisis de evaluación". Los puntos de referencia habituales te dan una puntuación general que no refleja realmente qué tan bien un modelo realiza las tareas que más importan a los usuarios. Cohere piensa que AyaVisionBench puede ayudar a solucionar eso, ofreciendo una forma rigurosa y amplia de evaluar las capacidades multilingües y multimodales de un modelo.

Esperemos que tengan razón. Los investigadores de Cohere dicen que el conjunto de datos es un punto de referencia sólido para probar modelos de visión-lenguaje en escenarios multilingües y del mundo real. Lo han puesto a disposición de la comunidad de investigación para ayudar a avanzar en las evaluaciones multimodales y multilingües.

Artículo relacionado

Cohere presenta una familia de modelos de IA multilingües de código abierto La empresa de IA empresarial Cohere ha presentado una nueva familia de modelos multilingües, denominada Tiny Aya, durante la Cumbre de IA de la India que se está celebrando estos días. Estos modelos d

Cohere y Aleph Alpha anuncian su fusión La startup canadiense de IA Cohere va a adquirir la alemana Aleph Alpha con el respaldo del Grupo Schwarz, la empresa matriz de la cadena de supermercados Lidl. Con el apoyo del Gobierno, las empresas

Cohere lanza una plataforma segura de inteligencia artificial para empresas North Las herramientas de agentes de IA tienen el potencial de reducir las tareas repetitivas en los flujos de trabajo diarios, pero muchas organizaciones siguen mostrándose cautelosas a la hora de adoptarl

Recomendaciones de temas especiales relacionados

escribiendo

Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes

Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.

10 herramientas

xix.ai

Negocio

El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda

Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.

10 herramientas

xix.ai

código

Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados

Descubre los mejores revisores de código con IA de 2026 en XIX.AI. Nuestra lista seleccionada incluye herramientas de primera categoría y revolucionarias para automatizar el cumplimiento de las normas de código limpio y refactorizar archivos de repositorios heredados. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo tu ventaja con la IA.

10 herramientas

xix.ai

Texto a voz

Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes

Descubre las mejores aplicaciones de TTS con IA de 2026, seleccionadas específicamente para ayudar a las personas con dislexia. Nuestra clasificación, elaborada por expertos, compara herramientas gratuitas y de pago, y destaca sus potentes funciones para mejorar la eficiencia en la lectura y el aprendizaje. Explora soluciones innovadoras e imprescindibles para liberar el potencial de los estudiantes. Empieza tu viaje en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Los mejores generadores de IA para manga shonen: crea secuencias de acción trepidantes y efectos de energía

Descubre los mejores generadores de IA para manga shonen de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas para crear secuencias de acción trepidantes y efectos energéticos dinámicos. Compara las opciones gratuitas con las de pago mediante pruebas reales. ¡Libera tu potencial creativo y empieza a crear manga épico hoy mismo!

15 herramientas

xix.ai

Negocio

Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa

Los mejores gestores de gastos con IA de 2026: las herramientas mejor valoradas para escanear recibos y clasificar automáticamente los gastos de la empresa. Descubre soluciones potentes y revolucionarias para una gestión de gastos sin esfuerzo, un seguimiento financiero preciso y un cumplimiento normativo optimizado. Nuestra comparativa, seleccionada y actualizada semanalmente, entre opciones gratuitas y de pago te ayuda a encontrar la que mejor se adapta a tus necesidades. Aprovecha al máximo las ventajas de la IA con las recomendaciones de los expertos de XIX.AI.

10 herramientas

xix.ai

comentario (46)

0/500

Inicie sesión primero

EricJohnson

5 de mayo de 2026 02:00:24 GMT+02:00

このモデルは23言語に対応しているって、すごいね！でも、実際に使ってみないと本当の性能はわからないかも。Cohereは競合他社と比べてどうなんだろう？🤔

JasonAnderson

31 de enero de 2026 19:00:22 GMT+01:00

Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.

JoseAdams

2 de octubre de 2025 04:30:37 GMT+02:00

Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.

MarkRoberts

4 de septiembre de 2025 06:30:34 GMT+02:00

¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎

KennethMartin

10 de agosto de 2025 07:00:59 GMT+02:00

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing

31 de julio de 2025 13:35:39 GMT+02:00

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como un revolucionario sistema de IA multimodal Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado

Más

Presentado