选项
首页
新闻
共同揭示了最高评级的AYA Vision AI模型

共同揭示了最高评级的AYA Vision AI模型

2025-04-10
113

Cohere的非营利研究实验室刚刚发布了一款新的多模态AI模型,名为Aya Vision,他们称其为同类最佳。这款模型非常出色——它可以生成图像描述,回答关于图片的问题,翻译文本,甚至能用23种主要语言进行内容总结。此外,Cohere在WhatsApp上免费提供Aya Vision,称这是让这些技术突破进入全球研究者手中的重要举措。

在他们的博客文章中,Cohere指出,尽管AI取得了进展,但在处理不同语言方面,模型的表现仍然存在巨大差距,尤其是在同时处理文本和图像时。Aya Vision的出现旨在弥补这一差距。

Aya Vision有两种版本:更强大的Aya Vision 32B和更轻量级的Aya Vision 8B。据Cohere称,32B版本开创了“新前沿”,在一些视觉理解测试中超越了比它大两倍的模型,如Meta的Llama-3.2 90B Vision。而8B版本也能与比它大10倍的模型一较高下。

你可以在Hugging Face上以Creative Commons 4.0许可证获取这两种模型,但有一个限制——它们不可用于商业用途。

Cohere使用英语数据集的混合进行Aya Vision的训练,将其翻译并转化为合成注释。这些注释或标签帮助模型在训练过程中理解数据。例如,如果你在训练一个图像识别模型,你可能会使用注释来标记对象或为图片添加描述。

Cohere Aya Vision

Cohere的Aya Vision模型可以执行一系列视觉理解任务。图片来源:Cohere
使用合成注释现在非常流行,尽管它也有其缺点。像OpenAI这样的大公司也在追随合成数据潮流,因为现实世界的数据越来越难获取。Gartner估计,去年用于AI和分析项目的数据中有60%是合成的。

Cohere表示,使用合成注释训练Aya Vision使他们能够以更少的资源获得顶尖结果。他们说,这一切都关乎效率和以更少资源做更多事情,这对那些不总能访问大型计算资源的研究者来说是个好消息。

与Aya Vision一起,Cohere发布了一个新的基准测试套件,名为AyaVisionBench。它旨在测试模型在诸如发现图像差异和将屏幕截图转化为代码等任务中的能力。

AI领域一直在挣扎于一些人所说的“评估危机”。常规基准测试给出的总体分数并不能真正反映模型在用户最关心的任务上的表现。Cohere认为AyaVisionBench可以帮助解决这一问题,提供一种严格且广泛的方法来检查模型的跨语言和多模态能力。

希望他们是对的。Cohere的研究人员表示,这个数据集是测试多语言和现实场景中视觉-语言模型的坚实基准。他们已将其提供给研究社区,以帮助推动多语言多模态评估的进展。

相关文章
拥抱面孔为OpenAI研究工具提供开放式替代方案 拥抱面孔为OpenAI研究工具提供开放式替代方案 包括联合创始人和首席科学家托马斯·沃尔夫(Thomas Wolf)在内的拥抱面孔的开发人员团队创建了他们所谓的OpenAI深入研究工具的“开放”版本。 Openai在最近的一项活动中介绍了深入的研究,据透露该工具搜寻网络以生成研究报告
选择最佳AI编码工具为您的项目 选择最佳AI编码工具为您的项目 软件开发领域正在迅速变革,人工智能(AI)成为关键驱动力。AI编码工具帮助开发者更快、更准确、更高效地编写代码。然而,面对众多选择,挑选合适的AI编码助手可能令人不知所措。本指南概述了关键因素,帮助您为项目选择理想的AI工具。关键要点探索AI编码工具的主要类型:集成IDE、代码编辑器和基于Web的平台。评估项目的具体需求和技术要求。检查每种AI工具提供的集成,如身份验证、数据库和支付系统。评估各种
AI驱动的播客工具简化内容创作 AI驱动的播客工具简化内容创作 制作和优化播客既具有挑战性又充满回报。许多播客主面临耗时任务的挑战,如去除填充词、撰写引人入胜的节目笔记以及有效推广内容。幸运的是,人工智能(AI)提供了尖端解决方案,简化了这些流程,使播客制作更加高效和易于操作。本文介绍了顶级AI播客编辑工具,它们可以革新您的工作流程,帮助您轻松创建专业内容。关键要点AI工具提升播客制作效率。通过AI自动去除“嗯”“啊”等填充词。使用AI技术创建转录文本和节目笔
评论 (42)
0/200
KennethMartin
KennethMartin 2025-08-10 13:00:59

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing
PaulKing 2025-07-31 19:35:39

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

JackMartinez
JackMartinez 2025-04-21 09:32:08

Aya Vision es increíblemente útil. Lo utilizo para mis proyectos de diseño y me encanta cómo genera descripciones de imágenes. Aunque a veces se equivoca con los detalles, en general es muy preciso. ¡Lo recomiendo totalmente! 🌟

WilliamYoung
WilliamYoung 2025-04-20 08:58:05

Aya Vision ist echt cool, aber es hat manchmal Schwierigkeiten mit der Übersetzung. Trotzdem ist es eine tolle Hilfe für meine Arbeit. Es könnte etwas schneller sein, aber insgesamt bin ich zufrieden. 👍

StevenGonzalez
StevenGonzalez 2025-04-20 02:53:55

아야 비전은 멋지지만 완벽하지는 않아요. 이미지 캡션은 정확하지만 번역이 때때로 틀릴 때가 있어요. 그래도 빠른 요약을 위한 좋은 도구예요! 👍

FredBrown
FredBrown 2025-04-18 09:22:30

J'adore Aya Vision, c'est super pratique pour résumer des textes en plusieurs langues. Par contre, il a du mal avec les images complexes. Mais pour le reste, c'est top ! Essayez-le, vous ne serez pas déçus. 😊

返回顶部
OR