选项
首页
新闻
共同揭示了最高评级的AYA Vision AI模型

共同揭示了最高评级的AYA Vision AI模型

2025-04-10
201

Cohere的非营利研究实验室刚刚发布了一款新的多模态AI模型,名为Aya Vision,他们称其为同类最佳。这款模型非常出色——它可以生成图像描述,回答关于图片的问题,翻译文本,甚至能用23种主要语言进行内容总结。此外,Cohere在WhatsApp上免费提供Aya Vision,称这是让这些技术突破进入全球研究者手中的重要举措。

在他们的博客文章中,Cohere指出,尽管AI取得了进展,但在处理不同语言方面,模型的表现仍然存在巨大差距,尤其是在同时处理文本和图像时。Aya Vision的出现旨在弥补这一差距。

Aya Vision有两种版本:更强大的Aya Vision 32B和更轻量级的Aya Vision 8B。据Cohere称,32B版本开创了“新前沿”,在一些视觉理解测试中超越了比它大两倍的模型,如Meta的Llama-3.2 90B Vision。而8B版本也能与比它大10倍的模型一较高下。

你可以在Hugging Face上以Creative Commons 4.0许可证获取这两种模型,但有一个限制——它们不可用于商业用途。

Cohere使用英语数据集的混合进行Aya Vision的训练,将其翻译并转化为合成注释。这些注释或标签帮助模型在训练过程中理解数据。例如,如果你在训练一个图像识别模型,你可能会使用注释来标记对象或为图片添加描述。

Cohere Aya Vision

Cohere的Aya Vision模型可以执行一系列视觉理解任务。图片来源:Cohere
使用合成注释现在非常流行,尽管它也有其缺点。像OpenAI这样的大公司也在追随合成数据潮流,因为现实世界的数据越来越难获取。Gartner估计,去年用于AI和分析项目的数据中有60%是合成的。

Cohere表示,使用合成注释训练Aya Vision使他们能够以更少的资源获得顶尖结果。他们说,这一切都关乎效率和以更少资源做更多事情,这对那些不总能访问大型计算资源的研究者来说是个好消息。

与Aya Vision一起,Cohere发布了一个新的基准测试套件,名为AyaVisionBench。它旨在测试模型在诸如发现图像差异和将屏幕截图转化为代码等任务中的能力。

AI领域一直在挣扎于一些人所说的“评估危机”。常规基准测试给出的总体分数并不能真正反映模型在用户最关心的任务上的表现。Cohere认为AyaVisionBench可以帮助解决这一问题,提供一种严格且广泛的方法来检查模型的跨语言和多模态能力。

希望他们是对的。Cohere的研究人员表示,这个数据集是测试多语言和现实场景中视觉-语言模型的坚实基准。他们已将其提供给研究社区,以帮助推动多语言多模态评估的进展。

相关文章
Cohere 发布开源多语言 AI 模型系列 Cohere 发布开源多语言 AI 模型系列 企业级人工智能公司Cohere在正在举行的印度人工智能峰会上发布了一款名为Tiny Aya的新型多语言模型系列。这些开放权重模型——即其核心代码可供公众使用和修改——支持70多种语言,且无需联网即可在笔记本电脑等日常设备上运行。该模型由Cohere的研究部门Cohere Labs开发,支持孟加拉语、印地语、旁遮普语、乌尔都语、古吉拉特语、泰米尔语、泰卢固语和马拉地语等南亚语言。基础模型拥有33.5
Cohere 与 Aleph Alpha 宣布合并 Cohere 与 Aleph Alpha 宣布合并 加拿大人工智能初创公司Cohere正收购德国的Aleph Alpha,此次收购得到了超市连锁店Lidl母公司Schwarz集团的支持。在政府支持下,两家公司旨在为企业在当前由美国公司主导的人工智能领域提供一种“自主”的替代方案。作为大型语言模型的开发者,Aleph Alpha和Cohere虽在区域内处于领先地位,但仍落后于OpenAI等全球巨头。尽管两者有相似之处,但这并非对等合并。Cohere(
Cohere推出安全企业级人工智能平台North Cohere推出安全企业级人工智能平台North 人工智能代理工具有望减少日常工作流程中的重复性任务,但许多组织仍对采用持谨慎态度。首要担忧在于数据安全。拥有专有秘密的大型企业、受严格监管行业的公司以及政府机构对此存在重大顾虑。他们担心自身数据或客户数据可能在缺乏适当保障的情况下泄露,或被用于训练公共人工智能模型。加拿大人工智能公司Cohere通过其全新AI代理平台North正致力于解决这些担忧。该平台专为私有部署设计,使企业和政府机构能够将敏感
相关专题推荐
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
商业 顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格
顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格

在 XIX.AI 上探索 2026 年最佳 AI 定价优化软件。我们精心挑选的清单汇集了备受好评、具有颠覆性意义的工具,这些工具不仅能追踪竞争对手,还能自动调整您的店铺价格,从而实现利润最大化。通过实际测试对比免费与付费选项。立即掌握您的定价优势。

10 个工具
xix.ai
代码 最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件
最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件

在 XIX.AI 上探索 2026 年最佳 AI 代码审查工具。我们的精选列表汇集了备受好评、具有颠覆性的工具,可自动确保代码规范并重构遗留代码库文件。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即开启您的 AI 优势。

10 个工具
xix.ai
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
评论 (46)
0/500
EricJohnson
EricJohnson 2026-05-05 08:00:24

このモデルは23言語に対応しているって、すごいね!でも、実際に使ってみないと本当の性能はわからないかも。Cohereは競合他社と比べてどうなんだろう?🤔

JasonAnderson
JasonAnderson 2026-02-01 02:00:22

Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.

JoseAdams
JoseAdams 2025-10-02 10:30:37

Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.

MarkRoberts
MarkRoberts 2025-09-04 12:30:34

¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎

KennethMartin
KennethMartin 2025-08-10 13:00:59

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing
PaulKing 2025-07-31 19:35:39

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

OR