Cohere раскрывает модель AYA Vision AI-Vision

Дом

Новости

10 апреля 2025 г.

DanielAllen

201

# Open AI # Cohere

Некоммерческая исследовательская лаборатория Cohere только что представила новую мультимодальную модель ИИ под названием Aya Vision, и они называют её лучшей в своём классе. Эта модель весьма впечатляющая — она может создавать подписи к изображениям, отвечать на вопросы о картинках, переводить текст и даже обобщать информацию на 23 основных языках. Кроме того, Cohere предоставляет Aya Vision бесплатно через WhatsApp, заявляя, что это важный шаг к тому, чтобы эти технологические прорывы стали доступны исследователям по всему миру.

В своём блоге Cohere отметили, что, хотя ИИ и делает успехи, всё ещё существует огромный разрыв в том, насколько хорошо модели справляются с разными языками, особенно когда речь идёт одновременно о тексте и изображениях. Именно здесь Aya Vision вступает в игру, стремясь преодолеть этот разрыв.

Aya Vision представлена в двух версиях: более мощной Aya Vision 32B и более лёгкой Aya Vision 8B. Версия 32B, по словам Cohere, устанавливает "новую границу", превосходя модели вдвое большего размера, такие как Llama-3.2 90B Vision от Meta, в некоторых тестах на визуальное понимание. А версия 8B? Она успешно конкурирует с моделями, которые в 10 раз больше.

Обе модели можно получить на Hugging Face под лицензией Creative Commons 4.0, но есть нюанс — они не предназначены для коммерческого использования.

Cohere обучала Aya Vision, используя комбинацию англоязычных наборов данных, которые они перевели и превратили в синтетические аннотации. Эти аннотации, или теги, помогают модели разбираться в данных во время обучения. Например, если вы обучаете модель распознавания изображений, аннотации могут использоваться для обозначения объектов или добавления подписей о том, что изображено на картинке.

Cohere Aya Vision

Модель Aya Vision от Cohere способна выполнять ряд задач по визуальному пониманию. Источник изображения: Cohere

Использование синтетических аннотаций сейчас в моде, несмотря на свои недостатки. Крупные игроки, такие как OpenAI, также переходят на синтетические данные, поскольку реальные данные становится всё сложнее добывать. По оценкам Gartner, в прошлом году 60% данных, использованных для проектов ИИ и аналитики, были синтетическими.

Cohere утверждает, что обучение Aya Vision на синтетических аннотациях позволило им использовать меньше ресурсов, при этом достигая отличных результатов. Речь идёт об эффективности и достижении большего с меньшими затратами, что является хорошей новостью для исследователей, у которых не всегда есть доступ к большим вычислительным ресурсам.

Наряду с Aya Vision Cohere выпустила новый набор тестов под названием AyaVisionBench. Он разработан для проверки навыков модели в таких задачах, как обнаружение различий между изображениями и преобразование скриншотов в код.

Мир ИИ сталкивается с тем, что некоторые называют "кризисом оценки". Обычные тесты дают общий балл, который не отражает, насколько хорошо модель справляется с задачами, важными для большинства пользователей. Cohere считает, что AyaVisionBench может помочь исправить это, предлагая сложный и всесторонний способ проверки мультиязычных и мультимодальных возможностей модели.

Будем надеяться, что они правы. Исследователи Cohere говорят, что этот набор данных является надёжным ориентиром для тестирования моделей визуально-языкового взаимодействия в мультиязычных и реальных сценариях. Они сделали его доступным для исследовательского сообщества, чтобы способствовать развитию мультиязычных мультимодальных оценок.

Связанная статья

Cohere представляет семейство многоязычных моделей искусственного интеллекта с открытым исходным кодом Компания Cohere, специализирующаяся на искусственном интеллекте для предприятий, представила новое семейство многоязычных моделей под названием Tiny Aya в рамках проходящего в настоящее время саммита

Cohere и Aleph Alpha объявляют о слиянии Канадский стартап Cohere, занимающийся искусственным интеллектом, приобретает немецкую компанию Aleph Alpha при финансовой поддержке Schwarz Group — материнской компании сети продуктовых магазинов Lid

Cohere запускает безопасную платформу искусственного интеллекта для предприятий North Инструменты искусственного интеллекта могут сократить количество повторяющихся задач в повседневных рабочих процессах, однако многие организации по-прежнему с осторожностью относятся к их внедрению. О

Рекомендации по связанным специальным темам

Создание комиксов

Лучшие инструменты для автоматической раскраски манги с помощью ИИ: нанесение плоских цветов без ошибок в цветовом решении

Откройте для себя лучшие инструменты для автоматической раскраски манги с помощью ИИ в 2026 году на сайте XIX.AI. В нашем тщательно составленном списке представлены самые популярные и революционные решения, которые наносят плоские цвета без единой ошибки в цветовом соответствии, что значительно повышает вашу продуктивность. Изучите сравнения бесплатных и платных версий, результаты реальных тестов и еженедельно обновляемые рейтинги, чтобы найти идеальный вариант для себя. Воспользуйтесь преимуществами ИИ уже сегодня.

10 инструментов

xix.ai

письмо

Лучшие программы для создания персонажей в жанре научной фантастики: генерация последовательных мотиваций персонажей и их роковых недостатков

Откройте для себя 20 лучших инструментов 2026 года для создания персонажей с помощью искусственного интеллекта, которые помогут вам придать своим героям глубину. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, способные генерировать правдоподобные мотивации и роковые недостатки персонажей. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой потенциал в области создания историй уже сейчас.

10 инструментов

xix.ai

Бизнес

Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов

xix.ai

код

Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях

Откройте для себя 20 лучших рецензентов кода на базе ИИ 2026 года на XIX.AI. В нашем тщательно составленном списке представлены высокооцененные, революционные инструменты для автоматизации проверки соответствия стандартам чистого кода и рефакторинга файлов в устаревших репозиториях. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Получите преимущество ИИ уже сегодня.

10 инструментов

xix.ai

Преобразование текста в речь

Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов

xix.ai

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Комментарии (46)

0/500

Пожалуйста, войдите в систему

EricJohnson

5 мая 2026 г., 3:00:24 GMT+03:00

このモデルは23言語に対応しているって、すごいね！でも、実際に使ってみないと本当の性能はわからないかも。Cohereは競合他社と比べてどうなんだろう？🤔

JasonAnderson

31 января 2026 г., 21:00:22 GMT+03:00

Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.

JoseAdams

2 октября 2025 г., 5:30:37 GMT+03:00

Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.

MarkRoberts

4 сентября 2025 г., 7:30:34 GMT+03:00

¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎

KennethMartin

10 августа 2025 г., 8:00:59 GMT+03:00

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing

31 июля 2025 г., 14:35:39 GMT+03:00

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан