Cohere는 최고 등급의 AYA Vision AI 모델을 공개합니다

집

뉴스

2025년 4월 10일

DanielAllen

201

# Open AI # Cohere

Cohere의 비영리 연구소가 새로운 멀티모달 AI 모델인 Aya Vision을 공개했으며, 이를 동급 최고로 평가하고 있습니다. 이 모델은 매우 뛰어납니다—이미지 캡션을 생성하고, 사진에 대한 질문에 답하며, 텍스트를 번역하고, 23개 주요 언어로 내용을 요약할 수 있습니다. 게다가 Cohere는 Aya Vision을 WhatsApp에서 무료로 제공하며, 이러한 기술 혁신을 전 세계 연구자들의 손에 쥐여주는 큰 걸음이라고 말합니다.

그들의 블로그 포스트에서 Cohere는 AI가 발전하고 있지만, 특히 텍스트와 이미지를 모두 처리할 때 모델이 다양한 언어를 얼마나 잘 다루는지에 큰 격차가 여전히 존재한다고 지적했습니다. 여기서 Aya Vision이 등장해 그 격차를 좁히는 것을 목표로 합니다.

Aya Vision은 두 가지 버전으로 제공됩니다: 더 강력한 Aya Vision 32B와 더 가벼운 Aya Vision 8B입니다. Cohere에 따르면 32B 버전은 "새로운 경지"를 열었으며, Meta의 Llama-3.2 90B Vision과 같은 두 배 크기의 모델을 일부 시각 이해 테스트에서 능가합니다. 그리고 8B 버전은? 10배 큰 모델들과도 당당히 경쟁합니다.

두 모델 모두 Hugging Face에서 Creative Commons 4.0 라이선스로 다운로드할 수 있지만, 상업적 사용은 불가능하다는 제약이 있습니다.

Cohere는 영어 데이터셋을 혼합해 Aya Vision을 훈련시켰으며, 이를 번역하고 합성 주석으로 변환했습니다. 이러한 주석 또는 태그는 훈련 중 모델이 데이터를 이해하는 데 도움을 줍니다. 예를 들어, 이미지 인식 모델을 훈련시킬 때 주석을 사용해 객체를 표시하거나 그림에 대한 캡션을 추가할 수 있습니다.

Cohere Aya Vision

Cohere의 Aya Vision 모델은 다양한 시각 이해 작업을 수행할 수 있습니다. 이미지 출처: Cohere

합성 주석 사용은 현재 큰 인기를 끌고 있지만, 단점도 있습니다. OpenAI와 같은 대기업들도 실제 데이터가 점점 구하기 어려워지면서 합성 데이터 열풍에 동참하고 있습니다. Gartner는 작년에 AI 및 분석 프로젝트에 사용된 데이터의 60%가 합성 데이터였다고 추정합니다.

Cohere는 합성 주석으로 Aya Vision을 훈련시키면 더 적은 자원을 사용하면서도 최고 수준의 결과를 얻을 수 있다고 말합니다. 그들은 효율성과 적은 자원으로 더 많은 것을 해내는 것이 목표라고 하며, 이는 대규모 컴퓨팅 자원에 항상 접근할 수 없는 연구자들에게 좋은 소식입니다.

Aya Vision과 함께 Cohere는 AyaVisionBench라는 새로운 벤치마크 스위트를 공개했습니다. 이는 이미지 간 차이점을 찾아내거나 스크린샷을 코드로 변환하는 등의 작업에서 모델의 기술을 테스트하도록 설계되었습니다.

AI 세계는 일부 사람들이 "평가 위기"라고 부르는 문제로 어려움을 겪고 있습니다. 일반적인 벤치마크는 전체 점수를 제공하지만, 이는 대부분의 사용자에게 중요한 작업에서 모델이 얼마나 잘 수행하는지를 제대로 반영하지 않습니다. Cohere는 AyaVisionBench가 이를 해결할 수 있으며, 모델의 다국어 및 멀티모달 능력을 확인하는 어렵고 포괄적인 방법을 제공한다고 생각합니다.

그들이 옳기를 바랍니다. Cohere의 연구자들은 이 데이터셋이 다국어 및 실제 시나리오에서 시각-언어 모델을 테스트하기 위한 견고한 벤치마크라고 말합니다. 그들은 다국어 멀티모달 평가를 발전시키기 위해 연구 커뮤니티에 이를 공개했습니다.

관련 특별 주제 추천

사업

최고의 AI 가격 최적화 소프트웨어: 경쟁사 추적 및 스토어 가격 자동 조정

XIX.AI에서 2026년 최고의 AI 가격 최적화 소프트웨어를 만나보세요. 저희가 엄선한 이 목록에는 경쟁사를 추적하고 최대 수익을 위해 매장 가격을 자동으로 조정해 주는, 최고 평점을 받은 혁신적인 도구들이 포함되어 있습니다. 실제 테스트 결과를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 가격 경쟁력의 우위를 확보하세요.

10 도구

xix.ai

암호

최고의 AI 코드 검토 도구: 깔끔한 코드 준수 자동화 및 레거시 리포지토리 파일 리팩토링

XIX.AI에서 2026년 최고의 AI 코드 검토 도구를 만나보세요. 엄선된 이 목록에는 깔끔한 코드 준수 여부를 자동으로 확인하고 레거시 리포지토리 파일을 리팩토링하는 데 있어 판도를 바꿀 만한 최고 등급의 도구들이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI의 경쟁력을 확보하세요.

10 도구

xix.ai

텍스트 음성 변환

난독증 환자를 위한 최고의 AI 음성 합성 앱: 학생들의 학습 및 독서 효율성 향상

난독증 지원을 위해 엄선된 2026년 최신 최고 평점 AI TTS 앱을 만나보세요. 전문가들이 선정한 이 순위는 무료 및 유료 도구를 비교 분석하여, 읽기 효율과 학습 효과를 높여주는 강력한 기능들을 소개합니다. 학생들의 잠재력을 최대한 발휘할 수 있도록 도와줄, 꼭 사용해봐야 할 혁신적인 솔루션을 확인해 보세요. XIX.AI에서 여정을 시작해 보세요.

10 도구

xix.ai

만화 창작

소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구

xix.ai

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

의견 (46)

0/500

먼저 로그인하십시오

EricJohnson

2026년 5월 5일 오전 9시 0분 24초 GMT+09:00

このモデルは23言語に対応しているって、すごいね！でも、実際に使ってみないと本当の性能はわからないかも。Cohereは競合他社と比べてどうなんだろう？🤔

JasonAnderson

2026년 2월 1일 오전 3시 0분 22초 GMT+09:00

Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.

JoseAdams

2025년 10월 2일 오전 11시 30분 37초 GMT+09:00

Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.

MarkRoberts

2025년 9월 4일 오후 1시 30분 34초 GMT+09:00

¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎

KennethMartin

2025년 8월 10일 오후 2시 0분 59초 GMT+09:00

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing

2025년 7월 31일 오후 8시 35분 39초 GMT+09:00

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더