Cohere는 최고 등급의 AYA Vision AI 모델을 공개합니다
Cohere의 비영리 연구소가 새로운 멀티모달 AI 모델인 Aya Vision을 공개했으며, 이를 동급 최고로 평가하고 있습니다. 이 모델은 매우 뛰어납니다—이미지 캡션을 생성하고, 사진에 대한 질문에 답하며, 텍스트를 번역하고, 23개 주요 언어로 내용을 요약할 수 있습니다. 게다가 Cohere는 Aya Vision을 WhatsApp에서 무료로 제공하며, 이러한 기술 혁신을 전 세계 연구자들의 손에 쥐여주는 큰 걸음이라고 말합니다.
그들의 블로그 포스트에서 Cohere는 AI가 발전하고 있지만, 특히 텍스트와 이미지를 모두 처리할 때 모델이 다양한 언어를 얼마나 잘 다루는지에 큰 격차가 여전히 존재한다고 지적했습니다. 여기서 Aya Vision이 등장해 그 격차를 좁히는 것을 목표로 합니다.
Aya Vision은 두 가지 버전으로 제공됩니다: 더 강력한 Aya Vision 32B와 더 가벼운 Aya Vision 8B입니다. Cohere에 따르면 32B 버전은 "새로운 경지"를 열었으며, Meta의 Llama-3.2 90B Vision과 같은 두 배 크기의 모델을 일부 시각 이해 테스트에서 능가합니다. 그리고 8B 버전은? 10배 큰 모델들과도 당당히 경쟁합니다.
두 모델 모두 Hugging Face에서 Creative Commons 4.0 라이선스로 다운로드할 수 있지만, 상업적 사용은 불가능하다는 제약이 있습니다.
Cohere는 영어 데이터셋을 혼합해 Aya Vision을 훈련시켰으며, 이를 번역하고 합성 주석으로 변환했습니다. 이러한 주석 또는 태그는 훈련 중 모델이 데이터를 이해하는 데 도움을 줍니다. 예를 들어, 이미지 인식 모델을 훈련시킬 때 주석을 사용해 객체를 표시하거나 그림에 대한 캡션을 추가할 수 있습니다.

Cohere의 Aya Vision 모델은 다양한 시각 이해 작업을 수행할 수 있습니다. 이미지 출처: Cohere 합성 주석 사용은 현재 큰 인기를 끌고 있지만, 단점도 있습니다. OpenAI와 같은 대기업들도 실제 데이터가 점점 구하기 어려워지면서 합성 데이터 열풍에 동참하고 있습니다. Gartner는 작년에 AI 및 분석 프로젝트에 사용된 데이터의 60%가 합성 데이터였다고 추정합니다.Cohere는 합성 주석으로 Aya Vision을 훈련시키면 더 적은 자원을 사용하면서도 최고 수준의 결과를 얻을 수 있다고 말합니다. 그들은 효율성과 적은 자원으로 더 많은 것을 해내는 것이 목표라고 하며, 이는 대규모 컴퓨팅 자원에 항상 접근할 수 없는 연구자들에게 좋은 소식입니다.
Aya Vision과 함께 Cohere는 AyaVisionBench라는 새로운 벤치마크 스위트를 공개했습니다. 이는 이미지 간 차이점을 찾아내거나 스크린샷을 코드로 변환하는 등의 작업에서 모델의 기술을 테스트하도록 설계되었습니다.
AI 세계는 일부 사람들이 "평가 위기"라고 부르는 문제로 어려움을 겪고 있습니다. 일반적인 벤치마크는 전체 점수를 제공하지만, 이는 대부분의 사용자에게 중요한 작업에서 모델이 얼마나 잘 수행하는지를 제대로 반영하지 않습니다. Cohere는 AyaVisionBench가 이를 해결할 수 있으며, 모델의 다국어 및 멀티모달 능력을 확인하는 어렵고 포괄적인 방법을 제공한다고 생각합니다.
그들이 옳기를 바랍니다. Cohere의 연구자들은 이 데이터셋이 다국어 및 실제 시나리오에서 시각-언어 모델을 테스트하기 위한 견고한 벤치마크라고 말합니다. 그들은 다국어 멀티모달 평가를 발전시키기 위해 연구 커뮤니티에 이를 공개했습니다.
관련 기사
포옹 얼굴은 OpenAI의 연구 도구에 대한 개방형 대안을 개발합니다
공동 창립자이자 최고 과학자 인 Thomas Wolf를 포함하여 Hugging Face의 개발자 팀은 OpenAi의 Deep Research Tool의 "Open"버전을 만들었습니다. OpenAi는 최근 행사에서 깊은 연구를 도입했으며,이 도구는 웹을 수색하여 연구 보고서를 생성하는 것으로 밝혀졌습니다.
Uber의 QueryGPT: AI로 SQL 쿼리 생성 혁신
빠르게 변화하는 데이터 중심의 현대 비즈니스 환경에서 데이터를 효율적으로 조회하고 관리하는 것은 모든 규모의 조직에 필수적입니다. 데이터베이스 상호작용의 핵심 언어인 SQL은 종종 전문 지식과 시간을 요구합니다. Uber의 QueryGPT는 생성형 AI를 활용해 자연어를 SQL 쿼리로 변환하여 데이터 접근을 단순화하고 엔지니어, 운영 관리자, 데이터 과학자
최고의 AI 코딩 도구 선택
소프트웨어 개발 환경은 인공지능(AI)이 핵심 동력으로 빠르게 변화하고 있습니다. AI 코딩 도구는 개발자가 더 빠르고 정확하며 효율적으로 코드를 작성할 수 있게 합니다. 하지만 다양한 옵션으로 인해 적합한 AI 코딩 도우미를 선택하는 것이 부담스러울 수 있습니다. 이 가이드는 프로젝트에 이상적인 AI 도구를 선택하는 데 도움이 되는 주요 요소를 설명합니다
의견 (42)
0/200
KennethMartin
2025년 8월 10일 오후 2시 0분 59초 GMT+09:00
This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎
0
PaulKing
2025년 7월 31일 오후 8시 35분 39초 GMT+09:00
This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎
0
JackMartinez
2025년 4월 21일 오전 10시 32분 8초 GMT+09:00
Aya Vision es increíblemente útil. Lo utilizo para mis proyectos de diseño y me encanta cómo genera descripciones de imágenes. Aunque a veces se equivoca con los detalles, en general es muy preciso. ¡Lo recomiendo totalmente! 🌟
0
WilliamYoung
2025년 4월 20일 오전 9시 58분 5초 GMT+09:00
Aya Vision ist echt cool, aber es hat manchmal Schwierigkeiten mit der Übersetzung. Trotzdem ist es eine tolle Hilfe für meine Arbeit. Es könnte etwas schneller sein, aber insgesamt bin ich zufrieden. 👍
0
StevenGonzalez
2025년 4월 20일 오전 3시 53분 55초 GMT+09:00
아야 비전은 멋지지만 완벽하지는 않아요. 이미지 캡션은 정확하지만 번역이 때때로 틀릴 때가 있어요. 그래도 빠른 요약을 위한 좋은 도구예요! 👍
0
FredBrown
2025년 4월 18일 오전 10시 22분 30초 GMT+09:00
J'adore Aya Vision, c'est super pratique pour résumer des textes en plusieurs langues. Par contre, il a du mal avec les images complexes. Mais pour le reste, c'est top ! Essayez-le, vous ne serez pas déçus. 😊
0
Cohere의 비영리 연구소가 새로운 멀티모달 AI 모델인 Aya Vision을 공개했으며, 이를 동급 최고로 평가하고 있습니다. 이 모델은 매우 뛰어납니다—이미지 캡션을 생성하고, 사진에 대한 질문에 답하며, 텍스트를 번역하고, 23개 주요 언어로 내용을 요약할 수 있습니다. 게다가 Cohere는 Aya Vision을 WhatsApp에서 무료로 제공하며, 이러한 기술 혁신을 전 세계 연구자들의 손에 쥐여주는 큰 걸음이라고 말합니다.
그들의 블로그 포스트에서 Cohere는 AI가 발전하고 있지만, 특히 텍스트와 이미지를 모두 처리할 때 모델이 다양한 언어를 얼마나 잘 다루는지에 큰 격차가 여전히 존재한다고 지적했습니다. 여기서 Aya Vision이 등장해 그 격차를 좁히는 것을 목표로 합니다.
Aya Vision은 두 가지 버전으로 제공됩니다: 더 강력한 Aya Vision 32B와 더 가벼운 Aya Vision 8B입니다. Cohere에 따르면 32B 버전은 "새로운 경지"를 열었으며, Meta의 Llama-3.2 90B Vision과 같은 두 배 크기의 모델을 일부 시각 이해 테스트에서 능가합니다. 그리고 8B 버전은? 10배 큰 모델들과도 당당히 경쟁합니다.
두 모델 모두 Hugging Face에서 Creative Commons 4.0 라이선스로 다운로드할 수 있지만, 상업적 사용은 불가능하다는 제약이 있습니다.
Cohere는 영어 데이터셋을 혼합해 Aya Vision을 훈련시켰으며, 이를 번역하고 합성 주석으로 변환했습니다. 이러한 주석 또는 태그는 훈련 중 모델이 데이터를 이해하는 데 도움을 줍니다. 예를 들어, 이미지 인식 모델을 훈련시킬 때 주석을 사용해 객체를 표시하거나 그림에 대한 캡션을 추가할 수 있습니다.
Cohere는 합성 주석으로 Aya Vision을 훈련시키면 더 적은 자원을 사용하면서도 최고 수준의 결과를 얻을 수 있다고 말합니다. 그들은 효율성과 적은 자원으로 더 많은 것을 해내는 것이 목표라고 하며, 이는 대규모 컴퓨팅 자원에 항상 접근할 수 없는 연구자들에게 좋은 소식입니다.
Aya Vision과 함께 Cohere는 AyaVisionBench라는 새로운 벤치마크 스위트를 공개했습니다. 이는 이미지 간 차이점을 찾아내거나 스크린샷을 코드로 변환하는 등의 작업에서 모델의 기술을 테스트하도록 설계되었습니다.
AI 세계는 일부 사람들이 "평가 위기"라고 부르는 문제로 어려움을 겪고 있습니다. 일반적인 벤치마크는 전체 점수를 제공하지만, 이는 대부분의 사용자에게 중요한 작업에서 모델이 얼마나 잘 수행하는지를 제대로 반영하지 않습니다. Cohere는 AyaVisionBench가 이를 해결할 수 있으며, 모델의 다국어 및 멀티모달 능력을 확인하는 어렵고 포괄적인 방법을 제공한다고 생각합니다.
그들이 옳기를 바랍니다. Cohere의 연구자들은 이 데이터셋이 다국어 및 실제 시나리오에서 시각-언어 모델을 테스트하기 위한 견고한 벤치마크라고 말합니다. 그들은 다국어 멀티모달 평가를 발전시키기 위해 연구 커뮤니티에 이를 공개했습니다.




This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎




This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎




Aya Vision es increíblemente útil. Lo utilizo para mis proyectos de diseño y me encanta cómo genera descripciones de imágenes. Aunque a veces se equivoca con los detalles, en general es muy preciso. ¡Lo recomiendo totalmente! 🌟




Aya Vision ist echt cool, aber es hat manchmal Schwierigkeiten mit der Übersetzung. Trotzdem ist es eine tolle Hilfe für meine Arbeit. Es könnte etwas schneller sein, aber insgesamt bin ich zufrieden. 👍




아야 비전은 멋지지만 완벽하지는 않아요. 이미지 캡션은 정확하지만 번역이 때때로 틀릴 때가 있어요. 그래도 빠른 요약을 위한 좋은 도구예요! 👍




J'adore Aya Vision, c'est super pratique pour résumer des textes en plusieurs langues. Par contre, il a du mal avec les images complexes. Mais pour le reste, c'est top ! Essayez-le, vous ne serez pas déçus. 😊












