共同揭示了最高評級的AYA Vision AI模型
Cohere的非營利研究實驗室剛剛發布了一款名為Aya Vision的新多模態AI模型,並稱其為同類最佳。這款模型非常出色——它能生成圖片說明、回答關於圖片的問題、翻譯文字,甚至能以23種主要語言進行內容摘要。此外,Cohere在WhatsApp上免費提供Aya Vision,稱這是將這些技術突破推廣到全球研究者手中的一大舉措。
在他們的部落格文章中,Cohere指出,雖然AI技術不斷進步,但不同語言的模型處理能力仍存在巨大差距,特別是在同時處理文字和圖片時。Aya Vision的出現正是為了彌補這一差距。
Aya Vision有兩個版本:功能更強大的Aya Vision 32B和更輕量的Aya Vision 8B。據Cohere表示,32B版本開創了“新前沿”,在某些視覺理解測試中超越了比它大兩倍的模型,如Meta的Llama-3.2 90B Vision。而8B版本也能與比它大十倍的模型相抗衡。
這兩個模型都可以在Hugging Face上以Creative Commons 4.0許可證獲得,但有一個限制——它們不能用於商業用途。
Cohere使用英文數據集進行Aya Vision的訓練,將其翻譯並轉化為合成標註。這些標註或標籤有助於模型在訓練過程中理解數據。例如,在訓練圖像識別模型時,可以使用標註來標記物體或為圖片添加說明。

Cohere的Aya Vision模型能執行多種視覺理解任務。圖片來源:Cohere 使用合成標註目前非常流行,儘管它也有其缺點。像OpenAI這樣的大公司也開始採用合成數據,因為真實世界數據越來越難獲得。Gartner估計,去年用於AI和分析項目的數據中有60%是合成的。Cohere表示,使用合成標註訓練Aya Vision讓他們用更少的資源仍能獲得頂尖結果。他們說,這一切都關乎效率和以更少的資源做更多的事,這對那些不總能獲得大量計算資源的研究者來說是個好消息。
除了Aya Vision,Cohere還發布了一套名為AyaVisionBench的新基準測試套件,旨在測試模型在諸如辨別圖片差異和將螢幕截圖轉為程式碼等任務中的能力。
AI界一直在應對一些人稱為“評估危機”的問題。常規基準測試給出的總體分數無法真正反映模型在對大多數用戶重要的任務上的表現。Cohere認為AyaVisionBench可以幫助解決這一問題,提供一個嚴格且廣泛的方式來檢驗模型的跨語言和多模態能力。
希望他們是對的。Cohere的研究者表示,這個數據集是測試多語言和現實場景中視覺-語言模型的堅實基準。他們已將其提供給研究社群,以推動多語言多模態評估的進展。
相關文章
Cohere 推出開源多語言 AI 模型系列
企業級人工智慧公司 Cohere 在正在舉行的印度人工智慧峰會上,發表了一系列名為 Tiny Aya 的新型多語言模型。這些開放權重模型——意即其核心程式碼可供公眾使用與修改——支援超過 70 種語言,並能在無需網路連線的情況下,於筆記型電腦等日常裝置上運作。該模型由 Cohere 的研究部門 Cohere Labs 開發,支援孟加拉語、印地語、旁遮普語、烏爾都語、古吉拉特語、泰米爾語、泰盧固語及
Cohere 與 Aleph Alpha 宣布合併
加拿大人工智慧新創公司 Cohere 正於食品連鎖超市 Lidl 的母公司 Schwarz Group 支持下,收購德國的 Aleph Alpha。在政府支持下,這兩家公司旨在為企業提供一種「自主」的替代方案,以應對當前由美國企業主導的人工智慧產業。作為大型語言模型的開發者,Aleph Alpha 和 Cohere 雖仍落後於 OpenAI 等全球巨頭,但兩者皆為區域領軍企業。儘管兩者有相似之處,
Cohere 推出安全企業級人工智慧平台 North
人工智慧代理工具具備減少日常工作流程中重複性任務的潛力,然而許多組織在採用時仍持謹慎態度。首要顧慮在於資料安全。擁有專有技術的大型企業、受嚴格監管的行業機構以及政府機關對此存在重大疑慮。他們擔憂自身資料——或客戶資料——可能在缺乏適當保障措施的情況下遭洩露,或被用於訓練公開的人工智慧模型。加拿大AI公司Cohere透過全新AI代理平台North正致力解決這些疑慮。該平台專為私有部署設計,讓企業與政
相關專題推薦
評論 (46)
0/500
Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.
Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.
¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎
This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎
Cohere的非營利研究實驗室剛剛發布了一款名為Aya Vision的新多模態AI模型,並稱其為同類最佳。這款模型非常出色——它能生成圖片說明、回答關於圖片的問題、翻譯文字,甚至能以23種主要語言進行內容摘要。此外,Cohere在WhatsApp上免費提供Aya Vision,稱這是將這些技術突破推廣到全球研究者手中的一大舉措。
在他們的部落格文章中,Cohere指出,雖然AI技術不斷進步,但不同語言的模型處理能力仍存在巨大差距,特別是在同時處理文字和圖片時。Aya Vision的出現正是為了彌補這一差距。
Aya Vision有兩個版本:功能更強大的Aya Vision 32B和更輕量的Aya Vision 8B。據Cohere表示,32B版本開創了“新前沿”,在某些視覺理解測試中超越了比它大兩倍的模型,如Meta的Llama-3.2 90B Vision。而8B版本也能與比它大十倍的模型相抗衡。
這兩個模型都可以在Hugging Face上以Creative Commons 4.0許可證獲得,但有一個限制——它們不能用於商業用途。
Cohere使用英文數據集進行Aya Vision的訓練,將其翻譯並轉化為合成標註。這些標註或標籤有助於模型在訓練過程中理解數據。例如,在訓練圖像識別模型時,可以使用標註來標記物體或為圖片添加說明。

Cohere表示,使用合成標註訓練Aya Vision讓他們用更少的資源仍能獲得頂尖結果。他們說,這一切都關乎效率和以更少的資源做更多的事,這對那些不總能獲得大量計算資源的研究者來說是個好消息。
除了Aya Vision,Cohere還發布了一套名為AyaVisionBench的新基準測試套件,旨在測試模型在諸如辨別圖片差異和將螢幕截圖轉為程式碼等任務中的能力。
AI界一直在應對一些人稱為“評估危機”的問題。常規基準測試給出的總體分數無法真正反映模型在對大多數用戶重要的任務上的表現。Cohere認為AyaVisionBench可以幫助解決這一問題,提供一個嚴格且廣泛的方式來檢驗模型的跨語言和多模態能力。
希望他們是對的。Cohere的研究者表示,這個數據集是測試多語言和現實場景中視覺-語言模型的堅實基準。他們已將其提供給研究社群,以推動多語言多模態評估的進展。
Cohere 推出開源多語言 AI 模型系列
企業級人工智慧公司 Cohere 在正在舉行的印度人工智慧峰會上,發表了一系列名為 Tiny Aya 的新型多語言模型。這些開放權重模型——意即其核心程式碼可供公眾使用與修改——支援超過 70 種語言,並能在無需網路連線的情況下,於筆記型電腦等日常裝置上運作。該模型由 Cohere 的研究部門 Cohere Labs 開發,支援孟加拉語、印地語、旁遮普語、烏爾都語、古吉拉特語、泰米爾語、泰盧固語及
Cohere 與 Aleph Alpha 宣布合併
加拿大人工智慧新創公司 Cohere 正於食品連鎖超市 Lidl 的母公司 Schwarz Group 支持下,收購德國的 Aleph Alpha。在政府支持下,這兩家公司旨在為企業提供一種「自主」的替代方案,以應對當前由美國企業主導的人工智慧產業。作為大型語言模型的開發者,Aleph Alpha 和 Cohere 雖仍落後於 OpenAI 等全球巨頭,但兩者皆為區域領軍企業。儘管兩者有相似之處,
Cohere 推出安全企業級人工智慧平台 North
人工智慧代理工具具備減少日常工作流程中重複性任務的潛力,然而許多組織在採用時仍持謹慎態度。首要顧慮在於資料安全。擁有專有技術的大型企業、受嚴格監管的行業機構以及政府機關對此存在重大疑慮。他們擔憂自身資料——或客戶資料——可能在缺乏適當保障措施的情況下遭洩露,或被用於訓練公開的人工智慧模型。加拿大AI公司Cohere透過全新AI代理平台North正致力解決這些疑慮。該平台專為私有部署設計,讓企業與政
Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.
Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.
¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎
This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎





首頁






