選項
首頁
新聞
共同揭示了最高評級的AYA Vision AI模型

共同揭示了最高評級的AYA Vision AI模型

2025-04-10
128

Cohere的非營利研究實驗室剛剛發布了一款名為Aya Vision的新多模態AI模型,並稱其為同類最佳。這款模型非常出色——它能生成圖片說明、回答關於圖片的問題、翻譯文字,甚至能以23種主要語言進行內容摘要。此外,Cohere在WhatsApp上免費提供Aya Vision,稱這是將這些技術突破推廣到全球研究者手中的一大舉措。

在他們的部落格文章中,Cohere指出,雖然AI技術不斷進步,但不同語言的模型處理能力仍存在巨大差距,特別是在同時處理文字和圖片時。Aya Vision的出現正是為了彌補這一差距。

Aya Vision有兩個版本:功能更強大的Aya Vision 32B和更輕量的Aya Vision 8B。據Cohere表示,32B版本開創了“新前沿”,在某些視覺理解測試中超越了比它大兩倍的模型,如Meta的Llama-3.2 90B Vision。而8B版本也能與比它大十倍的模型相抗衡。

這兩個模型都可以在Hugging Face上以Creative Commons 4.0許可證獲得,但有一個限制——它們不能用於商業用途。

Cohere使用英文數據集進行Aya Vision的訓練,將其翻譯並轉化為合成標註。這些標註或標籤有助於模型在訓練過程中理解數據。例如,在訓練圖像識別模型時,可以使用標註來標記物體或為圖片添加說明。

Cohere Aya Vision

Cohere的Aya Vision模型能執行多種視覺理解任務。圖片來源:Cohere
使用合成標註目前非常流行,儘管它也有其缺點。像OpenAI這樣的大公司也開始採用合成數據,因為真實世界數據越來越難獲得。Gartner估計,去年用於AI和分析項目的數據中有60%是合成的。

Cohere表示,使用合成標註訓練Aya Vision讓他們用更少的資源仍能獲得頂尖結果。他們說,這一切都關乎效率和以更少的資源做更多的事,這對那些不總能獲得大量計算資源的研究者來說是個好消息。

除了Aya Vision,Cohere還發布了一套名為AyaVisionBench的新基準測試套件,旨在測試模型在諸如辨別圖片差異和將螢幕截圖轉為程式碼等任務中的能力。

AI界一直在應對一些人稱為“評估危機”的問題。常規基準測試給出的總體分數無法真正反映模型在對大多數用戶重要的任務上的表現。Cohere認為AyaVisionBench可以幫助解決這一問題,提供一個嚴格且廣泛的方式來檢驗模型的跨語言和多模態能力。

希望他們是對的。Cohere的研究者表示,這個數據集是測試多語言和現實場景中視覺-語言模型的堅實基準。他們已將其提供給研究社群,以推動多語言多模態評估的進展。

相關文章
擁抱面孔為OpenAI研究工具提供開放式替代方案 擁抱面孔為OpenAI研究工具提供開放式替代方案 包括聯合創始人和首席科學家托馬斯·沃爾夫(Thomas Wolf)在內的擁抱面孔的開發人員團隊創建了他們所謂的OpenAI深入研究工具的“開放”版本。 Openai在最近的一項活動中介紹了深入的研究,據透露該工具搜尋網絡以生成研究報告
「圖形 AI 使用知識圖形轉換商業智慧」 「圖形 AI 使用知識圖形轉換商業智慧」 重點圖形人工智能利用知識圖形揭示複雜資料集中隱藏的關聯。知識圖形可視化資訊為相互連結的節點和關係。透過精密的異常偵測功能,找出不規則的模式。追蹤完整的資料歷史,維持資訊流的透明度。驗證專家的洞察力,確保可靠的決策基礎。整合 NLP 來分析和組織非結構化的文字資訊。Neo4j 和 Bloom 等解決方案可實現有效的圖形建構與可視化。機器學習與圖形演算法的結合,釋放了先進的分析潛力。瞭解圖形人工智能與
Minecraft Villager AI 以獨特的聲音封面重新想像音樂 Minecraft Villager AI 以獨特的聲音封面重新想像音樂 隨著 AI 技術以意想不到的方式推進創意的極限,音樂製作的環境也不斷改變。其中一個特別吸引人的發展是 AI 產生的音樂封面,利用 Minecraft 村民獨特的聲音重新詮釋流行歌曲。這些奇特但具有音樂能力的翻唱作品展示了機器學習如何從非常規聲音源中提取音樂潛力,將數位懷舊與當代 AI 創新融合在一起。重點AI 將 Minecraft 村民的聲音轉化為音樂表演機器學習模型利用遊戲音訊分析並重建歌曲過
評論 (43)
0/200
MarkRoberts
MarkRoberts 2025-09-04 12:30:34

¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎

KennethMartin
KennethMartin 2025-08-10 13:00:59

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing
PaulKing 2025-07-31 19:35:39

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

JackMartinez
JackMartinez 2025-04-21 09:32:08

Aya Vision es increíblemente útil. Lo utilizo para mis proyectos de diseño y me encanta cómo genera descripciones de imágenes. Aunque a veces se equivoca con los detalles, en general es muy preciso. ¡Lo recomiendo totalmente! 🌟

WilliamYoung
WilliamYoung 2025-04-20 08:58:05

Aya Vision ist echt cool, aber es hat manchmal Schwierigkeiten mit der Übersetzung. Trotzdem ist es eine tolle Hilfe für meine Arbeit. Es könnte etwas schneller sein, aber insgesamt bin ich zufrieden. 👍

StevenGonzalez
StevenGonzalez 2025-04-20 02:53:55

아야 비전은 멋지지만 완벽하지는 않아요. 이미지 캡션은 정확하지만 번역이 때때로 틀릴 때가 있어요. 그래도 빠른 요약을 위한 좋은 도구예요! 👍

回到頂部
OR