選項
首頁
新聞
共同揭示了最高評級的AYA Vision AI模型

共同揭示了最高評級的AYA Vision AI模型

2025-04-10
113

Cohere的非營利研究實驗室剛剛發布了一款名為Aya Vision的新多模態AI模型,並稱其為同類最佳。這款模型非常出色——它能生成圖片說明、回答關於圖片的問題、翻譯文字,甚至能以23種主要語言進行內容摘要。此外,Cohere在WhatsApp上免費提供Aya Vision,稱這是將這些技術突破推廣到全球研究者手中的一大舉措。

在他們的部落格文章中,Cohere指出,雖然AI技術不斷進步,但不同語言的模型處理能力仍存在巨大差距,特別是在同時處理文字和圖片時。Aya Vision的出現正是為了彌補這一差距。

Aya Vision有兩個版本:功能更強大的Aya Vision 32B和更輕量的Aya Vision 8B。據Cohere表示,32B版本開創了“新前沿”,在某些視覺理解測試中超越了比它大兩倍的模型,如Meta的Llama-3.2 90B Vision。而8B版本也能與比它大十倍的模型相抗衡。

這兩個模型都可以在Hugging Face上以Creative Commons 4.0許可證獲得,但有一個限制——它們不能用於商業用途。

Cohere使用英文數據集進行Aya Vision的訓練,將其翻譯並轉化為合成標註。這些標註或標籤有助於模型在訓練過程中理解數據。例如,在訓練圖像識別模型時,可以使用標註來標記物體或為圖片添加說明。

Cohere Aya Vision

Cohere的Aya Vision模型能執行多種視覺理解任務。圖片來源:Cohere
使用合成標註目前非常流行,儘管它也有其缺點。像OpenAI這樣的大公司也開始採用合成數據,因為真實世界數據越來越難獲得。Gartner估計,去年用於AI和分析項目的數據中有60%是合成的。

Cohere表示,使用合成標註訓練Aya Vision讓他們用更少的資源仍能獲得頂尖結果。他們說,這一切都關乎效率和以更少的資源做更多的事,這對那些不總能獲得大量計算資源的研究者來說是個好消息。

除了Aya Vision,Cohere還發布了一套名為AyaVisionBench的新基準測試套件,旨在測試模型在諸如辨別圖片差異和將螢幕截圖轉為程式碼等任務中的能力。

AI界一直在應對一些人稱為“評估危機”的問題。常規基準測試給出的總體分數無法真正反映模型在對大多數用戶重要的任務上的表現。Cohere認為AyaVisionBench可以幫助解決這一問題,提供一個嚴格且廣泛的方式來檢驗模型的跨語言和多模態能力。

希望他們是對的。Cohere的研究者表示,這個數據集是測試多語言和現實場景中視覺-語言模型的堅實基準。他們已將其提供給研究社群,以推動多語言多模態評估的進展。

相關文章
擁抱面孔為OpenAI研究工具提供開放式替代方案 擁抱面孔為OpenAI研究工具提供開放式替代方案 包括聯合創始人和首席科學家托馬斯·沃爾夫(Thomas Wolf)在內的擁抱面孔的開發人員團隊創建了他們所謂的OpenAI深入研究工具的“開放”版本。 Openai在最近的一項活動中介紹了深入的研究,據透露該工具搜尋網絡以生成研究報告
選擇最適合您項目的AI編碼工具 選擇最適合您項目的AI編碼工具 軟體開發環境正在迅速轉變,人工智慧(AI)成為關鍵驅動力。AI編碼工具使開發者能夠更快、更準確、更高效率地撰寫程式碼。然而,面對眾多選擇,挑選合適的AI編碼助手可能令人感到不知所措。本指南概述了關鍵因素,幫助您選擇最適合項目的AI工具。關鍵要點探索AI編碼工具的主要類型:整合式IDE、程式碼編輯器和網頁平台。評估您項目的具體需求和技術要求。檢查每種AI工具提供的整合功能,例如身份驗證、資料庫和支付
AI驅動的播客工具促進內容創作簡化 AI驅動的播客工具促進內容創作簡化 製作和精煉播客既具挑戰性又充滿成就感。許多播客創作者面臨耗時任務的挑戰,如去除填充詞、撰寫引人入勝的節目筆記以及有效推廣內容。幸運的是,人工智慧(AI)提供了尖端解決方案,簡化這些流程,使播客製作更高效且易於操作。本文介紹了頂尖的AI播客編輯工具,這些工具能革新您的工作流程,助您輕鬆打造專業內容。重點AI工具提升播客製作效率。利用AI自動去除「嗯」、「啊」等填充詞。使用AI技術生成轉錄和節目筆記。
評論 (42)
0/200
KennethMartin
KennethMartin 2025-08-10 13:00:59

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing
PaulKing 2025-07-31 19:35:39

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

JackMartinez
JackMartinez 2025-04-21 09:32:08

Aya Vision es increíblemente útil. Lo utilizo para mis proyectos de diseño y me encanta cómo genera descripciones de imágenes. Aunque a veces se equivoca con los detalles, en general es muy preciso. ¡Lo recomiendo totalmente! 🌟

WilliamYoung
WilliamYoung 2025-04-20 08:58:05

Aya Vision ist echt cool, aber es hat manchmal Schwierigkeiten mit der Übersetzung. Trotzdem ist es eine tolle Hilfe für meine Arbeit. Es könnte etwas schneller sein, aber insgesamt bin ich zufrieden. 👍

StevenGonzalez
StevenGonzalez 2025-04-20 02:53:55

아야 비전은 멋지지만 완벽하지는 않아요. 이미지 캡션은 정확하지만 번역이 때때로 틀릴 때가 있어요. 그래도 빠른 요약을 위한 좋은 도구예요! 👍

FredBrown
FredBrown 2025-04-18 09:22:30

J'adore Aya Vision, c'est super pratique pour résumer des textes en plusieurs langues. Par contre, il a du mal avec les images complexes. Mais pour le reste, c'est top ! Essayez-le, vous ne serez pas déçus. 😊

回到頂部
OR