Cohereは、最高評価のAYA Vision AIモデルを発表します
Cohereの非営利研究ラボが、Aya Visionという新しいマルチモーダルAIモデルを発表し、クラス最高と称しています。このモデルは非常に優れており、画像キャプションの作成、画像に関する質問への回答、テキストの翻訳、さらには23の主要言語での要約が可能です。さらに、CohereはAya VisionをWhatsAppで無料提供し、これらの技術的進歩を世界中の研究者の手に届ける大きな一歩だと述べています。
彼らのブログ投稿では、AIが進歩している一方で、モデルが異なる言語、特にテキストと画像の両方を扱う場合のパフォーマンスに大きな差があると指摘しています。そこでAya Visionが登場し、そのギャップを埋めることを目指しています。
Aya Visionには2つのバージョンがあります:より高性能なAya Vision 32Bと、軽量なAya Vision 8Bです。Cohereによると、32Bバージョンは「新たなフロンティア」を設定し、MetaのLlama-3.2 90B Visionのような2倍のサイズのモデルを、一部の視覚理解テストで上回っています。そして8Bバージョンは、10倍大きなモデルに対抗できる実力を持っています。
両モデルはHugging FaceからCreative Commons 4.0ライセンスで入手可能ですが、商用利用はできません。
Cohereは、英語のデータセットを翻訳し、合成アノテーションに変換してAya Visionを訓練しました。これらのアノテーション、つまりタグは、訓練中にモデルがデータを理解するのに役立ちます。たとえば、画像認識モデルの訓練では、アノテーションを使ってオブジェクトをマークしたり、画像の内容に関するキャプションを追加したりします。

CohereのAya Visionモデルは、さまざまな視覚理解タスクを実行できます。画像提供:Cohere 合成アノテーションの使用は現在非常に流行していますが、欠点もあります。OpenAIのような大手企業も、現実世界のデータが入手しにくくなる中、合成データの活用に乗り出しています。Gartnerによると、昨年、AIおよび分析プロジェクトで使用されたデータの60%が合成データでした。Cohereは、合成アノテーションでAya Visionを訓練することで、少ないリソースで最高の結果を得たと述べています。効率性と少ないリソースでより多くのことを行うことが、大きなコンピューティングリソースにアクセスできない研究者にとって朗報だと彼らは言います。
Aya Visionと同時に、CohereはAyaVisionBenchという新しいベンチマークスイートをリリースしました。これは、画像間の違いを特定したり、スクリーンショットをコードに変換したりするタスクで罐でモデルのスキルをテストするために設計されています。
AI業界では、いわゆる「評価危機」に悩まされています。通常のベンチマークでは、ユーザーにとって重要なタスクでのモデルのパフォーマンスを正確に反映しない全体的なスコアしか得られません。Cohereは、AyaVisionBenchがこの問題を解決し、モデルの多言語およびマルチモーダルな能力を厳しく幅広くチェックする方法を提供できると考えています。
その通りであってほしいものです。Cohereの研究者たちは、このデータセットが多言語および現実世界のシナリオでビジョン言語モデルのテストに適した強力なベンチマークだと述べています。彼らは研究コミュニティに提供し、多言語マルチモーダル評価の推進を支援しています。
関連記事
Cohere、オープンソースの多言語AIモデル群を発表
エンタープライズAI企業のCohereは、現在開催中の「India AI Summit」において、「Tiny Aya」と名付けられた新しい多言語モデル群を発表した。これらのオープンウェイトモデル(コアコードが公開されており、誰でも利用・改変が可能)は70以上の言語に対応しており、インターネット接続がなくてもノートパソコンなどの一般的なデバイス上で動作する。Cohereの研究部門であるCohere
CohereとAleph Alphaが合併を発表
カナダのAIスタートアップ企業Cohereは、スーパーマーケットチェーンLidlの親会社であるSchwarz Groupの支援を受け、ドイツのAleph Alphaを買収する。両社は政府の支援を得て、現在米国企業が支配するAI分野において、企業向けに「自国主導の代替案」を提供することを目指している。大規模言語モデルの開発者として、Aleph AlphaとCohereはいずれも地域をリードする存在だ
コヘア、セキュアなエンタープライズAIプラットフォーム「North」を発表
AIエージェントツールは日常業務における反復作業を削減する可能性を秘めているが、多くの組織は導入に慎重な姿勢を崩していない。主な懸念はデータセキュリティである。企業秘密を抱える大企業、規制の厳しい業界の企業、政府機関は強い懸念を抱いている。自社のデータ、あるいは顧客データが、適切な保護措置なしに公開AIモデルの訓練に流用される可能性を危惧しているのだ。カナダのAI企業Cohereは、新たなAIエー
関連特集おすすめ
コメント (46)
0/500
Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.
Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.
¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎
This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎
Cohereの非営利研究ラボが、Aya Visionという新しいマルチモーダルAIモデルを発表し、クラス最高と称しています。このモデルは非常に優れており、画像キャプションの作成、画像に関する質問への回答、テキストの翻訳、さらには23の主要言語での要約が可能です。さらに、CohereはAya VisionをWhatsAppで無料提供し、これらの技術的進歩を世界中の研究者の手に届ける大きな一歩だと述べています。
彼らのブログ投稿では、AIが進歩している一方で、モデルが異なる言語、特にテキストと画像の両方を扱う場合のパフォーマンスに大きな差があると指摘しています。そこでAya Visionが登場し、そのギャップを埋めることを目指しています。
Aya Visionには2つのバージョンがあります:より高性能なAya Vision 32Bと、軽量なAya Vision 8Bです。Cohereによると、32Bバージョンは「新たなフロンティア」を設定し、MetaのLlama-3.2 90B Visionのような2倍のサイズのモデルを、一部の視覚理解テストで上回っています。そして8Bバージョンは、10倍大きなモデルに対抗できる実力を持っています。
両モデルはHugging FaceからCreative Commons 4.0ライセンスで入手可能ですが、商用利用はできません。
Cohereは、英語のデータセットを翻訳し、合成アノテーションに変換してAya Visionを訓練しました。これらのアノテーション、つまりタグは、訓練中にモデルがデータを理解するのに役立ちます。たとえば、画像認識モデルの訓練では、アノテーションを使ってオブジェクトをマークしたり、画像の内容に関するキャプションを追加したりします。

Cohereは、合成アノテーションでAya Visionを訓練することで、少ないリソースで最高の結果を得たと述べています。効率性と少ないリソースでより多くのことを行うことが、大きなコンピューティングリソースにアクセスできない研究者にとって朗報だと彼らは言います。
Aya Visionと同時に、CohereはAyaVisionBenchという新しいベンチマークスイートをリリースしました。これは、画像間の違いを特定したり、スクリーンショットをコードに変換したりするタスクで罐でモデルのスキルをテストするために設計されています。
AI業界では、いわゆる「評価危機」に悩まされています。通常のベンチマークでは、ユーザーにとって重要なタスクでのモデルのパフォーマンスを正確に反映しない全体的なスコアしか得られません。Cohereは、AyaVisionBenchがこの問題を解決し、モデルの多言語およびマルチモーダルな能力を厳しく幅広くチェックする方法を提供できると考えています。
その通りであってほしいものです。Cohereの研究者たちは、このデータセットが多言語および現実世界のシナリオでビジョン言語モデルのテストに適した強力なベンチマークだと述べています。彼らは研究コミュニティに提供し、多言語マルチモーダル評価の推進を支援しています。
Cohere、オープンソースの多言語AIモデル群を発表
エンタープライズAI企業のCohereは、現在開催中の「India AI Summit」において、「Tiny Aya」と名付けられた新しい多言語モデル群を発表した。これらのオープンウェイトモデル(コアコードが公開されており、誰でも利用・改変が可能)は70以上の言語に対応しており、インターネット接続がなくてもノートパソコンなどの一般的なデバイス上で動作する。Cohereの研究部門であるCohere
CohereとAleph Alphaが合併を発表
カナダのAIスタートアップ企業Cohereは、スーパーマーケットチェーンLidlの親会社であるSchwarz Groupの支援を受け、ドイツのAleph Alphaを買収する。両社は政府の支援を得て、現在米国企業が支配するAI分野において、企業向けに「自国主導の代替案」を提供することを目指している。大規模言語モデルの開発者として、Aleph AlphaとCohereはいずれも地域をリードする存在だ
コヘア、セキュアなエンタープライズAIプラットフォーム「North」を発表
AIエージェントツールは日常業務における反復作業を削減する可能性を秘めているが、多くの組織は導入に慎重な姿勢を崩していない。主な懸念はデータセキュリティである。企業秘密を抱える大企業、規制の厳しい業界の企業、政府機関は強い懸念を抱いている。自社のデータ、あるいは顧客データが、適切な保護措置なしに公開AIモデルの訓練に流用される可能性を危惧しているのだ。カナダのAI企業Cohereは、新たなAIエー
Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.
Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.
¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎
This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎





家






