Cohere enthüllt Top-bewertete Aya Vision AI-Modell

Heim

Nachricht

10. April 2025

DanielAllen

201

# Open AI # Cohere

Das gemeinnützige Forschungslabor von Cohere hat gerade ein neues multimodales KI-Modell namens Aya Vision veröffentlicht und nennt es das beste seiner Klasse. Dieses Modell ist ziemlich beeindruckend – es kann Bildunterschriften erstellen, Fragen zu Bildern beantworten, Texte übersetzen und sogar Inhalte in 23 wichtigen Sprachen zusammenfassen. Außerdem stellt Cohere Aya Vision kostenlos auf WhatsApp zur Verfügung und sagt, dass dies ein großer Schritt ist, um diese technologischen Durchbrüche in die Hände von Forschern weltweit zu bringen.

In ihrem Blogbeitrag wies Cohere darauf hin, dass es trotz der Fortschritte in der KI immer noch eine große Lücke darin gibt, wie gut Modelle verschiedene Sprachen verarbeiten, insbesondere wenn sowohl Text als auch Bilder involviert sind. Hier setzt Aya Vision an, um diese Lücke zu schließen.

Aya Vision gibt es in zwei Versionen: die leistungsstärkere Aya Vision 32B und die leichtere Aya Vision 8B. Die 32B-Version setzt laut Cohere eine „neue Grenze“ und übertrifft Modelle, die doppelt so groß sind, wie Metas Llama-3.2 90B Vision, in einigen Tests zur visuellen Verständnis. Und die 8B-Version? Sie hält sich gegen Modelle, die zehnmal größer sind.

Beide Modelle können auf Hugging Face unter einer Creative Commons 4.0-Lizenz heruntergeladen werden, aber es gibt einen Haken – sie dürfen nicht für kommerzielle Zwecke genutzt werden.

Cohere hat Aya Vision mit einer Mischung aus englischsprachigen Datensätzen trainiert, die sie übersetzt und in synthetische Annotationen umgewandelt haben. Diese Annotationen, oder Tags, helfen dem Modell, die Daten während des Trainings zu verstehen. Zum Beispiel könnten bei der Schulung eines Bilderkennungsmodells Annotationen verwendet werden, um Objekte zu markieren oder Bildunterschriften hinzuzufügen.

Cohere Aya Vision

Cohere’s Aya Vision-Modell kann eine Reihe von Aufgaben zum visuellen Verständnis ausführen. Bildnachweis: Cohere

Die Verwendung synthetischer Annotationen ist derzeit sehr beliebt, auch wenn sie ihre Nachteile hat. Große Akteure wie OpenAI setzen ebenfalls auf synthetische Daten, da reale Daten immer schwerer zu bekommen sind. Gartner schätzt, dass im letzten Jahr 60 % der für KI- und Analyseprojekte verwendeten Daten synthetisch waren.

Cohere sagt, dass das Training von Aya Vision mit synthetischen Annotationen es ihnen ermöglicht hat, weniger Ressourcen zu nutzen und dennoch erstklassige Ergebnisse zu erzielen. Es geht um Effizienz und darum, mit weniger mehr zu erreichen, sagen sie, was eine gute Nachricht für Forscher ist, die nicht immer Zugang zu großen Rechenressourcen haben.

Neben Aya Vision hat Cohere eine neue Benchmark-Suite namens AyaVisionBench veröffentlicht. Sie ist darauf ausgelegt, die Fähigkeiten eines Modells in Aufgaben wie dem Erkennen von Unterschieden zwischen Bildern und dem Umwandeln von Screenshots in Code zu testen.

Die KI-Welt hat mit einer sogenannten „Bewertungskrise“ zu kämpfen. Die üblichen Benchmarks geben eine Gesamtpunktzahl, die nicht wirklich widerspiegelt, wie gut ein Modell bei den Aufgaben abschneidet, die den meisten Nutzern wichtig sind. Cohere glaubt, dass AyaVisionBench dieses Problem lösen kann, indem es eine anspruchsvolle und umfassende Möglichkeit bietet, die multilingualen und multimodalen Fähigkeiten eines Modells zu überprüfen.

Man kann nur hoffen, dass sie recht haben. Die Forscher von Cohere sagen, der Datensatz sei ein solides Benchmark für die Prüfung von Vision-Sprachmodellen in mehrsprachigen und realen Szenarien. Sie haben ihn der Forschungsgemeinschaft zur Verfügung gestellt, um die Entwicklung mehrsprachiger multimodaler Bewertungen voranzutreiben.

Verwandter Artikel

Cohere stellt eine Familie von mehrsprachigen Open-Source-KI-Modellen vor Das auf Unternehmens-KI spezialisierte Unternehmen Cohere hat auf dem derzeit stattfindenden India AI Summit eine neue Familie mehrsprachiger Modelle namens „Tiny Aya“ vorgestellt. Diese Open-Weight-M

Cohere und Aleph Alpha geben Fusion bekannt Das kanadische KI-Startup Cohere übernimmt das deutsche Unternehmen Aleph Alpha mit Unterstützung der Schwarz-Gruppe, der Muttergesellschaft der Lebensmittelkette Lidl. Mit staatlicher Unterstützung w

Cohere startet sichere KI-Plattform für Unternehmen North KI-Agent-Tools haben das Potenzial, sich wiederholende Aufgaben im täglichen Arbeitsablauf zu reduzieren, doch viele Unternehmen sind bei der Einführung noch zurückhaltend. Ein Hauptanliegen ist die D

Empfehlungen zu verwandten Spezialthemen

Geschäft

Die beste Software zur Preisoptimierung mittels KI: Beobachten Sie die Konkurrenz und passen Sie Ihre Shop-Preise automatisch an

Entdecken Sie auf XIX.AI die beste Software zur Preisoptimierung mittels KI für 2026. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die Ihre Mitbewerber beobachten und Ihre Shop-Preise automatisch anpassen, um den maximalen Gewinn zu erzielen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Sichern Sie sich jetzt Ihren Preisvorteil.

10 Tools

xix.ai

Code

Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys

Entdecken Sie die besten KI-Code-Reviewer des Jahres 2026 auf XIX.AI. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools zur Automatisierung der Einhaltung von Clean-Code-Standards und zur Refaktorisierung von Dateien in älteren Repositorys. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren KI-Vorsprung.

10 Tools

xix.ai

Text-zu-Sprache

Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern

Entdecken Sie die besten KI-TTS-Apps des Jahres 2026, die speziell zur Unterstützung bei Legasthenie ausgewählt wurden. In unseren Experten-Rankings vergleichen wir kostenlose und kostenpflichtige Tools und stellen leistungsstarke Funktionen für mehr Leseeffizienz und besseren Lernerfolg vor. Entdecken Sie bahnbrechende Lösungen, die Sie unbedingt ausprobieren sollten, um das Potenzial Ihrer Schüler voll auszuschöpfen. Beginnen Sie Ihre Reise bei XIX.AI.

10 Tools

xix.ai

Comic-Erstellung

Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools

xix.ai

Geschäft

Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools

xix.ai

Geschäft

Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools

xix.ai

Kommentare (46)

0/500

Bitte melden Sie sich zuerst an

EricJohnson

5. Mai 2026 02:00:24 MESZ

このモデルは23言語に対応しているって、すごいね！でも、実際に使ってみないと本当の性能はわからないかも。Cohereは競合他社と比べてどうなんだろう？🤔

JasonAnderson

31. Januar 2026 19:00:22 MEZ

Aya Vision klingt beeindruckend! Besonders die 23 Sprachen sind praktisch. Hoffentlich bleibt die Übersetzungsqualität auch bei komplexen Themen konsistent. 🤔 Würde mich interessieren, wie es sich im Alltag gegen GPT-4 behauptet.

JoseAdams

2. Oktober 2025 04:30:37 MESZ

Incroyable modèle de Cohere ! Mais est-ce que cette IA 'top-rated' tiendra ses promesses face à GPT-4 ? 🤔 Les fonctionnalités multilingues sont impressionnantes, mais j'aimerais voir plus de démos concrètes.

MarkRoberts

4. September 2025 06:30:34 MESZ

¡Interesante! Aya Vision parece ser un modelo bastante completo con esas capacidades multilingües. Me pregunto qué tan bien funcionará en idiomas menos comunes, sobre todo porque menciona '23 grandes idiomas'. ¿Habrá algún soporte para lenguas indígenas o regionales en el futuro? 🌎

KennethMartin

10. August 2025 07:00:59 MESZ

This Aya Vision model sounds like a game-changer! Captioning images and translating in 23 languages? That’s some next-level tech. Can’t wait to see how it stacks up against the big players like OpenAI. 😎

PaulKing

31. Juli 2025 13:35:39 MESZ

This Aya Vision model sounds like a game-changer! Being able to handle images and 23 languages is wild—imagine using it to instantly caption my travel photos or summarize foreign articles. Curious how it stacks up against other AI models in real-world tasks. 😎

Top -Nachrichten

AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung KI -Hosts des Notebooklm -Podcasts, das jetzt für Interviews verfügbar ist China stellt nationale Standards für humanoide Roboter und verkörperte Intelligenz vor Ramp-Daten zeigen, dass die Akzeptanz von KI in Unternehmen sinkt Bing Image Creator Tutorial: Anleitung zur KI-Kunstgenerierung Lernen Sie, AI-Musik mit Ihrer Stimme zu erstellen: ein Schritt-für-Schritt-Suno-Tutorial iMyFone MagicMic: Echtzeit-AI-Stimmerveränderer Bewertung und Tutorial Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen DeepSeek V4 revolutioniert multimodale KI Embodied Intelligence stellt ersten Branchenstandard zur Eindämmung unkontrollierten Wachstums vor

Mehr

Vorgestellt