KI für die Welt oder nur im Westen? Wie Forscher die globalen Lücken von Big Tech in Angriff nehmen

Seit der Einführung von OpenAI's ChatGPT im Jahr 2022 hat sich künstliche Intelligenz (AI) tief in das Gefüge unseres täglichen Lebens eingewoben. Doch oft liegt der Fokus auf AI-Produkten, die mit Blick auf amerikanische und europäische Zielgruppen entwickelt wurden, obwohl sie als universelle Werkzeuge gelten, die den Zugang zu Technologie demokratisieren. Von den Anwendungen, die sie unterstützen, bis zu den Sprachen, die sie bedienen, sind diese Werkzeuge nicht immer so global, wie sie erscheinen.
In ganz Afrika setzen Forscher und Technologen diesem Trend entgegen, fordern den Status quo heraus und hinterfragen die umfassenderen Machtstrukturen innerhalb der AI-Branche. Ihre Arbeit zielt darauf ab, den Fokus auf Lösungen zu verlagern, die wirklich auf lokale Bedürfnisse und Gemeinschaften zugeschnitten sind.
Ein globales Ungleichgewicht der AI-Macht
Das Distributed AI Research Institute (DAIR) steht als Leuchtfeuer des Wandels, ein internationales Kollektiv, das sich der „unabhängigen und gemeinschaftsverwurzelten AI-Forschung widmet, frei von dem allgegenwärtigen Einfluss großer Technologieunternehmen“. Ich hatte die Gelegenheit, mit DAIR-Mitgliedern zu sprechen, die AI-Lösungen speziell für afrikanische Kontexte entwickeln und gesellschaftliche Bedürfnisse ansprechen, anstatt den Interessen multinationaler Konzerne oder überwiegend westlicher Nutzer zu dienen.
Nyalleng Moorosi, eine leitende Forscherin bei DAIR mit Sitz in Lesotho und Gründungsmitglied von Deep Learning Indaba, ist eine solche Pionierin. Ihr Hintergrund im Bereich maschinelles Lernen und ihre Erfahrung als Lehrerin an südafrikanischen öffentlichen Schulen haben ihre Ansichten über Gleichberechtigung in der Technologie geprägt. Als ehemalige Dozentin an der University of Forte – einer der wenigen Universitäten in Südafrika, die während der Apartheid schwarze Studierende aufnahm – erlebte sie hautnah, wie Armut die Bildungswege der Studierenden beeinflusste. „Es war überwältigend, sich vorzustellen, die Dinge, die ich während meines Grund- und Aufbaustudiums tat, unter solcher Unsicherheit zu bewältigen“, reflektierte sie.
Nach ihrer Tätigkeit als Lehrerin trat Moorosi als eine der ersten Mitarbeiterinnen dem Google Africa AI-Forschungslabor in Ghana bei. Ihre Rolle als Softwareingenieurin ermöglichte es ihr, Methoden und Technologien zu entwickeln, die auf verantwortungsvolle AI-Entwicklung abzielen. „Ich bin zu Google gegangen, weil sie ein Büro in Afrika eröffneten, und ich wollte in Afrika sein“, erklärte Moorosi. „Ich wollte nicht einfach nur zu Google. Ich wollte zu Google Africa.“
Ein Gespräch mit Timnit Gebru, der Gründerin von DAIR und ehemaligen Co-Leiterin des ethischen AI-Teams bei Google, veranlasste Moorosi jedoch, zu hinterfragen, ob Google die richtige Plattform für die Art von gleichheitsorientierter Arbeit war, die sie im Bereich maschinelles Lernen anstrebte. Dies führte dazu, dass sie sich DAIR anschloss, wo sie und Gebru Gemeinschaften stärken wollten, die historisch von der Technologiebranche an den Rand gedrängt wurden, indem sie lokale Experten vor Ort behielten und finanzierten.
DAIRs AI-Studie
Im Jahr 2018 begannen Moorosi, Gebru und DAIR-Mitarbeiterin Raesetje Sefala ein Projekt, um Satellitenbilder südafrikanischer Townships – historisch von schwarzen Bewohnern bewohnte Arbeiterviertel – zu analysieren. Ihr Ziel war es, zu verstehen, wie sich diese Gebiete seit dem Ende der Apartheid entwickelt haben. Sie stellten einen Datensatz zusammen, um zu bewerten, ob sich die Lebensqualität für die Bewohner der Townships im Laufe der Zeit verbessert hat.
Südafrikanische Townships, die sich am Stadtrand befinden, leiden oft unter Unterentwicklung und schlechteren Lebensbedingungen im Vergleich zu wohlhabenderen Vororten. Die Volkszählungsdaten der Regierung, die tendenziell wohlhabendere Gebiete bevorzugen, haben die Daten der Townships nahezu unsichtbar gemacht, was räumliche Apartheid aufrechterhält und den Zugang zu grundlegenden Dienstleistungen wie Gesundheitsversorgung, Bildung und Grünflächen einschränkt.
DAIRs Forschung stand vor Herausforderungen aufgrund der Einschränkungen bestehender südafrikanischer AI-Modelle, die Schwierigkeiten hatten, Townships von Vororten zu unterscheiden. Um dies zu überwinden, nutzten die Forscher Millionen von Satellitenbildern und Geodaten, um Modelle für maschinelles Lernen zu trainieren. Diese Modelle konnten Gebiete erfolgreich in wohlhabende, nicht wohlhabende und nicht residenzielle Gebäudekluster wie unbebautes Land oder Industriezonen kategorisieren.
Trotz dieser Bemühungen stieß DAIR auf Widerstand, als sie ihre Ergebnisse veröffentlichen wollten. Überwiegend weiße westliche akademische Institutionen kritisierten die Studie als lediglich geografisch anstelle von Forschung zum maschinellen Lernen. Moorosi äußerte Frustration: „Wir verwenden dieselben Metriken, Algorithmen und Kommunikationsmethoden, einschließlich Diagrammen und allem. Es ist so verrückt, weil damals viele Spielzeugdatensätze verwendet wurden, aber wir hatten diesen Datensatz über tatsächliche Dinge, und er war zu speziell.“
Dennoch betonte Moorosi die Relevanz der Studie: „Diese Verfolgung, wie historische Segregation unser Leben beeinflusst, ist in vielen ehemaligen britischen Kolonien präsent. Es ist in Nairobi. Es ist in Lagos. In den Kolonien war es Standard, dass die weißen Menschen dort lebten und die schwarzen Menschen dort. Und die Verteilung der Ressourcen war unterschiedlich zwischen dort und dort.“
Sie hob hervor, dass der Inhalt der Studie, nicht ihre Qualität, ihre Anerkennung in einer von westlichen Ländern dominierten Branche zu untergraben schien.
Versorgung unterversorgter Gemeinschaften
Asmelash Teka Hadgu, Mitbegründer und CTO von Lesan AI sowie Forschungsfellow bei DAIR, unterstrich diesen Punkt weiter. Er sprach über Lesan, ein Werkzeug, das für die Übersetzung und Transkription indigener afrikanischer Sprachen entwickelt wurde. Im Gegensatz zu US-amerikanischen Technologieriesen konzentriert sich Lesan AI auf Sprachen mit geringen Ressourcen wie Amharisch und Tigrinya. Hadgus persönliche Verbindung zu diesen Sprachen ermöglichte es ihm, einen robusten Datensatz zu erstellen, indem er lokale Zeitungs- und Radiomaterialien wiederverwendete.
Im afrikanischen Kontext bleiben populäre Sprachmodelle von Technologieriesen wie OpenAI und Anthropic bei der Darstellung der vieldigkeitsreichen Sprachenlandschaft des Kontinents zurück. Laut dem Papier von Wei Rui Chen, Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability, erhalten afrikanische Sprachen die geringste Unterstützung. „OpenAI's ChatGPT ist völlig kaputt, nicht nur leicht falsch, sondern erzeugt Kauderwelsch in Sprachen wie Amharisch und Tigrinya“, bemerkte Hadgu. „Dennoch setzen sie weiterhin auf diese alte Denkweise, die darauf abzielt, zuerst Lösungen für Englisch zu finden. Und davon ausgehen, dass andere Sprachen aufholen werden.“
Lesan zielt darauf ab, diese Lücke zu schließen, indem es genaue Übersetzungen für Millionen von Nutzern bereitstellt und Webinhalte für diese Gemeinschaften zugänglich macht. Hadgu betonte, dass diese Sprachen keine bloßen Zusatzleistungen sind: „Wir verwenden nicht 95 % unserer Ressourcen für eine Handvoll Sprachen und arbeiten dann an dem, was sie als Long-Tail-Sprachen bezeichnen.“
Westliche AI-Unternehmen haben Schwierigkeiten, Sprachen mit geringen Ressourcen angemessen zu repräsentieren, da diese Sprachen online weniger verfügbar sind, insbesondere im Vergleich zu englisch dominierten Inhalten. Zudem stammen die Daten, die zum Trainieren von AI-Modellen verwendet werden, überwiegend aus Europa und Nordamerika, wobei nur ein kleiner Bruchteil aus Afrika kommt, laut einer Studie der Data Provenance Initiative.
Hadgu kritisierte den Ansatz von Projekten wie Facebooks No Language Left Behind, das er als abhängig von „Convenience“-Datenabfragen und automatisierten Methoden beschrieb. Er stellte fest, dass afrikanische Sprachen im Vergleich zu englisch fokussierten Initiativen nur minimale Finanzierung erhalten. Bloomberg berichtete, dass Orange SA in Zusammenarbeit mit OpenAI und Meta Platforms Inc. daran arbeitet, AI-Programme auf afrikanische Sprachen wie Wolof, Pulaar und Bambara zu trainieren.
Viele afrikanische Sprachen basieren jedoch auf Tonsystemen und mündlichen Traditionen, die von westlichen LLMs oft übersehen werden. Hadgu betonte die Bedeutung der Einbindung von Ältesten und Gemeindemitgliedern, um eine genaue Repräsentation lokaler Kontexte sicherzustellen.
Selbst wenn große Technologieunternehmen mit kleineren AI-Startups zusammenarbeiten, um sprachspezifische Modelle zu entwickeln, nutzen sie oft Open-Source-Arbeiten aus, um Ideen und Ressourcen zu gewinnen. Georg Zoeller vom Centre for AI Leadership in Singapur hob dieses Problem hervor: „Durch die Open-Sourcing grundlegender AI-Werkzeuge haben Hyperscaler es Startups ermöglicht, Produkte in diesem Bereich zu entwickeln und sie als primäre Quelle für Produkt-Forschung und -Entwicklung zu nutzen, um interne Teams zu ersetzen.“
Dr. Paul Azunre, Mitbegründer von Ghana NLP, teilte seine Erfahrungen über große Unternehmen, die Daten ohne Entschädigung nutzen. Nachdem Facebook ihre Daten für ein Open-Source-Modell verwendet hatte, wandten sie sich an Ghana NLP für Fördervorschläge. „Als Facebook zu uns kam, nachdem sie ein Modell veröffentlicht hatten, das Open Source war und auf unseren Daten basierte, machten sie einen offenen Aufruf für Vorschläge. Sie kamen zu uns und sagten: ‚Warum reichen Sie keinen Fördervorschlag ein?‘ Und wir sagten: ‚Nun, Sie nutzen bereits unsere Arbeit.‘ ‚Was müssen wir Ihnen also noch beweisen? Zahlen Sie uns einfach‘“, berichtete Azunre.
Ghana NLP konzentriert sich darauf, die Lücke in Softwareprodukten wie Google Translate zu schließen, indem es Spracherkennung, Text-to-Speech und Speech-to-Text-Übersetzungen in lokalen Sprachen wie Twi, Ewe, Yoruba, Fante und Ga entwickelt, mit Plänen, in Nachbarländer zu expandieren. Azunre betonte die Wichtigkeit, lokale Gemeinschaften zu priorisieren: „Als Entwickler, der versucht, selbsttragende Produkte zu schaffen, verstehe ich, warum bestimmte Produkte oder Projekte auf eine bestimmte Weise priorisiert werden. Wir werden zuerst Twi herausbringen, weil wir in Ghana 30 Millionen Twi-Sprecher haben… aber der Unterschied zwischen dem, was wir tun, und den Technologieriesen ist, dass für uns das leitende Prinzip ist, dass die Einheimischen oberste Priorität haben.“
Er betonte die Notwendigkeit, Arbeitsplätze und die Kontrolle über Daten in den Gemeinschaften zu halten, aus denen das Wissen extrahiert wird, und plädierte für die Datensouveränität der Gemeinschaften sowie die Schaffung lokaler Datenquellen, um afrikanische Gemeinschaften zu stärken und ihre sprachliche und kulturelle Identität in AI-Lösungen zu bewahren.
Was kommt als Nächstes für AI in Afrika
Die Technologie-Governance-Forscherin Chinasa T. Okolo stellte fest, dass mehrere afrikanische Regierungen AI-Governance-Rahmenwerke entwickeln, um dem Einfluss multinationaler Konzerne entgegenzuwirken. Sieben afrikanische Länder haben nationale AI-Strategien entworfen, obwohl noch keine formellen AI-Regulierungsstrategien umgesetzt haben. Die südafrikanische Regierung hat einen Nationalen AI-Politikrahmen veröffentlicht, um einen gerechten Zugang zu AI-Technologien zu gewährleisten, insbesondere in unterversorgten und ländlichen Gebieten. Zudem haben 36 afrikanische Länder Datenschutzregelungen eingeführt, die den Weg für umfassendere AI-Regulierungsrahmen ebnen.
In der Zwischenzeit beginnen westliche AI-Unternehmen, sich auf regionale spezifische LLMs zu konzentrieren, wie Mistral’s Modell für arabischsprachige Länder in der MENA-Region und Metas Erweiterung von Meta AI zur Unterstützung arabischsprachiger Nutzer. Die Parallelen zwischen kolonialer Ausbeutung und den aktuellen Trends in der AI-Entwicklung werden jedoch immer offensichtlicher. Karen Hao vom MIT Tech Review wies darauf hin: „Während es die Tiefe vergangener Traumata mindern würde zu sagen, dass die AI-Branche heute die exakten Modalitäten kolonialer Gewalt wiederholt, nutzt sie nun andere, heimtückischere Mittel, um die Reichen und Mächtigen auf Kosten der Armen zu bereichern.“
Verwandter Artikel
Hawaiianische Strand-Eskapaden: Neue Bindungen und überraschende Wendungen
Stellen Sie sich vor, Sie liegen an einem unberührten hawaiianischen Strand, die Sonne wärmt Ihre Haut, die Wellen erzeugen einen beruhigenden Rhythmus. Für Josh wurde diese Vision nach Jahren der Hi
Ozzy Osbournes animiertes Video "Crazy Train": Ein tiefer Einblick in seine Kunst und Wirkung
Crazy Train" von Ozzy Osbourne ist nicht nur ein Klassiker des Heavy Metal, sondern auch ein kultureller Meilenstein. Das animierte Musikvideo bietet eine beeindruckende visuelle Reise, die die rohe
EleutherAI stellt riesigen lizenzierten Textdatensatz für KI-Training vor
EleutherAI, eine führende KI-Forschungsgruppe, hat eine der größten Sammlungen lizenzierter und gemeinfreier Texte für das Training von KI-Modellen veröffentlicht.Der Datensatz namens Common Pile v0.1
Kommentare (42)
0/200
WillieJohnson
26. August 2025 07:25:25 MESZ
AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍
0
DavidLewis
4. August 2025 08:01:00 MESZ
It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔
0
JustinJackson
23. April 2025 20:47:47 MESZ
AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀
0
WilliamAllen
22. April 2025 21:37:38 MESZ
AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀
0
CharlesWhite
22. April 2025 04:11:35 MESZ
¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍
0
JackPerez
21. April 2025 20:15:34 MESZ
Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍
0
Seit der Einführung von OpenAI's ChatGPT im Jahr 2022 hat sich künstliche Intelligenz (AI) tief in das Gefüge unseres täglichen Lebens eingewoben. Doch oft liegt der Fokus auf AI-Produkten, die mit Blick auf amerikanische und europäische Zielgruppen entwickelt wurden, obwohl sie als universelle Werkzeuge gelten, die den Zugang zu Technologie demokratisieren. Von den Anwendungen, die sie unterstützen, bis zu den Sprachen, die sie bedienen, sind diese Werkzeuge nicht immer so global, wie sie erscheinen.
In ganz Afrika setzen Forscher und Technologen diesem Trend entgegen, fordern den Status quo heraus und hinterfragen die umfassenderen Machtstrukturen innerhalb der AI-Branche. Ihre Arbeit zielt darauf ab, den Fokus auf Lösungen zu verlagern, die wirklich auf lokale Bedürfnisse und Gemeinschaften zugeschnitten sind.
Ein globales Ungleichgewicht der AI-Macht
Das Distributed AI Research Institute (DAIR) steht als Leuchtfeuer des Wandels, ein internationales Kollektiv, das sich der „unabhängigen und gemeinschaftsverwurzelten AI-Forschung widmet, frei von dem allgegenwärtigen Einfluss großer Technologieunternehmen“. Ich hatte die Gelegenheit, mit DAIR-Mitgliedern zu sprechen, die AI-Lösungen speziell für afrikanische Kontexte entwickeln und gesellschaftliche Bedürfnisse ansprechen, anstatt den Interessen multinationaler Konzerne oder überwiegend westlicher Nutzer zu dienen.
Nyalleng Moorosi, eine leitende Forscherin bei DAIR mit Sitz in Lesotho und Gründungsmitglied von Deep Learning Indaba, ist eine solche Pionierin. Ihr Hintergrund im Bereich maschinelles Lernen und ihre Erfahrung als Lehrerin an südafrikanischen öffentlichen Schulen haben ihre Ansichten über Gleichberechtigung in der Technologie geprägt. Als ehemalige Dozentin an der University of Forte – einer der wenigen Universitäten in Südafrika, die während der Apartheid schwarze Studierende aufnahm – erlebte sie hautnah, wie Armut die Bildungswege der Studierenden beeinflusste. „Es war überwältigend, sich vorzustellen, die Dinge, die ich während meines Grund- und Aufbaustudiums tat, unter solcher Unsicherheit zu bewältigen“, reflektierte sie.
Nach ihrer Tätigkeit als Lehrerin trat Moorosi als eine der ersten Mitarbeiterinnen dem Google Africa AI-Forschungslabor in Ghana bei. Ihre Rolle als Softwareingenieurin ermöglichte es ihr, Methoden und Technologien zu entwickeln, die auf verantwortungsvolle AI-Entwicklung abzielen. „Ich bin zu Google gegangen, weil sie ein Büro in Afrika eröffneten, und ich wollte in Afrika sein“, erklärte Moorosi. „Ich wollte nicht einfach nur zu Google. Ich wollte zu Google Africa.“
Ein Gespräch mit Timnit Gebru, der Gründerin von DAIR und ehemaligen Co-Leiterin des ethischen AI-Teams bei Google, veranlasste Moorosi jedoch, zu hinterfragen, ob Google die richtige Plattform für die Art von gleichheitsorientierter Arbeit war, die sie im Bereich maschinelles Lernen anstrebte. Dies führte dazu, dass sie sich DAIR anschloss, wo sie und Gebru Gemeinschaften stärken wollten, die historisch von der Technologiebranche an den Rand gedrängt wurden, indem sie lokale Experten vor Ort behielten und finanzierten.
DAIRs AI-Studie
Im Jahr 2018 begannen Moorosi, Gebru und DAIR-Mitarbeiterin Raesetje Sefala ein Projekt, um Satellitenbilder südafrikanischer Townships – historisch von schwarzen Bewohnern bewohnte Arbeiterviertel – zu analysieren. Ihr Ziel war es, zu verstehen, wie sich diese Gebiete seit dem Ende der Apartheid entwickelt haben. Sie stellten einen Datensatz zusammen, um zu bewerten, ob sich die Lebensqualität für die Bewohner der Townships im Laufe der Zeit verbessert hat.
Südafrikanische Townships, die sich am Stadtrand befinden, leiden oft unter Unterentwicklung und schlechteren Lebensbedingungen im Vergleich zu wohlhabenderen Vororten. Die Volkszählungsdaten der Regierung, die tendenziell wohlhabendere Gebiete bevorzugen, haben die Daten der Townships nahezu unsichtbar gemacht, was räumliche Apartheid aufrechterhält und den Zugang zu grundlegenden Dienstleistungen wie Gesundheitsversorgung, Bildung und Grünflächen einschränkt.
DAIRs Forschung stand vor Herausforderungen aufgrund der Einschränkungen bestehender südafrikanischer AI-Modelle, die Schwierigkeiten hatten, Townships von Vororten zu unterscheiden. Um dies zu überwinden, nutzten die Forscher Millionen von Satellitenbildern und Geodaten, um Modelle für maschinelles Lernen zu trainieren. Diese Modelle konnten Gebiete erfolgreich in wohlhabende, nicht wohlhabende und nicht residenzielle Gebäudekluster wie unbebautes Land oder Industriezonen kategorisieren.
Trotz dieser Bemühungen stieß DAIR auf Widerstand, als sie ihre Ergebnisse veröffentlichen wollten. Überwiegend weiße westliche akademische Institutionen kritisierten die Studie als lediglich geografisch anstelle von Forschung zum maschinellen Lernen. Moorosi äußerte Frustration: „Wir verwenden dieselben Metriken, Algorithmen und Kommunikationsmethoden, einschließlich Diagrammen und allem. Es ist so verrückt, weil damals viele Spielzeugdatensätze verwendet wurden, aber wir hatten diesen Datensatz über tatsächliche Dinge, und er war zu speziell.“
Dennoch betonte Moorosi die Relevanz der Studie: „Diese Verfolgung, wie historische Segregation unser Leben beeinflusst, ist in vielen ehemaligen britischen Kolonien präsent. Es ist in Nairobi. Es ist in Lagos. In den Kolonien war es Standard, dass die weißen Menschen dort lebten und die schwarzen Menschen dort. Und die Verteilung der Ressourcen war unterschiedlich zwischen dort und dort.“
Sie hob hervor, dass der Inhalt der Studie, nicht ihre Qualität, ihre Anerkennung in einer von westlichen Ländern dominierten Branche zu untergraben schien.
Versorgung unterversorgter Gemeinschaften
Asmelash Teka Hadgu, Mitbegründer und CTO von Lesan AI sowie Forschungsfellow bei DAIR, unterstrich diesen Punkt weiter. Er sprach über Lesan, ein Werkzeug, das für die Übersetzung und Transkription indigener afrikanischer Sprachen entwickelt wurde. Im Gegensatz zu US-amerikanischen Technologieriesen konzentriert sich Lesan AI auf Sprachen mit geringen Ressourcen wie Amharisch und Tigrinya. Hadgus persönliche Verbindung zu diesen Sprachen ermöglichte es ihm, einen robusten Datensatz zu erstellen, indem er lokale Zeitungs- und Radiomaterialien wiederverwendete.
Im afrikanischen Kontext bleiben populäre Sprachmodelle von Technologieriesen wie OpenAI und Anthropic bei der Darstellung der vieldigkeitsreichen Sprachenlandschaft des Kontinents zurück. Laut dem Papier von Wei Rui Chen, Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability, erhalten afrikanische Sprachen die geringste Unterstützung. „OpenAI's ChatGPT ist völlig kaputt, nicht nur leicht falsch, sondern erzeugt Kauderwelsch in Sprachen wie Amharisch und Tigrinya“, bemerkte Hadgu. „Dennoch setzen sie weiterhin auf diese alte Denkweise, die darauf abzielt, zuerst Lösungen für Englisch zu finden. Und davon ausgehen, dass andere Sprachen aufholen werden.“
Lesan zielt darauf ab, diese Lücke zu schließen, indem es genaue Übersetzungen für Millionen von Nutzern bereitstellt und Webinhalte für diese Gemeinschaften zugänglich macht. Hadgu betonte, dass diese Sprachen keine bloßen Zusatzleistungen sind: „Wir verwenden nicht 95 % unserer Ressourcen für eine Handvoll Sprachen und arbeiten dann an dem, was sie als Long-Tail-Sprachen bezeichnen.“
Westliche AI-Unternehmen haben Schwierigkeiten, Sprachen mit geringen Ressourcen angemessen zu repräsentieren, da diese Sprachen online weniger verfügbar sind, insbesondere im Vergleich zu englisch dominierten Inhalten. Zudem stammen die Daten, die zum Trainieren von AI-Modellen verwendet werden, überwiegend aus Europa und Nordamerika, wobei nur ein kleiner Bruchteil aus Afrika kommt, laut einer Studie der Data Provenance Initiative.
Hadgu kritisierte den Ansatz von Projekten wie Facebooks No Language Left Behind, das er als abhängig von „Convenience“-Datenabfragen und automatisierten Methoden beschrieb. Er stellte fest, dass afrikanische Sprachen im Vergleich zu englisch fokussierten Initiativen nur minimale Finanzierung erhalten. Bloomberg berichtete, dass Orange SA in Zusammenarbeit mit OpenAI und Meta Platforms Inc. daran arbeitet, AI-Programme auf afrikanische Sprachen wie Wolof, Pulaar und Bambara zu trainieren.
Viele afrikanische Sprachen basieren jedoch auf Tonsystemen und mündlichen Traditionen, die von westlichen LLMs oft übersehen werden. Hadgu betonte die Bedeutung der Einbindung von Ältesten und Gemeindemitgliedern, um eine genaue Repräsentation lokaler Kontexte sicherzustellen.
Selbst wenn große Technologieunternehmen mit kleineren AI-Startups zusammenarbeiten, um sprachspezifische Modelle zu entwickeln, nutzen sie oft Open-Source-Arbeiten aus, um Ideen und Ressourcen zu gewinnen. Georg Zoeller vom Centre for AI Leadership in Singapur hob dieses Problem hervor: „Durch die Open-Sourcing grundlegender AI-Werkzeuge haben Hyperscaler es Startups ermöglicht, Produkte in diesem Bereich zu entwickeln und sie als primäre Quelle für Produkt-Forschung und -Entwicklung zu nutzen, um interne Teams zu ersetzen.“
Dr. Paul Azunre, Mitbegründer von Ghana NLP, teilte seine Erfahrungen über große Unternehmen, die Daten ohne Entschädigung nutzen. Nachdem Facebook ihre Daten für ein Open-Source-Modell verwendet hatte, wandten sie sich an Ghana NLP für Fördervorschläge. „Als Facebook zu uns kam, nachdem sie ein Modell veröffentlicht hatten, das Open Source war und auf unseren Daten basierte, machten sie einen offenen Aufruf für Vorschläge. Sie kamen zu uns und sagten: ‚Warum reichen Sie keinen Fördervorschlag ein?‘ Und wir sagten: ‚Nun, Sie nutzen bereits unsere Arbeit.‘ ‚Was müssen wir Ihnen also noch beweisen? Zahlen Sie uns einfach‘“, berichtete Azunre.
Ghana NLP konzentriert sich darauf, die Lücke in Softwareprodukten wie Google Translate zu schließen, indem es Spracherkennung, Text-to-Speech und Speech-to-Text-Übersetzungen in lokalen Sprachen wie Twi, Ewe, Yoruba, Fante und Ga entwickelt, mit Plänen, in Nachbarländer zu expandieren. Azunre betonte die Wichtigkeit, lokale Gemeinschaften zu priorisieren: „Als Entwickler, der versucht, selbsttragende Produkte zu schaffen, verstehe ich, warum bestimmte Produkte oder Projekte auf eine bestimmte Weise priorisiert werden. Wir werden zuerst Twi herausbringen, weil wir in Ghana 30 Millionen Twi-Sprecher haben… aber der Unterschied zwischen dem, was wir tun, und den Technologieriesen ist, dass für uns das leitende Prinzip ist, dass die Einheimischen oberste Priorität haben.“
Er betonte die Notwendigkeit, Arbeitsplätze und die Kontrolle über Daten in den Gemeinschaften zu halten, aus denen das Wissen extrahiert wird, und plädierte für die Datensouveränität der Gemeinschaften sowie die Schaffung lokaler Datenquellen, um afrikanische Gemeinschaften zu stärken und ihre sprachliche und kulturelle Identität in AI-Lösungen zu bewahren.
Was kommt als Nächstes für AI in Afrika
Die Technologie-Governance-Forscherin Chinasa T. Okolo stellte fest, dass mehrere afrikanische Regierungen AI-Governance-Rahmenwerke entwickeln, um dem Einfluss multinationaler Konzerne entgegenzuwirken. Sieben afrikanische Länder haben nationale AI-Strategien entworfen, obwohl noch keine formellen AI-Regulierungsstrategien umgesetzt haben. Die südafrikanische Regierung hat einen Nationalen AI-Politikrahmen veröffentlicht, um einen gerechten Zugang zu AI-Technologien zu gewährleisten, insbesondere in unterversorgten und ländlichen Gebieten. Zudem haben 36 afrikanische Länder Datenschutzregelungen eingeführt, die den Weg für umfassendere AI-Regulierungsrahmen ebnen.
In der Zwischenzeit beginnen westliche AI-Unternehmen, sich auf regionale spezifische LLMs zu konzentrieren, wie Mistral’s Modell für arabischsprachige Länder in der MENA-Region und Metas Erweiterung von Meta AI zur Unterstützung arabischsprachiger Nutzer. Die Parallelen zwischen kolonialer Ausbeutung und den aktuellen Trends in der AI-Entwicklung werden jedoch immer offensichtlicher. Karen Hao vom MIT Tech Review wies darauf hin: „Während es die Tiefe vergangener Traumata mindern würde zu sagen, dass die AI-Branche heute die exakten Modalitäten kolonialer Gewalt wiederholt, nutzt sie nun andere, heimtückischere Mittel, um die Reichen und Mächtigen auf Kosten der Armen zu bereichern.“




AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍




It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔




AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀




AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀




¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍




Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍












