вариант
Дом
Новости
ИИ для всего мира или только запад? Как исследователи справляются с глобальными пробелами Big Tech

ИИ для всего мира или только запад? Как исследователи справляются с глобальными пробелами Big Tech

12 апреля 2025 г.
109

ИИ для всего мира или только запад? Как исследователи справляются с глобальными пробелами Big Tech

С момента запуска ChatGPT от OpenAI в 2022 году искусственный интеллект (AI) глубоко интегрировался в ткань нашей повседневной жизни. Однако внимание часто сосредотачивается на продуктах AI, разработанных с учетом американской и европейской аудитории, несмотря на заявления о том, что это универсальные инструменты, демократизирующие доступ к технологиям. От приложений, которые они обслуживают, до языков, которые они поддерживают, эти инструменты не всегда так глобальны, как кажется.

По всей Африке исследователи и технологи выступают против этой тенденции, бросая вызов статус-кво и более широкой динамике власти в индустрии AI. Их работа направлена на смещение акцента в сторону решений, которые действительно удовлетворяют местные потребности и сообщества.

Глобальный дисбаланс в сфере AI

Институт распределенных исследований AI (DAIR) выступает маяком перемен, международным коллективом, посвященным "независимым и укорененным в сообществе исследованиям AI, свободным от всепроникающего влияния крупных технологических компаний." У меня была возможность поговорить с членами DAIR, которые разрабатывают решения AI, специально адаптированные для африканских контекстов, решая общественные потребности, а не интересы многонациональных корпораций или преимущественно западных пользователей.

Ньялленг Муроси, старший исследователь DAIR, базирующийся в Лесото, и один из основателей Deep Learning Indaba, является одним из таких первопроходцев. Ее опыт в области машинного обучения и преподавания в государственных школах Южной Африки сформировал ее взгляды на равенство в технологиях. Как бывший преподаватель Университета Форте — одного из немногих университетов в Южной Африке, принимавших чернокожих студентов во времена апартеида, — она на собственном опыте видела, как бедность влияла на образовательный путь студентов. "Было ошеломляюще представлять, как я проходила бакалавриат и магистратуру, будучи обремененной такой неуверенностью," — размышляла она.

После преподавания Муроси присоединилась к Google в качестве одного из первых сотрудников исследовательской лаборатории Google Africa AI в Гане. Ее роль инженера-программиста позволила ей разрабатывать методологии и технологии, направленные на ответственное развитие AI. "Я присоединилась к Google, потому что они открывали офис в Африке, и я хотела быть в Африке," — объяснила Муроси. "Я не просто хотела работать в Google. Я хотела работать в Google Africa."

Однако беседа с Тимнит Гебру, основателем DAIR и бывшим со-руководителем команды Google по этике AI, заставила Муроси задуматься, является ли Google подходящей платформой для той работы, ориентированной на равенство, которую она представляла в области машинного обучения. Это привело ее к присоединению к DAIR, где она и Гебру стремились расширить возможности сообществ, исторически оттесненных технологической индустрией, сохраняя и финансируя местных экспертов на местах.

Исследование AI от DAIR

В 2018 году Муроси, Гебру и сотрудник DAIR Раэсетже Сефала начали проект по анализу спутниковых изображений южноафриканских городков — исторически рабочих кварталов, населенных чернокожими жителями. Их целью было понять, как эти районы развивались после окончания апартеида. Они собрали набор данных, чтобы оценить, улучшилось ли качество жизни жителей городков со временем.

Южноафриканские городки, расположенные на окраинах городов, часто страдают от недоразвитости и худших условий жизни по сравнению с более богатыми пригородами. Государственные данные переписи, которые склоняются в пользу более состоятельных районов, сделали данные о городках практически невидимыми, увековечивая пространственный апартеид и ограничивая доступ к основным услугам, таким как здравоохранение, образование и зеленые зоны.

Исследования DAIR столкнулись с трудностями из-за ограничений существующих южноафриканских моделей AI, которые с трудом различали городки и пригороды. Чтобы преодолеть это, исследователи использовали миллионы спутниковых изображений и геопространственных данных для обучения моделей машинного обучения. Эти модели успешно классифицировали районы на богатые, небогатые и нежилые кластеры зданий, включая пустующие земли или промышленные зоны.

Несмотря на эти усилия, DAIR столкнулась с сопротивлением при попытке опубликовать свои результаты. Преимущественно белые западные академические институты критиковали исследование как чисто географическое, а не исследование в области машинного обучения. Муроси выразила разочарование: "Мы используем те же метрики, алгоритмы и методы коммуникации, включая графики и все остальное. Это так безумно, потому что тогда использовались многие игрушечные наборы данных, но у нас был этот набор данных о реальных вещах, и он был слишком нишевым."

Тем не менее, Муроси подчеркнула актуальность исследования: "Это отслеживание того, как историческая сегрегация влияет на нашу жизнь, присутствует во многих бывших британских колониях. Это в Найроби. Это в Лагосе. В колониях было стандартным, что белые люди жили там, а черные — там. И распределение ресурсов отличалось между там и там."

Она отметила, что содержание исследования, а не его качество, казалось, подрывало его признание в индустрии, доминируемой Западом.

Обеспечение поддержки для недообслуженных сообществ

Асмелаш Тека Хадгу, сооснователь и технический директор Lesan AI, а также исследователь DAIR, дополнительно подчеркнул этот момент. Он рассказал о Lesan, инструменте, разработанном для перевода и транскрипции африканских языков коренных народов. В отличие от американских технологических гигантов, Lesan AI сосредотачивается на языках с низкими ресурсами, таких как амхарский и тигринья. Личная связь Хадгу с этими языками позволила ему создать надежный набор данных, используя переработанный контент местных газет и радио.

В африканском контексте популярные языковые модели от технологических гигантов, таких как OpenAI и Anthropic, не справляются с представлением разнообразного языкового ландшафта континента. Согласно статье Вэй Жуй Чена, Fumbling in Babel: Исследование способности ChatGPT к идентификации языков, африканские языки получают наименьшую поддержку. "ChatGPT от OpenAI совершенно сломан, не просто немного ошибается, а создает бессмыслицу на языках, таких как амхарский и тигринья," — отметил Хадгу. "Тем не менее, они продолжают придерживаться старого подхода, который сосредотачивается на поиске решений для английского языка в первую очередь. И предполагают, что другие языки догонят."

Lesan стремится преодолеть этот разрыв, предоставляя точные переводы для миллионов пользователей, открывая веб-контент для этих сообществ. Хадгу подчеркнул, что эти языки — не просто дополнения: "Мы не тратим 95% наших ресурсов на горстку языков, а затем работаем над тем, что они называют языками с длинным хвостом."

Западные компании AI с трудом представляют языки с низкими ресурсами, потому что эти языки менее доступны для сбора данных в Интернете, особенно по сравнению с контентом, доминируемым английским языком. Кроме того, данные, используемые для обучения моделей AI, преимущественно поступают из Европы и Северной Америки, с лишь небольшой долей из Африки, согласно исследованию Data Provenance Initiative.

Хадгу раскритиковал подход проектов, таких как No Language Left Behind от Facebook, который, по его словам, полагается на "удобный" сбор данных и автоматизированные методы. Он отметил, что африканские языки получают минимальное финансирование по сравнению с инициативами, ориентированными на английский язык. Bloomberg сообщил, что Orange SA в сотрудничестве с OpenAI и Meta Platforms Inc. работает над обучением программ AI на африканских языках, таких как волоф, пулаар и бамбара.

Однако многие африканские языки полагаются на тональные системы и устные традиции, которые часто игнорируются западными большими языковыми моделями (LLM). Хадгу подчеркнул важность вовлечения старейшин и членов сообщества для обеспечения точного представления местных контекстов.

Даже когда крупные технологические компании сотрудничают с небольшими стартапами AI для разработки языковых моделей, они часто эксплуатируют работы с открытым исходным кодом, чтобы захватить идеи и ресурсы. Георг Золлер из Центра лидерства в области AI в Сингапуре отметил эту проблему: "Открывая базовые инструменты для AI, гипермасштабируемые компании позволили стартапам создавать продукты в этой области и использовали это для замены внутренних команд в качестве основного источника исследований и разработок продуктов."

Доктор Пол Азуне, сооснователь Ghana NLP, поделился своим опытом, когда крупные компании присваивали данные без компенсации. После того, как Facebook использовал их данные для модели с открытым исходным кодом, они обратились к Ghana NLP с предложением о финансировании. "Как только Facebook пришел к нам после того, как они выпустили модель, которая была с открытым исходным кодом и была построена на наших данных. Затем они проводили открытый конкурс предложений. Они пришли к нам и сказали: 'Почему бы вам не подать заявку на финансирование?' И мы сказали: 'Ну, вы уже используете нашу работу.' 'Так что еще нам нужно вам доказать? Просто заплатите нам,'" — рассказал Азуне.

Ghana NLP сосредотачивается на заполнении пробела в программных продуктах, таких как Google Translate, разрабатывая распознавание речи, преобразование текста в речь и перевод речи в текст на местных языках, таких как тви, эве, йоруба, фанте и га, с планами расширения в соседние страны. Азуне подчеркнул важность приоритизации местных сообществ: "Как разработчик, который пытается создавать самоокупаемые продукты, я понимаю, почему определенные продукты или проекты приоритизируются определенным образом. Мы собираемся выпустить тви первыми, потому что в Гане у нас 30 миллионов носителей тви… но разница между тем, что мы делаем, и технологическими гигантами в том, что для нас руководящим принципом является то, что местные жители находятся в приоритете."

Он подчеркнул необходимость сохранения рабочих мест и контроля над данными в сообществах, из которых извлекаются знания, выступая за суверенитет данных сообщества и создание местных источников данных для расширения возможностей африканских сообществ и сохранения их языковой и культурной идентичности в решениях AI.

Что дальше для AI в Африке

Исследователь в области технологического управления Чинаса Т. Около отметила, что несколько африканских правительств разрабатывают рамки управления AI для противодействия влиянию многонациональных корпораций. Семь африканских стран разработали национальные стратегии AI, хотя ни одна из них еще не внедрила формальные стратегии регулирования AI. Правительство Южной Африки выпустило Национальную рамочную политику AI для обеспечения равного доступа к технологиям AI, особенно в недообслуженных и сельских районах. Кроме того, 36 африканских стран установили регулирование защиты данных, прокладывая путь к более всеобъемлющим рамкам регулирования AI.

Между тем, западные компании AI начинают сосредотачиваться на региональных языковых моделях, таких как модель Mistral для арабскоязычных стран региона MENA и расширение Meta AI для поддержки арабскоязычных пользователей. Однако параллели между колониальной эксплуатацией и текущими тенденциями развития AI становятся все более очевидными. Карен Хао из MIT Tech Review отметила: "Хотя было бы преуменьшением глубины прошлых травм сказать, что индустрия AI повторяет точные модальности колониального насилия сегодня, она теперь использует другие, более коварные средства для обогащения богатых и влиятельных за счет бедных."

Связанная статья
Гавайские пляжные эскапады: Новые связи и неожиданные повороты Гавайские пляжные эскапады: Новые связи и неожиданные повороты Представьте себя на чистейшем гавайском пляже, солнечные лучи согревают вашу кожу, а волны создают успокаивающий ритм. Для Джоша это видение стало реальностью после многих лет самоотверженной работы.
Анимационное видео Оззи Осборна Анимационное видео Оззи Осборна "Crazy Train": Глубокое погружение в его искусство и влияние Песня Оззи Осборна "Crazy Train" выходит за рамки статуса классики хэви-метала и становится вехой в истории культуры. Анимационный клип на эту песню представляет собой поразительное визуальное путеше
EleutherAI представляет массивный лицензированный текстовый набор данных для обучения ИИ EleutherAI представляет массивный лицензированный текстовый набор данных для обучения ИИ EleutherAI, ведущая группа исследований ИИ, запустила одну из крупнейших коллекций лицензированных и общедоступных текстов для обучения моделей ИИ.Названный Common Pile v0.1, этот набор данных объемом
Комментарии (42)
WillieJohnson
WillieJohnson 26 августа 2025 г., 8:25:25 GMT+03:00

AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍

DavidLewis
DavidLewis 4 августа 2025 г., 9:01:00 GMT+03:00

It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔

JustinJackson
JustinJackson 23 апреля 2025 г., 21:47:47 GMT+03:00

AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀

WilliamAllen
WilliamAllen 22 апреля 2025 г., 22:37:38 GMT+03:00

AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀

CharlesWhite
CharlesWhite 22 апреля 2025 г., 5:11:35 GMT+03:00

¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍

JackPerez
JackPerez 21 апреля 2025 г., 21:15:34 GMT+03:00

Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍

Вернуться к вершине
OR