选项
首页
新闻
AI为世界还是西方?研究人员如何应对Big Tech的全球差距

AI为世界还是西方?研究人员如何应对Big Tech的全球差距

2025-04-12
109

AI为世界还是西方?研究人员如何应对Big Tech的全球差距

自2022年OpenAI推出ChatGPT以来,人工智能(AI)已深深融入我们的日常生活。然而,聚光灯往往聚焦于为美国和欧洲观众设计的AI产品,尽管这些产品宣称是普及技术的通用工具。从它们服务的应用到支持的语言,这些工具并非如表面那样全球化。

在非洲,研究人员和技术专家正在对抗这一趋势,挑战现状和AI行业更广泛的权力动态。他们的工作致力于转向真正满足当地需求和社区的解决方案。

全球AI权力失衡

分布式人工智能研究所(DAIR)是变革的灯塔,这是一个致力于“独立且根植于社区的AI研究,摆脱大科技公司的普遍影响”的国际集体。我有幸与DAIR成员交谈,他们正在打造专为非洲环境定制的AI解决方案,解决社会需求,而非跨国公司或主要西方用户的利益。

Nyalleng Moorosi是DAIR的资深研究员,驻莱索托,也是Deep Learning Indaba的创始成员之一,是一位开拓者。她在机器学习方面的背景和在南非公立学校教学的经历塑造了她对技术公平的看法。作为种族隔离时期南非少数接纳黑人学生的大学之一——Forte大学的 former educator,她亲眼见证了贫困如何影响学生的教育历程。“想象在本科和研究生阶段背负如此多的不安全感做我所做的事情,真是令人难以置信,”她反思道。

在教学之后,Moorosi加入Google,成为加纳Google Africa AI研究实验室的首批员工之一。她作为软件工程师的角色使她能够开发方法和技术,以确保负责任的AI发展。“我加入Google是因为他们在非洲建了一个办公室,我想在非洲,”Moorosi解释说。“我不想只是去Google,我想去Google Africa。”

然而,与DAIR创始人、Google前伦理AI团队联合负责人Timnit Gebru的一次谈话促使Moorosi质疑Google是否是她设想在机器学习中实现公平的合适平台。这促使她加入DAIR,与Gebru一起通过保留和资助当地专家,赋予历史上被科技行业边缘化的社区权力。

DAIR的AI研究

2018年,Moorosi、Gebru和DAIR研究员Raesetje Sefala开始一个项目,分析南非乡镇的卫星图像——这些历史上由黑人居民居住的工人阶级社区。他们的目标是了解自种族隔离结束以来这些地区如何演变。他们编制了一个数据集,以评估乡镇居民的生活质量是否随时间改善。

南非乡镇位于城市郊区,通常发展不足,生活条件比富裕郊区差。政府的普查数据倾向于更富裕的地区,使乡镇数据几乎不可见,延续了空间种族隔离,限制了医疗、教育和绿色空间等基本服务的获取。

由于现有南非AI模型的局限性,DAIR的研究面临挑战,这些模型难以区分乡镇和郊区。为此,研究人员利用数百万卫星图像和地理空间数据训练机器学习模型。这些模型成功将区域分类为富裕、非富裕和非住宅建筑群,包括空地或工业区。

尽管如此,DAIR在尝试发表研究结果时遇到了阻力。主要由白人主导的西方学术机构批评这项研究仅仅是地理研究,而非机器学习研究。Moorosi表达了她的挫败感:“我们使用了相同的指标、算法和沟通方法,包括图表等。太离谱了,因为当时许多玩具数据集被使用,但我们有这个关于真实事物的数据集,却被认为太小众。”

然而,Moorosi强调了研究的意义:“这种追踪历史隔离如何影响我们生活的方式在许多前英国殖民地中存在。它在奈罗毕、拉各斯都有。在殖民地,白人住在这儿,黑人住在那儿,资源分配在这儿那儿之间是不同的。”

她指出,研究的内容而非质量似乎在西方主导的行业中削弱了其认可度。

为服务不足的社区提供支持

Lesan AI的联合创始人兼首席技术官、DAIR研究员Asmelash Teka Hadgu进一步强调了这一点。他讨论了Lesan,这是一个为翻译和转录非洲原住民语言设计的工具。与美国科技巨头不同,Lesan AI专注于低资源语言,如阿姆哈拉语和提格雷语。Hadgu与这些语言的个人联系使他能够利用本地报纸和广播内容重新构建一个强大的数据集。

在非洲背景下,来自OpenAI和Anthropic等科技巨头的流行语言模型在代表非洲大陆多样化语言景观方面表现不足。根据Wei Rui Chen的论文《在巴别塔中摸索:ChatGPT的语言识别能力研究》,非洲语言的支持最少。“OpenAI的ChatGPT完全失效,不是稍微错误,而是在阿姆哈拉语和提格雷语等语言中产生乱码,”Hadgu指出。“然而,他们仍然坚持以英语为中心寻找解决方案的旧思维方式,假设其他语言会跟上。”

Lesan旨在通过为数百万用户提供准确翻译,弥合这一差距,向这些社区开放网络内容。Hadgu强调这些语言不是附属品:“我们不会将95%的资源花在少数语言上,然后再处理他们所谓的长尾语言。”

西方AI公司在充分代表低资源语言方面面临困难,因为这些语言的在线数据较少,特别是与英语主导的内容相比。此外,根据数据来源倡议的研究,训练AI模型的数据主要来自欧洲和北美,来自非洲的仅占一小部分。

Hadgu批评了像Facebook的No Language Left Behind这样的项目,称其依赖“便利”数据抓取和自动化方法。他指出,与专注于英语的项目相比,非洲语言的资金支持微乎其微。据彭博社报道,Orange SA与OpenAI和Meta Platforms Inc.合作,致力于通过在Woolof、Pulaar和Bambara等非洲语言上训练AI程序来解决这一问题。

然而,许多非洲语言依赖音调系统和口头传统,这些往往被西方大型语言模型忽视。Hadgu强调了让长者和社区成员参与以确保准确代表当地背景的重要性。

即使大科技公司与小型AI初创公司合作开发特定语言模型,它们也常常利用开源工作来获取创意和资源。新加坡人工智能领导中心的Georg Zoeller指出:“通过开源AI的基本工具,大型企业使初创公司能够在该领域构建产品,并用它来取代内部团队作为产品研发的主要来源。”

Ghana NLP的联合创始人Paul Azunre博士分享了大公司未经补偿擅自使用数据的经历。在Facebook使用他们的数据构建开源模型后,他们联系Ghana NLP寻求资助提案。“Facebook在发布了一个基于我们数据的开源模型后找到我们,然后他们公开征集提案。他们来找我们说,‘为什么不提交一个资助提案?’我们说,‘你们已经在用我们的工作了。’‘我们还需要向你们证明什么?直接付钱给我们吧,’”Azunre回忆道。

Ghana NLP专注于填补Google Translate等软件产品的空白,开发语音识别、文本到语音和语音到文本的翻译,支持Twi、Ewe、Yoruba、Fante和Ga等本地语言,并计划扩展到邻国。Azunre强调优先考虑当地社区的重要性:“作为一名试图打造自给自足产品的开发者,我理解为什么某些产品或项目被优先考虑。我们首先推出Twi,因为在加纳我们有3000万Twi使用者……但我们与科技巨头的区别在于,对我们来说,指导原则是当地人优先。”

他强调了在知识提取的社区内保留工作和数据控制的必要性,倡导社区数据主权和创建本地数据源,以增强非洲社区的能力并在AI解决方案中保留其语言和文化身份。

非洲AI的未来

科技治理研究员Chinasa T. Okolo指出,几个非洲政府正在制定AI治理框架,以对抗跨国公司的影响。七个非洲国家已起草国家AI战略,尽管尚未实施正式的AI监管策略。南非政府发布了国家AI政策框架,以确保特别是服务不足和农村地区的AI技术公平获取。此外,36个非洲国家已建立数据保护法规,为更全面的AI监管框架铺平道路。

与此同时,西方AI公司开始关注区域特定的语言模型,例如Mistral为中东和北非地区阿拉伯语国家开发的模型,以及Meta扩展Meta AI以支持阿拉伯语用户。然而,殖民剥削与当前AI发展趋势之间的相似性日益明显。MIT科技评论的Karen Hao指出:“虽然说AI行业今天完全重复了殖民暴力的模式会淡化过去创伤的深度,但它现在正以其他更隐秘的方式使富人和强者受益,而以穷人为代价。”

相关文章
夏威夷海滩逍遥游:新的纽带和令人惊喜的转折 夏威夷海滩逍遥游:新的纽带和令人惊喜的转折 想象自己置身于纯净的夏威夷海滩,阳光温暖着你的肌肤,海浪谱写出平静的节奏。对于乔希来说,经过多年的努力,这一愿景终于变成了现实。从宁静的度假开始,很快就变成了一段充满新友谊和意外转折的惊险旅程。在夏威夷迷人的海岸线上,您将沉浸在这个关于联系、海滨乐趣和意外变化的迷人故事中。精彩内容乔希来到夏威夷,实现了多年来的梦想。与塞林的意外相遇在海滩上擦出了新友谊的火花。塞林欢迎乔希加入她的海滩俱乐
奥兹-奥斯本的《疯狂列车》动画视频:深入探究其艺术和影响 奥兹-奥斯本的《疯狂列车》动画视频:深入探究其艺术和影响 奥兹-奥斯本(Ozzy Osbourne)的《疯狂列车》超越了其重金属经典的地位,体现了一个文化里程碑。其动画音乐录影带带来了一次震撼人心的视觉之旅,增强了歌曲的原始能量和主题深度。本文探讨了该视频的艺术选择、核心信息和持久影响力。主要亮点疯狂列车》视频采用大胆的黑白素描风格动画。它探讨了精神错乱、社会恐惧和战争徒劳无益等主题。通过生动的漫画和象征手法,奥兹-奥斯本的形象更加鲜明。视觉
EleutherAI发布大规模许可文本数据集用于AI训练 EleutherAI发布大规模许可文本数据集用于AI训练 EleutherAI,一个领先的AI研究组织,推出了一套最大的许可和开放领域文本集合,用于AI模型训练。名为Common Pile v0.1的这个8TB数据集,经过两年时间与AI初创公司Poolside、Hugging Face以及多家学术机构合作开发。它被用来训练EleutherAI的两个新模型,Comma v0.1-1T和Comma v0.1-2T,该组织声称这些模型的性能可与使用未经许可的版
评论 (42)
0/200
WillieJohnson
WillieJohnson 2025-08-26 13:25:25

AI's global reach sounds grand, but it’s mostly a Western party. Cool to see researchers poking at Big Tech's blind spots—hope they dig deeper! 🌍

DavidLewis
DavidLewis 2025-08-04 14:01:00

It's wild how AI like ChatGPT seems so universal but mostly caters to Western vibes. Kinda makes you wonder if the 'global' tag is just marketing fluff. Are we ever gonna see AI that truly gets the rest of the world? 🤔

JustinJackson
JustinJackson 2025-04-24 02:47:47

AI para o mundo ou só para o Ocidente? É legal que a AI esteja em todos os lugares agora, mas por que parece sempre feita para americanos e europeus? Queria que focassem mais em torná-la realmente global. Ainda assim, é um passo na direção certa! 🌍👀

WilliamAllen
WilliamAllen 2025-04-23 03:37:38

AI for the world? More like AI for the West! It's cool that AI is everywhere now, but why does it always seem tailored for American and European folks? I wish there was more focus on making it truly global. Still, it's a step in the right direction! 🌍👀

CharlesWhite
CharlesWhite 2025-04-22 10:11:35

¡Lectura interesante sobre el impacto global de la IA! Es genial ver a los investigadores abordando las brechas en la tecnología, pero es frustrante ver tanto enfoque aún en Occidente. Necesitamos más herramientas diseñadas para todos, no solo para los sospechosos habituales. ¡Sigan empujando por una IA verdaderamente global, chicos! 🌍

JackPerez
JackPerez 2025-04-22 02:15:34

Leitura interessante sobre o impacto global da IA! É ótimo ver pesquisadores abordando as lacunas na tecnologia, mas é frustrante ver tanto foco ainda no Ocidente. Precisamos de mais ferramentas projetadas para todos, não apenas para os suspeitos habituais. Continuem empurrando por uma IA verdadeiramente global, pessoal! 🌍

返回顶部
OR