谷歌推出WAXAL:非洲语音数据集助力提升人工智能数据主权

谷歌正式推出WAXAL——一个专注于非洲语言的新语音数据集。该项目涵盖阿科利语、豪萨语、卢干达语和约鲁巴语等21种语言,致力于解决人工智能系统在这些语言中长期存在的识别准确率低、错误频发的问题。
该项目主要亮点包括:
数据主权回归:不同于早期由大型企业主导的数据集,WAXAL数据集完全归属参与创建的非洲机构所有,而非谷歌。
大规模专业级数据:包含逾11,000小时语音素材及近200万条录音,其中约1,250小时语音已完成转录,并提供适用于文本转语音的高品质音频资源。
推动本土创新:项目采用开放许可协议开源,允许商业使用。加纳大学等机构已利用该数据在孕产妇健康等领域开展本土化人工智能研究。
尽管面临语言复杂性与声调标记缺失等挑战,WAXAL的发布标志着非洲正从数据提供者转型为人工智能基础设施的共同拥有者。谷歌计划将项目扩展至27种语言,进一步巩固非洲在人工智能领域的地位。
相关文章
北京工业大学就包括人工智能模型上下文协议在内的121项行业标准征求公众意见
中国工业和信息化部正式发布通知,征求公众对121项行业标准化的意见,其中包括“人工智能安全治理模型上下文协议的应用安全要求”。这一公告标志着中国在建立人工智能基础标准和安全监管框架方面取得了重要进展。此次公开征求意见的重点是针对该模型上下文协议的应用安全问题,旨在通过标准化的技术规范来解决多模态交互、长文本处理以及跨平台调用过程中出现的协议兼容性和数据安全方面的问题。
OpenAI与美国国防部合作,ChatGPT的卸载数量激增了295%
公众愤怒:OpenAI的军事合作引发“卸载潮”近日,人工智能领域的领头羊OpenAI宣布与美国国防部建立了深度合作关系,将其人工智能模型整合到高度机密的军事网络中。这一消息在美国引发了广泛的用户抗议,“抵制ChatGPT”运动势头日益强劲。根据市场分析机构Sensor Tower的数据,2026年2月28日——OpenAI正式宣布这一合作的当天——美国市场上ChatGPT移动应用的卸载率比前一天激增了295%,而此前该应用的平均每日卸载率约为9%。用户们对人工智能被用于军事目的表示强烈担忧,
OpenAI 推出“Sites”功能,以基于文本的网站标志着“无代码时代”的终结
OpenAI 推出了 Sites,这是其面向软件工程的人工智能平台 Codex 的一项新功能。该功能目前处于预览阶段,仅向付费的“商业版”和“企业版”订阅用户开放,旨在消除网页和应用程序开发中的传统障碍。从本质上讲,Sites 是一个将抽象概念转化为实用工具的平台。用户可以输入概念、数据分析或项目计划,Codex 会自动将这些静态内容重构为仪表盘、日程规划器、评审工作区、项目看板以及轻量级应用程序
相关专题推荐
评论 (0)
0/500

谷歌正式推出WAXAL——一个专注于非洲语言的新语音数据集。该项目涵盖阿科利语、豪萨语、卢干达语和约鲁巴语等21种语言,致力于解决人工智能系统在这些语言中长期存在的识别准确率低、错误频发的问题。
该项目主要亮点包括:
数据主权回归:不同于早期由大型企业主导的数据集,WAXAL数据集完全归属参与创建的非洲机构所有,而非谷歌。
大规模专业级数据:包含逾11,000小时语音素材及近200万条录音,其中约1,250小时语音已完成转录,并提供适用于文本转语音的高品质音频资源。
推动本土创新:项目采用开放许可协议开源,允许商业使用。加纳大学等机构已利用该数据在孕产妇健康等领域开展本土化人工智能研究。
尽管面临语言复杂性与声调标记缺失等挑战,WAXAL的发布标志着非洲正从数据提供者转型为人工智能基础设施的共同拥有者。谷歌计划将项目扩展至27种语言,进一步巩固非洲在人工智能领域的地位。
北京工业大学就包括人工智能模型上下文协议在内的121项行业标准征求公众意见
中国工业和信息化部正式发布通知,征求公众对121项行业标准化的意见,其中包括“人工智能安全治理模型上下文协议的应用安全要求”。这一公告标志着中国在建立人工智能基础标准和安全监管框架方面取得了重要进展。此次公开征求意见的重点是针对该模型上下文协议的应用安全问题,旨在通过标准化的技术规范来解决多模态交互、长文本处理以及跨平台调用过程中出现的协议兼容性和数据安全方面的问题。
OpenAI与美国国防部合作,ChatGPT的卸载数量激增了295%
公众愤怒:OpenAI的军事合作引发“卸载潮”近日,人工智能领域的领头羊OpenAI宣布与美国国防部建立了深度合作关系,将其人工智能模型整合到高度机密的军事网络中。这一消息在美国引发了广泛的用户抗议,“抵制ChatGPT”运动势头日益强劲。根据市场分析机构Sensor Tower的数据,2026年2月28日——OpenAI正式宣布这一合作的当天——美国市场上ChatGPT移动应用的卸载率比前一天激增了295%,而此前该应用的平均每日卸载率约为9%。用户们对人工智能被用于军事目的表示强烈担忧,
OpenAI 推出“Sites”功能,以基于文本的网站标志着“无代码时代”的终结
OpenAI 推出了 Sites,这是其面向软件工程的人工智能平台 Codex 的一项新功能。该功能目前处于预览阶段,仅向付费的“商业版”和“企业版”订阅用户开放,旨在消除网页和应用程序开发中的传统障碍。从本质上讲,Sites 是一个将抽象概念转化为实用工具的平台。用户可以输入概念、数据分析或项目计划,Codex 会自动将这些静态内容重构为仪表盘、日程规划器、评审工作区、项目看板以及轻量级应用程序





首页






