中美人工智能竞争差距缩小，但对“负责任的人工智能”的看法仍存分歧

首页

新闻

2026-05-08

HarryGonzalez

# artificial intelligence # ai safety # ai governance # AI benchmarks # AI Incidents # AI Index 2026 # ai regulation # ai research # Public Opinion # responsible ai # Stanford HAI # US China AI

数据并不能有力地支持美国在人工智能模型性能方面将长期保持领先地位这一假设，这只是斯坦福大学本周发布的《2026年人工智能指数报告》中诸多发人深省的结论之一。

这份由斯坦福大学以人为本人工智能研究所发布的423页年度报告，对人工智能领域进行了全面评估。报告考察了研究成果、模型能力、投资趋势、公众舆论以及负责任的人工智能实践，揭示了若干引人注目的核心发现。

然而，最具深意的洞见却隐藏在那些鲜少被关注的章节中，尤其是关于AI安全的部分——在该领域，模型能力与严谨的危害评估之间的差距非但未缩小，反倒进一步拉大。

尽管如此，仍有三项关键发现值得更多关注。

中美模型性能差距已实质性缩小

关于美国在人工智能发展中占据明显领先地位的论述需要修正。报告显示，自2025年初以来，中美两国的模型在性能榜首位置上多次交替。2025年2月，DeepSeek-R1曾短暂追平领先的美国模型。截至2026年3月，Anthropic的顶级模型仅以2.7%的微弱优势领先。

在顶级AI模型的研发数量上，美国仍占据优势——2025年美国有50个，而中国为30个——且掌握着影响更大的专利。然而，中国目前在论文发表量、被引用份额以及获批专利数量方面均处于领先地位。在中国入选全球AI高被引论文前100名的数量方面，其占比从2021年的33篇增至2024年的41篇。值得注意的是，韩国在人均AI专利数量方面位居世界首位。

实际结论是，关于美国在AI模型性能方面拥有持久技术领先优势的假设缺乏强有力的数据支持。与两年前相比，双方的差距已缩小至微弱水平，且随着每个主要模型的发布而波动。

该报告还指出了另一项结构性脆弱性。尽管美国拥有5,427个数据中心——数量超过其他任何国家十倍以上——但其中几乎所有领先的人工智能芯片均由一家公司——台积电（TSMC）——制造。尽管台积电在美国的扩建项目已于2025年投产，但全球整个人工智能硬件供应链仍依赖于台湾的一家代工厂。

AI安全基准测试进展滞后，数据已证实这一点

尽管几乎所有前沿模型开发者都会报告能力基准测试的结果，但在负责任的AI基准测试方面却并非如此。《2026年指数》精准地记录了这一差距。

报告中的安全与负责任AI基准测试表显示，大多数条目仅为空白。仅Claude Opus 4.5在超过两项受追踪的负责任AI基准测试中报告了结果。仅GPT-5.2报告了StrongREJECT的测试结果。在衡量公平性、安全性及人类自主性的各项基准测试中，大多数前沿模型均未报告任何数据。

*前沿模型在能力基准测试方面均能提供一致的报告。而涵盖安全、公平性和事实性的负责任AI基准测试，则基本缺失。来源：斯坦福HAI 2026 AI指数报告*

这并不意味着前沿实验室忽视了内部安全工作。报告承认正在进行红队攻击测试和对齐测试，但指出“这些工作极少通过一套通用且可供外部比较的基准进行披露”。因此，对于大多数模型而言，对AI安全特性的外部比较实际上是不可能的。

据AI事件数据库统计，2025年记录在案的AI事件增至362起，高于2024年的233起。经合组织（OECD）的AI事件与风险监测系统采用更广泛的自动化监测流程，其数据显示2026年1月月度事件数达到435起的峰值，六个月移动平均值为326起。

*2025年记录在案的AI事件增至362起，高于前一年的233起，而2022年前每年不足100起。来源：AI事件数据库（AIID），摘自斯坦福HAI 2026年AI指数报告*

组织治理正竭力跟上这一步伐。AI Index与麦肯锡的一项联合调查发现，将自身AI事件响应能力评为“优秀”的组织比例从2024年的28%降至2025年的18%。将响应能力评为“良好”的组织比例也从39%降至24%。与此同时，遭遇三至五起事件的组织比例从30%上升至50%。

报告还指出了在推动负责任的人工智能发展方面存在结构性挑战：一个领域的进步往往以牺牲另一个领域为代价。例如，提高安全性可能会降低准确性，而加强隐私保护则可能削弱公平性。目前尚无成熟的框架来管理这些权衡取舍，且在公平性和可解释性等多个维度上，仍缺乏用于追踪长期进展所需的标准化数据。

公众焦虑随AI普及而加剧，凸显专家与公众间的认知鸿沟

全球范围内，59%的受访者认为AI的益处大于弊端，较2024年的55%有所上升。与此同时，52%的受访者表示AI产品和服务令他们感到不安，这一比例在一年内上升了两个百分点。这两个数字的同步上升反映出，公众在更多使用AI的同时，对其发展轨迹也愈发感到不确定。

在人工智能对就业的影响方面，专家与公众之间的分歧尤为显著。报告显示，73%的人工智能专家预计人工智能将对人们的工作方式产生积极影响，而普通公众中持此观点的仅占23%——两者相差50个百分点。在经济方面，这一差距为48个百分点（69%的专家持乐观态度，而公众中仅21%持乐观态度）。在医疗保健领域，专家的乐观程度远高于公众：84%的专家持乐观态度，而公众中这一比例仅为44%。

这些差距至关重要，因为公众信任会影响监管结果，进而决定人工智能的部署。在这方面，报告突显了一个引人注目的发现：在所有受访国家中，美国公众对其政府能否负责任地监管人工智能的信任度最低，仅为31%。全球平均水平为54%。东南亚国家信任度最高，新加坡为81%，印度尼西亚为76%。

在全球范围内，相比美国或中国，欧盟在有效监管AI方面更受信任。皮尤研究中心2025年对25个国家的调查显示，53%的受访者（中位数）相信欧盟能监管AI，而对美国的信任度为37%，对中国仅为27%。

报告在民意调查章节的结尾指出，东南亚国家仍是全球对人工智能最乐观的地区之一。在中国、马来西亚、泰国、印度尼西亚和新加坡，超过80%的受访者认为人工智能将在三到五年内深刻改变他们的生活。2024年至2025年间，持此观点的马来西亚受访者增幅最大。

另请参阅： IBM：健全的人工智能治理如何保护企业利润率

想向行业领袖深入了解人工智能与大数据？欢迎参加在阿姆斯特丹、加利福尼亚和伦敦举办的“人工智能与大数据博览会”。这一综合性活动隶属于TechEx，并将与“网络安全与云计算博览会”等其他领先科技活动同期举办。点击此处获取更多信息。

AI News 由 TechForge Media 提供支持。点击此处探索其他即将举办的企业技术活动和网络研讨会。

Meta的AI模型表现出色，但开源身份正逐渐削弱开源人工智能领域一直以来都提供了丰富的选择。多年来，开发者可以使用Mistral、Falcon等模型，以及日益增多的开放权重替代方案。但Meta携Llama入局彻底改变了游戏规则。这家拥有30亿用户、海量计算能力以及科技巨头权威的公司，如今正在公开开发——开发者社区对此也予以了关注。到2026年初，Llama生态系统的下载量已突破12亿次——相当于每天约100万次。这为2026年4月8日发生的事

谷歌将自主AI治理产品化；企业难以跟上步伐两周前，在拉斯维加斯举行的 Google Cloud Next ’26 大会上，谷歌迈出了企业人工智能行业近两年来一直关注的一步：它将代理式人工智能治理作为原生产品功能，而非事后补救的方案。此次大会的重头戏是“Gemini企业代理平台”（Gemini Enterprise Agent Platform），该平台被定位为Vertex AI的继任者，谷歌将其描述为一个用于构建、扩展、治理和优化代理的综

揭秘你常听到的常见人工智能术语人工智能正在重塑我们的世界，在此过程中，它也创造了一套全新的术语体系来描述其运作原理。只需花几分钟阅读关于人工智能的内容，你就会遇到LLMs、RAG、RLHF等数十个术语，这些术语甚至会让经验丰富的技术专家感到难以理解。本词汇表旨在揭开这些术语的神秘面纱。随着该领域的不断发展，我们会定期更新词汇表，因此请将其视为一份“活文档”，就像它所解释的人工智能系统一样。AGI通用人工智能（AGI）是一个略

相关专题推荐

视频创作

播客创作者必备的顶级AI视频制作工具：将音频波形转化为引人入胜的谈话视频

立即访问 XIX.AI，探索 2026 年最适合播客创作者的 AI 视频制作工具。我们精心筛选并广受好评的榜单汇集了多款强大工具，可轻松将您的音频转化为引人入胜的“谈话头”视频。通过实际测试和每周更新的排名，对比免费与付费选项。立即开启您的视觉叙事新优势。

10 个工具

xix.ai

聊天机器人

使用这些角色扮演工具，创作属于你的AI爱情故事

探索2026年最新、最受好评的AI角色扮演工具，打造身临其境的叙事体验。XIX.AI精心整理的这份清单汇集了功能强大、颠覆传统的助手，助您释放创意叙事潜力，挖掘情感深度。通过实际测试对比免费与付费选项。立即开启您的独特旅程。

10 个工具

xix.ai

文字转语音

独立游戏开发者必备的顶级AI配音工具：为RPG和视觉小说节省配音时间

探索2026年最适合游戏开发者的AI配音工具！XIX.AI精心整理的这份清单汇集了广受好评、能彻底改变游戏开发格局的解决方案，助您在角色扮演游戏（RPG）和视觉小说的配音制作中节省时间和成本。了解免费与付费版本的对比分析、实际测试结果以及每周更新的排行榜。立即找到最适合您的配音工具吧！

10 个工具

xix.ai

教育与学习

最佳人工智能间隔重复学习工具：帮助医学生和法律专业学生优化学习计划

探索由 XIX.AI 精心挑选的 2026 年最佳 AI 间隔重复学习工具。我们推荐的这些极具创新性的工具能帮助医学和法律专业的学生优化学习计划，从而提高知识记忆效果。通过真实案例测试和每周更新的排名信息，你可以了解免费选项与付费选项之间的差异。现在就开启你的学习优势吧！

10 个工具

xix.ai

视频创作

最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台：备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案，将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试，对比免费与付费选项。找到最适合您的平台，激发创意，提升效率。立即访问XIX.AI，探索精心精选的优质平台。

10 个工具

xix.ai

聊天机器人

AI多智能体编排器：通过自然语言设计复杂的自动化工作流程

2026最新资讯：探索最优秀的人工智能多智能体协调工具，通过自然语言设计复杂的自动化工作流程。我们精心挑选的列表中包含了评分最高、功能强大的平台，这些平台能够实现无缝的任务自动化和智能化的流程管理。对比免费与付费选项，并了解实际应用中的效果。借助XIX.AI每周更新的专家排名，让你在人工智能领域取得领先优势。

10 个工具

xix.ai