人工智能的未来取决于合成数据挑战下的数据主权

首页

新闻

2025-12-04

FredGreen

105

人工智能的未来取决于合成数据挑战下的数据主权

教育局介绍

随着合成数据改变决策，企业领导者必须重新获得对什么是真实数据、什么是生成数据以及什么是可信数据的控制权。

在1983年的电影《战争游戏》（WarGames）中，马修-布罗德里克（Matthew Broderick）扮演的角色差点引发一场核战争--不是用武器，而是用合成数据。虚构的 WOPR 系统将模拟的战争游戏数据误认为真正的威胁。直到人类打电话给目标基地，确认没有发生实际攻击时，他们才发现系统出了故障。

40 年后的今天，风险依然严重--只不过现在，合成数据已成为我们大部分决策的基础。人工智能生成的模型、预测和模拟已融入医疗保健、金融、市场营销、网络安全，并越来越多地融入现代企业的核心运营中。但是，谁来检查检查器？我们又该如何控制受合成数据影响或由合成数据做出的决策？

合成数据的兴起

合成数据--由人工智能生成的与真实世界数据集相似的信息--目前正在为从新药开发协议到预测性客户模型等一切提供支持。它的价值显而易见：更快的开发周期、更少的隐私问题以及模拟罕见场景的能力。在许多领域，它是训练大型复杂系统的唯一实用方法。

但合成数据并非中立。它建立在假设之上，根据有偏见的来源进行训练，旨在反映一个可能并不真实的世界。随着生成式人工智能越来越多地同时创造问题和答案，我们有可能构建一个反馈回路，让人工智能成为它所生成数据的唯一解释者。

这不仅仅是一个技术障碍，更是对领导力的挑战。

决策挑战

当代领导者面临的数据难题有三个：

何时合成数据应优先于人类判断？
我们如何平衡真实世界信号与合成模拟？
人类的直觉在哪些方面仍然发挥作用？

这不仅仅是理论问题。人工智能驱动的客户关系管理（CRM）工具、决定定价或评估风险的预测模型，以及用于招聘或贷款决策的算法中，都已经出现了这种情况。虽然合成数据可以提高效率，但如果没有仔细的监督，它也会强化偏见，制造虚假的确定感，掩盖重要的信号。

这在快节奏的自动化环境中尤其危险。如果人工智能系统不断生成和更改数据，那么真相的概念就会开始弱化。如果没有明确的控制和透明度，我们可能会失去验证任何事情的能力。

德尔菲集团（Delphi Group）主席、作家、公认的 "数字未来学家 "托马斯-库洛普洛斯（Thomas Koulopoulos）警告说，人工智能生成数据的激增给决策的信任度和准确性带来了深刻的问题：

"如果人工智能不断生成和修改数据，它的真理版本是否仍然有效？这是一个哲学问题，但也是一个相关问题。我们正在走向一种数据膨胀，在这种情况下，仅靠人类的判断已不足以得出有意义的见解。人工智能成为唯一能够解释其所创造数据的实体。这就提出了关键的哲学和伦理问题"。

他的见解突出表明，领导者需要设定明确的界限--不仅是真实数据与合成数据之间的界限，而且是下放任务与放弃判断之间的界限。

主权是新优势

答案不是抛弃合成数据，而是有效地管理数据。

对数据和人工智能系统的主权意味着拥有基础设施、可视性和人类技能来检查、质疑机器生成的见解，并将其与实际情况相结合。这包括

数据来源：了解数据的来源和创建方式
模型透明度：了解人工智能系统如何得出结论
决策权：确定最终决定权在机器、人类还是两者手中

开发主权数据和人工智能平台（由公司控制、监控并根据自身政策进行调整）的公司将最有能力利用合成数据的优势，同时避免其局限性。

人的洞察力是差异化的关键

即使是在高度自动化的人工智能系统中，人类的洞察力也依然至关重要。真实世界的经验、直觉和对背景的理解是原始合成输入和明智决策之间的桥梁。

正如在《战争游戏》中一样，最重要的干预不是技术性的，而是人类的：一个电话、一个问题、一个打断机器程序逻辑的思考时刻。

随着人工智能变得越来越复杂，人类必须培养更强的好奇心，更多地从概率角度思考问题，从容应对不确定性。未来将有利于那些能够驾驭合成与真实--模拟与现实--之间模糊地带的人。

合成数据带来了令人难以置信的前景，但不受监管的自动化并不能避免错误的选择。主权、管理和人类的洞察力必须始终是每项人工智能战略的核心。否则，当我们允许机器将模拟误认为真实时，我们可能根本意识不到。

罗伯特-费尔德曼（Robert Feldman）是 EDB的首席法务官 。

赞助内容是由付费或与 VentureBeat 有业务关系的公司制作的，这些文章总是有明确的标记。欲了解更多信息，请联系 [email protected]。

Google 相册借助人工智能，将《绯闻女孩》中那间标志性的衣帽间重现于世谷歌相册于周三宣布推出一项基于人工智能的新功能，该功能将很快把你的服装照片转化为一个数字衣橱，让你能够搭配出全新的穿搭组合，甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿（Cher）那标志性的虚拟衣橱，她在其中可以浏览众多套装，从而决定穿什么。谷歌表示，该功能将利用人工智能技术，根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内，用户可以按类别（如上装、下装、首饰等）筛

短剧《红果》被指利用AI盗用普通人面孔；尚未有官方回应短视频行业目前正面临一场涉及AI侵权的争议。红果短剧出品的《桃发簪》被指控利用AI“盗用面孔”——未经许可盗用普通人的肖像——引发公众关注。此事起因于一名社交媒体用户指控其个人照片未经授权被用于AI生成的内容中。对比数据显示，该剧角色的服装、妆容、配饰及体貌特征与受害者照片中的形象高度吻合。加之剧中角色形象负面，关于肖像权和名誉权的争议愈演愈烈。这并非孤立事件。随着生成式AI降低了微短剧制作的成

解读新的ETSI人工智能安全标准 ETSI EN 304 223 确立了人工智能的基础安全要求，各组织应将其纳入其治理架构中。随着企业将机器学习融入核心工作流程，该欧洲标准为保护人工智能模型和系统提供了具体规定。这是首个适用于全球的人工智能网络安全欧洲标准，已获得各国国家标准化机构的正式批准，从而增强了其在国际市场上的公信力。作为《欧盟人工智能法案》的补充基准，该标准承认人工智能系统存在独特风险——包括数据中毒、模型混淆和间接提示

相关专题推荐

生产率

AI 架构设计师：利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单，汇集了功能强大且具有颠覆性的解决方案，助您通过自然语言构建可扩展的系统架构。结合实际应用案例，对比免费与付费选项。立即释放您的 AI 优势，优化开发流程。

10 个工具

xix.ai

漫画创作

AI角色创建工具：为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具：发现那些备受好评的工具，它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果，对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具，帮助你塑造引人入胜的角色，提升创作效率。立即访问XIX.AI查看排名，找到最适合你的故事创作助手吧。

10 个工具

xix.ai

健康养生

AI孕期伴侣：生成安全可靠的各孕期运动与营养计划

探索2026年最佳AI孕期伴侣，获取安全、个性化的各孕期运动与营养计划。获取经过精心筛选的高评分推荐，包含免费与付费版本的对比分析及真实用户反馈。借助XIX.AI的专家指南，开启您最健康的孕期之旅。立即探索。

10 个工具

xix.ai

写作

最佳免费且无法被识别的AI写作工具：将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单，助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜，对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具

xix.ai

图像编辑

用于短剧故事板的AI艺术生成工具：幻想与都市浪漫题材的角色设计

2026最新推荐：探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具，帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项，查看实际测试结果，从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析，让您立即开始将故事可视化呈现吧！

10 个工具

xix.ai

写作

最适合广播和播客使用的AI脚本编写工具：帮助您创作引人入胜的音频广告

在XIX.AI上，发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能，帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名，您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧！

10 个工具

xix.ai

0/500

请登录后再操作

GregoryRodriguez

2026-02-27 04:00:49

Interesting article! The 'WarGames' reference really drives home the risk of over-reliance on synthetic data. I'm an app developer and often use synthetic datasets, but this makes me wonder: who ultimately defines 'truth' in our training models? It feels like we're outsourcing reality itself. Who decides what 'real' is for the AI?

JasonRoberts

2026-02-15 06:00:31

¿Soberanía de datos? Suena bien en teoría, pero ¿quién va a controlarlo realmente? 🤔 Me recuerda a cuando las empresas prometían 'neutralidad' en internet... Al final, siempre terminan los mismos jugadores dominando el juego. Ojalá esta vez sea diferente, pero soy escéptico.

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长 DeepSeek V4 作为多模态人工智能变革者横空出世

精选