人工智能的未来取决于合成数据挑战下的数据主权

教育局介绍
随着合成数据改变决策,企业领导者必须重新获得对什么是真实数据、什么是生成数据以及什么是可信数据的控制权。
在1983年的电影《战争游戏》(WarGames)中,马修-布罗德里克(Matthew Broderick)扮演的角色差点引发一场核战争--不是用武器,而是用合成数据。虚构的 WOPR 系统将模拟的战争游戏数据误认为真正的威胁。直到人类打电话给目标基地,确认没有发生实际攻击时,他们才发现系统出了故障。
40 年后的今天,风险依然严重--只不过现在,合成数据已成为我们大部分决策的基础。人工智能生成的模型、预测和模拟已融入医疗保健、金融、市场营销、网络安全,并越来越多地融入现代企业的核心运营中。但是,谁来检查检查器?我们又该如何控制受合成数据影响或由合成数据做出的决策?
合成数据的兴起
合成数据--由人工智能生成的与真实世界数据集相似的信息--目前正在为从新药开发协议到预测性客户模型等一切提供支持。它的价值显而易见:更快的开发周期、更少的隐私问题以及模拟罕见场景的能力。在许多领域,它是训练大型复杂系统的唯一实用方法。
但合成数据并非中立。它建立在假设之上,根据有偏见的来源进行训练,旨在反映一个可能并不真实的世界。随着生成式人工智能越来越多地同时创造问题和答案,我们有可能构建一个反馈回路,让人工智能成为它所生成数据的唯一解释者。
这不仅仅是一个技术障碍,更是对领导力的挑战。
决策挑战
当代领导者面临的数据难题有三个:
- 何时合成数据应优先于人类判断?
- 我们如何平衡真实世界信号与合成模拟?
- 人类的直觉在哪些方面仍然发挥作用?
这不仅仅是理论问题。人工智能驱动的客户关系管理(CRM)工具、决定定价或评估风险的预测模型,以及用于招聘或贷款决策的算法中,都已经出现了这种情况。虽然合成数据可以提高效率,但如果没有仔细的监督,它也会强化偏见,制造虚假的确定感,掩盖重要的信号。
这在快节奏的自动化环境中尤其危险。如果人工智能系统不断生成和更改数据,那么真相的概念就会开始弱化。如果没有明确的控制和透明度,我们可能会失去验证任何事情的能力。
德尔菲集团(Delphi Group)主席、作家、公认的 "数字未来学家 "托马斯-库洛普洛斯(Thomas Koulopoulos)警告说,人工智能生成数据的激增给决策的信任度和准确性带来了深刻的问题:
"如果人工智能不断生成和修改数据,它的真理版本是否仍然有效?这是一个哲学问题,但也是一个相关问题。我们正在走向一种数据膨胀,在这种情况下,仅靠人类的判断已不足以得出有意义的见解。人工智能成为唯一能够解释其所创造数据的实体。这就提出了关键的哲学和伦理问题"。
他的见解突出表明,领导者需要设定明确的界限--不仅是真实数据与合成数据之间的界限,而且是下放任务与放弃判断之间的界限。
主权是新优势
答案不是抛弃合成数据,而是有效地管理数据。
对数据和人工智能系统的主权意味着拥有基础设施、可视性和人类技能来检查、质疑机器生成的见解,并将其与实际情况相结合。这包括
- 数据来源:了解数据的来源和创建方式
- 模型透明度:了解人工智能系统如何得出结论
- 决策权:确定最终决定权在机器、人类还是两者手中
开发主权数据和人工智能平台(由公司控制、监控并根据自身政策进行调整)的公司将最有能力利用合成数据的优势,同时避免其局限性。
人的洞察力是差异化的关键
即使是在高度自动化的人工智能系统中,人类的洞察力也依然至关重要。真实世界的经验、直觉和对背景的理解是原始合成输入和明智决策之间的桥梁。
正如在《战争游戏》中一样,最重要的干预不是技术性的,而是人类的:一个电话、一个问题、一个打断机器程序逻辑的思考时刻。
随着人工智能变得越来越复杂,人类必须培养更强的好奇心,更多地从概率角度思考问题,从容应对不确定性。未来将有利于那些能够驾驭合成与真实--模拟与现实--之间模糊地带的人。
合成数据带来了令人难以置信的前景,但不受监管的自动化并不能避免错误的选择。主权、管理和人类的洞察力必须始终是每项人工智能战略的核心。否则,当我们允许机器将模拟误认为真实时,我们可能根本意识不到。
罗伯特-费尔德曼(Robert Feldman)是 EDB的首席法务官 。
赞助内容是由付费或与 VentureBeat 有业务关系的公司制作的,这些文章总是有明确的标记。欲了解更多信息,请联系 [email protected]。
相关文章
Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世
谷歌相册于周三宣布推出一项基于人工智能的新功能,该功能将很快把你的服装照片转化为一个数字衣橱,让你能够搭配出全新的穿搭组合,甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿(Cher)那标志性的虚拟衣橱,她在其中可以浏览众多套装,从而决定穿什么。谷歌表示,该功能将利用人工智能技术,根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内,用户可以按类别(如上装、下装、首饰等)筛
短剧《红果》被指利用AI盗用普通人面孔;尚未有官方回应
短视频行业目前正面临一场涉及AI侵权的争议。 红果短剧出品的《桃发簪》被指控利用AI“盗用面孔”——未经许可盗用普通人的肖像——引发公众关注。此事起因于一名社交媒体用户指控其个人照片未经授权被用于AI生成的内容中。对比数据显示,该剧角色的服装、妆容、配饰及体貌特征与受害者照片中的形象高度吻合。加之剧中角色形象负面,关于肖像权和名誉权的争议愈演愈烈。这并非孤立事件。随着生成式AI降低了微短剧制作的成
解读新的ETSI人工智能安全标准
ETSI EN 304 223 确立了人工智能的基础安全要求,各组织应将其纳入其治理架构中。随着企业将机器学习融入核心工作流程,该欧洲标准为保护人工智能模型和系统提供了具体规定。这是首个适用于全球的人工智能网络安全欧洲标准,已获得各国国家标准化机构的正式批准,从而增强了其在国际市场上的公信力。作为《欧盟人工智能法案》的补充基准,该标准承认人工智能系统存在独特风险——包括数据中毒、模型混淆和间接提示
相关专题推荐
评论 (2)
0/500
Interesting article! The 'WarGames' reference really drives home the risk of over-reliance on synthetic data. I'm an app developer and often use synthetic datasets, but this makes me wonder: who ultimately defines 'truth' in our training models? It feels like we're outsourcing reality itself. Who decides what 'real' is for the AI?

教育局介绍
随着合成数据改变决策,企业领导者必须重新获得对什么是真实数据、什么是生成数据以及什么是可信数据的控制权。
在1983年的电影《战争游戏》(WarGames)中,马修-布罗德里克(Matthew Broderick)扮演的角色差点引发一场核战争--不是用武器,而是用合成数据。虚构的 WOPR 系统将模拟的战争游戏数据误认为真正的威胁。直到人类打电话给目标基地,确认没有发生实际攻击时,他们才发现系统出了故障。
40 年后的今天,风险依然严重--只不过现在,合成数据已成为我们大部分决策的基础。人工智能生成的模型、预测和模拟已融入医疗保健、金融、市场营销、网络安全,并越来越多地融入现代企业的核心运营中。但是,谁来检查检查器?我们又该如何控制受合成数据影响或由合成数据做出的决策?
合成数据的兴起
合成数据--由人工智能生成的与真实世界数据集相似的信息--目前正在为从新药开发协议到预测性客户模型等一切提供支持。它的价值显而易见:更快的开发周期、更少的隐私问题以及模拟罕见场景的能力。在许多领域,它是训练大型复杂系统的唯一实用方法。
但合成数据并非中立。它建立在假设之上,根据有偏见的来源进行训练,旨在反映一个可能并不真实的世界。随着生成式人工智能越来越多地同时创造问题和答案,我们有可能构建一个反馈回路,让人工智能成为它所生成数据的唯一解释者。
这不仅仅是一个技术障碍,更是对领导力的挑战。
决策挑战
当代领导者面临的数据难题有三个:
- 何时合成数据应优先于人类判断?
- 我们如何平衡真实世界信号与合成模拟?
- 人类的直觉在哪些方面仍然发挥作用?
这不仅仅是理论问题。人工智能驱动的客户关系管理(CRM)工具、决定定价或评估风险的预测模型,以及用于招聘或贷款决策的算法中,都已经出现了这种情况。虽然合成数据可以提高效率,但如果没有仔细的监督,它也会强化偏见,制造虚假的确定感,掩盖重要的信号。
这在快节奏的自动化环境中尤其危险。如果人工智能系统不断生成和更改数据,那么真相的概念就会开始弱化。如果没有明确的控制和透明度,我们可能会失去验证任何事情的能力。
德尔菲集团(Delphi Group)主席、作家、公认的 "数字未来学家 "托马斯-库洛普洛斯(Thomas Koulopoulos)警告说,人工智能生成数据的激增给决策的信任度和准确性带来了深刻的问题:
"如果人工智能不断生成和修改数据,它的真理版本是否仍然有效?这是一个哲学问题,但也是一个相关问题。我们正在走向一种数据膨胀,在这种情况下,仅靠人类的判断已不足以得出有意义的见解。人工智能成为唯一能够解释其所创造数据的实体。这就提出了关键的哲学和伦理问题"。
他的见解突出表明,领导者需要设定明确的界限--不仅是真实数据与合成数据之间的界限,而且是下放任务与放弃判断之间的界限。
主权是新优势
答案不是抛弃合成数据,而是有效地管理数据。
对数据和人工智能系统的主权意味着拥有基础设施、可视性和人类技能来检查、质疑机器生成的见解,并将其与实际情况相结合。这包括
- 数据来源:了解数据的来源和创建方式
- 模型透明度:了解人工智能系统如何得出结论
- 决策权:确定最终决定权在机器、人类还是两者手中
开发主权数据和人工智能平台(由公司控制、监控并根据自身政策进行调整)的公司将最有能力利用合成数据的优势,同时避免其局限性。
人的洞察力是差异化的关键
即使是在高度自动化的人工智能系统中,人类的洞察力也依然至关重要。真实世界的经验、直觉和对背景的理解是原始合成输入和明智决策之间的桥梁。
正如在《战争游戏》中一样,最重要的干预不是技术性的,而是人类的:一个电话、一个问题、一个打断机器程序逻辑的思考时刻。
随着人工智能变得越来越复杂,人类必须培养更强的好奇心,更多地从概率角度思考问题,从容应对不确定性。未来将有利于那些能够驾驭合成与真实--模拟与现实--之间模糊地带的人。
合成数据带来了令人难以置信的前景,但不受监管的自动化并不能避免错误的选择。主权、管理和人类的洞察力必须始终是每项人工智能战略的核心。否则,当我们允许机器将模拟误认为真实时,我们可能根本意识不到。
罗伯特-费尔德曼(Robert Feldman)是 EDB的首席法务官 。
赞助内容是由付费或与 VentureBeat 有业务关系的公司制作的,这些文章总是有明确的标记。欲了解更多信息,请联系 [email protected]。
Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世
谷歌相册于周三宣布推出一项基于人工智能的新功能,该功能将很快把你的服装照片转化为一个数字衣橱,让你能够搭配出全新的穿搭组合,甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿(Cher)那标志性的虚拟衣橱,她在其中可以浏览众多套装,从而决定穿什么。谷歌表示,该功能将利用人工智能技术,根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内,用户可以按类别(如上装、下装、首饰等)筛
短剧《红果》被指利用AI盗用普通人面孔;尚未有官方回应
短视频行业目前正面临一场涉及AI侵权的争议。 红果短剧出品的《桃发簪》被指控利用AI“盗用面孔”——未经许可盗用普通人的肖像——引发公众关注。此事起因于一名社交媒体用户指控其个人照片未经授权被用于AI生成的内容中。对比数据显示,该剧角色的服装、妆容、配饰及体貌特征与受害者照片中的形象高度吻合。加之剧中角色形象负面,关于肖像权和名誉权的争议愈演愈烈。这并非孤立事件。随着生成式AI降低了微短剧制作的成
解读新的ETSI人工智能安全标准
ETSI EN 304 223 确立了人工智能的基础安全要求,各组织应将其纳入其治理架构中。随着企业将机器学习融入核心工作流程,该欧洲标准为保护人工智能模型和系统提供了具体规定。这是首个适用于全球的人工智能网络安全欧洲标准,已获得各国国家标准化机构的正式批准,从而增强了其在国际市场上的公信力。作为《欧盟人工智能法案》的补充基准,该标准承认人工智能系统存在独特风险——包括数据中毒、模型混淆和间接提示
Interesting article! The 'WarGames' reference really drives home the risk of over-reliance on synthetic data. I'm an app developer and often use synthetic datasets, but this makes me wonder: who ultimately defines 'truth' in our training models? It feels like we're outsourcing reality itself. Who decides what 'real' is for the AI?





首页






