首页 新闻 多人扑克中围绕超人AI的道德问题

多人扑克中围绕超人AI的道德问题

2025年05月05日
GeorgeThomas
0

人工智能的世界确实令人着迷,每个新的发展都在推动我们认为可能的界限。 AI在两人游戏中的胜利无非是超人。一个典型的例子是卡内基·梅隆大学(Carnegie Mellon University)的研究人员创建了Pluribus,这是一个AI机器人,掌握了多人扑克的艺术,即使是最熟练的人类玩家,也留下了最熟练的人。尽管这项成就是开创性的,但它还提出了有关在现实世界中使用此类技术的重要道德问题。让我们深入研究这个有趣的话题。

战略游戏中AI的兴起

AI在两人游戏中的主导地位

人工智能在各种两人游戏中表现出令人难以置信的人类占主导地位的能力。诸如Checkers,Chess和Go之类的游戏(按照完美信息运行)已经掌握了AI的精通。这些算法已经达到了一定的专业知识,这些专业知识曾经是无法实现的,强调了AI技术的快速进步及其改变战略决策的潜力。这种能力打开了令人兴奋的机会,但也给桌子带来了一些风险。

这些游戏对人工智能更容易管理的原因之一是它们的零和本质。在零和游戏中,一个玩家的收益是另一个球员的损失,为AI创造了一个明确的环境,以优化胜利策略。精心计算每一步,以最大程度地提高游戏约束中的获胜机会。像Pluribus这样的AI轻松导航了这个环境,但在更复杂的多人游戏环境中这样做。

多人游戏中的挑战

尽管AI在两人游戏中表现出色,但向多人游戏环境的转变引入了新的挑战。多人游戏带来了复杂性,例如多种战略互动,建立联盟的必要性以及处理不完整的信息,所有这些都加剧了游戏的困难。多人游戏中的一个主要障碍是纳什均衡的概念。

游戏理论中的纳什平衡

在游戏理论中,纳什均衡是一个州,没有球员可以通过单方面改变其策略来改善其结果,假设所有其他玩家都保持不变。在多人游戏设置中,发现这种平衡变得更加困难,因为每个玩家的策略不仅取决于他们的行动,而且取决于所有其他玩家的策略。随着球员数量的增加,策略和反设计的潜在组合也会增加,这对于AI来说,计算最佳行动方案的任务是一项艰巨的任务。

卡内基·梅隆(Carnegie Mellon)的突破:pluribus

pluribus的工作原理

2019年,卡内基·梅隆大学(Carnegie Mellon)的研究人员通过开发Pluribus(一种AI算法)取得了重大飞跃,该算法超过了六名玩家无限制的Texas Texas Hold'em Poker'em poker的顶级人类扑克专业人士。与以前的AI扑克机器人不同,Pluribus并不是要直接计算NASH平衡。取而代之的是,它采用了一种复杂的自学方法,对抗自身的副本来通过无数迭代来完善其技能。这种自我播放使Pluribus能够适应各种各样的策略和不可预测的场景,从而制定了强大而多功能的游戏计划。

Pluribus浏览多人扑克复杂性的能力令人印象深刻。其策略的关键部分是它有效地使用虚张声势,这是扑克中的关键要素,涉及欺骗对手关于手的力量。 Pluribus学会了指出虚张声势会带来优势的情况,比人类玩家获得优势。它还采用了非常规的举动,使经验丰富的扑克玩家措手不及,这使对手预测其行动具有挑战性。通过自我播放和战略创新,Pluribus展示了AI在复杂的,现实世界中实现超人表现的潜力。

针对人类专业人士测试pluribus

为了测试Pluribus的能力,研究人员将其与世界上一些最好的扑克玩家相提并论。在一个实验中,Pluribus与五个人类对手面对面,包括吉米·周,塞思·戴维斯和迈克尔·加利亚诺等著名的专业人士。人类玩家获得了2,000美元的参与,如果赢得了2,000美元。 Pluribus的平均获胜率令人印象深刻,每场比赛(MBB/游戏)的平均胜利率约为25 Mbb/game,这是专业扑克的出色表现。

在另一项测试中,Pluribus对一个人类球员进行了五个AI机器人,其中两名专业球员被选为挑战。 pluribus始终排名第一,进一步证明了其优于人类能力。这些测试表明,Pluribus可以掌握涉及不完整信息,欺骗和战略适应的复杂游戏。

人工智能研究中的道德考虑因素

优点

  • 保护脆弱人群免受潜在伤害。
  • 保留在线平台和游戏的完整性。
  • 促进负责的AI开发和部署。
  • 增强公众对AI技术的信任。

缺点

  • 限制访问有价值的研究结果。
  • 潜力扼杀创新并放慢进步。
  • 在AI开发中缺乏透明度。
  • 阻碍了人工智能应对社会挑战的潜力。

常见问题

什么是纳什平衡?

在游戏理论中,纳什均衡是一个州,没有球员可以通过单方面改变其策略来改善其结果,假设所有其他玩家都保持不变。考虑到其他所有人在做什么,每个人都尽力而为。

每场比赛的Milli-big蓝色是什么意思?

每场比赛(MBB/游戏)是一个用于衡量扑克玩家的获胜率的单元。相对于大盲人的规模,它代表了球员每场胜利的平均金额。更高的MBB/游戏表示更成功的玩家。

什么是德克萨斯州Hold'em扑克?

德克萨斯州Hold'em是扑克的一种变体,每个玩家都会在桌子上面对两张私人卡(“孔卡”),然后面对五张社区卡。玩家竞争,使用其孔卡和社区卡的任何组合制作最佳的五张卡片手。

道德考虑

研究人员为什么不发布Pluribus模型?

尽管Pluribus取得了开创性的成功,但卡内基·梅隆大学的研究人员还是选择不向公众发布AI模型。他们的决定是由于对潜在滥用的道德关注而推动的。他们担心个人可能会利用Pluribus算法在在线扑克比赛中作弊,造成财务损失并破坏游戏的诚信。发布该模型可能会对在线扑克参与者造成重大伤害并损害游戏声誉,从而促使玩家由于AI欺诈而退出。该决定强调了AI研究人员对工作的道德意义的越来越多的意识。

什么是双重使用算法?

Pluribus的案例带来了更广泛的双使用算法问题,可用于有益和恶意目的。尽管AI有可能推动创新并改善我们的生活,但如果被滥用,它也会带来风险。扣留pluribus模型的决定反映了一种积极的道德AI发展方法,强调了仔细评估AI技术的潜在影响的必要性。 AI研究人员,开发人员和政策制定者必须共同努力,建立确保AI开发的准则。这涉及进行彻底的风险评估,开发防止滥用的保障措施以及促进AI算法中的透明度。在AI社区中培养一种道德意识的文化并鼓励人们讨论AI的道德意义,这是利用AI福利的重要步骤,同时减轻其风险。

相关文章
掌握管弦乐作品:使用Cubase的综合指南 掌握管弦乐作品:使用Cubase的综合指南 在像Cubase这样的数字音频工作站中创建管弦乐音乐可能会感觉像是一项艰巨的任务。但是不要担心 - 使用正确的方法,工具和一些专业知识,您可以从计算机上制作出惊人的管弦乐作品。本指南深入探讨了管弦乐的世界
AI-Ruined鱿鱼游戏2:有趣的模因引发道德辩论 AI-Ruined鱿鱼游戏2:有趣的模因引发道德辩论 互联网上嗡嗡作响,以AI生成的内容,最有趣的趋势之一是“ AI-Ruined Squid游戏2”模因。这些视频(AI)从心爱的系列中重新想象场景,通常会导致有趣和奇异的结果。当它们是娱乐的来源时,他们也提高了IM
Jaykii的“Chiềuhôm”':深入探索令人心碎的探索 Jaykii的“Chiềuhôm”':深入探索令人心碎的探索 Jaykii的“Chiềuhôm” Yy不仅仅是另一种曲调;这是一个通过音乐讲述的衷心故事。这篇博客文章将带您进入歌曲的核心,探索其歌词和精致的艺术性,这些艺术性在个人层面上感动了听众。我们将浏览心碎的主题,接受
评论 (0)
0/200
返回顶部
OR