当前位置: 首页 > 科技赋能

AI挑战扑克世界冠军,这次领先了,

时间:2024-05-22 16:40:47 科技赋能

Zhidixcom(公众号:zhidxcom)编辑|海中天简介:在匹兹堡赌场,AI正与扑克世界冠军对决。

整个比赛历时20天,将于月底举行。

结果会出来的,不出意外的话,AI会赢。

这是AI技术的又一突破。

从周五晚上到周六早上,金东的声音听起来很挫败。

靳东是一位扑克高手,尤其擅长无限注德州扑克。

他今年 28 岁,韩裔美国人。

一般来说,靳东只在高风险网站和拉斯维加斯大型赌场与顶尖玩家较量。

靳东是谁?本月,金来到匹兹堡,与卡内基梅隆大学两名计算机科学家开发的人工智能机器对峙。

没有计算机在无限注德州扑克中击败过顶级人类玩家,无限注德州扑克是一种非常复杂的纸牌游戏,也是世界扑克系列赛的主要赛事。

大约2年前,金东在同一家赌场击败了AI,但这一次情况有所不同。

周五深夜,为期20天的比赛刚刚进入第十天。

靳东在接受采访时表示,他和他的同龄人没有机会赢得比赛。

当时,靳东正准备返回酒店,备战第二天的比赛。

靳东告诉记者:“在今天之前,我并不知道AI已经变得如此强大。

在对决的过程中,我感觉我在和一个人比赛,这个人作弊了。

他好像能看到我的底牌。

我不是谈论人工智能是作弊,只是它玩得太好了。

”该机器名为 Libratus。

Libratus在拉丁语中的意思是“平衡”,靳东表示这个名字与机器的性能相符。

靳东也表示:“好像什么都知道一点。

” AI不会以同样的方式打牌。

它也会用好牌或坏牌进行虚张声势。

如果手中的牌是好是坏,它就会下注很高。

赌注。

也就是说,靳东在比赛过程中很难找到漏洞。

如果他确实发现了漏洞,那就是第二天了。

顶级扑克玩家Jason Les和Daniel McAulay也参加了挑战,他们的描述与靳东非常相似。

当比赛进行到第10天时,三名球员都表示可能能打平,但一场都赢不了。

赖斯说:“很明显,在这一点上,人类不太可能取得完全的胜利。

我们深陷绝望的境地。

”从那时起,他们的处境变得更加恶化。

到周一晚上,尽管人类赢得了当天的比赛,但机器赢得的赌注比最接近的竞争对手多了 42 美元。

人工智能再次取得重大突破。

人工智能机器在跳棋、国际象棋、危险边缘和围棋等游戏上已经超越了人类,但无限制的德州扑克非常困难。

为什么?因为它是一个“不完全信息”的游戏。

卡牌是隐藏的,玩家在任何时候都只能看到游戏的一部分。

为了获胜,他们必须依靠直觉:猜测对手会打什么牌。

这在无限注德州扑克中尤其重要,因为赌博过程涉及复杂的投注策略。

人工智能正在兴起,人类在扑克游戏中扮演什么角色?这是本次大赛的焦点。

机器每天都会以不同的方式玩扑克,而且差异巨大,它会修补人类对手认为存在的游戏漏洞,而卡内基梅隆大学的研究人员会随着游戏的进展改进系统。

有修改过吗?卡内基梅隆大学教授 Tuomas Sandholm 拒绝透露此事。

不管怎样,桑德霍姆和他的搭档、卡内基梅隆大学的博士生诺姆·布朗肯定参与了这场游戏,而且很活跃。

他们很可能每天都会修改机器。

即使没有修改,他们也在掩盖,试图让靳东和其他人类玩家产生怀疑,这也能改变游戏的轨迹。

这可能看起来不公平,但这就是人工智能的工作原理。

人类一直在改变人工智能,因为人类正在走向更好的可能性。

很多时候,人类和人工智能并肩前进,因为这是让可能性变成现实的最佳方式。

正如 Kim Dong 指出的那样,桑德霍尔姆确实想赢。

靳东说:“他是一个非常复杂的人,我认为他不会轻易接受失败。

”在AI世界中,许多专家将游戏作为下一站的跳板。

是的,广泛的协作是现代人工智能的一个特征。

许多研究人员都是学者,或者来自学术界,他们希望以某种方式分享他们的研究成果,这种意愿改变了许多公司的文化。

与此同时,研究人员也希望击败同行,取得新的突破。

事实上,就在桑德霍姆和布朗推出 Libratus 之前,阿尔伯塔大学的研究人员也发布了一份关于击败许多人类扑克玩家的系统的报告。

只不过这些选手的水平没有靳东那么高。

一方面有学术竞争和共享,另一方面有大量的企业资金。

两者的结合刺激了人工智能的快速发展。

在谷歌的资助下,研究人员开发了一种人工智能,击败了职业围棋选手。

人工智能是如何运作的?从匹兹堡扑克比赛中,我们可以看到AI与人类之间的距离正在缩小。

人类和人工智能同时竞争和协作,竞争和合作往往会带来最好的结果。

匹兹堡的比赛中,金东心情沮丧,似乎有一种挫败感。

桑德霍姆没有透露 Libratus 是如何工作的,也没有透露这台机器是否在不断修改,这似乎不公平。

但我们以前已经看到过这种情况:计算机和人类共同努力构建明天无敌的系统。

游戏规则就是这样。

就在匹兹堡的对决即将开始之际,桑德霍姆接受了《华盛顿邮报》的采访。

他说:“我很兴奋。

”桑德霍姆被机器打败了,但他的卡牌技术却不太好。

对于机器来说击败他并不是什么伟大的成就。

过去13天里,Libratus在匹兹堡赌场与四位世界扑克冠军对决。

如果AI能够击败对手,无疑将是又一个巨大的突破。

到目前为止,已经玩了0手牌,Libratus从0开始就赢得了42美元的筹码。

换句话说,世界冠军损失了42美元。

他们不是玩真钱游戏,而是争夺 200,000 美元的总奖金,这笔奖金将由所有人分享。

还剩 0 手牌可以玩。

如果情况不扭转,人工智能最终将在扑克游戏中击败人类。

这是第一次。

“Libratus 从一开始就处于领先地位,”计算机科学家 Sandholm 说道,他的简历长达 12 页。

Libratus 是 Sandholm 12 年研究的成果。

卡内基梅隆大学的研究始于 2001 年,当时 Sandholm 开始研究具有连续信息不完整性的游戏的抽象算法。

国际象棋是一种具有“完整”信息的游戏,因为双方棋手都可以看到棋盘并预测对手的下一步行动。

与“不完整的游戏”不同,双方无法知道游戏的所有信息,例如对手的牌是什么。

桑德霍姆认为,无限下注德州扑克模型可以用来推测真实的“不完整”情况,例如网络和军事策略。

他想开发一套可以执行策略推理的通用算法。

从Claudico到Libratus的研究过程中,算法一次又一次输给了人类。

2018 年 5 月,桑德霍尔姆在河流赌场组织了一场扑克锦标赛。

当时,他让人工智能程序“Claudico”与四位扑克冠军进行比赛。

Claudico 输掉了 13 美元的筹码。

卡内基梅隆大学在 2016 年的一份新闻稿中解释道:“人类通常下注等于底池的一半或三分之二(所有玩家在游戏中下注的筹码总和)。

克劳迪科有时会下注。

很少见,只有 10%,有时很多,最多 10 次,”参加比赛的人类大师 Doug Polk 当时向卡内基梅隆大学解释道:“下注 0 美元,只是为了赢 10 美元。

”在参加“年度电脑扑克大赛”时,Sandholm 的团队连续两年输给其他 AI 团队。

Sandholm 解释道:“不同的研究方法带来不同的结果。

”但到目前为止,还没有 AI 系统击败过人类扑克大师直到 Libratus 出现,现在 AI 又在匹兹堡与世界冠军对决了。

桑德霍姆说:“AI打扑克的方法可能是人类从未使用过的。

AI打扑克就像火星人打扑克一样。

” Libratus对无限注德州扑克的规则有着深刻的理解,它也知道对手可能会采取行动,然后制定策略。

其中两名被AI击败的冠军选手此前曾与克劳蒂科交手过。

游戏进展如下: 玩了 0 手牌后,Libratus 领先 3 美元;玩了 0 手牌后,Libratus 将金额增加了 14 倍,达到 42 美元。

Libratus 面临着挑战。

AI程序是恒定的,而人类玩家则可以不断学习、学习、提高。

人类玩家依然有求胜的欲望。

他们想要赢得奖品并面临社会压力。

比赛第9天,一名男子对赖斯说:“嘿,你让我们失望了。

”现在AI已经成为第一位。

Sandholm 已经开始接受这一结果,他告诉记者,其他人工智能研究人员已经发送了许多电子邮件祝贺 Libratus 的成功。

与此同时,人类玩家使用 Twitch 直播比赛,使用 Twitter 直播比赛结果。

1月23日,赖斯在推特上发文:“人类终于赢得了9.3万美元。

”现在还不是桑德霍尔姆庆祝的时候,因为结果要到月底才会正式公布。

Libratus 曾与几位职业扑克玩家对战,有时是单挑,有时是两名玩家,并且已经玩了数千场扑克游戏。

这场为期20天的比赛才刚刚过半,Libratus已经比人类对手多了近80万美元的筹码。

虽然不确定,但AI获胜的概率非常高。

寻找最佳策略 百度首席科学家吴恩达认为:“对于AI来说,扑克是最难征服的游戏之一。

没有单一的最佳策略可供选择。

AI必须随机化行动,这样对手就无法达到欺骗的目的,桑德霍姆表示,他很惊讶人类竟然能优于计算机这么久,桑德霍姆说:“这些顶级职业选手太棒了,完全超出了我的预期。

在所有经过人工智能处理的游戏中,只有在扑克中人工智能无法超越人类的表现。

”人工智能专家使用博弈论——换句话说,它是战略决策的数学——找到应对的最佳策略杜克大学人工智能和博弈论教授 Vincent Conitzer 认为:“每一种行为的好坏都取决于你无法观察到的事物,因此,存在多种可能性。

”系统必须具有“不可预测”的特征,如果你从不吓唬或愚弄,那么你就不是一个好的玩家。

博弈论可以告诉我们如何最佳地随机化游戏。

“与之前的Claudico相比,Libratus采用了一些新技术。

Sandholm表示,它采用了新的平衡近似技术。

当游戏进入后期时,一些牌会被揭开。

系统用新的方法分析可能的结果。

分析游戏结果计算量大,系统需要卡内基梅隆大学和匹兹堡大学联合运营的匹兹堡超级计算中心的支持,每场比赛的胜利并不意味着人类将不再在扑克桌上立足。

Libratus 使用的技术无法处理多人无限德州扑克。