首页 > 人工智能 >德扑人工智能,德扑人工智能软件

德扑人工智能,德扑人工智能软件

爱卡科技 2024-11-30 10:44:08 0

大家好,今天小编关注到一个比较有意思的话题,就是关于德扑人工智能的问题,于是小编就整理了2个相关介绍德扑人工智能的解答,让我们一起看看吧。

AI赌神Libratus称霸德州扑克赛场,人工智能是如何打德州扑克的?

1 月 30 日,宾夕法尼亚州匹兹堡Rivers赌场,耗时20天的德州扑克人机大战尘埃落定。卡耐基梅隆大学(CMU)开发的AI程序Libratus 击败人类顶级职业玩家,赢取了20万美元的奖金。(关注钮问,关注创业

德扑人工智能,德扑人工智能软件

众所周知,人工智能已经在围棋中击败了人类中的顶级人物,相比而言扑克更加复杂。扑克不确定因素很多,比如对手可能会欺骗,在现实世界中到处都是欺骗,AI还不懂得怎样欺骗。扑克玩家看不到对手的牌,但在西洋棋、国际象棋和围棋中,大家可以看清对方的棋子。

那么人工智能是如何打德州扑克的呢?

一、AI赌神Libratus的策略

Libratus 运用了三种策略:增强(自我)学习、残局解算器、避免人类识别模式。程序用“逼近法”打败了人类对手,“逼近法”与直觉有点相似。

德州扑克有运气成分,但比赛总共进行12万手牌,牌运的影响几乎微乎其微。打100-1000手牌,运气还是影响很大的;但打了12万手牌赢到17.66万个盲注,比赛结果的可信度高达99.77%。也就是说,每场比赛打12万手牌,人类与AI进行1000场比赛,AI将赢下998场,人类只能赢下2场。因此,人工智能Libratus 有着完全不可逆转的优势。

二、人类学习扑克的模式

人类学习扑克的一种模式是试错模式,每次输了一手大牌后,想如果我当时不去加注,不去跟注或者扣牌就不会输了。每次对过去的行为感到后悔,然后总结经验调整打法,看是否赢得更多的钱或少输钱。

人类更多是从互联网学习别人已经总结好的正确打法。然后再加以练习,比如每天打上4-5个小时,再花1-2个小时总结今天打扑克的错误和进步,一般6个月里在互联网上打300—500万手牌,通常能成为优秀的扑克玩家。

三、人工智能Libratus学习扑克的模式

扑克人工智能是通过Counterfactual Regret Minimization进行100万亿手牌的训练来形成一套完美的打法。

Libratus主要依靠自己的近乎无限的计算量,通过无数盘德州扑克对决,把自己培养成能够面对各种复杂牌局都能提供最优解,换言之,Libratus本身就变成了德州扑克对决的最优算法集。再根据不同的对手,在不同时间段,进行调整。人工智能必须根据近期相关性的牌局,来调整自己的打牌的范围,进而适应不同对手,不同的打法。

卡内基梅隆大学团队(其Computer Science专业堪称全球最好)每晚用超级电脑来分析白天的比赛,提高系统性能。系统检测自身在每轮比赛中的弱点,每天补救三个最明显的失误,而不是试图学习对手的制胜战术。

相对其它玩扑克的程序,Libratus最主要的提高在于电脑在接近游戏最后时的玩法。先前的系统从头至尾使用单一战术,但是Libratus使用额外的反馈回路来实时回应对桌的人类。

百度首席科学家的吴恩达说:“扑克曾经是AI最难攻克的游戏之一,因为关于游戏状态你只能看到部分信息。扑克并没有单一的最优下法。相反,AI玩家必须让自己的行动随机化,这样它诈唬时才能让对方无法确定真假。”


如果你也想创业!如果你正在创业!
右上角关注:“钮问”的头条号

在今年的围棋人机大战中,“阿尔法狗”击败世界最顶级的职业选手。而在美国的匹兹堡,人工智能Libratus在德州扑克比赛中击败四名顶尖人类牌手,这些耀眼的成绩,吸引着无数人的眼球。也坚定了人工智能开发者的信心。

这些人工智能开发团队通过棋类比赛来,挑战人类的极限。无论是“阿尔法狗”还是Libratus这些对弈类人工智能都遵循一套既定的运算原理。人工智能最大优点就是高效的运算能力。通过对已有大量棋局或牌局的情形分析,通过已将量化的可供运算的模型来找出最优解,达成既定目标,赢得对局。

第一步数据的获得就是通过电脑的运算来实现的。电脑和电脑打牌,输入既定残局,记录对弈过程中可能出现的各种结果,积累大量可用数据。第二步建立模型,这是最重要的部分,大量的顶尖科学家需要建立系统模型,让人工智能从众多的情况中挑出当时的最优解,这里是需要大量人力进行参与,使得人工智能表现自能像人一样具有逻辑性,实现具有处理数据的能力。第三步让人工智能向着既定目标,步步为营,找出实现目标的最快策略,赢得博弈比赛。所有的对弈类比赛都是这个思路,有兴趣的朋友可以看看大牛写的专业分析,做为一个实用主义者,海微更喜欢用微信聊天,而不是研究微信的代码是怎么写出来的。

人工智能之所以能够战胜人类棋手或牌手是因为,人的对弈都是从经验中来,当某一种出牌风格或下棋风格不容易出现在对弈过程中,人类的博弈经验就会相对缺失,而机器人ai自我演练却能很好的弥补人类的经验的空白。实际上人类棋牌类的高手对弈的可能是比自己经验更丰富,一群顶尖人才团队智慧的集合体,玩不过也是合情合理。

我是海微,告别纷繁冗杂的科技术语,用最接地气的语言,带你了解最新的科技资讯

胡扯,机器人能称霸德州扑克?那让他把每年的世锦赛冠军都拿下吧,几百万美金,得一个小冠军就敢说称霸了,连i∨ey都不敢这样说,世界级牌手,职业生涯超三干万美元的奖金没你牛逼,一个小冠军,技术有,但运气还是占主要的,你机器人只要看不到底牌,长期和人打,必死。

你喜欢玩游戏吗?

从小就喜欢玩游戏,玩游戏还沉迷于中,各种充钱熬夜从俄罗斯方块,植物大战僵尸到要塞围城到亡灵杀手和现在的王者农药每一个都玩了差不多一两年!王者玩了三年,充了2000多块,后来连学业都荒废了,想通了其实真的游戏玩玩就好,玩多了会让人心灵空虚,堕落,没有上进心。还是多做做有意义的事吧!沉迷虚拟世界没有意义。该多陪陪家人交交朋友!游戏就是游戏,不要被游戏玩。

到此,以上就是小编对于德扑人工智能的问题就介绍到这了,希望介绍关于德扑人工智能的2点解答对大家有用。