人工智能打牌,人工智能打牌如何
大家好,今天小编关注到一个比较有意思的话题,就是关于人工智能打牌的问题,于是小编就整理了2个相关介绍人工智能打牌的解答,让我们一起看看吧。
乌镇是人工打造的吗?
1995年十月,画家陈丹青去杭州,绕到乌镇。那个时候乌镇还没有开发。当时陈丹青写下了这样一段文字:“东西栅破败凄凉,剩几户老人,听评弹,打牌,河边衰墙边停着垃圾堆、鸟笼子、还有家家的马桶,年轻人走光了。那种没落颓败,味道是好极了,我原是江南人,走走看看,绝对怀自己的旧,可是全镇完全被世界遗忘,像一个炊烟缭绕、鸡鸣水流的地狱。”
这是真实乌镇的写照。随着时代的进步,旅游业的迅速发展,给这座古镇带来了许多变化,现代化的购物中心等设施不断出现,也给来旅游的人们带来许多便利。所以说,乌镇不能算是人造的景观,它是一座有了现代化烙印的古镇。
AI赌神Libratus称霸德州扑克赛场,人工智能是如何打德州扑克的?
1 月 30 日,宾夕法尼亚州匹兹堡Rivers赌场,耗时20天的德州扑克人机大战尘埃落定。卡耐基梅隆大学(CMU)开发的AI程序Libratus 击败人类顶级职业玩家,赢取了20万美元的奖金。(关注钮问,关注创业)
众所周知,人工智能已经在围棋中击败了人类中的顶级人物,相比而言扑克更加复杂。扑克不确定因素很多,比如对手可能会欺骗,在现实世界中到处都是欺骗,AI还不懂得怎样欺骗。扑克玩家看不到对手的牌,但在西洋棋、国际象棋和围棋中,大家可以看清对方的棋子。
那么人工智能是如何打德州扑克的呢?
一、AI赌神Libratus的策略
Libratus 运用了三种策略:增强(自我)学习、残局解算器、避免人类识别模式。程序用“逼近法”打败了人类对手,“逼近法”与直觉有点相似。
德州扑克有运气成分,但比赛总共进行12万手牌,牌运的影响几乎微乎其微。打100-1000手牌,运气还是影响很大的;但打了12万手牌赢到17.66万个盲注,比赛结果的可信度高达99.77%。也就是说,每场比赛打12万手牌,人类与AI进行1000场比赛,AI将赢下998场,人类只能赢下2场。因此,人工智能Libratus 有着完全不可逆转的优势。
二、人类学习扑克的模式
人类学习扑克的一种模式是试错模式,每次输了一手大牌后,想如果我当时不去加注,不去跟注或者扣牌就不会输了。每次对过去的行为感到后悔,然后总结经验调整打法,看是否赢得更多的钱或少输钱。
人类更多是从互联网学习别人已经总结好的正确打法。然后再加以练习,比如每天打上4-5个小时,再花1-2个小时总结今天打扑克的错误和进步,一般6个月里在互联网上打300—500万手牌,通常能成为优秀的扑克玩家。
三、人工智能Libratus学习扑克的模式
扑克人工智能是通过Counterfactual Regret Minimization进行100万亿手牌的训练来形成一套完美的打法。
Libratus主要依靠自己的近乎无限的计算量,通过无数盘德州扑克对决,把自己培养成能够面对各种复杂牌局都能提供最优解,换言之,Libratus本身就变成了德州扑克对决的最优算法集。再根据不同的对手,在不同时间段,进行调整。人工智能必须根据近期相关性的牌局,来调整自己的打牌的范围,进而适应不同对手,不同的打法。
卡内基梅隆大学团队(其Computer Science专业堪称全球最好)每晚用超级电脑来分析白天的比赛,提高系统性能。系统检测自身在每轮比赛中的弱点,每天补救三个最明显的失误,而不是试图学习对手的制胜战术。
相对其它玩扑克的程序,Libratus最主要的提高在于电脑在接近游戏最后时的玩法。先前的系统从头至尾使用单一战术,但是Libratus使用额外的反馈回路来实时回应对桌的人类。
百度首席科学家的吴恩达说:“扑克曾经是AI最难攻克的游戏之一,因为关于游戏状态你只能看到部分信息。扑克并没有单一的最优下法。相反,AI玩家必须让自己的行动随机化,这样它诈唬时才能让对方无法确定真假。”
如果你也想创业!如果你正在创业!
右上角关注:“钮问”的头条号
在今年的围棋人机大战中,“阿尔法狗”击败世界最顶级的职业选手。而在美国的匹兹堡,人工智能Libratus在德州扑克比赛中击败四名顶尖人类牌手,这些耀眼的成绩,吸引着无数人的眼球。也坚定了人工智能开发者的信心。
这些人工智能开发团队通过棋类比赛来,挑战人类的极限。无论是“阿尔法狗”还是Libratus这些对弈类人工智能都遵循一套既定的运算原理。人工智能最大优点就是高效的运算能力。通过对已有大量棋局或牌局的情形分析,通过已将量化的可供运算的模型来找出最优解,达成既定目标,赢得对局。
第一步数据的获得就是通过电脑的运算来实现的。电脑和电脑打牌,输入既定残局,记录对弈过程中可能出现的各种结果,积累大量可用数据。第二步建立模型,这是最重要的部分,大量的顶尖科学家需要建立系统模型,让人工智能从众多的情况中挑出当时的最优解,这里是需要大量人力进行参与,使得人工智能表现自能像人一样具有逻辑性,实现具有处理数据的能力。第三步让人工智能向着既定目标,步步为营,找出实现目标的最快策略,赢得博弈比赛。所有的对弈类比赛都是这个思路,有兴趣的朋友可以看看大牛写的专业分析,做为一个实用主义者,海微更喜欢用微信聊天,而不是研究微信的代码是怎么写出来的。
人工智能之所以能够战胜人类棋手或牌手是因为,人的对弈都是从经验中来,当某一种出牌风格或下棋风格不容易出现在对弈过程中,人类的博弈经验就会相对缺失,而机器人ai自我演练却能很好的弥补人类的经验的空白。实际上人类棋牌类的高手对弈的可能是比自己经验更丰富,一群顶尖人才团队智慧的集合体,玩不过也是合情合理。
我是海微,告别纷繁冗杂的科技术语,用最接地气的语言,带你了解最新的科技资讯
到此,以上就是小编对于人工智能打牌的问题就介绍到这了,希望介绍关于人工智能打牌的2点解答对大家有用。