2020年10月

德州扑克人机大战:人工智能上半程领先

  继围棋之后,人工智能(AI)又开始挑战德州扑克。而且,根据目前的战况,人工智能这一次似乎又要打败人类顶尖高手。这场德州扑克人机大战目前正在匹兹堡赌场上演,整个赛程共持续20天,始于今年1月11日,将持续到1月30日。对阵的双方是卡耐基梅隆大学(CMU)开发的“Libratus”人工智能系统,以及四位德州扑克的人类顶尖高手。

  如今,第13天的比赛已经结束。在67000手较量中,Libratus已经赢得价值70.1242美元的筹码。这意味着,人类冠军已经输掉了同等数量的筹码。

  在剩余的比赛日中,还有53000万手较量。如果按照当前的趋势,人工智能将首次在德州扑克比赛中战胜人类冠军。

  卡耐基梅隆大学研究人员也表示,希望Libratus最终能够赢得比赛,这样他们就可以首次向全世界宣布:人工智能又攻克了德州扑克,首次战胜人类冠军。但同时,卡耐基梅隆大学的竞争对手又表示不服。

  加拿大阿尔伯塔大学、捷克布拉格查理大学和捷克理工大学的研究者近日联合发表论文称,其所研发的人工智能系统DeepStack已经在德州扑克比赛中达到了专家级水平。因此,他们的人工智能系统才是第一个战胜人类的。

  但帮助卡耐基梅隆大学设计Libratus人工智能系统的托马斯·桑德霍姆(TuomasSandholm)教授称:“DeepStack并未战胜顶尖高手,因此还不能说它已经战胜了人类。”

  桑德霍姆还称:“我们两年前已经达到他们的水平了,但那不是我们的目标。我们的目标从来就不是 专家级 ,而是 超人水平 ,就像 深蓝 和 沃森 那样。”

  需要指出的是,无论是在“有限注德州扑克”,还是“无限注德州扑克”比赛中,人工智能系统只能应对“一对一”的比赛。而在多人(五人或更多)同时比赛中,其复杂性仍是人工智能目前所难以应付的。但不管怎样,这些比赛结果表明,至少有两套人工智能系统又要创造新的里程碑。

CMU风头被抢 新型DeepStack算法抢先攻克德州扑克图灵测试

  (原标题:CMU风头被抢 新型DeepStack算法抢先攻克德州扑克图灵测试)

  在国外的学术圈里,有一份论文火了。论文里进行的研究表明,人类历史上第一次,AI在德州扑克游戏上赢得了人类职业玩家。而这份论文的突破性意义在于:AI在非完整信息的博弈游戏中,赢得人类职业对手。这篇论文的名字是《DeepStack:无限下注扑克里的专家级人工智能》(DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker),1月6号提交到了ArXiv上。

  论文作者是来自加拿大Alberta大学、捷克Charles大学、布拉格捷克理工大学的研究人员。而论文题目里的DeepStack,是一种新型的算法名称,论文里说明到“DeepStack 是一种通用算法,可用于一大类非完整信息的序列博弈”。在一项涉及到数十位参与者和4.4万手扑克的研究中,DeepStack 成为了世界上第一个在“一对一无限注德州扑克”上击败了职业扑克玩家的计算机程序。

  德州扑克的英文名称是“Texas Holdem”,而“一对一无限注德州扑克”(Heads-up no-limit,简称 HUNL)的意思,就是有2个玩家且不限下注筹码。这篇论文里的自然就是计算机和职业玩家挨个对局。

  虽然是扑克,但跟斗地主还是很不一样的,它是“赌场”十分受欢迎的项目。这里祭出视频,帮大家理解一下德州扑克的规则和玩法。

  从上面的视频中,我们大致能了解一场德州扑克会有两类信息:玩家每人手里分到2张底牌的“私有信息”和桌子上公共牌的“公开信息”。玩家选择5张公共牌里的3张,与手里的2张底牌组合,最后以期得到最好的5张牌的组合。按照“Card Ranking”决定最后的胜者。

  在中国玩德州扑克的名人,一个是汪峰老师,另一个就是李开复老师。在知乎上“扑克有哪些技巧、经验或者原则?”的提问下,排名第一的,就是李开复老师的答案,他尤其提到玩好诈唬(Bluffing,高手惯用技巧)的关键在于学好统计。

  德州扑克已经成为十分流行的人工智能研究测试地,每一个扑克玩家手里握着的底牌“私有信息”,是其它玩家看不到的,所以被称为是“非完整信息”(Imperfect information)的博弈。这跟围棋有很大不同,围棋是完整信息公开的博弈,玩家们可以看到棋盘上的每个旗子,考虑所有落子的可能性。所以德州扑克对于人工智能来说,更加具有挑战性。

  《DeepStack》这篇论文的通信作者 Michael Bowling曾经在2015年初接受《New Scientist》采访时说道:“德州扑克最有趣的地方,就是你无法获得完整的信息”。

  而卡耐基梅隆大学(CMU)Tuomas Sandholm教授也说道:“扑克已经成为在非完整信息情况下,衡量(计算机)智能水平的标准......而它可以看做是一种超越图灵测试的存在。”

  有趣的是,这两位教授都在领导自己的团队攻克这个新型图灵测试,一位在加拿大Alberta大学,一位在美国CMU大学。

  几天前,CMU已经发出预告:由Tuomas Sandholm教授领导研发出的Libratus人工智能系统,将于当地时间1月11日,在宾夕法尼亚州匹兹堡的 Rivers 赌场,与四个顶级职业玩家玩12万手的HUNL,并角逐20万美元的奖金。早在2015年,Libratus的前身Claudico与人类玩家首次对战,在8万手的对决中完败,这次算是CMU的卷土重来。

  但是我们已经知道了结果,Alberta赶在CMU之前,把就论文发出来了。学术圈人士纷纷表达赞美,称DeepStack具有里程碑意义(当然这份论文还未通过同行审议阶段),然而跟CMU Libratus提前好几天的预热盛况相比,DeepStack并没有得到等量的媒体待遇,也引发一些人的不满。

  CMU走的是当年AlphaGo的路线,在华丽的赌场搞一场秀,与人类顶尖玩家对战,还有20万美金的噱头。所以这份DeepStack论文虽然比CMU更早取得突破,但阵仗不如后者大,媒体对其忽视了,也在情理。

  总之一句话,Alberta抢了先,CMU抢了热闹(学术界的竞争也是异常激烈的)。

  DeepStack总共与33位人类选手进行了4.4万手的较量,分别在2016年11月7日和12月12日之间于线上举行对局。最终获胜的前三位选手,分别有5000、2500和1250加元的奖励。以下是对局结果。结果显示,DeepStack的平均赢率为492 mbb/g(一般人类玩家到50 mbb/g就被认为拥有较大优势,750mbb/g 就是对手每局都弃牌的赢率)。

  前面我们提到,一场扑克的信息可以分为“私有”和“公开”,放在桌子中间的5张公开牌形成一种动态的“公开状态”。游戏中的公开状态的可能序列构成一个公开树(Public tree),其中每一个公开状态都有一个相关的公开子树(Public subtree)。

  上图是HUNL 中公开树的一部分。红色和蓝色线条表示玩家动作,绿色线条表示公开的公共牌。圆形节点表示游戏结束。

  这张图是DeepStack整体架构,分为(a)(b)(c)三个部分。在(a)中,DeepStack在每一个公开状态里, 都要重新计算它需要的动作,其中子树值(Subtree value)会通过一个训练好的深度神经网络 Neural net(b)来计算,而训练Neural net的样本就是(c)。

  总的来说,DeepStack结合了递归推理(Recursive reasoning)来处理信息不对称性,还结合了分解(Decomposition)集中计算到相关决策上,并形成了一种关于任意牌的直觉(Intuition),这种直觉可以使用深度学习进行自我玩牌而自动学习到。

公司简介

  体育竞彩网以科技先导,追求无止境,朝尖端技术迈步,凝结高科技成果,高理想精湛开发,以顾客满意为标准,先进的工艺设...。流体装卸设备设计制造技术,产品能满足用户不同介质、压力、温度、化学特性的液体介质的储运、装卸。本公司拥有一批精干的创新能力、开发能力、开拓能力的研发人员,熟练的车间技工,既具有较深调试技术经验的工程师。公司主要产品有:陆用液体装卸臂、鹤管、移动装卸泵组、防滑活动梯、装卸操作平台、定量装车系

可当现金用 斗地主如何赢淘宝红包和集分宝

  当然我们付出的时间也不应该白费,现在笔者就交大家如何斗地主赢淘宝红包,可以在购物时当现金用哦。

  4、点击进入后,我们可以看到,不同类别的游戏场次,这时候随便你进那个场,只要有你赢的前几名都想获得不同的层次的奖励,当然第一名的奖励就如图上标出的那样了,而且进入场次需要宝豆,淘宝每天都会送你不少,要是你运气好,赢多多是没问题的!

  5、当你获得很多红包和集分宝时,你可以点击下方领奖按钮,这时会跳出领奖页面,看看你到领奖的条件没,红包的兑换是10和50,集分宝的越换1000个。

未命名文档

  体育竞彩网提供整个城市,你可以放心,知道我们有你需要的停车空间。找到该设备是最接近您的目的地。

  还有遍布全市兰卡斯特1,052咪表泊车位。仪表具有从上午8:00至下午6:00周一2小时的时限至周六。

  支付你的月租,汇款凭证,发票,停车票,以及住宅停车许可证在线。服务可能需要付费。网上支付

  周四,2020年9月24日的LPA的定期董事会会议将由变焦会议在上午8点举行。请使用以下信息登录到会议。放大董事会会议