德州扑克中的人工智能


 

今在男女老少之间有一种十分流行的消遣娱乐方式,就是德州扑克。德州扑克是英文Texas Hold’em poker的中文翻译,这个扑克游戏看则简单实则需要斗智斗勇。

一般每个台面上至少有两个玩家,有时最多会有22人,通常2-10人参加。德州扑克一共有52张牌,没有王牌。每个玩家分两张牌作为“底牌”,五张由荷官陆续朝上发出的公共牌。开始的时候,每个玩家会有两张面朝下的底牌。经过所有押注圈后,若仍不能分出胜负,游戏会进入“摊牌”阶段,也就是让所剩的玩家亮出各自的底牌以较高下,持大牌者获胜。
 

对于山姆•甘梓弗兰德而言,德州扑克“玩的就是心跳”。在他看来,可以从德州扑克当中学到很多有用的思维,这个游戏中用到的各种方法,在使用科学方法来解决复杂问题时,同样有效,例如可以用来为艾滋病人制定一个最好的治疗方案,或者是在机场防护这个问题上为其制定出最有效的方案。
 

甘梓弗兰德从匹兹堡搬到了迈阿密,在那里他开始担任佛罗里达国际大学计算机科学系的助理教授,他既玩德州扑克,也研究德州扑克。在2010年的世界扑克大赛中他砸了很多钱进去,在去年的匹兹堡扑克公开赛和三河扑克挑战赛中也花了重金。
 

此外,甘梓弗兰德也是卡内基•梅隆大学人工智能研究小组的成员之一,这个小组曾研发了著名的人工智能扑克程序Claudico,在2015年它曾与四名世界上最顶尖的四名扑克选手进行无限制德州扑克比赛,在连续两周的比赛中选手们与人工智能程序Claudico大战80000回合。
 

德州扑克是一个很好的研究工具,因为它需要参与的玩家都必须基于不完整的信息来做出一个最终决定,这里的玩家无论是人工智能程序还是人类,都必须要这样做。每个玩家的手中都有两张牌是桌面上其他玩家看不到的。德州扑克的游戏过程中,可以让AI自主选择出一种最好的扑克战略,而这一思路,可以完全适用于人类的科学探究上,能够帮助人们解决许多复杂的问题,这些问题之所以复杂,科学家们认为主要是因为没有提供足够的信息。
 

“关于电脑扑克研究,仅仅只有十几年的时间。”甘梓弗兰德说,他目前拥有哈佛大学的数学本科学位以及卡内基梅隆大学的计算机博士学位。他说道,“电脑扑克程序这一先进的科技应用也逐渐在医学和安全领域中崭露头角。看到这些应用的发展是一件令人很兴奋的事情。”
 

打个比方,在医疗诊断领域,最关键的是要将疾病的诊断当成一个零和游戏,这就好比在一对一的扑克游戏中,一方赢了另一方就输了。在医疗上,如果病人“赢”了,那疾病就“输”了,反之亦然。人工智能的目标是能够制定出一项策略,使之长期都能够起到一定的作用。
 

甘梓弗兰德说,参加一对一无限制德州扑克的玩家,在整个游戏过程中,要遇到不计其数的各形各色的情况,其中存在着许多可能性,据一家网站统计报道,这种模式下选手们面临的选择很庞大,他们夸张地形容其数目都可以与宇宙中原子的数目相媲美。
 

“在很多情形中,对于很多牌手,有些信息只有他们知道,别人不知道。”甘梓弗兰德说道。“人工智能牌手必须要有策略地对其进行识别和反攻。这其中存在的黑幕,所使用的各种方法迟早有一天会涉及到其他领域,这仅仅是时间问题。”比如在阿尔伯塔大学,就曾经开发过一个智能程序,在德州扑克中也使用过,后来被用于帮助计算机来进行个体糖尿病治疗。
 

单纯从扑克领域来说,甘梓弗兰德十分担忧这些计算机机器人会对在线游戏带来很多潜在的影响。宾夕法尼亚州会协同内华达州,新泽西州和特拉华州一起对在线扑克行业进行整顿和管制。成千上万的美国人依然通过境外的一些网站玩在线扑克,这一管制的实施对幕后的老板带来了很多损失,为此一直抱怨不断。目前在美国的扑克网站,使用人工智能程序是违法行为。 
 

“尽管我现在是从事人工智能扑克程序的研究工作,但是我也玩扑克牌。我当然不希望这些程序对会扑克游戏产生任何不利的影响。现在学术研究人员们的确没有将所研发的机器人代码用于在线游戏中。”
 

不过,还是有人开发了计算机程序,将其用于在线扑克游戏中,许多人类玩家都不是它们的对手。甘梓弗兰德说道这一趋势让一些火爆的网站陷于一个困境。如果这些机器人程序能够玩许多回合,那么该网站就能从每个回合中赚到更多的钱。另一方面,当人们因为无法赢过这些机器人,通常就会离开,那么对于该网站就会赔不少钱。
 

有一种方法可能会缓解这样的问题,就是对这些网站进行分门别类,哪些是专门针对机器人开放的,哪些是针对人类开放的。“这样分开,可能会发生很多有意思的事情,其中的一些数据会有很大的研究价值。”甘梓弗兰德说道。
 

“无论该领域发生了什么,我的目标不仅是开发一个扑克程序,而是对那些具有广泛适用性的基础科学问题进行研究。”他如此说道。


发表回复