来源|大数据文摘
还记得那个叫Libratus的扑克机器人吗?在2017年,它在无限加注(可以随时全压All In)德州扑克比赛中击败了四名人类高手,成为一时的焦点。
似乎已经很久没有听到它的消息和后续研究了,近期有消息透露,原来它已经去五角大楼给美国军方进行秘密研究了。
计算博弈论或为军方提供意想不到的决策方案
Libratus机器人-拉丁语的意思是平衡-由卡内基梅隆大学的研究人员制造,用于测试基于博弈论的自动决策。
2017年2月,经过20日的赛程,Brain vs.AI的德州扑克人机大战在卡耐基梅隆大学(CMU)落幕,由4名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 组成的人类大脑不敌人工智能程序 Libratus。
当时获胜的AI Libratus,在胜利后还不忘在推特上发文嘲讽了一下战胜的几位人类玩家,“至少你们努力了……”。
“Libratus”以绝对的优势在单挑无限德州扑克中赢得了人家职业玩家,这无疑是AI发展史上的一座里程碑。
战后,CMU也发布了官方文章,Libratus的研发者之一、CMU计算机系教授Tuomas Sandholm也说明了本次研究的新意所在:“每天的比赛结束后,我们会利用算法分析职业玩家的战术漏洞,并将其补充给Libratus的套路中,Libratus会据此每晚优先修复排名前三的漏洞。这与我们之前了解的扑克的学习方法很不一样,一般来说,研究者会开发利用对方弱点的算法。这次相反,我们采用的是通过算法将对方的漏洞修补到自己的套路中。”
去年年初,领导该项目的教授Tuomas Sandholm创立了一家叫“策略机器人”(Strategy Robot)的公司,将其实验室的游戏技术改造为政府所用,比如战争游戏和用于探索军事战略和规划的模拟器。
公开记录显示,8月下旬,该公司与美国陆军签订了一个价值高达1000万美元的两年合同。这份合同是为了“支持”一个名为国防创新部的五角大楼机构,该机构于2015年创建,旨在吸引硅谷科技公司进行合作并促进美国军方采用新技术。
Libratus在2017年击败职业扑克选手被视为人工智能的一个里程碑,因为纸牌游戏的复杂性是电脑最容易掌握的棋盘游戏所不具备的。在国际象棋和围棋中,玩家双方都可以看到每一个棋子的行为,是一种完全信息游戏。而在扑克中,并非所有的牌对双方都是可见的,这意味着,在许多实际场景中,计算真实状态所需的某些信息是未知的。
Libratus建立在一种称为计算博弈论的技术之上。它通过计算对手对它决策的反应从而赢得超过180万美元的扑克冠军奖金。该软件设计了强大的投注策略,甚至可以做到虚张声势(bluff)。
Sandholm说,Libratus的博弈方法可以应用于许多其他游戏,也可以应用于军事模拟(沙盘演练)。他认为,即使是计算机模拟的战争游戏,这样的训练通常也只是测试了假想对手的策略的一小部分。Sandholm说:“这会过分强调你自己的主观假设,但真正的对手可能不会根据你的假设来行动。”
Sandholm拒绝讨论公司项目的具体细节,这其中至少包括一项其他的政府合同。他认为,他们的技术可以解决,包括在模拟的物理空间中做出决策的问题,例如军队的布防。国防创新部拒绝对该项目发表评论,陆军也没有对其评论请求作出回应。
Libratus的扑克技术表明,策略机器人可能会向作战人员提供一些令人惊讶的建议。和机器人打过比赛的专业玩家发现,它在和平于夸张的战术之间反复变换,一直不断直至胜利,仿佛它计算出了胜利之路。“这很奇怪,因为看上去它似乎风轻云淡,但是你看看得分,你就会意识到发生了什么,”Sandholm说。
美国新安全中心智囊团的研究员Greg Allen表示,Libratus所采用的技术可以使战争游戏和模拟练习变得更有用。“它虽仍然与真实情况相差甚远,但它的确是现实世界的一个很好的替代品,”他说,尽管如此,这种技术给出的结果可能仍然只是战略规划和研究的其中一个组成部分,因为即使最好的人工智能技术可以掌控某些场景,现实世界也要比这些场景复杂得多。
由 Tuomas Sandholm 和 Noam Brown 开发的计算机程序在2017年的比赛中击败了四名职业扑克玩家。
五角大楼正全面扩大人工智能的应用
策略机器人不是五角大楼唯一一个在AI增强游戏理论领域的新尝试。其研究机构Darpa正在启动一项计划,探索该技术如何应用于军事决策。密歇根大学Michael Wellman教授表示,他的团队正致力于将计算博弈论应用于该计划下的网络安全。他认为Libratus可以被视为这种技术迈向成熟的标志。
现在是时候在一些更真实的领域尝试这项技术了,扑克比赛的突破非常引人注目,应该也会很快应用于其他游戏中。
除了策略机器人公司,Sandholm创办了另一家叫“战略机器”(Strategic Machine)的公司,该公司正在将其博弈解决技术部署到商业环境中,如电力市尝体育赛事以及使电子游戏中电脑控制的玩家更加狡猾。Sandholm表示,这两家公司都是自增长(早期不融资,靠自己能力成长)式的公司,拥有大约6名员工,并且已经开始盈利。
回到CMU计算机实验室,Sandholm也在考虑如何使他的技术更便携。
Libratus挑战职业扑克选手时,它是在联邦政府资助的匹兹堡超级计算中心的Bridges超级计算机上运行的。Sandholm说他的初创公司也使用过超级计算机。
在上个月举行的世界上最大的人工智能会议NeurIPS 上,他和Libratus的合作开发者Noam Brown发表了一篇关于一个名为Modicum的扑克机器人的文章,这个机器人功能略差但更为小巧,可以在一台服务器上运行。“在某些应用中,你需要将它小型化,比如能便携,”桑德霍尔姆说,“有些平台不支持大型计算机。”
五角大楼正在推动更广泛地使用人工智能技术。2017年,当时的美国国防部长James Mattis曾经感叹,他的部门在采用机器学习等技术方面落后于科技公司。同年,五角大楼启动了一项名为Project Maven的计划,旨在美国的各种军事任务中采用已商用的人工智能技术。它的首个项目是在精通人工智能的创业公司和包括谷歌在内的大公司的帮助下,使用机器学习来标记无人机监控视频中的对象。
人工智能的军事用途在全球逐渐推进,该喜还是忧?
其他国家也正在探索人工智能的军事用途。俄罗斯总统普京曾表示,谁能引领人工智能技术,谁就将成为世界的主宰。军事应用在中国的国家人工智能战略中也占据突出地位。2017年,中国国防大学举办了一场人类对抗人工智能的全国性的战争游戏竞赛。
人工智能在军事领域应用的不断增加,使一些正在推进基础技术的科技人员感到不安。谷歌的一些人工智能研究人员加入了千人抗议行动,抗议本公司对Project Maven项目的支持。很多员工辞职表示参与军事研究有悖谷歌信条"Don't be evil"。谷歌迫于压力,没有与五角大楼续约。
Sandholm认为对美国军方使用人工智能的担忧被夸大了。他表示,这项技术对于帮助五角大楼保护美国国土安全和提高运营效率非常重要。“我认为人工智能将使世界变得更加安全,”Sandholm说。
相关报道:
https://www.wired.com/story/poker-playing-robot-goes-to-pentagon/