李开复:冷扑大师情商高 10%胜率远超围棋人机

2017年 04月 06日 09:31 责任编辑:董文龙 来源:新浪体育
字号:|

李开复与杜悦答记者问

北京时间4月5日上午,冷扑大师VS中国龙之队人机扑克巅峰表演赛赛前发布会在北京创新工场举行。创新工场CEO暨人工智能工程院院长李开复博士联手中国龙之队队长杜悦在现场答记者问。以下为相关采访。

记者:在AlPhaGo之后机器击败之类的事情已经不奇怪了,这次德州扑克的AI比赛,你希望哪些东西被关注到?

李开复:从纯AI科技领域来说,胜负不是最重要的,最终一定是电脑打败人类,我们可以为杜老师的团队加油。最重要的是两件事情,第一是AI的能力,AI的能力不仅仅与聪明的搜索,很大的搜索空间,像AlPhaGo这样。而且在很多未知的因素之下做判断和推理,同时我们可以把AlPhaGo理解为高智商的,但是冷扑大师是高情商的,而且这样的技术是可以在很多商业的领域里面达到应用,因为大部分人类的信息都不是彼此公开的,因此让更多的人了解AI的时代来临了,应用是众多的。另外对于科技一点的人来说,其实冷扑大师并不用深度学习,当我们都在位深度学习疯狂找各位应用的时候,我们要了解深度学习即便很伟大,有很多应用,其实才是刚刚开始,未来我们会有更多的科学家发明更多的技术,让AI给人类带来更多的价值。

中国龙之队队长杜悦

记者:你们团队有很多德扑玩的很好又懂计算机的专家,你们现在有没有针对冷扑大师有大概性的策略?

杜悦:第一我们做了很多准备,在小长假过程当中,龙之队的队员都在北京做团队的讨论,所以我们准备工作做得非常充分。第二基于我们对于人工智能对于AI的了解,我们相信虽然说这次冷扑大师是AI在德扑领域的巅峰之作,应该是取得了非常大的进步,非常大的成就,但是离计算机科学和人工智能能够达到的理论水平,还有一定的距离。它这个点是不是已经超越了一般的德州扑克高手,我们这次可以验证一下,就像李开复老师讲的,人工智能超越人类这是迟早的事情,不是这一次就是下一次,我们只是希望有一个小小的梦想和愿望,希望中国龙之队是最后一次能够战胜人工智能的团队。

记者:这次的表演赛为什么选择在海南而不是在北京、上海、深圳这样的人工智能发展相对好一点的城市呢?

李开复:我们在北京会做各种的直播,包括这次记者会,所以其实现在互联网已经连接了全世界了,在哪里比赛倒不是至关重要的,经过直播和记者会,当场跟大家讲解,我觉得在海南跟北京差别不是很大。但是我们也深深认为海南作为一个空气特别好,很好的创业环境,能够请一些国外的高手和队员看一看,会让我们大开眼界,有一些人可能觉得创业可以在海南做,有一些人可能决定在那边度假,教授已经拿着泳装问我那边的天气怎么样。

记者:人工在策略博弈和逻辑推理方面的作用。

李开复:不排除有运气成分,就像我跟杜老师打牌也不是每次都输给你,也偶尔赢一次,有这个概率的存在,但是两件事情可以把随机因素降到零,第一次打够多牌,我们这次打36000手牌。第二刚才打的复试机试,我跟Anita是一个队伍的,陈杰跟杜悦是一个队伍的,我拿到了AA,他拿到了二七,这样我赢的概率非常大。但是怎么把这个消灭掉?我的队友跟陈杰打的时候,一定程度把运气对冲了,经过这两件事情运气会被降到非常低,作为CMU的教授,已经打败了美国顶尖的牌手了,为什么不像深蓝封牌了不打了呢?他觉得还可以打一场,因为他觉得有足够多的信心可以胜出。我们做科研的不太相信外国瑞士法院,他们要懂让他们发明AI好了。

杜悦:我只是补充一点关于德州扑克,德州扑克运气成分非常大,这也是为什么德州扑克家喻户晓、广为流行,大家参与度非常强的重要的原因。一定是技术水平高的选手能够获胜。

记者:问一个问题,德州扑克作为棋牌的一种,有天然的体育属性,如何看待中国体育产业的发展。

李开复

李开复:体育尤其是从智力和体力的体育,都是很重要的,虽然未来人工智能时代来临,人有更多的时间,把这个时间放在智力和体力的运动是非常好的事情。对于智力、体力的投资,我们也有投资,我们也会看这些方面的投资机会,看到看得更多的是体育型的多一些,投了悦跑圈。如果说创新工场跨领域,最多是人工智能,这个领域里并不会看。这次冷扑大师组了一个公司,我们没有计划投资这个公司的,我们还是要看到人工智能公司能够快速产生巨大的商业价值,无论打得多好,还是相对小众的,我们看人工智能、文化娱乐、互联网金融、教育、B2B,也看一些体育方面的,我们不会投资太多,但是还是观看。

记者:像对于降低波动性来讲,有很多的方法。从限注和发多次牌或者说保险,为什么你们这次要采取直接按照概率进行?过度的为了降低波动性更改规则,是不会对人类选手的发挥影响,第二没有反转的德州扑克能算德州扑克吗?

杜悦:第一个问题为什么采用按概率的来降低运气的含量,记者朋友提到了好几种方式,比如说保险、限注,这些方式理论上来讲都没有体现对于期望值的评估。德州扑克长远而言打的是期望值,任何运气成分能够带来更多的刺激和体验,并不是一种技战术水平的准确的反映。这次人机大赛主要衡量机器人人工智能跟人类的选手技战术的水平,要尽量尽力运气成分。

记者:冷扑大师不是基于深度学习,而是基于博弈论,大家知道这轮人工智能的发展为什么是基于深度学习,因为深度学习让机器可以自我发展,像这次36000手牌的核心,我们看到不是让机器去不断的根据前面的战局完善自己,而是因为博弈论降低波动性,这样意味着他的概率在里面,不会随着时间的成长而让AI的提升像深度学习那么明显,而是说AI的提升还是基于程序员在背后做修改,而不是基于不断的持续的对战,您怎么看待AI的发展的趋势和未来?有没有可能和深度学习结合起来?

李开复:有关技术不要认为博弈论就是一个人工的编程,里面是有非常多的机器学习的成分,有两种不同的策略,都会学习和进步,而且上次跟美国高手对决之后,有在继续的学习,这次也会在每一次的半天比赛之后启动机器学习让它进步,绝对不是一个死的编程的东西在里面,博弈论是运用的方法,实际的学习还是机器学习,CMU的这位教授是美国人工智能世界TOP10之一。和AlPhaGo的深度学习的差别,创新工场有一位员工是曾经看过AlPhaGo的代码的,里面肯定不止是深度学习,有各种跟围棋相关的东西,即便发表的论文里面,也是深度学习和(英文)的配合,做好任何一个高端的AI软件,不能完全靠一种技术,AlPhaGo是至少三种的结合,我们相信冷扑大师现在发表的是两种,但是实际上可能有三四种不同的经过学习和成功失败、对手来做调整。另外对于个人也会有学习,比如说跟杜老师打的,慢慢的就会形成不同的数据,彼此对应的打法,智能还是挺强的。

记者:开复老师提到概率,德扑人类战胜人工智能的概率不到10%,是如何得到的?

李开复:我觉得我是凭两件事情,第一个毕竟这次的表演赛不如上次的对决那么长,这次是36000手牌,上次是12万,从12万降到36000手运气成分会增加一些,人类的机会会有一些。第二靠一批不懂计算机的人凭拍脑袋决定该怎么调整自己的策略,一定不如龙之队有这么多的学霸,如果纯一对一的比,龙之队不见得打得过美国的四个人,但是经过深度的思考研究,对于计算机的理解应该是有胜率的。我大胆的相信了杜老师的10%的预测。

记者:我们抱着必败的心理参加比赛了,这有什么价值?

李开复:10%挺高的,大家赶快来观看人类还有10%的机率,AlPhaGo对于柯洁是完胜。

杜悦:10%是我原创的,经过李开复的宣传广为人知,如果需要任何人承担10%,大家可以来找我。