北京时间5月24日消息,今日上午的中国乌镇人工智能高峰论坛上,有“AlphaGo之父”之称的DeepMind公司CEO哈萨比斯发表了主题演讲,详细解答了为什么让计算机实现下围棋是如此困难,以及未来AlphaGo的应用领域。
据哈萨比斯介绍,AlphaGo是DeepMind公司打造了人工智能系统,虽说AlphaGo已经在围棋上对人类选手取得优势,但是哈萨比斯表示,让计算机实现下围棋这件事依旧是困难重重。
这是因为其复杂程度让穷举搜索都难以解决,这个难题包括两个方面,一是“不可能”写出评估程序以决定输赢,另一个是搜索空间太过庞大。哈萨比斯还指出,更困难的是围棋不像象棋等游戏靠计算,而是靠直觉。
“围棋中没有等级概念,所有棋子都一样,围棋是筑防游戏,因此需要盘算未来。你在下棋的过程中,是棋盘在心中,必须要预测未来。小小一个棋子可撼动全局,牵一发动全身”哈萨比斯说。因此在技术上,AlphaGo用到了两种网络:策略网络和估值网络。
虽然AlphaGo是玩围棋的,但是它也可以做其他东西。从下围棋这件事情上哈萨比斯认为,AlphaGo已经可以模仿人的直觉,而且具备创造力,通过组合已有知识或独特想法的能力。因此除了围棋之外,哈萨比斯希望将人工智能运用到各种各样的领域。比如将AI用到材料设计、新药研制上,还有现实生活中的应用,如医疗、智能手机、教育等。
同样的哈萨比斯指出,AlphaGo并不能“消灭”围棋。“AlphaGoVS李世石吸引了2.8亿的观众,3.5万篇的报道,棋盘销售在西方增加了10倍。同时引述李世石的说法,“我认为这给围棋引入了新思路,我感觉找到了继续玩围棋的新理由。”
“DeepMind的愿景是研究何为AI,然后再用智能解决所有问题,即我们怎样提出有效的建议去解决问题,我们最终希望建立通用人工智能。”哈萨比斯说到。
哈萨比斯指出,AlphaGo打造的通用学习机器有两个特性,一个是“学习”,即非程序预设,可以自主学习原始材料。另一个是通用性,即同一个系统可以执行多种任务。借此,DeepMind希望打造一种强化学习框架。
因为围棋盘有19*19=361个交叉点,每一点有黑,白和空三种可能性,围棋的棋局就可能组合成3的361次方种,如果每落一颗子引出10的10次方种的变化,如果形成一个非常大的可能变化数字。现在观察到的宇宙中,基本的总数约为10的80次方。所以,现有的任何的计算机都无法在人类有限的生命期间算出应对的变化。
“AI如何看待李昌镐白88这步棋?”
这个问题很有意思,正好我一直想跟大家聊聊关于如何看待AI的意见这个话题,所以今天就着大家这个提问,跟大家一起讨论一下。
在讨论之前,我先抛两个问题出来:
1:如果李昌镐白88这步棋不在AI的考虑范围内,那这步棋就一定是问题手吗?
2:如果AI给李昌镐白88这步棋降了胜率,那就代表李昌镐在这盘棋中的胜算变小了吗?
这两个问题其实可以合成一个大问题:
AI给出的意见,就一定是好的吗?
下面我们先来看看AI是如何看待李昌镐白88这步棋的:
图1:我们先回顾一下李昌镐白88下在了哪里?
白88下在了上面的一路立,这步棋看着很慢,其实意境深远。
关于这步棋的故事,我之前已经说了,这里就不多讲了。
我在写李昌镐白88这步棋之前,就看过星阵的建议,白88这步棋不在星阵的选择范围内。
而星阵的*,也就是它推荐的一手棋是:
图2:我估计李昌镐若在当时看到星阵白1这步推荐,应该会吓一大跳。
这是孤身单挑黑三角六子的节奏。
的确,别说是李昌镐这样谨慎的棋风,就是剑法最霸道的申真谞来了,估计也不会去动黑三角六子的脑筋。
当然星阵有它的理由,它显然不认为你黑棋三角六子很强,它要来攻击黑三角六子。
那么星阵推荐的这步棋就一定适合李昌镐来下吗?
下面我就以虚构的形式,来跟大家推演一下,如果李昌镐采取了星阵的推荐,会发生什么情况:(以下内容纯属虚构)
图3:李昌镐正准备下白88(白A),心里想着:“这步棋虽然实地价值小了,但是可使白三角大块彻底净活,而黑三角大块则没有安定。关键这样简化了局势,接下来慢慢小刀割肉。这种局面是我最擅长的。”
正当李昌镐要落下白88时,星阵突然出现,悄悄跟李昌镐说:“我觉得白1这步棋胜率*,我推荐白1这步棋。”
李昌镐一看白1这步棋,心想:“白1这步棋不像是优势情况下的招,倒像是形势不利下的胜负手,可这时候明明是白棋形势好,这步棋靠谱吗?
但星阵实力那么强,它推荐的招,总不会错吧。”
于是李昌镐就改变原计划,采取了星阵的意见,下出了白1这步棋。
而此时李昌镐的对手,正处于劣势下的马晓春,正愁全盘找不到敌人可以搞乱局面。突然发现李昌镐白1自己找来了,心中大喜:“此时不反击,更待何时!”
于是黑2反包围白1一子是必然的选择。
那么接下来白棋该如何处理呢?
图4:白1靠,利用黑三角孤单一子做文章,是星阵的后续手段。
李昌镐下出此手后,马晓春黑2长也是必然,不然在A的位扳的话,白棋在黑2位一虎,黑棋形有问题。
当黑4压的时候,星阵选择了白5、7顶断后,白9长出。
电脑能战胜国际象棋大师,但对付围棋职业高手则要难得多。当人们把代表着东方智慧的围棋与代表着西方棋类的国际象棋相比较时,常常会惊叹于围棋的复 杂程度。国际象棋平均每回合有35种选择,围棋每个回合则有250种可能,250种可能中每一种又有250种可能。以此类推,其运算结果是一个天文数字。 运算也许对拥有“大数据”“云计算”的电脑来说不算什么,可下围棋仅仅靠运算是赢不了比赛的。
不管是东方人还是西方人,有一个基本共识:围棋是人类发明的最复杂也是最美的游戏。不是说围棋每一个着法都比国际象棋多,而是两者下法的理念有所不 同。简单地说,国际象棋(中国象棋)的目的就是杀王,子是越下越少;围棋的目的是“圈地”,子越下越多,地多者胜。这实际上就给电脑出了一个难题,用专业 的术语来说,国际象棋的着法较易通过函数评估,而围棋的着法相对抽象,电脑不好计算。此外,围棋还有手筋、劫争、弃子等战术战略层面的技法。