亚博：田渊栋：AI还不是围棋之神但终将造福全人类

来源：yabo 编辑：U体育时间：2018-06-22 15:59:25

亚博2018年06月22日独家专访：

AI科学家田渊栋

2018腾讯世界人工智能围棋大赛的举办，为全世界的开发者提供了面对面交流探讨的平台。借此机会，我们亦有幸请到了全世界最顶级人工智能科学家，作为访谈对象。

从谷歌的无人车组到Facebook的人工智能实验室（FAIR），一度是FAIR唯一能打中文的全职研究员的田渊栋博士，带领一个团队重复了AlphaGoZero的算法，在一个月前发布了ELF OpenGo，并宣布开源。围棋AI的格局也因此发生了天翻地覆的变化。

然而取得如此成就的田先生，却在访谈的一开始就表示“原则上本次参赛我们倒数第一”。看完本期访谈后，相信您的收获将不仅限于围棋，更会对人工智能拥有更深刻的认识。

——野狐小编：田博士您好，很荣幸能够借这次腾讯世界人工智能围棋大赛的机会，聆听世界级人工智能大牛的传道解惑。早在2015年您便从事过围棋AI的开发，并且比谷歌早三个月发表文章，证明了用深度学习破解围棋的可行性。

一个多月前您的ELF OpenGo再次震惊围棋界。经广泛评测，目前公认ELF OpenGo是普通人能接触到的最强AI。可能会有人下意识认为这是“三年不鸣，一鸣惊人”，事实上ELF OpenGo达到如此水平仅用了不到4个月时间。可否向棋迷们分享开发过程和感想？

——田渊栋：其实并没有“三年不鸣，一鸣惊人”，作为研究员肯定还是要每隔一段时间鸣一次的。在DarkForest这个项目在2016年4月停止之后，这两年还是做了很多事情，包括设计Doom AI，做深度学习梯度下降算法的理论分析，ELF框架的提出及在NIPS大会上的演讲，House3D环境的发布及算法设计，还有这次ELF的改进和OpenGo，等等。两年可以做很多事的，只是大部分都没有涉及到围棋，所以棋迷们可能不知道我们的工作。

其实在去年10月AlphaGoZero文章出来之后我就想动手，不过那时正是赶会议论文及开会的时间，忙的不可开交，只能看不能动手的感觉是很不爽的。ELF OpenGo大约在今年1月才开始做，这个项目的目的并不是只为了围棋，而是作为ELF这个框架的一个测试和推广。去年ELF出来之后，尽管我在各种地方做了大量的演讲，推广仍不是很顺利（毕竟是C++代码，写得人比较少，而且第一版的代码组织也不太行），自然地我就想到需要一个具体应用，正好AlphaGoZero出来，配上以前的围棋代码，再合适不过了。于是我就花一周重写了一遍ELF的核心，增加了分布式系统的部分，然后按照论文把系统做了一遍。基本上二月中就可以跑了，接下来就是比较痛苦的调参和找bug的过程，一直到三月下旬我们才看到希望，然后才有了CGOS上的王朝系列和美国总统系列，和最后五月份的发布版。

田渊栋与李喆

——野狐小编：可否进一步透露一下达到这样一个水平，背后调动的硬件资源，是一个怎样的概念？

——田渊栋：我们用了两千块V100的显卡训练两到三周。两千块卡其实还好，没有特别多。对比谷歌，我们的资源还是比较有限的。当然这个对于大部分人来说还不能接触到，不过我相信随着算法的改进和硬件的进步，说不定过几年每位棋迷都可以亲手训练了。

——野狐小编：您认为借助CNN（卷积神经网络），通过堆砌资源，或者资源+时间的方式，能否帮助我们触摸到想象中的“围棋之神”境界？

——田渊栋：不觉得如此。首先围棋状态还是太多，现在探索到的只是很小一部分。大家可以做个算数，四百九十万局乘上每局平均250步，能够覆盖多少围棋的局面，而所有可能的围棋局面又有多少，就知道拿“沧海一粟”这个成语来形容，实在是太无力了。另外人类在学围棋的时候会形成很多概念，但目前CNN还做不到，而且通过堆砌资源可能永远做不到。这个是人类智能优于CNN的地方，也是算法可以继续改进的地方。

——野狐小编：那么除了围棋，其他一切领域是否都有可能通过这种方式取得突破。

——田渊栋：AlphaGoZero系列算法虽然通用，但远不是能解决一切问题的灵丹妙药。概念上来说它需要一个完美及快速的模拟环境，还需要神经网络与具体问题相容。去年我写博客的时候，能看到它的问题；在复现完这个算法之后，我们知道得要多得多，也对它的局限性有更深刻的认识。总的来说，对AI不能过于乐观，想要让它在一切领域都有突破，还早，需要大家共同努力。

——野狐小编：ELF OpenGo宣布开源，对正在做AI、做围棋AI以及从事围棋相关行业的人群，带来了强烈而迥异的震动。耗费如此昂贵的资源让ELF OpenGo达到这样一个水平，又免费提供给所以人借鉴使用，能否向我们科普这种“极客”范儿十足的做法的出发点？

——田渊栋：这些资源确实不便宜，但“昂贵”实在谈不上，应该没有北京一套房贵，所需的人力和耗时也并不多。一开始一两个月基本上都是我一个人在推动，等到看到了希望，就自然会有更多的同事加入。

做这个项目的目的，一是去了解DeepMind提出的AlphaGoZero及AlphaZero算法为什么能工作，有什么优缺点，如何去改进；二是借此机会完善和推广我们的ELF平台，以后可以用于其它目的；最后是借此磨练项目组，这次参与的组员有些新人，一起做成一个项目，对大家都是有好处的。

至于开源是我们一向的方针，科研要服务全人类，这是科研的最终目的。我相信就算没有我们，像LeelaZero也会逐渐达到目前OpenGo的水平，甚至更高（他们现在应该很厉害了）。

——野狐小编：宣布开源后，ELF在围棋上的研究是继续进行，还是再度终止？未来打算探索哪些领域？

——田渊栋：ELF框架会继续改进，下一步计划还在讨论中，目前暂不透露。两年前DarkForest终止主要是因为当时科研上再做一个单独的围棋AI价值不大了。这次是用通用算法训练出来的，所以会继续思考其它各种想法，围棋模型作为一个明确客观的测试方案，当然会尝试，但是不一定只用在围棋上，也不一定以性能为导向。

——野狐小编：如果将来，人们发现一种深度学习以外的算法，也能适用于围棋，甚至比深度学习的效果更佳（效率或者高度），围棋会再次吸引人工智能领域的科学家们开发新一代AI么？

——田渊栋：那是必然的。职业棋手们一辈子没有下过几百万局棋，却达到了很高的水准，并且能解释每一步的下法，对围棋有自己的世界观和方法论。这些都是人工智能目前完全达不到的，也是作为科学家的我们一直努力研究的目标。如果能只用几万局自对弈棋谱训练出强AI，或者让一个挂在网上的小白AI通过和对手对下来成长，或者设计出能够抽象出围棋各种基本概念的AI，将会是很有意思的事情。

——野狐小编：ELF这三个字母对于棋界即便不是人尽皆知，也即将在人尽皆知的路上。然而绝大多数棋迷对“ELF”的认知，还仅仅停留在一款单卡碾压人类高手的围棋AI上，并不知道ELF是一个开源游戏平台。身为开发者，您在命名时赋予了“ELF”非常浪漫的想象和希冀，可否为大家介绍一下作为开源游戏平台的“ELF”？（注：ELF原名为LigthELF，意为“光之精灵”）

——田渊栋：ELF是一个通用的强化学习训练平台，第一版在去年六月的时候发布，当时带了一个微缩版的即时战略游戏（MiniRTS），可以用强化学习训练AI打即时战略游戏，这里是一些演示视频（http://yuandong-tian.com/minirts_v1/minirts_video.html），后来我们在上面做了大量改进，这次随OpenGo发布的是第二版的ELF还有分布式训练代码，这些都是通用的，和围棋无关，之后ELF还会继续改进，名字很浪漫，不过脚印还是要一步一步走的。

——野狐小编：我想棋迷和参赛者，都是以看待绝顶高手的眼光，来评价本次ELF团队的参赛的，您对于本次参赛抱有怎样的预期？

——田渊栋：首先这次我们还是以团队身份，作为基线算法（baseline）参赛的，以推广我们的OpenGo。我们已经开源，所以原则上我们是倒数第一。

——野狐小编：倒数第一……对我们围棋迷来说，您和您的ELF OpenGo是宛如世外高人一般的存在。“倒数第一”这个说法会不会让其他参赛者们亚历山大

——田渊栋：我们开源后一直鼓励大家使用，这一个半月以来我相信很多团队已经找到改进的方案，比如说加一些额外的条件防止出现征子bug，这些都会让OpenGo变得更强。这次参赛，能让大家用我们的平台，那就是达到目的了。团队还有很多任务要完成，我们不会为这次比赛的胜负花太多力气在上面，所以我们并不期望OpenGo可以获得很高的名次。当然啦，我们还是希望它能赢。

——野狐小编：围棋进入AI时代以来，棋迷与棋手们诞生过许多有趣的、神化AI的说法。比方说公众目前普遍将AI看作“围棋之神”，还有人认为其实两年前第一次人机战时，AI已经拥有让人类三子的实力。有些人连CNN（卷积神经网络）和RNN（循环神经网络）都分不清，却深信AI可以解决一切问题，对此您怎么看待？AI对围棋、乃至对当前人类社会意味着什么？

——田渊栋：对于棋手们来说，围棋AI已经可以让他们大幅度提高平时训练的效率，对于棋迷们来说，有一个顶尖高手时刻陪着自己下棋，并且能不停指出落子的问题所在，这种感觉可能是之前从未体验过的。《棋魂》里面小光和佐为的梦幻组合，现在已经实现了。虽然我个人认为AI离围棋之神还有距离的，但可以确定的是，将来AI会成为进一步提高大家效率的必要工具，甚至成为水和空气那样的必需品，谁能用得好，谁就可以变得更强。至于AI将来能不能解决一切问题，现在回答这个问题还为时过早，还需要大家的努力。

——野狐小编：在您的心目中，围棋的未来是怎样的？它的意义、价值该如何体现？

——田渊栋：我自己围棋大概是18k的水平，所以这个问题不好回答。围棋的未来大概可以参照现在的国象，大家用软件训练及评测，会有更多的人成为爱好者参与进来，会有更多的人自学成材，会有更多人发现新的着法。我想作为一个有着三千年历史、浓厚中国文化底蕴和无穷变化的游戏，围棋可能会变得更加繁荣吧。

(责编：樊璐璐)

上一篇：亚博：世界男排联赛江门站各队名单江川施密特领衔
下一篇：亚博：东城体育局牵手北京国安强强联手助力北京青少年足球

亚博：田渊栋：AI还不是围棋之神 但终将造福全人类

亚博：田渊栋：AI还不是围棋之神但终将造福全人类