澎湃新闻消息,5月份的乌镇人机大战上,当今世界围棋第一人柯洁在赛后曾这样评价坐在他对面的对手:“黄博士来摆棋,可能更让我有和AI对战的感觉。我也特别佩服黄博士,大家看直播也能看到我很爱动,总喜欢活动身体,而黄博士总是一动不动,不上厕所、不喝水、也不吃东西……所以跟黄博士下棋时,我觉得黄博士就是AlphaGo。”
柯洁(前左)、黄士杰(前右)在乌镇围棋峰会现场。有一个细节值得一提,从直播镜头里看,当时柯洁旁边的桌子上,除了一个水杯,还有两盘水果和零食。而黄士杰这边的桌子上,只有一个白色水杯。三场比赛都是如此的摆设
柯洁这里说的黄博士,正是AlphaGo的“人肉臂”黄士杰(Aja Huang),他是DeepMind的高级研究员,AlphaGo团队的领导成员之一。北京时间12月11日晚间,DeepMind公司在自己官网上线了AlphaGo教学工具,旨在帮助公众用新的、启发性的方式下围棋。至此,AlphaGo也兑现了乌镇人机大战上许下的诺言:与全世界围棋爱好者共同分享AlphaGo的数据。
伴随着教学工具的上线,黄士杰也第一时间在自己的Facebook账号上分享了感慨:AlphaGo教学工具已经发布,这也是我AlphaGo研究之旅的美好句点。我已经转到DeepMind的其他专案,也将在深度学习与强化学习的AI研究上持续探索和精进。
黄士杰在自己的Facebook账号上的留言
从2012年11月加入DeepMind,到AlphaGo项目的最初立项,再到陆续战胜樊麾、李世石,此后又进化成Master,战胜柯洁;再到今年10月份进化为AlphaGo Zero,最后发展为三类棋“通吃”,黄士杰一直是AlphaGo最核心的参与者。
回看黄士杰在DeepMind的这5年,或许能让我们知道更多关于AlphaGo背后的故事。
Aja,我们准备启动一个围棋项目
2001年,黄士杰考入台湾师范大学,开始自己的研究生学习,他的硕士毕业论文题目是《电脑围棋打劫的策略》。到2004年,此时已经毕业一年,在学校当了一年的研究助理后的黄士杰,再次考入台湾师范大学资讯工程研究所念博士。到了2011年6月,黄士杰的博士毕业论文答辩前夕,他就已经获邀到加拿大阿尔伯塔大学攻读博士后,并担任电脑围棋程序的研究员。当时,他的博士论文题目为《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。
在整个时间线上,需要插一句的是, 2010年,戴密斯·哈萨比斯(Demis Hassabis)和大卫·席尔瓦(Dave Sliver)在伦敦成立了DeepMind。而当2011年,黄士杰到加拿大念博士后,并担任研究员时,大卫·席尔瓦于前一年离开阿尔伯塔大学。
到了2012年,戴密斯·哈萨比斯、大卫·席尔瓦和黄士杰才在伦敦相遇,而那时AlphaGo项目可能连想法都还没有形成。直到2014年1月,谷歌宣布用4亿英镑收购DeepMind,事情才有了质的突破。
据黄士杰回忆,有一天,席尔瓦走到他面前说:“Aja,我们准备启动一个围棋项目。最开始只有你和我”。当时团队只有三个人:哈萨比斯、席尔瓦、黄士杰。哈萨比斯是整个公司的老板,席尔瓦是黄士杰的经理。从三个人的职位来看,黄士杰需要干的活可能是最多的。
黄士杰落子瞬间
给AlphaGo团队当围棋培训师
除了专业受到DeepMind团队青睐外,黄士杰对围棋的热爱也是团队看中的因素之一。黄士杰从小热爱围棋,在台师大读书时就曾经创办了学校的围棋社,是个业余六段围棋选手。除了爱下围棋外,他还对电脑棋类程序竞赛非常感兴趣。他曾自己开发过一款围棋程序,名为AjaGo。2010年,黄士杰开发的围棋程序Erica,在当年的围棋比赛中击败了日本著名“选手”Zen,获得当年的冠军。当时黄士杰在准备的博士论文也与围棋程序相关,题为《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。
随着AlphaGo团队的不断壮大,越来越多计算机方面、深度学习领域的人才加入其中,团队也不再只有3个人组成。但有个问题是,新加入团队的工程师,可能之前并不了解围棋规则,这就需要有人来为其普及知识。因此,黄士杰为新加入的同事办了一个训练班,普及基本的围棋规则。
有了新力量的加入,AlphaGo项目的推进突飞猛进。2016年1月27日,《自然》杂志以封面论文的形式,介绍了DeepMind团队开发的AlphaGo,以及它击败了欧洲冠军樊麾的消息。实际上,自那时起,黄士杰就已经成为了AlphaGo的人肉臂。在与樊麾比赛前,他还曾告诉过樊麾,AlphaGo非常厉害,但那时,樊麾没有听进去,也大意了。或许不只是樊麾大意了,即便《自然》已公布AlphaGo的成功,那时候,仍没有人能够相信人工智能程序能战胜人类职业棋手。直到同年3月份,它以4:1的成绩打败韩国棋手李世石,才真正意义上赢得了世界的刮目相看。
黄士杰
他是AlphaGo,但他又和AlphaGo不同
2016年3月9日至15日,AlphaGo和李世石在韩国大战五个回合。最终AlphaGo以4:1取得胜利。当时坐在李世石对面,代替AlphaGo落子的还是黄士杰。这一次,他真正走入人们的视野,出现在电视转播前面。
按照当时的比赛规则,每一次对弈,最长可能耗时近6个小时。据电视直播记录,在与李世石的对弈过程中,黄士杰只喝过一次水,甚至一次洗手间都没有去过。
“黄士杰是此次人机对弈中最辛苦受累的人,他担心我会受到影响,对弈期间,他一直面无表情,甚至连一次洗手间都没去过。”这是李世石赛后给予的评价,与柯洁的评价如出一辙。
黄士杰在比赛中的表现,让人惊叹,也是自那时起他有了AlphaGo人肉臂的称号。作为AlphaGo的执棋手,要下好棋并不容易。战胜了李世石后,AlphaGo以Master的名义在野狐围棋平台上以60:0的成绩横扫中日韩顶尖高手。在最后一盘棋结束后,Master现出真身:我是AlphaGo的黄士杰。
尽管成绩傲人,但黄士杰曾在Facebook上透露,在Master对战人类棋手取得60:0大胜过程,自己却有过2个失误。这是人代机器执子的过程中的人为失误。而在一些围棋网站的棋谱解析中,这两步棋被认为是別出心裁的、有"非人类式"大局观的着手。
到了今年5月,人机大战移步中国乌镇,坐在柯洁对面的仍是黄士杰。有一个细节值得一提,从直播镜头里看,当时柯洁旁边的桌子上,除了一个水杯,还有两盘水果和零食。而黄士杰这边的桌子上,只有一个白色水杯。三场比赛都是如此的摆设。
相比比赛过程中,柯洁情绪的波动,黄士杰一直面无表情,冷酷地有点像冰冷的机器。即便有记者想上去采访,当时也被“他们不让我接受采访”拒绝了。
结束与柯洁的对战后,5月28日,黄士杰少见地在朋友圈发了一条状态:“天下没有不散的筵席,我转往其他专案的时刻已到”。或许从那时候起,黄士杰就一直在为与AlphaGo的道别做准备了。
有时候,结束意味着新征程的开始,黄士杰在Facebook上说,这是自己到伦敦的第5年,他感谢家人的陪伴,但更多地,他开始期待前路,也希望自己的前路能一步步踏实的走下去。
(原标题:阿尔法狗“人肉臂”黄士杰:结束围棋项目,转战下个领域)
【免责声明】上游新闻客户端未标有“来源:上游新闻-重庆晨报”或“上游新闻LOGO、水印的文字、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与上游新闻联系。