人机大战疯狂一周 究竟发生了什么?

  [摘要]若干年后,假如机器文明取代人类,那么这场对决就像是莱克星顿傍晚的枪声。

人机大战疯狂一周 究竟发生了什么?

  若干年以后,假如机器文明取代了人类,那么这场对决就像是莱克星顿傍晚的枪声;假如我们像《疯狂动物城》里的动物们一样和谐地生活在一起,那么这将是两种文明历史上重要的章节。

  从Koreana酒店出门,穿过两个十字路口,向前走200米就是首尔最好的五星级酒店之一–四季酒店。早上10点出门,步行10分钟,在酒店门口的报刊亭花1000韩元买一份当天的《韩国时报》,然后在洒店里一直呆到晚上7点,就是我过去一周每天的工作。

  坦白说,“上下班”路上的20分钟,是我所经历的“疯狂一周”中最乏味的部分。除此以外的每一分钟,我都愿意再经历一次。

  1:4的比分,五场精彩绝伦的围棋比赛,只是其中最为人所知部分,更多的故事,还隐藏在四季酒店深色玻璃幕墙的背后。对于这一周究竟发生了什么,我们或许能从之后Google
DeepMind的纪录片,或者是李世石的回忆录中找到更多答案。

  在这里,我希望通过一些现场的观察,带你完成记忆拼图中最初的部分。一方面,作为一名旁观者,我了解到的实在太少。另一方面,一切都发生得太快。

  DAY1:AlphaGo小分队的“伏击”

  一群穿着统一黑色T恤的年轻人,突然聚集在了国际媒体直播间门口。他们在相互击掌、拥抱,脸上的笑容,就像是在圣诞节早晨得到了心仪礼物的孩子。

  这是3月9日下午3点30分左右,就在几分钟之前,李世石出人意料地做出了投子认输的决定,这也就意味着AlphaGo第一次击败了职业9段围棋手。媒体们一齐拥向了十几米外的长廊两侧,这里是李世石从比赛现场走到发布会房间的必经之路。

  其中一个年轻人为了躲开一个从身边匆忙跑过的媒体,往后退了一步。他对身边的另一个戴眼镜的哥们儿耸了耸肩,露出了一副“看我们干的好事”的神情。这时候,英文解说嘉宾Chris
Garlock从媒体直播间走了出来。“太棒了,实在是太棒了。恭喜你们。”Garlock对这种小伙子说。在说这句话时,他似乎还没有从刚刚的兴奋中缓过来,当李世石投子认输时,他一连喊了三个“wow”。

  黑色T恤背上的AlphaGo字样暴露了这群人的身份,他们正是来自DeepMind公司,开发了AlphaGo的那群人。就在几分钟之前,他们创造了历史。

  这是一支15人的小分队,为了这次比赛特地从伦敦飞到韩国,从2月底开始,就住在四季酒店,为比赛做着各项准备。

  George Van Den Driessche 和 Julian Schrittweiser
是两位最主要的工程师,他们的主要任务,就是保证AlphaGo能在这里顺利运行。“他们许多与系统相关的检查,包括查看各个接口,准备备用方案。”DeepMind的创始人,CEO
Demis Hassabis
告诉腾讯科技。除了工程师,这个团队中还有人专门负责IT基础设施。尽管韩国是全球网速第一的国家,但团队仍然在酒店周边铺设了特别的网线,保证全球直播过程中的高速和稳定。

  另一部分团队成员则与Google的团队一起,负责比赛的组织。不同颜色的号码牌代表不同的权限,每一个区域交接处都有至少两名安保人员站岗;直播间为国际媒体和DeepMind团队专门预留座位,所有发布会和采访时间的误差均不超过10分钟。

  “我从来没有见过组织比赛这么细致的,所有的事情都要排练好多次。”樊麾告诉腾讯科技。作为这次比赛的裁判,他从比赛前5天就来到了首尔,帮助小分队一起准备。

  更早的准备从半年前就开始了,AlphaGo的团队在去年10月初给它做了一轮测试。在与欧洲围棋冠军樊麾的五盘棋较量中,AlphaGo以5:0完胜。包括比赛的过程,AlphaGo的算法原理,都以论文形式公布在了今年1月27日的《自然》(Nature)杂志上。几乎是在同时,Google宣布AlphaGo的下一个对手将是世界冠军李世石。

  与其说是李世石轻敌,不如说是AlphaGo的团队刻意隐藏了实力。与樊麾交手的AlphaGo被普遍认为只有业余5、6段的实力,根本无法挑战李世石。尽管团队表示AlphaGo每天都在进步,但包括李世石在内的所有人都不相信,人类棋手需要花费数十年取得的进步,这台机器用五个月时间就能完成。

  这也是为什么在赛前的新闻发布会上,李世石突然从原先自信满满预测的5:0获胜,改口为可能不会全胜。直到那个时候,他才对AlphaGo这个对手有了更多的了解,作为职业棋手的敏感,他可能意识到了这个对手有所不同。

  当然,除了DeepMind团队本身,谁也没有真的认真看待这个所谓的人工智能围棋程序。直到所有人在大屏幕上看到李世石苦笑了一声,然后把两颗棋子放到了棋盘上,弃子认输。

  在半小时后的第一场赛后发布会上,AlphaGo项目的主要负责人David Silver和公司CEO Demis
Hassabis、李世石一起上台接受了采访。而在离他几米远的地方,小分队的成员们聊得正high。

  发布会一结束,李世石匆匆离场。这个角落,被媒体团团围住。

  “伏击”就此完成,他们成了英雄。

  DAY2:第37手

  即便是第一天李世石失利后,从媒体和棋手都表现得相对乐观。没有人怀疑李世石会拿下第二场,毕竟从第一场的情况来看,AlphaGo同样出现了不少“失误”。直到第二天比赛,确切地说是第37手的出现,所有人都傻了。

  这其中就包括英文解说嘉宾麦克·雷蒙。他不敢相信自己看到的画面,右手在空中足足停留了两秒,其间四次扭头看向电脑屏幕上的棋盘,才把一颗黑棋贴在了AlphaGo刚刚走的位置上。

  作为一名职业9段的围棋高手,雷蒙已经习惯了把自己的情绪隐藏起来。他是这次人机大战的英文解说嘉宾,一本正经又慢条斯理的解说风格,有时会让人犯困。不过一秒前他脸上的困惑以及随后的嘴角上扬,都说明了赛场上发生了一件不同寻常的事,而这一切,刚好被扫过的特写镜头逮到。

  因为现场转播信号的延迟,古力比雷蒙晚了一分多钟才看到这一手棋。他的反应与雷蒙如出一辙,只不过更加激烈,“AlphaGo怎么会下这里?”
整个腾讯的直播间也因这一步棋炸开了锅,国家围棋队总教练俞斌表示“反常规”,职业棋手唐奕觉得“是业余水准”,没有人觉得这是一步“对”的棋。

  李世石抽完本场比赛的第一支烟,回到座位上。他也看到了对手的这一步棋,第一次露出了疑惑的神情。不过这种疑惑持续了只很短的时间,随后,他陷入了长时间的思考,脸色也变得越来越难看。“印象中我从没见过职业高手下这样的棋,李世石可能也没有,所以看得出,他要好好考虑一下。”雷蒙评论道。

  这一幕发生在“人机大战”第二场比赛开始后50分钟,AphaGo所下的第37手。

  根据比赛的规则,每名选手都有两个小时的常规时间,再此期间选手可以任意分配每一步棋的时间(10秒或者10分钟)一旦时间用完,就要进入“读秒”,每步棋考虑时间不能超过60秒。

  李世石明白,第一场的失利很大程度上是因为自己下得太快,考虑不周全。在投子认输时,他还有近半小时的常规时间,比AphlaGo少用了25分钟。因此在第二场比赛中,他有意放慢了每一步棋的节奏,希望可以考虑得更周全。在这一步棋之前,他的总用时是25分2秒,比AlphaGo多用的5分钟帮他换回了盘面上的一点优势,于是他放松地起身,去抽了第一支烟。

  AlphaGo无法感受到李世石心情的变化,所以这一步“怪棋”也不像只是简单地想把当前的局面搅乱,而是跟前面的36步一样,进行过分析后的决定。李世石明白这一点,也正是因为如此,他花了更多时间去思考这棋背后的“深意”。

  “当你觉得它足够厉害时,即使它真的下了一招烂棋,你也会觉得它有别的什么意图,只是自己没有看出来。然后你会越来越怀疑自己。”在回顾0比5输给AlphaGo的心理变化时,樊麾这么告诉腾讯科技。

  在赛后接受采访时,作为裁判的他对AlphaGo的这一步棋赞不绝口。在此之前,他曾经说过“AplhaGo缺点是他无法理解围棋之美”,但在这一刻,
AlphaGo却用自己的一步棋让他体会到了其中的美和优雅。

  麦克·雷蒙也感受到了这种“刺激”,他说经过这两天的观察,自己非常想和AlphaGo下一盘棋。“许多围棋高手都会有自己习惯的套路,尤其是在布局阶段。这样做确却更加稳健,但是下多了也少了许多变化的乐趣。”雷蒙说,“而这也是AlphaGo与众不同的地方。”

  15分37秒,这是李世石在这一步棋上花掉的思考时间。从结果上看,这一部棋并没有对之后的棋局产生巨大的影响。但在下完这步棋后,他的用时已经比AlphaGo多了20分钟。有意思的是,李世石比AlphaGo先读秒的时间,也恰好是20分钟。

  在赛后的新闻发布会上,李世石用“完美”来形容他对手的表现。“我没有找到它的弱点,所以我输了。”李世石说。

  DAY3:哈萨比斯的烦恼

  哈萨比斯(Demis Hassabis)飞快地从会议室走出,朝我的方向走来,手里抓着一台Macbook
Air和一副苹果耳机。还没等我开口,他做了一个礼貌的拒绝手势。一名工作人员紧跟在他身后,一脸紧张,不停地跟对讲机说着话。

  两人来到连接6层和7层的旋转楼梯口,停下来耳语了几句。楼下不断传来嘈杂的说话声和三角架相互的碰撞声。哈萨比斯往下走了半层楼梯,让自己保持在不会被看到的区域。然后像一名侦察兵一样弯下腰,探出头,开始观察楼下“敌人”的情况。

  他有些犹豫,似乎还有些懊恼,懊恼自己没有早一点离开房间,悄悄地下楼。现在,他必须要穿过前方那个十几米的区域,才能和他的组员们会合。

  如果是四天前,哈萨比斯完全不用担心这些。他和我一样随意地在四季酒店六层的公共区域穿梭,自由地选择金枪鱼三明治、蔬菜沙拉或是奶油大虾等几十种食物,一边吃饭一边和组员交谈。没有几个人认得这张脸,更重要的是,没有太多人真的关心DeepMind是个什么公司,AlphaGo是个什么东西。

  而在AlphaGo赢得首场胜利之后,这个名字一夜之间出现在了3300篇韩国媒体的文章当中。等到第二次败击李世石时,哈萨比斯的照片已经登上了包括《朝鲜日报》在内的各大报纸的头版,KBS、MBC、SBS等电视台争着想要对他进行采访。

  记者们努力练习着这个名字的正确发音,然后在发布会上高高举起手,只是为了问这个不知道从哪里冒出来,小个子,戴着黑框眼镜的英国人一个问题。

  而就在哈萨比斯下楼的十几分钟前,由他领导的团队所开发的人工智能围棋程序AlphaGo在四天内第三次迫使世界围棋冠军,那个曾一度声称要5比0完胜的李世石投子认输,从而也以3比0的比分,让这次人机大战的胜负失去了悬念。

  现在的哈萨比斯,意味着版面、话题、收视率,他就是一个十足的K-POP明星。而他也遇到了所有K-POP明星都会遇到的问题,如何躲避媒体。

  显然,他还没有完全适应这种情况。探了几次头之后,他终于准备走完另一半台阶,接受一轮闪光灯的扫射。但就在迈腿的那一刻,又想起了什么。他招呼身后的工作人员过去,把手上的笔记本和耳机递给了她。像是准备经历一场机场安检,或者准备冲刺跑。

  就在这个时候,他发现了佯装下楼,一直躲在背后观察他的我。为了掩视我的真实目的–当然,我觉得他心里肯定无比清楚–我开口说:“我可以从这里下去吗?”
“当然,你先下,你先下。”哈萨比斯回答道,同时让出了半个身位。

  于是我只好从他的身边走过,下楼,隔着电梯间看到了对面一堆“长枪短跑”和几十个包麦当劳薯条一样挤在一起的记者和摄影师。有几个可怜的同行看到有人下来,下意识地抬起了挂在胸前相机,才发现走过他们身边的是个“冒牌货”。

  这时候,真正的主角哈萨比斯也跟着下了楼。两手空空,脚步飞速,有些媒体还没反映过来,他已经低着头冲过了“封锁”,一头扎进了边上的会议室中。

  会议室大门被迅速关上,里头传来了欢呼和掌声。

  DAY4:“李世石!李世石!”

  在韩国,李世石并不是一个招媒体喜欢的棋手。

  “目中无人”、“口无遮拦”、“不尊重对手和前辈”,你可以在任何一个韩国围棋记者口中得到这些形容李世石的话。在过去15年,这些标签就像他的成绩一样耀眼,即使他现在已经比过去收敛许多,这些轻狂之言也时常会被翻出,虽然大部分时间仅仅是作为谈资。

  比如在2001年第5届LG杯决赛中输给前辈李昌镐之后,年仅18岁的李世石却说“在所有高手中,昌镐的水平是最差的”,同样在两年后的LG杯中,李世石再一次语出惊人,他说自己心目中世界冠军的候选中,没有包括马晓春。在对尊卑位份异常重视的韩国,李世石常常因此受到媒体诟病。

  他还经常在大赛前做出乐观的预测,2005年1月第二届丰田杯,李世石与常昊冠亚军决赛前,他声称自己“有65%至70%的胜算”,尽管当时双方历史交手的成绩是1比4;2010年第12届农心杯前,李世石面对10位中日高手,声称要取得“十连胜”。

  即便在这两年有所收敛,但是在接受Google AlphaGo的围棋挑战时,李世石仍然在第一时间表示,比赛将会是他以5:0取胜。

  这一次,李世石不仅是代表韩国,而且是代表人类出战。这个巨大的噱头无疑刺激到了韩国媒体们的神经,只要他能赢,他说什么都行。

  一时间,李世石以一种“民族英雄”的形象登上了报纸和电视的头版头条,所有的报道都在极力渲染这次比赛的重大意义,“从没有见过这么多媒体如此关心一个围棋选手和围棋比赛”,一位跑了15年围棋的韩国记者告诉腾讯科技。

  这种关心的“保质期”并没有想象得那么久,比赛当天那种300多家媒体涌进四季酒店,为了提前进场占据一个有力位置不惜提前一个小时排队的盛况已经不再。来到现场的韩国媒体数量大概只有前一天的70%,中餐自助午餐的消耗速度也不像第一天那么快。

  过去几天里,每场比赛的赛后发布会,对李世石是另一种折磨。

  你能看到他尽可能表现得让所有人满意,认真地倾听和回答媒体的提问,即便有些问题比较刺耳,他也会礼貌的回复,或者用聪明的方式躲过。

  但与同时,他一秒也不想在这个屋子呆下去。在没有轮到自己说话,或者翻译的时间,他的双手拿着话简,垂在两腿之间,两个大姆指来回打转,眼睛会不自觉得看向他左前方一二排的方向,进行暂短的放空。只要与他有关的问题,就会立刻抽神回来,抬头并保持嘴角微微上扬,看向提问者,进行回答。然后,又会进入新一轮的放空。

  “很抱歉,我让许多人失望了。虽然胜负已经没有的悬念,但我还是希望大家可以继续关注最后两场比赛。”在连续三场输给AlphaGo之后,这个世界上最高傲的棋手,只剩下了卑微。

  李世石离场的时候,所有人为他送上了掌声。他没有抬头,他只想快点离开这里。那个时候的他一定无法想象,就在24小时之后,当他再一次走进这个屋子的时候,他会受到完全不一样的待遇。

  比赛第四天,当坐在李世石对面,代表AlphaGo摆子的黄士杰(Aja
Huang)将两颗黑子放到棋盘上时,现场的两个媒体直播室同时爆发出了巨大的观呼声和掌声。现场镜头扫向黄士杰身边的显示器,棋盘的中央多了一个弹窗,上面写着:AlphaGo
Resigns (AlphaGo认输)。

  李智秀(Lee
Jisoo)第一个从欢呼声中反应过来,拿起相机就往外走。他大概20出头,皮肤很白,只穿一件短袖T恤,T恤背面是一个准备出拳的拳击手图案,上方用英文印着一句“状态正佳”。作为一名朝鲜电视台的摄影师,对于现在应该去哪,他再清楚不过了。

  他穿过长廊,找了一个自己满意的拍摄位置,守在从比赛现场到发布会必须的这条路上。他把一只脚踩在小梯子上,如果有必要,他会站到这个梯子上以更高的角度拍摄。此刻,李智秀正在专心调试手上的佳能相机,在这么关键的时刻,他可不能让设备出问题。

  尽管离赛后发布会开始还有半小时,但现场的媒体席已经基本塞满。媒体席的左右两侧也都架满了摄影机,把整个现场围了起来。与第三场比赛之后的安静不同,此刻这里就像一个热闹的菜市场,当然,媒体们的表情也比前两天轻松很多。

  我在第三排左侧中间找到了一个空隙挤了进去,一边在笔记本上写着待会儿准备提问的问题,一边和边上的韩国记者搭话。“谢天谢地,李世石终于赢了。”这是她跟我说的第一句话,“不然我都不知道要怎么报道了。”过去几天,和李世石同样处于煎熬的,还有不少这样的赛前对他抱有巨大期待的韩国媒体。

  这些情绪在积压了几天之后,在李世石进入发布会现场的那一刻彻底爆发。掌声和尖叫持续了一分钟,还有记者有节奏的喊着“李世石!李世石!”。他又成为了这个国家的英雄。

  DAY5:一个两岁的孩子

  由于前四场1:3的比分,加上李世石刚刚在前一场取胜,第五场比赛的结果已经变得不那么重要。李世石希望用黑棋再赢一次,媒体们则期盼一个Happy
Ending。

  最终李世石还是没有从AlphaGo手上拿到第二场胜利,总比分也定格在了1:4。李世石在赛后发布会上的发言,也超出了胜负和比赛的范畴,他开始谈论AlphaGo改变了他对围棋固有的认知,与此同时他也有点后悔,认为自己可以表现的更好,让人类在与人工智能的较量中,有更多的可能性。

  AlphaGo与以往所有人工智能程序的不同之处就在于,它不是简单的“算”出最好的棋,而是试图用人类的思考方式,去模似人类下棋的思维。而这种思考方式将是“通用”型的,你可以用来理解围棋,也可以用来“理解”成千上万的癌症论文,做出最为科学的诊断;或是让Siri愈发接近《她》里面那个性感的私人助理。

  当哈萨比斯跟你讨论起这些问题时,他会显得异常严肃,同时两眼放光。6年前,当他创立DeepMind这家公司时,他的目标就是“解决智力,然后用它解决其它一切。”(solve
intelligence, and then use that to solve everything else)

  戴维席尔瓦(David
Silver)可能是最了解哈萨比斯的人之一。他俩同在1990年代的剑桥大学学习计算机科学,成为了好友,又同时喜欢上的人工智能和围棋。一起创办了一家游戏公司,开发了《共和国:革命》这样优秀的游戏,游戏里的电脑角色要比以往聪明得多。

  “当你开发电脑游戏的时候,你实际上只是在假装人工智能,你需要做的只是让游戏玩家觉得这些电脑玩家很聪明。但是,这与让电脑变得智能是两码事。”David
Silver告诉腾讯科技,于是在公司开门后,戴维和哈萨比斯都回到了学术界,戴维攻读的是“增强学习”的博士,而哈萨比斯则对准了“神经科学”。

  若干年后,这些知识都被注入了AlphaGo的“身体”里,哈萨比斯教会了它如何像人脑一样思考,而戴维则让AlphaGo可以像人类一样强化学习。一定程度上来说,他们就是造物主。

  在第四场比赛结束后,哈萨比斯被问到AlphaGo开发了多久,他说,“它还只是个两岁的孩子”。

  我不知道,AlphaGo会给我们带来什么样的惊喜。就像我不知道,这些雄心勃勃的年轻人,他们的极限到底在哪里。

  我只知道,超越人类的,终究还是人类自己。没有比这更令人兴奋的事了。

(0)
上一篇 2016年3月16日 09:14
下一篇 2016年3月16日 09:29