bobvip2017

  Handol 是韩国 NHN 娱乐公司推出的一款围棋 AI,用以训练的数据来自 1999 年以来 NHN 公司在游戏业务方面的大量积累。与 AlphaGo 的进化路线 出世,当时已拥有人类职业棋手 9 段棋力,可以实现在人类棋谱及既定模式的基础上对棋局进行预测,到了 Handol 2.0 已经能够脱离棋谱,自己与自己下棋。在 NHN 看来,Handol2.1 的实力已经超越了当初对战李世石的 AlphaGo。

bobvip2017

  AlphaGo 真正的优势来源于将策略网络和价值网络整合进基于概率的蒙特卡罗树搜索(MCTS)中。在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最繁琐考察的位置将成为 AlphaGo 的最终选择。经过先期的全盘探索和过程中对最佳落子的不断揣摩,AlphaGo 的探索算法就能在其计算能力之上加入近似人类的直觉判断。2016 年 1 月 28 日,击败李世石的 AlphaGo 版本登上《Nature》封面,随后在 3 月即 4:1 击败李世石,名声大振。

  12 月 21 日,最后一局的赛场转移到了李世石的家乡全罗道新安郡。这一场李世石依然受两子执黑挑战 AI,黑棋贴目 7 目半。人类与 AI 在棋盘右下角展开激战。

  在围棋 AI 领域,棋力最高的选手仍然是 DeepMind 公司的 AlphaGo,它也是第一个击败人类围棋世界冠军的人工智能程序。在 2017 年柯洁与 AlphaGo 对战之后,David Silver、谷歌大脑负责人 Jeff Dean 等人曾在乌镇围棋峰会现场对 AlphaGo 背后的技术进行过解读。

  3 年零 6 个月后,年仅 12 岁的李世石成功入段,从此在韩国棋院开始了职业围棋生涯。24 年来,李世石已经获得了 14 个国际比赛冠军,32 次国内比赛冠军,皆仅次于李昌镐,高居历史第二。

  李世石 1983 年出生在距离全罗南道新安郡的飞禽岛,爱好围棋的父亲是李世石的第一任导师。6 岁开始接触围棋的李世石是兄弟姐妹中年龄最小的一个,但也是天赋最高的一个。9 岁时,因大哥李相勋成功入段,父亲终于也下定决心将李世石送到有「韩国围棋山脉」之称的首尔权甲龙围棋道场学棋。

  北京时间 12 月 18 日 12 时,李世石与 Handol 开始第一局对弈。李世石执黑被让两子,按 7 目半还子。前半盘黑棋先拿到右上角实地,胜率一直保持在 80% 以上。随后白棋开始反击,直到第 78 手之前,胜率一直处于上升阶段。

  当然,这样的 bug 不止存在于 AlphaGo。李世石曾说:「在腾讯『绝艺』中,这样的 bug 至今仍然会出现。即使现在的绝艺已经可以做到让人类两子胜利了,但它仍然会以奇怪的方式输掉比赛,这是因为一个 bug 所致。」

  李世石的围棋生涯中曾有一次「妥协」的退役风波,2009 年 6 月,李世石曾向韩国棋院提交过休职书,称因「韩国棋院对棋手不合理的约束」而身心疲惫,计划从当日起休职到 2010 年底。半年后,李世石复职,但桀骜不驯的性格并未改变。2016 年,李世石又与哥哥李相勋一起,因韩国棋院「克扣奖金」的原因退出了棋士会。

  除了没有信心战胜 AI,李世石的退役似乎也和自己与韩国棋院之间的矛盾分不开。在韩国棋院的 24 年中,李世石曾提交过休职申请,也强行退出过棋士会,特立独行的处事方式与其在棋盘上的风格如出一辙。

  上个月,DeepMind 又推出了名为 MuZero 的「通用版」AlphaGo,在国际象棋、日本将棋和围棋的精确规划任务中可以匹敌 Alpha Zero,在围棋中甚至超过了 Alpha Zero。但与前辈不同的是,MuZero 不需要提前获知规则。

  乌镇之后,DeepMind 宣布 AlphaGo 从此不会再参与比赛,但在几个月后推出了更强版本的围棋 AI「AlphaGo Zero」。如果说 AlphaGo 版本最初还需要观察数千场人类围棋比赛来训练如何学习围棋,AlphaGo Zero 则直接跳过这一步,从自己完全随机的下围棋开始来学习围棋,几天之内即超越人类棋手的水平,并且以 100:0 的比分打败了之前战胜世界冠军的 AlphaGo。

  2019 年 1 月,Handol 连续战胜了申旻埈九段、李东勋九段、金智硕九段、朴正焕九段和申真瑞九段五位韩国顶级围棋选手,8 月在山东举行的「中信证券杯」世界智能围棋公开赛中,Handol 也捧回了季军奖杯。

  当很多人都以为李世石的最后一战会选择与古力对决时,李世石却选了韩国围棋 AI「Handol」,理由是担心「最后和他下棋的人会有负担」。

  2000 年,当时的「李世石三段」在巴斯卡杯天元战和倍达王战中击败柳才馨九段和刘昌赫九段,连获两个冠军,成为围棋史上成就最高的「三段」选手。但他却拒绝参加升段赛,声称「段位并不能体现实力」。为此,韩国棋界不得不废除了升段赛,改以成绩定段位。2001 年,李世石在获得第五届 LG 杯世界棋王赛亚军后升至七段,2003 年获 LG 世界棋王战冠军,直升九段。

  下午 2 时 50 分左右,李世石进入读秒,此时白棋已在右侧和左上成活,李世石试图通过打劫寻找 AI 的破绽。

  一直以来,人们都认为顶尖人类棋手与 AI 之间的差距在二子到三子之间,但由于从来没有进行过正式比赛的对局,所以真正差距无从得知。李世石提到,自己最终选择下升降棋,也是想确认人类和人工智能之间的差距到底有多少。在对战 Handol 之前,李世石说自己已经有大概 5 个月的时间没有参加过比赛,也几乎没有进行过围棋训练。

  转折点出现在李世石的第 78 手(值得一提的是,李世石当年对战 AlphaGo 获胜的唯一一局,胜负手同样是第 78 手)。黑棋吃掉白棋棋筋,加之 Handol 在第 84 手征子失误,只得在第 92 手时投子认输。

发表评论

电子邮件地址不会被公开。 必填项已用*标注