图片来源:pixabay
2016年,AlphaGo战胜了前围棋世界冠军李世石,登上各大新闻头条。这不免让人想起1997年在国际象棋上战胜人类的IBM深蓝,但不同的是,国际象棋的棋盘是8×8,而围棋的棋盘是19×19,每一步棋多出来的可能性让棋局的可能性呈指数暴增,让IBM深蓝的穷举策略变得不可能。但在蒙特卡洛树和深度神经网络的加持下,AI围棋程序AlphaGo展现出了魔法一般的能力,让人类无从招架。
编译 | 王昱
随着AlphaGo的胜利,AI对人类的威胁,不论是科幻中控制人类社会的AI失控,还是现实中的失业风险,都引起了越来越多的注意,这与现目前人们对ChatGPT和GPT-4的担忧别无二致。不过,当时败北的李世石却发出了不一样的声音:“它的风格完全不同,和它对弈的体验非同一般,我花了点时间才适应。AlphaGo让我意识到,我在围棋上还能继续精进。”同时,几个月前就输给AlphaGo的欧洲围棋冠军选手樊麾也表示,与AlphaGo的对弈让他对围棋有了“完全不同”的看法,这在后来甚至提升了他的排名。
人工智能究竟有没有改变顶级棋手的思考方式,这很难研究。但是几十年来职业棋手对弈时的棋谱则为研究人员提供了宝贵的参考。3月13日在《美国科学院刊》上发表的一篇论文显示,自从围棋AI出现后,人类选手在围棋竞赛中的水平确实提高了。
DeepMind首席科学家、AlphaGo项目负责人戴维·西尔弗(David Silver,并未参与此项研究)表示:“看到人类玩家能这么快适应,并将新发现融入自己的对局中,真的令人惊讶。论文结果表明,人类能很快适应这些变化,并在此基础上更进一步,提升自己。”
为了查明围棋AI是否促使人类找到了新的围棋策略,香港城市大学的助理教授申敏奎和同事使用了一个数据库网站Games of Go on Download,其中收录了1950至2021年期间580万次棋局的棋谱。之所以从1950年开始记录数据,是因为1950年是现代围棋规则建立的那一年。
为了梳理580万盘棋局,研究团队必须创造一套程序来评估每一步决策的质量。研究团队用到了人工智能系统KataGo,评估人类每一步棋的胜率,并将它和AI决策的胜率进行比较,并以此评判人类棋手每一步棋的水平。DeepMind的AlphaGo并没有公开,一般认为KataGo是和AlphaGo同等级的AI围棋程序。
研究人员用AI胜率分析了2016年以前和2016年以后的数据。结果非常明显,在AI击败人类类围棋冠军之前的66年里,人类的决策水平在AI看来保持一致,或者说停滞不前,而在2016年AlphaGo的胜利后,人类棋手的决策质量开始攀升——人类虽然可能下不过围棋AI,但在围棋AI的指导下,人类围棋选手的决策质量也在不断攀升。
掌握了这些数据,研究人员又开发出了一种方法,来查明人类棋手下出的棋中,究竟哪一步是新颖的——这指的是这种下法没有出现在以前的对弈记录中。在围棋对弈的创新型分析中,研究人员跟踪了每局棋的前60手,并在新下法出现时进行标记。比如,如果一场比赛中到第9手时才和传统下法出现差异,而另一场比赛中到第15手才出现差异,那么前一场比赛就比另一场比赛更多变、更新奇。
结果显示,在2016年之后,人类棋手的下法更多变了。而且有趣的是,在2016年之前,大多数新颖的下法往往会降低整体的胜率;而2016年之后则反了过来——新颖的下法反而会提升整体胜率。很显然,单纯的“背AI棋谱”并不能达成这样的效果,AI真的帮人类找到了更科学的下棋方法。
但情况在最近发生了转变。最近,美国棋手凯琳·佩林(Kellin Pelrine)站了出来,他并非专业棋手,甚至也不是顶尖业余棋手,却能和顶级围棋AI取得14:1的战绩。
他所用下法是一种专用于对抗AI的方法,如果用这种方法和人类玩家对弈,你一定会输得很惨。并且,最令人失望的是,就连这种专门针对AI的下法,也是由计算机程序算出来的。
美国加州科技公司FAR AI的首席执行官亚当·格利夫(Adam Gleave)设计了这个程序,他表示:“开发这套系统出乎意料的容易。”他补充道,该软件与顶级围棋AI KataGo进行了超过100万场对局,就是为了找到人类棋手可以利用的盲点。
这个由计算机程序找到的对抗AI的策略是这样的:慢慢地在棋盘外圈连起来一连串棋子,试图将这一串棋子围成一个大“包围圈”,同时,在棋盘的其他角落下一些分散的棋子来分散AI的注意力。使用这种策略,AI很难发现你已经悄悄围起来了一大片区域,最终你能通过这种方法占据更多目,战胜不可一世的围棋AI。
但是如果你用这种方式来和人类棋手对弈,对方大概率会觉得你是一个刚刚掌握围棋规则的新手,只想过来随便玩玩。毕竟这种下法的目的太明显了——就是想用棋子围起来一大片区域。只要对方掌握了基本的围棋规则,用这种下法基本就没有胜率。因为只要你的“包围圈”还没有合拢,对方就能在几手棋内轻松破解整个包围圈。这时,因为你在包围圈上浪费了太多棋子,已经不可能再赢得这场比赛了。
但AI就是识别不出潜在的危险,也无法在包围圈合拢前破解整个包围圈。当然,在棋盘的其他角落分散下一些棋子来吸引AI的注意还是需要一些水平的。据佩林的说法,至少也要是比较强的爱好者才能用这种办法战胜AI。
研究人员表示,KataGo之所以失手,可能是因为在它的对抗性演练中,并没有经历过足够多的此类下法——或者说,这种制造“包围圈”的下法往往在刚开始时就因为浪费棋子太多,而被认为注定落败,所以围棋AI也没有意识到如果让“包围圈”合围,自己就会落败。
AlphaGo的出现让人类围棋水平快速提升,申敏奎表示:“我们不应将人工智能视作人类的威胁,而是一种能增强我们能力的宝贵工具”。在ChatGPT和GPT-4爆火的今天,这种观点能给人更多希望。
但是,这一切并非没有风险,就像在AI已经统治围棋界的今天,仍有一部分在人类看来完全不成立的下法却能战胜AI。亚当·格利夫表示:“我们能看到,非常庞大的AI系统在几乎没有被验证的情况下就被大规模部署了。”这究竟给我们带来了更多的便利,还是带来了更多的风险,谁都无法回答这个问题。