人工智能下象棋,走一步,能看几步?|漫画

图文原创:谭婧

fd3eb2c4d15637a4ce2a1eff5a1ba39b.png

谭婧老师爱下象棋,就是谁也赢不了。

去公园下了一盘棋 ,第一步我就走了一个当头炮 ,剩下的都是大爷们帮我走的。

结果,我输了。

经过他们的总结研究,我第一步走错了 。

d7671f67c901e6fc3ae952c449bacbbb.png

2022年,象棋AI下棋机器人,问世了。

我和它对弈了一盘,结果,我赢了。

很有自知之明的我,严重怀疑设计者增加了噪音,降低了棋力。让我赢得很舒服。

但我没有证据。

怎么说呢,我就喜欢高情商的AI象棋机器人。

低情商的机器人只会冷漠地碾压我:“下不过我,就别废话。”

仿佛不仅嫌弃我棋臭,还嫌弃我话多。

45774e63b6041500da95ba6fe72648ff.png

而高情商的AI象棋机器人,大为不同。

它伸出胳膊,温柔地摆出“请”的姿势,它居然有机械臂。

961a511e26513a5715ca36bca263f7b3.jpeg

情商和机械臂都不是重点,聊聊它的智商从何而来。

AI象棋机器人是人工智能技术中深度学习与强化学习的成果,击杀四方。

任何人工智能都离不开数学基础原理,在此,首先得感谢尊敬的贝尔曼(Bellman)教授。

8372cc4bc3102bae6c459b9b05c5cead.png

以他名字命名的贝尔曼方程,在绝大多数强化学习的成果中都会用到,比如象棋AI下棋机器人的远方表哥,自动驾驶。

它们是亲戚,“血缘关系”是“最优决策”。

a9a14cf6053d0fb4409eec41110e4988.jpeg

强化学习是要在多种决策中评价,找出好的决策。

强化学习在象棋中,就是在多种走法中找到最好的走法。

围观数学公式的人少,围观下象棋的人多。

我们抛开公式,用决策树表示每一步的输赢,非常直观。

一盘三十步的象棋比赛,会是一颗很大的决策树,有很多枝叶。

3910412dfe62269cc7ff645b48310a84.png

计算机下象棋的棋力,早就超越了绝大多数的人。然而,至今没有任何一款计算机软件达到全知全能的“棋神”状态,连AI也不行。

那在下象棋这件事情上,AI这几年在忙活啥?

3deb436cf5d9f25f00de774782c2265d.jpeg

那要从几十年前讲起了。

1980到1990年代,深蓝计算机是大公司的,小霸王游戏机是大家的。

假如一个人类象棋高手下一步棋,能看未来八步棋。就好比一下能想到决策树上的第八层。

传统象棋软件说,这我也行。

43eb35fb7608080787238d6c93b7b2ba.png

话是没有吹牛,传统象棋软件确实可以做到。

可是,再往前多算几步,所耗时间和计算存储可能都要翻倍。或者说,情况急转直下。

c0731e4994de5c86ee4950d76562d1ab.png

在旧式象棋软件的时代,得想办法减少计算量。所以,有了阿法贝塔剪枝。

这虽然有“偷懒”的嫌疑,但我也没有证据。

阿法贝塔剪枝的方法,相当于提前知道哪些搜索是没有意义的,排除错误答案,用巧思“偷懒”,相当于省略做题过程。

e637f2d240445205601bc46f5019e403.png

旧思路在象棋上还能支撑,用在围棋上力有不逮。

(因为围棋是19×19的一个矩阵,每步可选择的走法要比象棋多一个数量级。)

从旧式象棋软件时代,人们就为棋力算分。这是一个起源很早的好办法。

那么得分是怎么来呢?

用一个数学函数把有利赢棋的因素都考虑进去。

以至于,中国象棋协会也有象棋大师用此来构思好棋。

557c91dd32b32336240d28d5799e3fa5.png

有了分数,僵化的下象棋,就是“哪步得分高,就走哪步”。

然而,象棋是一个非常讲究全局观的游戏。

追求最终取胜,不追求每一步占尽优势。

比如,战术性丢车保帅。

深度学习模型在象棋面前暴露了“缺点”,它算出当下局面的胜率,但是,并不能估算出后续局面的胜率。

所以,需要一个重要的动作来加持:搜索

从决策树上理解,就是考虑的越多越好。

如今,能搜索到决策树里非常深的层数,这就意味着,招数更多,棋路更多,对胜利的把握就越大。

e39086b3c6177f93ffd92a6daf4813a3.png

谈到如何处理搜索量大,就谈到了蒙特卡洛树搜索是学霸特供技能,对大多数人来说,都很难。

甚至可以这样说,就是题目很困难,算不出来,只好求助于概率,求助于实验。

一顿猛如虎的严谨分析算不出来。来吧,学霸直接撸起袖子做实验。

fe51719bf853b1adc806656b02f396a1.png

蒙特卡洛方法的做法虽然看起来比较随意,但却有着坚实的理论基础:大数定律。

在计算机眼里,棋子挪动一步,都算一个新的棋局,所以棋局数量何其之多。

一个厮杀正酣的棋局,往后走,可能衍生出10000种棋局。

借助蒙特卡洛树搜索这一方法,看未来几步怎么走。或者说,当AI象棋机器人,有了强化学习,就有了“大局观”。

我们马上进入学霸区特供:《AI象棋机器人所用的蒙特卡洛树搜索》。

e984456ed85a58dd04cf2303019945e1.png

这就是深度强化学习,模型收敛的目标是,把胜率估计越准越好。经过多轮训练,胜率会越来越准。

胜率是AI象棋机器人的KPI,每下一步都估算胜率。每一步,尽量把胜率提高。

常识是,高手胜率高,低手胜率低。

问题来了,高到多少,低到多少。每一步的胜率很难准确估算,只能估大致范围。

而且,把胜率提高的前提是,得把胜率算准确。

49036111705fceae6899f53c8b44c7ef.png

在如此模糊的情况下,数据里会有误差。因为有误差,所以AI象棋机器人只能知道“棋神”的方向是什么,它想方设法逼近这个方向。

象棋AI机器人的棋力水平的训练方法是,AI,加上蒙特卡洛树搜索,然后再教导AI本身。

这个过程类似总结经验,这样使得它的棋力飙升。

可以说,AI象棋机器人强大之处得益于蒙特卡洛树搜索。

超越人类是很早以前的本事了,现在追求棋力丝滑上升,情商在线。

让棋力水平菜,还有棋瘾的人,也能玩得开心(请不要在我下象棋的时候安装监控)。

好了,

这回就聊到这吧。

看在象棋AI下棋机器人输给我的份上,我不妨透露两个消息。

第一,有一版的AI象棋机器人初级棋力就打败了全公司的挑战者。

大胜之际,算法设计工程师们哀嚎遍野:“大事不妙”。

第二,我下赢AI象棋机器人那一局的时候,旁边有三个AI工程师帮忙出主意。

(哦,第二点是在凡尔赛科技新媒体的日常)

最后隆重介绍一下我们的全文审核专家:

ac3270f3302b9438fedc03c2f4cb9ce3.png

更多阅读

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3. 隐私计算:消失的人工智能 “法外之地”

4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?

5. 两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500

漫画系列

1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,人工智能算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”划算吗?

10. 你爱吃的火锅底料,是机器人自动进货丨漫画AutoML

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

DPU芯片系列:

1.造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4.哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

b898839e1d86403a7ebe1b0b6b3c4286.jpeg

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

个人微信:18611208992

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  

73bad4bef004b396102dca4286cc6ede.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/52662.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

参考文献怎么查找,去哪里查找?一篇文章讲明白这些问题

在我们撰写论文查找参考文献时,往往不知道从哪里入手,本文小编就针对下面这三个方面给大家详细讲解下: 一、查找参考文献方法 二、参考文献资料查找网站 三、参考文献格式规范 一、查找参考文献方法: 1、知网全球最大的中文数据…

与外文文献有关的那些事儿

目录 SCI是什么 一、SCI分区依据? 二、如何查找外文文献 1.常用的外文文献数据库​编辑 2.Web of Science数据库 总结 SCI是什么 SCI是美国《科学引文索引》的英文简称,其全称为:Science Citation Index,,创刊于1961年&…

从算力到存力:存储芯片研究框架(2023)

2023年3月31日,我国发起对美光在华销售产品的网络安全审查,体现出存储产业安全的重要性。此外,AI算力需求拉动高算力服务器出货,而AI服务器的存力需求更强,AI将驱动“从算力到存力”的中长期需求: 1、海外…

Python为什么有那么多人在学?有了ChatGPT还有必要学习Python吗?

为什么学习Python呢? 学习 Python 的原因有很多,以下是一些常见的原因: 简单易学: Python 是一门易于学习的编程语言,语法简单、清晰明了,可以快速掌握基本的编程概念。 应用广泛: Python 是…

在数字化质变“奇点”时刻,看数字生产力跃升的华为观

(华为轮值董事长孟晚舟) 进入2023年,以大语言模型为代表的新AI,打开了全球对于数字生产力的全新认知:高盛集团经济学家认为,ChatGPT等生成式AI最终可能在10年的时间里使得全球年GDP增长7%(近7万…

chatgpt赋能python:Python照片换底:让您的照片更具艺术感

Python照片换底:让您的照片更具艺术感 Python是一种高级编程语言,拥有丰富的库和工具,可以实现多种应用。其中,照片换底技术是很多人感兴趣的内容之一。通过使用Python,您可以自动抠出照片中的主体,并将其…

chatgpt赋能Python-pycharm怎么重新配置python环境

Pycharm重新配置Python环境方法概述 如果您是Python编程的专业人士或者是刚开始学习Python,您可能已经听说了Pycharm这个IDE。Pycharm不仅可以提高您Python编程的效率,而且也大大改善了整个开发过程。不过,如果您需要使用Pycharm重新配置Pyt…

运营小红书需要注意什么?这4个方法助你成为小红书达人!(上)

在小红书这个平台上,大部分人都心照不宣的意识到成为小红书的博主就能赚到钱,这是事实。比如粉丝5千的博主就可以申请成为小红书的创作者,开始推广赚钱,而粉丝过万的博主除了申请创作者外,可能还会有品牌主动找你合作。…

小红书「高效达人筛选攻略」

三八女神节降临,诸多品牌纷纷开启铺垫预热,在各大平台借势宣传。而聚集庞大年轻女性消费群体的小红书,对“她营销”的重要性不言而喻。节点序幕拉开,面对海量达人信息,如何提前积草屯粮、高效备战? 本期千瓜…

小红书达人怎么找?保姆级教程来了~

在小红书推广营销中,寻找优质的达人是最头疼的事,许多品牌往往会根据简单的小红书排名来直接进行判断认定,其实在挑选小红书达人时有许多要注意的点,接下来和小编一起根据小红书数据分析工具来筛选合适、优质的达人。 千瓜数据—…

阿里云版GPT官宣,我们问了它10个问题

4月7日,阿里云宣布自研大模型“通义千问”,目前已开始邀请用户测试体验。 阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发,通义千问便是其最新成果,相当于阿里云版的“ChatGPT”。 …

《长津湖》,我没看够

大家好,我是校长。 今天我比较期待的一个电影《长津湖》终于上映了,下午的时候,我就去电影院看了这部电影。 其实,我这个人从小喜欢看历史,看近现代史,我小学和中学的时候,历史经常考满分&#…

前端和HTML基础

本文重点: 1. 介绍什么是前端。 2. 简单介绍了html以及html中常用的一些标签。 前端 1.含义 使用web技术栈解决多终端图形界面下的人机交互问题 前端技术栈分为三层: HTML为内容,CSS为样式,JavaScript为行为,三者通过H…

中文影评分类的神经网络模型

本文旨在利用Tensorflow训练一个中文影评二分类神经网络,由于分词处理是以词为最小单位的,所以该模型同时也是word-based NLP模型。 准备文本训练集 训练集为一个文本文件,数字部分为影评的标签,1表示影评是消极的,0表示影评是积极…

5.springboot整合thymeleaf

1.创建数据库 DROP TABLE IF EXISTS movie; CREATE TABLE movie (id int(255) NOT NULL AUTO_INCREMENT,name varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,author varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,score varchar(2…

2.springboot整合mybatisplus

1.创建数据库 DROP TABLE IF EXISTS movie; CREATE TABLE movie (id int(255) NOT NULL AUTO_INCREMENT,name varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,author varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,score varchar(2…

4.springboot整合swagger

1.创建数据库 DROP TABLE IF EXISTS movie; CREATE TABLE movie (id int(255) NOT NULL AUTO_INCREMENT,name varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,author varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,score varchar(2…

1.springboot整合mybatis

1.创建数据库 DROP TABLE IF EXISTS movie; CREATE TABLE movie (id int(255) NOT NULL AUTO_INCREMENT,name varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,author varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,score varchar(2…

SQL语句练习附带答案

首先创建数据库filmclub DROP DATABASE IF EXISTS filmclub;CREATE DATABASE filmclub;USE filmclub;CREATE TABLE category (cid INT PRIMARY KEY AUTO_INCREMENT,cname VARCHAR(20) )CHARSETutf8; CREATE TABLE film (fid INT PRIMARY KEY AUTO_INCREMENT,fname VARCHAR(20)…

CSS基础学习十九:CSS布局之图文混排,图像签名,多图拼接和图片特效

学习了CSS布局的定位和浮动&#xff0c;我们可以简单地做出很多排版和内容拼接。今天就来做几个简单的实例展示现在 流行的DIVCSS布局的方便好用之处。顺便也说一下CSS3新增的样式属性box-shadow和属性transform。 一图文混排 <!DOCTYPE html PUBLIC "-//W3C//DTD XHT…