用小学数学带你感受人工智能的魅力

AI因你而升温,记得加个星标哦!

大家好,我是泰哥。在ChatGPT火爆出圈后,越来越多的人对人工智能、深度学习、神经网络等名词更加好奇,身边的朋友最近也频繁的问我,AI究竟为什么如此强大?

偷个懒,用ChatGPT 帮我写段生物信息代码

如果 ChatGPT 给出的的代码不太完善,如何请他一步步改好?

今天我就用大家都看得懂的小学数学知识,来带大家感受人工智能的魅力,带大家认识神经网络

平面中的一条直线能分割平面

平面中的一条直线,可以用函数来表示,比如:

f55b49bcfa3bc3b43c06fbd1afcf3c69.png

这条直线也可以表示为,以线为依据,它可以将平面分为直线上(阴影部分)和直线下两部分。

如果随机给你一个点,你如何判断它在直线上方还是直线下方呢?

f4fe81e1f3d9a3d38da582e4669b2bd6.png

我们以(2,2)和(2,-2)两点为例:

d7dc75bcd82b957baf91b28e54380cd6.png

将点(2,2)代入方程:

将点(2,-2)代入方程:

不难发现,将直线上方的点代入方程后,最终结果会大于0;将直线下方的点代入方程后,最终结果会小于0。

我们用z来表示方程的结果,可以得出以下结论:

  • 随机带入一个点,

    当z大于0时,说明点在直线的上方

  • 随机带入一个点,

    当z小于0时,说明点在直线的下方

那么我们只要再构造一个函数来判断z的值是大于0还是小于0,即可判断该点在图中的位置。

判断函数怎么构造

随机带入一个点:

  • 如果它在直线上方(z大于0),我们就令它为真,让判断函数输出1

  • 如果它在直线下方(z小于0),我们就令它为假,让判断函数输出0

cbafef20a5c26d37e2825610cc1a1906.png

判断函数的表达式是

我们把任意一个点(x,y)带入后可以求得z的大小,再将z作为判断函数的输入,就可以输出0或1,来直接得出这个点位于直线的上方还是下方。用流程图来表示:

b1f8330602568801a521c07ab6e27b18.png

比如将(2,2)代入:

6e3cb5fbad61399e0cb1394ac742f57a.png

所以任意给出平面一点,只要先代入函数算出z的值,再将z的结果代入判断函数,就可以知道它在直线的上方还是下方。

在AI领域,这个判断函数叫做激活函数。

从一条线到三角区域

如果你会判断一个点位于直线的上方还是下方,那么你会判断一个点位于三角形内(阴影部分)还是三角形外吗?

fc25021082bca2ec9c642ef0940601bf.png

不难想到,可以根据这个点位于三条线的位置来判断!

61c0a9239b513f28c306f90dd726a631.png

由上图可知:

设L1的方程是,并规定当点在L1右方时(阴影部分)为真

设L2的方程是,并规定当点在L2下方时(阴影部分)为真

设L3的方程是,并规定当点在L3左方时(阴影部分)为真

a6d9f6a394bc2c20cf135e6f7727d5a1.png

根据上文一条直线的例子,我们不难理解,当三个判断函数的输出均为1时,这个点就在三角形内部。因此,我们需要对三个判断函数输出值是否均为1进行二次判断

我们可以把三个判断函数的输出看作新的输入,再经过一次线性变化和判断函数,。

27153f73988b820c97ed803b4a56be48.png

最后让它输出0或1,来判断一点是否在三角形内部。因为判断函数的输出只能是0或1,所以将他们相加后,结果可能的最大值为3,然后减去一个(2,3)区间内的数,这里选的是2.5(截距b),最后通过判断函数,就可以判断一点是否在三角形内了。

从三角形到圆

如果会判断一个点是否在三角区域内,那么你会判断一个点在矩形内吗?

aca1a046ec1eefad17e7289c3e5740c4.png

无非就是再多加一条线:

9894da60871c910e5e21b641b3519ec6.png

如果这个区域是圆呢?ea508ee57ae6cf358569b20431e594ca.png

我们就可以用8条直线乃至更多直线去拟合这圆,然后判断该点是否在这些直线内部:

31e3bf6767702267752a751af9d46d20.png

同理,只要每层的直线够多,我们就可以拟合任意图像:

dee84fda95de569de4a9e015edc58325.png

科普:人工智能中一层神经网络包括一次连续线性变化与非连续线性变化

连续线性变化就是,要求连续且为直线。将输入的x乘系数后再加上截距,使它变大或变小,在图中为一条直线。

非连续线性变化就是判断函数,在人工智能领域称为激活函数。比如我们本次用的判断函数在0处是间断的,不是连续的。

8a47362c0afda0bc5665fac22a7f5b4d.png

我们处理以上问题时,都用了两层神经网络,大家知道是哪两层吗?

以判断一点是否在矩形内为例:

c70b6d7e248dfa24f8de07542e1995c1.png

从一个图形到多个图形

那么如果是要判断一点是否在以下阴影区域呢?

4c17388a03b9918f41e68100780a33ce.png

那就需要用4条直接拟合矩形,3条直线拟合三角形,把他们的结果汇总,需要再加一层神经网络():

e2fe3df148784a3380fae6cacbd62d25.png

有了这个例子,在二维平面内的所有问题(任何形状、任意多少区域)都可以使用3层神经网络来解决,比如:

6b8f099dbffc882b330ac1c0e8b8c9a4.png

这就是人工智能领域著名的结论:三层神经网络可以模拟任意决策面。这就是深度学习(神经网络)的基础。

神经网络的精妙之处在于,将前一层的多个输出值再次构造成一个新的线性函数从而进行再判断,以此类推。神经网络不断从线性变为非线性的过程,就是提取数据特征的过程。

从二分类到多分类

此上介绍的问题都是二分类问题(在阴影中或不在阴影中),但生活中绝大多数问题都是多分类问题。比如如何判断一点在以下哪个区域?这就是一个三分类问题。

7c38ae782298811b434c7bf5bc21e5d8.png

几分类问题就设置几个输出,最后哪个判断函数的输出为1,该点就在哪个区域:

a233d5eb8b8baf95e2e7d8c7c9ba8a6e.png

从二维到多维

我在AI科普4:通俗易懂的机器学习模型中举例的肿瘤问题:有一批肿瘤病人相关数据,横轴为肿瘤存在时长,纵轴为肿瘤的大小,橙色为恶性肿瘤,绿色为良性肿瘤。每位病人肿瘤的大小和存在时长就构成了二维空间中的一个点,现在我们有10位病人的肿瘤病情信息。

如果新来一位病人,我们怎么判断它是良性还是恶性呢?这个问题我们就可以用神经网络去解决。

9eaf08f2fc8f42cda6a673eadc372704.png

构造一条线(曲线也可以),这条线是,它可以将良性肿瘤与恶性肿瘤分开:

4914d4baf8bb86a32e270537b05541f5.png

新来一位病人,他得肿瘤的时长是x,目前大小是y,就把它代入神经网络。

如果z大于0,在直线上方,就为恶性;在直线下方,就为良性。

实际问题中,要考虑的因素更多,数据的维度变多,也就意味着输入更多。比如进行电影评分预测(结果分为5个等级),那么一部电影要考虑的因素可能包括电影类型、导演、演员、电影时长等等。我们就把这些因素设为输出,将5个结果设为输出:

6e7ffd6eefbef3b4fb557dfdd5921fee.png

这个过程,是不是很像我们大脑的思考过程?其实神经网络就是根据人脑来设计的模型。例如当我们要买一件短袖,我们会参考品牌、价格、款式、颜色等维度综合考量,得出买或不买的结论。

这就是人工智能的强大之处,只要直线个数够多、维度够多,就可以拟合任意空间,解决任何问题。比如现在的ChatGPT,就有1750亿个参数 (GPT-3 有 1750 亿参数,ChatGPT 并未公布,但肯定是多于这个数)。

难点就是学习这些参数

以一点是否在三角形中的函数为例:

a6832735c6659522c8252f7c2a2934b9.png

我们可以轻松发现,解决某点是否在三角形内这个问题时,只要让,,就能作出二次判断。但实际应用中,这些参数()的值事先是不知道的、是随机初始化的。

科学家们不断探索研究的核心之一就是设计算法找到合适的参数值。再遇到类似问题时,就可以用已经学习到的参数来解决问题。

▼ 推荐阅读 ▼

手机拍照与相机拍照究竟有什么区别?

为什么正态分布如此常见?

AI科普(一):什么是人工智能?

AI科普(四):通俗易懂的机器学习模型

往期精品(点击图片直达文字对应教程)

a75282085c251b4c54f0b9fb2b98dce2.jpeg

e839df1c0be988805b8e5c4b15610624.jpeg

860712ba75ef83b5b662de72cfdc593e.jpeg

aab2e82b286fbc89fef377a3e8dc5c8f.jpeg

7a1ad4eeb3d2863764a09bd437d03339.jpeg

b53ff1a1446bec81107528ef7e4be5b0.jpeg

04c1cc3d4708056ad51c95e78cc7fef4.jpeg

414d3b9e08f994c49cb0595512c9212b.jpeg

ae3689b12025fad460db96968cdc6c16.jpeg

c7edc7ea12abea04deb08713f98ebf85.jpeg

62b6733273e893b7e00c76ef3f3b295a.jpeg

6af7ea663a4538d0dd7b15df13b4bc01.jpeg

0b0a045950e9c4c71029185a52676ffb.png

22159b4fb0db575ff1104201c78aa837.png

6398d9e175cf062f7112259f259619a3.png

f5464398d803526adbf1b61b9d968056.png

2156b056a26d4e9c291a56425cd06474.jpeg

abd15ba9459baeb800b88f64ddab151f.jpeg

4dc629414177b3b140ca7a1875243f68.jpeg

2fd650c3a717edcbb921a52ba3ef27ff.jpeg

8321d36cf7db81ee2bff6a0bc66fe409.png

ed2ee284c486eaa02a1b3f383118100e.png

be55da5b555c9e6501fd43c91911727e.jpeg

48b8f435237bbb7394e8ca761622e0fa.png

cfaea13671ec18ba64780e65e84f5ba8.png

3672b0b4f3d4faed6aa392bc71747ae2.jpeg

6cbe8a8d269b3a85b86714772f95b619.png

28d3ccf3f5a8753a0e515cb02682dda4.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

7040a44830f810e94b5dbebe48982da3.jpeg

866b5f909fd79e725d822a15989cf065.jpeg

edca07b47cec2f6258f4136aa33d843e.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22592.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

精选| 2023年1月R新包推荐(第72期)

译:黄小伟,目前就职于杭州有赞 知乎专栏:中国R语言社区 |30,000关注、300万阅读 2023年1月,165个R包收录于CRAN,环比增长42.4%,本月Top 40 R包分为14个类别,详细介绍如下&#xff1a…

我用Echarts图表分析巴西队历年战绩,预测卡塔尔世界杯能否夺冠

🐱 个人主页:不叫猫先生 🙋‍♂️ 作者简介:前端领域新星创作者、阿里云专家博主,专注于前端各领域技术,共同学习共同进步,一起加油呀! 💫系列专栏:vue3从入门…

陶哲轩甩出调教GPT-4聊天记录,点击领取大佬的研究助理!

Datawhale干货 方向:GPT-4高级调教,来源:量子位 鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了! 就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用…

ESP8266还可以这样玩

作者:晓宇,排版:晓宇 微信公众号:芯片之家(ID:chiphome-dy) 01 巨型ESP8266 ESP8266几乎无人不知,无人不晓了吧,相当一部分朋友接触物联网都是从ESP8266开始的&#xff…

笑死!推特限流,微博赢麻了;使用ChatGPT撰写简历;SD电脑配置推荐;斯坦福67门AI课程学习路径 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 因 Twitter 限流,大量海外画师涌入微博哈哈哈哈 7月3日,马斯克突然发推宣布用户浏览数量限制,新账…

想要成为 NLP 领域的大牛?从 ChatGPT 的 5 大自然语言模型开始了解吧(LM、Transformer、GPT、RLHF、LLM)——小白也能看得懂

目录 前言ChatGPT基础科普——知其一点所以然1. LM2. Transformer3. GPT4. RLHF5. LLM 参考资料其它资料下载 前言 如果想在自然语言处理(Natural Language Processing,NLP)领域内脱颖而出,那么你一定不能错过 ChatGPT 的 5 大自然…

浏览器工作原理和实践

1.介绍 见正文3 2.应用背景 参透了浏览器的工作原理,可解决80%的前端难题. 帮助高效快速安全开发web前端项目. 3.学习 课程目录 开篇词 (1讲) 开篇词 | 参透了浏览器的工作原理,你就能解决80%的前端难题 宏观视角下的浏览器 (6讲) 01 | Chrome架构…

SpringBoot自动配置的模版引擎

文章目录 目录 一、Thymeleaf 1.什么是Thymeleaf? 2.什么是模版引擎? 3.JAVA中的SPI(Service Provider interface)机制? 4.META-INF目录是干嘛用的? 总结 前言 一、Thymeleaf 1.什么是Thymeleaf? hymeleaf是试用于Web和独立环境的现代服务器端Java模版引擎 目的:…

chatgpt赋能Python-python_lirc

Python-LIRC:让Python与遥控器无缝连接 介绍 Python-LIRC是一个Python语言的模块,它提供了一种接口,用于与Linux Infrared Remote Control(LIRC)系统进行通信。有了Python-LIRC,你可以轻松地将红外线遥控…

重磅!牛客笔试客户端可防ChatGPT作弊

上线俩月,月活过亿。 爆火的ChatGPT能代写文,撕代码,善玩梗,秒答题,几乎“无所不能”,争议也随之而来。 调查显示,截至2023年1月,美国89%的大学生利用ChatGPT应付作业,53…

学生用ChatGPT拿下全班最高分,教授惊呆

【导读】ChatGPT爆火两个月,整个教育系统都被颠覆了。学生用得不亦乐乎,而老师们迫不得已,纷纷打响了ChatGPT反击战。 ChatGPT已经让大学老师们受到惊吓了。 摸出门道的学生们,开始使用ChatGPT生成论文,得到了A的分数…

自然语言处理(NLP)之跳字(元)模型<skip-gram>与连续词袋模型<continuous bag of words>

自然语言处理(Natural Language Processing, NLP)是AI里的一个非常重要的领域,比如现在很火爆的ChatGPT,首先就需要很好的理解输入内容的意思才能够做出合理的回复。 自然语言处理应用非常广泛,比如机器翻译、问题回答、文本语义对比、语音识…

DeepMind:用 GNN 学习通用推理算法

文 | 智商掉了一地 小孩子才做选择,我的模型全!都!要! 近年来,基于深度神经网络的机器学习系统取得了巨大进步,尤其是在以感知为主的任务上。这一领域表现突出的模型通常要在分布中进行泛化,意味…

GPT-4发布:人工智能新高度,以图生文技术震撼,短时间内挤爆OpenAI模型付费系统

“GPT-4,起飞!”今日凌晨1点,OpenAI正式推出史上最强大的GPT-4文本生成AI系统 GPT-4:人工智能的新里程碑 你可能已经听说过GPT-3,它是一种能够生成自然语言文本的强大模型,可以用来回答问题、写文章、编程…

从BERT到ChatGPT,9大研究机构全面综述:「预训练基础模型」

来自:新智元 编辑:LRS 【导读】2023年了,还有人从头开始训模型吗?追踪一下从Bert以来的那些预训练模型。 ChatGPT在few-shot和zero-shot场景下展现出的惊人性能,让研究人员们更坚定「预训练」是一条正确的路线。 预训练…

【AI项目实战】某语言模型-stable diffusion-vits-cqhttp 实现能对话能语音能绘画的Q群机器人

好久没写文章了,终于想起来我有个博客账号系列。。 项目已开源在github上。 文章已滤敏,一切涉及语言模型名字的内容都以某语言模型代替 提示:AI绘画部分建议6G显存以上。 cqhttp 用于接收群友消息,并回复消息。 某语言模型 基于…

微信PC端各个数据库文件结构与功能简述 - 根目录

异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复;本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告。本人所有文章仅在CSDN、掘金和个人博客(一定是异想之旅域名)…

springboot+vue集成websocket实现聊天功能

1、添加pom依赖 <!-- websocket --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dependency> 2、创建一个config文件夹&#xff0c;在config文件夹中创建…

广州租房房价分析

利用八爪鱼爬链家网上广州市租房房源数据&#xff0c;网址为https://gz.lianjia.com/zufang/&#xff0c;爬取字段为价格、租赁方式、房型、楼层、面积、朝向、地铁、小区、位置、经度、纬度等&#xff0c;保存到E盘数据分析课程设计文件夹下&#xff0c;存为“gz_zufang.csv”…

房价数据分析

文章目录 一、数据预处理1、删除多余列2、缺失值、异常值处理 二、 数据探索分析1、DistanceKM与房价关系2、14岁及以下比重与房价关系3、自驾实际值与房价关系4、65岁及以上比重与房价关系5、人口占比与房价关系 三、机器学习预测房价1、模型选择2、模型调参 四、总结 一、数据…