03 神经元多输入

神经元多输入

  上一篇博客介绍了二分类的逻辑回归模型。如果我们想要多分类的逻辑回归模型,我们该怎么做呢?

  很显然,我们在只有一个神经元的时候可以做二分类的问题。如果我们想要多分类的话,直接加神经元的个数就好了,使用多个神经元就能得到多输出的回归模型。如下图所示,我们又多加了一个神经元,之后就可以得到两个输出,那么就可以去做三分类的逻辑回归。

在这里插入图片描述
  
  这里多加一个神经元就相当于把 W W W 从向量扩展为矩阵,输出的 W ∗ x W*x Wx 从一个值变成了一个向量。
  
  下面举一个简单的例子,比如输入的 X X X = [3, 1, 2], W W W = [ [0.4, 0.6, 0.5], [0.3, 0.2, 0.1] ],那么我们可以计算出 Y 0 Y0 Y0 Y 1 Y1 Y1
  
在这里插入图片描述
  
  我们将有多个输出的神经元叫做多输出神经元,那么我们有了多输出神经元之后,那么我们怎么对之前的二分类逻辑斯蒂回归模型进行扩展,将其扩展为多分类逻辑斯蒂回归模型。其实二分类在现实生活中应用比较少,所以遇到的一般都还是多分类问题。所以多分类问题比二分类问题具有更广泛的适用性。

  我们先回顾之前的二分类问题,二分类问题只有一个神经元,神经元只有一个输出,它的输出经过一个 sigmoid 函数然后得到相应结果,这个结果我们可以认为它是对于 Y = 0 Y=0 Y=0 这个类的一个概率估计,那么相应的我们也能得到 Y = 1 Y=1 Y=1 这个类的概率估计。
  
在这里插入图片描述
  
  那么我们还可以从另外一个角度去看它。我们可以看出这两个 P P P 的值分子一个是 1,一个是 e ( − w T x ) e^(-w^Tx) e(wTx),分母是相同的,那么我们可以把分母看成是数据归一化(把数据归到同一个量纲上)的过程。
  
  比如一个神经元的输出为 e ( − w T x ) e^(-w^Tx) e(wTx) ,那么和另一个 1 做归一化。我们就得到了和上图式子同样的效果。

在这里插入图片描述
  
  因此,我们想要去做扩展,就可以直接将 W ∗ x W*x Wx 变成多输出就可以了。
  
在这里插入图片描述
  
  仿照二分类概率的公式,可以得到多分类的公式为:
  
在这里插入图片描述
  
  这样我们就将一个二分类的逻辑回归模型变成了一个多分类的逻辑回归模型。但是在实际处理的时候,我们会把下图中的 1 和上面的形式相统一,写成 E ( − w 0 x ) E^(-w^0x) E(w0x),然后我们使得该值恒等于 1,这样也能达到效果。
  
在这里插入图片描述
  
  下面我们仍然举一个简单的例子帮助理解。比如我们现在 Y Y Y 的输出为 [2.8,1.3],激活函数为 y = e ( − x ) y = e^(-x) y=e(x)

在这里插入图片描述
  
  所以我们就可以得出我们要归一化的分母为 1 + 0.06 + 0.27 = 1.33 1 + 0.06 + 0.27 = 1.33 1+0.06+0.27=1.33,然后就得到了三个概率:

在这里插入图片描述
  
  这样的多分类回归模型和之前介绍的二分类回归模型它们可以被认为是神经网络。
  
  下面我们要介绍的是如何去调整神经网络使得神经网络能够学到数据中的规律,那么首先我们得定义一个目标函数,它是衡量一个模型对数据的拟合程度。目标函数通常也叫做损失函数,还是举一个简单的例子,比如我们的数据样本 X 1 X1 X1 是一个向量 [10, 3, 9, 20, …, 4],这些样本的类别值都是 1,这里我们可以认为是一个二分类问题,它有两个类别值,一个是 1,一个是 0。那么我们将样本 X X X 放到我们训练的一个模型 Model 中去,得到的分类准确度为 0.8,那么我们相应的损失函数 Loss 的值就应该用这些样本的真值减去样本的预测值得到 0.2。
  
在这里插入图片描述

  下面再举出一个多分类问题的例子。比如下面的例子中有 5 类。数据样本 X 1 X1 X1 是一个向量 [10, 3, 9, 20, …, 4],这些样本的类别值都是 3。那么 y y y 的预测值为拥有 5 个元素的向量,假设得到的 y y y = [0.1,0.2,0.25,0.4,0.05],那么最后的 Loss 函数的值为 y y y 的真值减去 y y y 的预测值。

在这里插入图片描述
  
  这里需要注意一点, Loss 函数需要加上 abs(绝对值) 函数,因为我们最后求得的是距离,距离为正数,所以需要加上一个绝对值函数。
  
  我们定义一个损失函数的形式一般有两种,一种是平方差损失

在这里插入图片描述

  然后另外一种是交叉熵损失,其实这一种是更适合解决多分类问题。因为 l n ln ln 函数正好是一个熵函数,熵函数正是衡量两个分布之间的差距的。

在这里插入图片描述

  总结一下,其实对于神经网络的训练就是要调整参数使模型在训练集上的损失函数最小。损失函数最小意味着模型预测的结果和真实值之间越接近,即预测结果更准确。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/67670.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人脑部神经网络分布特点,人脑部神经网络分布图

人的大脑的怎么分配的 大脑(Brain)包括左、右两个半球及连接两个半球的中间部分,即第三脑室前端的终板。大脑半球被覆灰质,称大脑皮质,其深方为白质,称为髓质。髓质内的灰质核团为基底神经节。在大脑两半球间由巨束纤维—相连。 …

人体内数量最多的神经元,人体内有多少个神经元

人体内平均有多少神经元? 。 约含有140亿个神经元胞体虽然神经元形态与功能多种多样,但结构上大致都可分成胞体(cellbody,orsoma)和突起(neurite)两部分.突起又分树突(dendrite)和…

【计量经济学】【高教版】第二次作业

第二次作业: 教材:伍德里奇。计量经济学导论:现代观点(第五版)。 第三章习题:必做 1,2,5,6,11,选做13 第四章习题:必做2,3,4,5,8,选做9,10,11 第三章 1.多元线性回归模型的基本假设是什么?在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起…

【计量经济学】【高教版】第一次作业(7、8、10)

第二次 7.假设有人做了如下的回归: y i = β 0 ^ + β 1 ^ x i + e i y_i=\widehat{\beta_0}+\widehat{\beta_1}x_i+e_i yi​=β0​ ​+β1​ ​xi​+ei​ 其中, y i , x i y_i,x_i yi​,xi​分别为 Y i , X i Y_i,X_i Yi​,Xi​关于各自均值的离差。问 β 0 ^ 和 β 1 ^ \…

软件工程经济学作业5-7

1.什么是生产函数? 其主要特征是什么? 答:生 产函数是指一定时期内生产要素的数量与某种组合同其所能出产的最大产量之间存在的函数关系。 生产函数通常满足以下三个特征: (1 ) 资本 与劳动力的边际产出总是为正值, 在…

2020年12月程序员工资统计,平均14222元(转载)

2020年12月全国招收程序员394699人。2020年12月全国程序员平均工资14222元,工资中位数12500元,其中96%的人的工资介于3250元到62500元。 从图上看,工资是真的降了,吓得我瑟瑟发抖。希望明年涨回来。 城市 排名city平均工资最低工资…

每日一题-13(员工薪水中位数)

题13: 根据下表,在不使用任何内置的SQL函数的情况下编写SQL查询来查找每个公司的薪水中位数。 解题思路:题目要求是不使用任何内置的SQL函数,因此使用HAVING的妙用。 (1)先做自连接,之后根据ID…

《2020年全球程序员收入报告》字节跳动高居全球第七,年薪中位数高达40万美元!

速读2分钟,今天看到一份特别有意思的报告,是 《2020 年全球程序员收入报告》 。 大家谨慎观看,我感觉大家看完这份报告,在感受到拖后腿之后,容易丧心病狂,产生病态的嫉妒心理。 日前,Levels.f…

上半年薪资统计,数据岗中位数接近20K!

大家应该都和我一样,经常看到类似于《XXX入职大厂数据分析师,年薪50W》之类的标题。 数据分析师的薪资真的有这么夸张吗?我特意去查了下数据: (数据来源:职友集) 最近的数据显示,全国…

2021年3月程序员工资统计,平均15189元,又涨了

2021年3月采集数据124176条。2021年3月全国程序员平均工资15189元,工资中位数12500元,其中95%的人的工资介于5250元到37500元。 工资K线图: 这个月涨了一点点,一点点也是涨呀。 程序员的工资虽然不高,但是涨幅还是超…

2019年一线城市程序员工资大调查

转载声明:转载不得篡改文章内容。必须注明出处,必须注明Github源代码地址。 保留要求转载者删除文章的权力。 欢迎转载,提供本文markdown: https://github.com/juwikuang/china_job_survey/blob/master/articles/2019年一线城市…

2020年1月全国程序员工资统计,平均工资13632元。

趋势 2020年1月,中国大陆程序员平均工资13632员,比上个月增加。具体趋势如图: 各主要程序员城市工资变化 城市 北京,上海,深圳,杭州,广州四地的工资最高。 city平均工资最低工资中位数最高…

2020年9月程序员工资统计,平均14469元

目录 平均工资主要城市工资Java程序员按职能 统一回复,我9月1日爬的数据,当然是9月的程序员工资了。总不能说是8月的吧。 平均工资 2020年9月全国招收程序员352733人。2020年9月全国程序员平均工资14469元,工资中位数12500元,其…

2020年11月程序员工资统计,平均14327元

2020年11月全国招收程序员340579人。2020年11月全国程序员平均工资14327元,工资中位数12500元,其中96%的人的工资介于3000元到85000元。 工资好像又降低了,吓得我瑟瑟发抖。《权力的游戏》里面的一句话又回荡在我的耳边:winter is…

2020年8月程序员工资统计,平均14401元,下跌势头止住了

统一回复,我8月1日爬的数据,当然是8月的程序员工资了。总不能说是7月的吧。 平均工资 2020年8月全国招收程序员346036人。2020年8月全国程序员平均工资14401元,工资中位数12500元,其中95%的人的工资介于5250元到35000元。 主要城…

2020年6月程序员工资统计,平均14404元,又跌了,扎心

本文已过时 都7月了,你该看7月的数据去了: 2020年7月中国编程语言排行榜 2020年7月程序员工资统计,平均14357元,又跌了,扎心 见了鬼 本月的平均收入为14404, 本文的articleId为106503404,真…

字节主管工程师年薪中位数 56.4 万美元,排世界第 7,2022 全球程序员收入报告出炉!...

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 在科技迅速发展的时代,各行业对程序员的需求持续增长,程序员作科技市场的“重要基石”,薪资一直是非常“能打”的存在。 近日,美国科技公…

求员工薪资中位数

现有salary表(员工ID,部门,薪水 ),请输出每个部门薪水中位数及对应的员工ID,输出字段员工ID,部门,中位数薪水。如果一个部门有偶数个员工,则输出中间两个员工ID和薪水。如果有两个员工薪水相同都…

你的工资是怎样被平均的?终于有人把平均数、中位数和众数讲明白了

导读:我们在数据处理时,要小心各种陷阱!人们习惯使用统计数据来简化事物描述,但错误的统计方法不仅不能反映事实,还会让数据变得毫无意义。 作者:徐晟 来源:大数据DT(ID:…

2021年2月程序员工资统计,平均15144元

2021年2月采集样本370020人。2021年2月程序员平均工资15144元,工资中位数12500元,其中95%的人的工资介于5250元到37500元。 一年工资变化: 这里出现了神奇的一幕,去年也是这个时候工资大涨。这是不是有什么规律呢?这个…