深度学习碎碎念——碎片知识1

1、什么叫模型收敛?什么叫模型欠拟合和过拟合?

什么叫模型收敛?——模型收敛是指在训练过程中,模型的损失函数逐渐减小并且趋于稳定的状态。简而言之,当模型的训练过程达到一个稳定的点,使得进一步的训练不会显著改变模型的参数或性能时,我们就说模型已经收敛。

模型要避免过拟合——过拟合是指机器学习模型在新的、以前未曾见过的输入上的表现不如在训练数据上的表现。过拟合的模型会“记住”训练数据集中的噪声和细节,从而对模型在新数据上的表现产生负面影响;欠拟合——在训练集和测试集效果都不佳——模型训练还不足。

2、TensorFlow和PyTorch中的张量tensor是什么?干什么用的?

Tensor 是最基本的数据结构之一——多维矩阵。

张量可以有不同的维度(也称为秩或轴的数量),例如:

  1. 标量(Scalar):零维张量,只有一个数值。
  2. 向量(Vector):一维张量,可以看作是一列或一行数值。
  3. 矩阵(Matrix):二维张量,可以看作是由行和列组成的表格。
  4. 更高维的张量:具有三个或更多维度的张量,可以用来表示更复杂的数据结构,例如图像或视频帧。

张量的形状(Shape)定义了每个维度的大小,而张量的大小(Size)则是张量中元素的总数。

Tensor 的用处

  1. 数据表示:Tensor 用于表示输入数据、权重、偏置等,可以是一维向量、二维矩阵或更高维度的数据结构。
  2. 数学运算:Tensor 支持各种数学运算,如加法、减法、乘法、点积等。
  3. 自动求导:Tensor 支持自动求导,这对于训练神经网络至关重要,因为它可以自动计算梯度用于反向传播。
  4. GPU 加速:如果系统配置了 NVIDIA GPU 并且 PyTorch 被正确配置为使用 CUDA,那么 Tensor 可以在 GPU 上进行计算,显著加快训练过程。

3、神经网络能够更好的拟合数据的原因是?感觉隐藏层中通过权重和偏置不应该都属于线性变换吗?怎么实现的非线性变换?为什么多层感知机MLP就可以实现捕捉非线性变换?不理解怎么实现的呢?

因为神经网络的工作原理就是通过权重和偏置计算数据,所以不断训练每一层神经网络连接层上的权重和偏置直到找到最合适的可以更好拟合训练数据的参数们,该神经网络就可以将没识别过的数据计算后较为准确判断。

在神经网络中,每一层的输出通常是由线性变换(权重乘以输入加上偏置)和非线性激活函数组成的。线性变换本身确实是线性的,但通过添加非线性激活函数,整个模型就能够捕获非线性关系。这些激活函数引入了非线性,使得神经网络能够学习复杂的函数映射。如果没有非线性激活函数,无论神经网络有多少层,其输出都是输入的线性组合,因此无法捕获非线性关系。这种非线性激活函数有助于打破线性关系,使得神经网络能够学习和逼近复杂的非线性函数。

4、激活函数是什么?交叉熵是什么?

2.1、sigmoid——二分类问题中的输出层或作为隐藏层的激活函数——将连续实数映射到(0,1)——也可以和交叉熵损失函数一起使用,以评估模型预测的概率分布与真实标签之间的差异

2.2、relu——ReLU(x)=max(0,x)

2.3、softmax——多分类问题的输出层——输出一个概率分布——通常与交叉熵损失函数一起使用,以评估模型预测的概率分布与真实标签之间的差异

2.4交叉熵Cross-Entropy)是一种常用的损失函数,尤其适用于分类问题,包括二分类和多分类任务,用来衡量两个概率(真实数据概率分布和预测概率分布)分布之间的差异,差距越小则交叉熵越小,用来指导梯度下降优化模型。

5、常见模型评估指标

  • 较低的损失值表明模型在数据集上的预测效果较好——损失值衡量了模型预测值与真实值之间的差距——Logloss
  • 精确率衡量了被模型标记为正类的样本中真正为正类的比例;召回率衡量了所有实际为正类的样本中有多少被模型正确识别为正类——PR AUC 是 Precision-Recall 曲线下面积的缩写,衡量了模型在不同阈值下的精确率和召回率的表现。
  • ROC AUC 是 ROC 曲线下面积的缩写,衡量了模型区分正类和负类的能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/397611.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CV党福音:YOLOv8实现语义分割(一)

前面我们得知YOLOv8不但可以实现目标检测任务,还包揽了分类、分割、姿态估计等计算机视觉任务。在上一篇博文中,博主已经介绍了YOLOv8如何实现分类,在这篇博文里,博主将介绍其如何将语义分割给收入囊中。 YOLOv8语义分割架构图 …

【C++】特殊类的设计与类型转换

文章目录 1. 特殊类的设计1.1 不能被拷贝的类1.2 只能在堆上创建对象的类1.3 只能在栈上创建对象的类1.4 不能被继承的类1.5 只能创建一个对象的类(单列模式) 2. 类型转换2.1 C/C的类型转换2.2 C规定的四种类型转换2.2.1 static_cast2.2.2 reinterpret_c…

【吊打面试官系列-Elasticsearch面试题】对于 GC 方面,在使用 Elasticsearch 时要注意什么?

大家好,我是锋哥。今天分享关于 【对于 GC 方面,在使用 Elasticsearch 时要注意什么?】面试题,希望对大家有帮助; 对于 GC 方面,在使用 Elasticsearch 时要注意什么? 1、SEE 2、倒排词典的索引需…

vue3使用pnpm运行项目但是运行不起来

运行项目的时候发现根本运行不起来了 尝试过创建.npmr文件 删除node_modules重新下 但是都出现问题了 创建.npmr:不管用 删除node_modules重新下:文字编译乱码,utf-8可能解析处理问题 最后解决方法: 重新创建项目&#xff0…

网络科技公司官网电商软件开发小程序网站pbootcms模板带手机端

免费授权可商用网站模板 PC端移动端后台测试数据 所有页面均都能完全自定义标题/关键词/描述,PHP程序,安全、稳定、快速,响应式同一个后台,数据即时同步,简单适用,附带测试数据!!

物流仓库安全视频智能管理方案:构建全方位、高效能的防护体系

一、背景分析 随着物流行业的快速发展和仓储需求的日益增长,仓库安全成为企业运营中不可忽视的重要环节。传统的人工监控方式不仅效率低下,且难以做到全天候、无死角覆盖,给仓库资产和人员安全带来潜在风险。因此,引入仓库安全视…

了解细胞外基质:它是啥?有啥作用?

了解细胞外基质:它是啥?有啥作用? 大家好,今天我们来阅读这篇Biofabrication methods for reconstructing extracellular matrix mimetics发表于《Bioactive Materials》上的文章。细胞外基质在人体中起着至关重要的作用&#xff…

同城门户同城分类信息网站源码discuz插件+pc端+小程序端+49款插件

同城分类信息 同城好店 同城合伙人 同城招聘 同城卡 同城活动 同城优惠抢购 同城商城 同城头条 同城抽奖 同城拼团 同城砍价 同城电话本 同城认证 同城签到 同城拼车 同城红包 同城子站点 同城相亲 同城交友 同城小程序 比较流行的同城信息门户网站源码,基于dz&…

【计算机网络】网络基础概念

目录 计算机网络发展 协议 协议分层 OSI 七层模型 TCP/IP 五层(四层)模型 究竟什么是协议? 网络与操作系统的关系 网络传输基本流程 局域网网络传输流程 认识 MAC 地址 局域网(以太网为例)通信原理 数据包…

【前端设计方案】H5 图片懒加载 SDK

实现思路 定义<img srcloading.png data-srcxxx.png/>页面滚动&#xff0c;图片露出时&#xff0c;将 data-src 赋值给 src 注意事项&#xff1a;滚动要节流 技术要点 获取图片的位置 elem.getBoundingClientRect() 图片 top < window.innerHeight 时&#xff0c;图片…

Install pytorch 使用 torch 的例子

如果不知道怎么开始和安装软件 从这里开始 如果需要GPU版本&#xff0c;请选择CUDA&#xff0c;而不是CPU PyTorchhttps://pytorch.org/ Python 3.8.13 | packaged by conda-forge | (default, Mar 25 2022, 06:04:10) [GCC 10.3.0] on linux Type "help", &quo…

opencv 深度图视差图可视化案例

参考:https://www.cnblogs.com/zyly/p/9373991.html(图片这里面下载的) https://blog.csdn.net/He3he3he/article/details/101053457 原理 双目摄像头 视差公式: 三角形对应推算 深度距离转换: 这里d是视差Disparity 代码 下面两种计算视差方法: import os impor…

计算机毕业设计Hadoop+Hive居民用电量分析 居民用电量可视化 电量爬虫 机器学习 深度学习 大数据毕业设计 Spark

《Hadoop居民用电量分析》开题报告 一、研究背景与意义 能源问题在全球范围内一直是热点议题&#xff0c;尤其是随着居民生活水平的提高和城市化进程的加快&#xff0c;居民用电量急剧增长&#xff0c;对电力系统的稳定运行和能源管理提出了更高要求。如何科学合理地管理和分…

T9打卡学习笔记

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 import tensorflow as tfgpus tf.config.list_physical_devices("GPU")if gpus:tf.config.experimental.set_memory_growth(gpus[0], True) #设置…

红黑树的插入

文章目录 3.红黑树3.1概念3.2 性质3.3 RBTree的实现3.3.1 insert的框架3.3.2 insert的处理3.3.3 中序遍历3.3.4检查是否平衡和获取树的高度 3.4完整代码 3.红黑树 3.1概念 红黑树&#xff0c;是一种二叉搜索树&#xff0c;但在每个结点上增加一个存储位表示结点的颜色&#xf…

07一阶电路和二阶电路的时域分析

一阶电路和二阶电路的时域分析 时域分析、频域分析、复频域分析本应该在信号与系统&#xff0c;或者数字信号处理这一章节里面进行处理的。 但在电路理论中也有这些知识&#xff0c;那就要好好掌握一下&#xff0c;打个底。详细细致的部分放到信号与系统里面去掌握

【单片机开发软件】使用VSCode开发STM32环境搭建

&#x1f48c; 所属专栏&#xff1a;【单片机开发软件技巧】 &#x1f600; 作  者&#xff1a; 于晓超 &#x1f680; 个人简介&#xff1a;嵌入式工程师&#xff0c;专注嵌入式领域基础和实战分享 &#xff0c;欢迎咨询&#xff01; &#x1f496; 欢迎大家&#xff1…

Java Web —— 第四天(HTTP协议,Tomcat)

HTTP-概述 概念:Hyper Text Transfer Protocol&#xff0c;超文本传输协议&#xff0c;规定了浏览器和服务器之间数据传输的规则 特点: 1. 基于TCP协议:面向连接&#xff0c;安全 2.基于请求-响应模型的:一次请求对应一次响应 3. HTTP协议是无状态的协议: 对于事务处理没有…

ASUS/华硕魔霸新锐2020 G512L系列 原厂win10系统 工厂文件 带F12 ASUS Recovery恢复

华硕工厂文件恢复系统 &#xff0c;安装结束后带隐藏分区&#xff0c;一键恢复&#xff0c;以及机器所有驱动软件。 系统版本&#xff1a;windows10 原厂系统下载网址&#xff1a;http://www.bioxt.cn 需准备一个20G以上u盘进行恢复 请注意&#xff1a;仅支持以上型号专用…

【多线程】CAS、ABA问题详解

一、什么是 CAS CAS&#xff1a;全称 Compare and swap&#xff0c;字⾯意思&#xff1a;⽐较并交换 比较内存和 CPU 中的内容&#xff0c;如果发现相同&#xff0c;就进行交换 交换的是内存和另一个寄存器的内容 一个内存的数据和两个寄存器中的数据进行操作&#xff08;寄…