神经网络八股(1)

1.什么是有监督学习,无监督学习

有监督学习是带有标签的,无监督学习是没有标签的,简单来说就是有监督学习的输入输出都是固定的,已知的,无监督学习输入是已知的,输出是不固定的,无监督学习是通过数据发现规律和经验,进而产生输出的

2.卷积的作用

核心作用是通过与一个特定的核(或滤波器)进行运算。在不同领域中实现信号或数据的特征提取、滤波、增强等功能。它的核心优势在于能够通过简单的数学运算实现复杂的特征学习和变换,同时减少计算量和参数数量。

卷积的计算公式:

3.池化层的作用

池化层主要作用是降低数据的空间维度,提取重要的特征,并且提高模型的计算效率。池化层通常在卷积层之后使用,可以分为最大池化(Max Pooling)和平均池化(Average Pooling)两种类型。

降维,减少数据计算量,特征提取,提取图像主要信息,减轻过拟合,减少模型参数量

4.全连接层作用

特征整合卷积层和池化层提取的特征通常是局部的、分布式的,而全连接层通过大量的神经元之间的连接,将这些局部特征组合成更高级别的全局特征表示。

分类或回归:全连接层的最终输出通常用于分类或回归任务。在分类任务中,最后一个全连接层的输出神经元数量通常与类别数量相同。在回归任务中,最后一个全连接层通常只有一个输出神经元,用于预测连续的数值。

输出层特征映射:全连接层中的每个神经元都与前一层的所有神经元相连,这种密集的连接方式使得全连接层能够学习到非常复杂的特征组合和映射关系

隐藏层维度变化

5.什么是空洞卷积

空洞卷积(Dilated Convolution),也称为扩张卷积或膨胀卷积,是一种在卷积核元素之间加入空格(零)来扩大卷积核的技术。其主要目的是在不增加参数数量的情况下增大感受野,同时保持特征映射尺寸不变

作用:增大卷积核的感受野,提高网络对细节信息的感知能力

6.1*1卷积的作用

1x1卷积,也称为点卷积,其卷积核大小为1。

通道数变换:可以将输入特征图的通道数从Cin变换为C_out,而不需要改变特征图的空间维度
线性组合:由于1x1卷积核只覆盖一个像素点,因此它实际上是在对每个像素点的通道值进行加权求和。这可以用于提取特征图中的有用信息,或者进行特征的线性变换。

7.训练策略

优化技术:

学习率调整(如余弦退火)或周期性学习率调整

优化器选择:Adam,SGD

批量大小调整:较大的批量可以提高计算效率,但可能导致过拟合;较小的批量可以提高泛化能力,但可能增加训练时间

梯度累积:梯度累积技术可以在小批量训练中模拟大批量的效果

泛化技术:

正则化:使用L1、L2正则化或Dropout可以有效防止模型过拟合

数据增强:对训练数据进行变换(如旋转、缩放、平移等)

早停机制:在验证集性能不再提升时提前停止训练,结合学习率衰减策略,可以避免过拟合

8.什么是过拟合和欠拟合,有什么方法解决

欠拟合是在训练集和测试集上误差都很高,网络没有学习到数据背后的规律和结构,没有学习到有用的特征,只是学习到了一些噪声和表面的东西。

过拟合就是训练集上表现得太好了,在测试集上反而表现得不好,原因就是在训练集上学习的只是一些简单的特征,从而削弱了该模型的泛化性导致在测试集上表现不好。

解决办法:欠拟合很明显就是训练不够彻底,可以选择增加模型的复杂度,增加训练集数据样本多样性,多用数据增强技术。过拟合就是训练的过头了,拟合的太好了,可以采用一些较为简单的模型,或者采用正则化,如dropout,减少特征维度。

9.有什么激活函数

神经网络非线性

sigmoid(二分类), relu ,tanh,leakyRelu, softmax(多分类)

leakrelu解决了ReLU的“死亡ReLU”问题,即使输入小于0,也有非零梯度

10.为什么Relu比Sigmod好

因为sigmod在梯度过大过小的时候存在梯度饱和问题,会发生梯度消失问题,而relu在大于0时候则不会发生梯度消失问题,稀疏性:当神经元输出小于0的时候经过relu的时候输出为0,会让神经元失活,类似dropout的效果。

本篇文章源自对知乎fp16占几个字节博主得学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23337.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

达梦:开发 ODBC配置指南

目录 达梦数据库DM8 ODBC配置指南(Linux环境)ODBC一、环境准备二、核心配置步骤1. 安装unixODBC2. 配置ODBC驱动(odbcinst.ini)3. 配置数据源(odbc.ini) 三、连接测试与验证1. 使用isql工具测试2. 执行基础…

Python游戏编程之赛车游戏6-1

通过Python的pygame模块可以实现赛车游戏,如图1所示。 图1 赛车游戏 从图1中可以看出,玩家通过键盘的左右键操作蓝色汽车躲避红色汽车的撞击,每成功躲避过一辆红色汽车,则玩家得一分。当蓝色汽车被红色汽车撞击后,游戏…

【Linux网络】序列化、守护进程、应用层协议HTTP、Cookie和Session

⭐️个人主页:小羊 ⭐️所属专栏:Linux 很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~ 目录 1、序列化和反序列化2、守护进程2.1 什么是进程组?2.2 什么是会话? 3、应用层协议HTTP3.1 HTTP协议3.2 HT…

【Java消息队列】应对消息丢失、重复、顺序与积压的全面策略

应对消息丢失、重复、顺序与积压的全面策略 引言kafka消息丢失生产者消费者重复消费顺序消费消息积压生产者消费者其他RabbitMQ消息丢失生产者事务机制,保证生产者发送消息到 RabbitMQ Server发送方确认机制,保证消息能从交换机路由到指定队列保证消息在 RabbitMQ Server 中的…

Windows 上源码安装 FastGPT

FastGPT 是一个强大的 AI RAG 平台,值得我们去学习了解。与常见的 Python 体系不同,Fast GPT 采用 Node.js/Next.js 平台(对于广大 JS 开发者或前端开发者比较亲切友好),安装或部署比较简单。虽然一般情况下推荐简单的…

【HeadFirst系列之HeadFirstJava】第5天之超强力方法 —— 从战舰游戏到循环控制

编写程序:超强力方法 —— 从战舰游戏到循环控制 在《Head First Java》的第五章节中,作者通过一个简单的战舰游戏示例,深入讲解了如何编写Java程序,并重点介绍了方法和循环控制的使用。这一章节的核心思想是:通过模块…

软件单元测试的技术要求

文章目录 一、软件单元测试的概念二、测试对象三、测试目的四、进入条件五、测试内容六、测试环境七、测试实施方一、软件单元测试的概念 单元测试(Unit Testing),是指对软件中的最小可测试单元进行测试验证。单元测试是白盒测试,主要依据软件详细设计和软件代码进行,不仅…

‌挖数据平台对接DeepSeek推出一键云端部署功能:API接口驱动金融、汽车等行业智能化升级

云端部署 引言:当数据生产力遇上云端智能化 2025年2月23日,国内领先的数据服务商挖数据平台宣布与人工智能巨头DeepSeek达成战略合作,正式推出“一键云端部署”功能。这一功能以API(应用程序接口)为核心,通…

QPainter绘制3D 饼状图

先展示图片 核心代码如下&#xff1a; pie.h #ifndef Q3DPIE_H #define Q3DPIE_H#include <QtGui/QPen> #include <QtGui/QBrush>class Pie { public:double value; QBrush brush; QString description; double percentValue;QString p…

VMWare安装Debian操作系统

参考链接 https://blog.csdn.net/weixin_61536532/article/details/129778310 注意 如果希望折腾Linux&#xff0c;建议缺省使用英语。在极端情况下&#xff0c;系统可能会只能输出ASCII码&#xff0c;使用中文可能会导致无法正常打印log 本文使用VMWare WorkStation Pro&a…

Compose 常用UI组件

Compose 常用UI组件 概述Modifier 修饰符常用Modifier修饰符作用域限定Modifier Modifier 实现原理Modifier.Element链的构建链的解析 常用基础组件文字组件图片组件按钮组件选择器对话框进度条 常用布局组件线性布局帧布局 列表组件 概述 Compose 预置了很多基础组件&#xf…

基于Python+django+mysql旅游数据爬虫采集可视化分析推荐系统

2024旅游推荐系统爬虫可视化&#xff08;协同过滤算法&#xff09; 基于Pythondjangomysql旅游数据爬虫采集可视化分析推荐系统 有文档说明 部署文档 视频讲解 ✅️基于用户的协同过滤推荐算法 卖价就是标价~ 项目技术栈 Python语言、Django框架、MySQL数据库、requests网络爬虫…

R 语言科研绘图 --- 散点图-汇总

在发表科研论文的过程中&#xff0c;科研绘图是必不可少的&#xff0c;一张好看的图形会是文章很大的加分项。 为了便于使用&#xff0c;本系列文章介绍的所有绘图都已收录到了 sciRplot 项目中&#xff0c;获取方式&#xff1a; R 语言科研绘图模板 --- sciRplothttps://mp.…

3分钟idea接入deepseek

DeepSeek简介 DeepSeek 是杭州深度求索人工智能基础技术研究有限公司开发的一系列大语言模型&#xff0c;背后是知名量化资管巨头幻方量化3。它专注于开发先进的大语言模型和相关技术&#xff0c;拥有多个版本的模型&#xff0c;如 DeepSeek-LLM、DeepSeek-V2、DeepSeek-V3 等&…

【数据结构】(12) 反射、枚举、lambda 表达式

一、反射 1、反射机制定义及作用 反射是允许程序在运行时检查和操作类、方法、属性等的机制&#xff0c;能够动态地获取信息、调用方法等。换句话说&#xff0c;在编写程序时&#xff0c;不需要知道要操作的类的具体信息&#xff0c;而是在程序运行时获取和使用。 2、反射机制…

基于Flask的去哪儿网海南旅游攻略数据分析系统的设计与实现

【Flask】基于Flask的去哪儿网海南旅游攻略数据分析系统的设计与实现&#xff08;完整系统源码开发笔记详细部署教程&#xff09;✅ 目录 一、项目简介二、项目界面展示三、项目视频展示 一、项目简介 随着旅游业的蓬勃发展&#xff0c;如何高效地整合、分析并呈现旅游数据&am…

从零开始构建一个小型字符级语言模型的完整详细教程(基于Transformer架构)

最近特别火的DeepSeek,是一个大语言模型,那一个模型是如何构建起来的呢?DeepSeek基于Transformer架构,接下来我们也从零开始构建一个基于Transformer架构的小型语言模型,并说明构建的详细步骤及内部组件说明。我们以构建一个字符级语言模型(Char-Level LM)为例,目标是通…

MyBatisPlus学习

MyBatisPlus 今日目标 基于MyBatisPlus完成标准Dao的增删改查功能 掌握MyBatisPlus中的分页及条件查询构建 掌握主键ID的生成策略 了解MyBatisPlus的代码生成器 本节主要讲的内容如下&#xff1a; 1&#xff0c;MyBatisPlus入门案例与简介 这一节我们来学习下MyBatisPlus的入…

golang内存泄漏

golang也用了好几年了&#xff0c;趁着有空 整理归纳下&#xff0c;以后忘了好看下 一般认为 Go 10次内存泄漏&#xff0c;8次goroutine泄漏&#xff0c;1次是真正内存泄漏&#xff0c;还有1次是cgo导致的内存泄漏 1:环境 go1.20 win10 2:goroutine泄漏 单个Goroutine占用内存&…

计算机毕业设计SpringBoot+Vue.jst房屋租赁系统(源码+LW文档+PPT+讲解)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…