神经网络八股（1）

1.什么是有监督学习，无监督学习

有监督学习是带有标签的，无监督学习是没有标签的，简单来说就是有监督学习的输入输出都是固定的，已知的，无监督学习输入是已知的，输出是不固定的，无监督学习是通过数据发现规律和经验，进而产生输出的

2.卷积的作用

核心作用是通过与一个特定的核（或滤波器）进行运算。在不同领域中实现信号或数据的特征提取、滤波、增强等功能。它的核心优势在于能够通过简单的数学运算实现复杂的特征学习和变换，同时减少计算量和参数数量。

卷积的计算公式：

3.池化层的作用

池化层主要作用是降低数据的空间维度，提取重要的特征，并且提高模型的计算效率。池化层通常在卷积层之后使用，可以分为最大池化（Max Pooling）和平均池化（Average Pooling）两种类型。

降维，减少数据计算量，特征提取，提取图像主要信息，减轻过拟合，减少模型参数量

4.全连接层作用

特征整合：卷积层和池化层提取的特征通常是局部的、分布式的，而全连接层通过大量的神经元之间的连接，将这些局部特征组合成更高级别的全局特征表示。

分类或回归：全连接层的最终输出通常用于分类或回归任务。在分类任务中，最后一个全连接层的输出神经元数量通常与类别数量相同。在回归任务中，最后一个全连接层通常只有一个输出神经元，用于预测连续的数值。

输出层特征映射：全连接层中的每个神经元都与前一层的所有神经元相连，这种密集的连接方式使得全连接层能够学习到非常复杂的特征组合和映射关系

隐藏层维度变化

5.什么是空洞卷积

空洞卷积（Dilated Convolution），也称为扩张卷积或膨胀卷积，是一种在卷积核元素之间加入空格（零）来扩大卷积核的技术。其主要目的是在不增加参数数量的情况下增大感受野，同时保持特征映射尺寸不变

作用：增大卷积核的感受野，提高网络对细节信息的感知能力

6.1*1卷积的作用

1x1卷积，也称为点卷积，其卷积核大小为1。

通道数变换：可以将输入特征图的通道数从Cin变换为C_out，而不需要改变特征图的空间维度
线性组合:由于1x1卷积核只覆盖一个像素点，因此它实际上是在对每个像素点的通道值进行加权求和。这可以用于提取特征图中的有用信息，或者进行特征的线性变换。

7.训练策略

优化技术：

学习率调整（如余弦退火）或周期性学习率调整

优化器选择：Adam,SGD

批量大小调整：较大的批量可以提高计算效率，但可能导致过拟合；较小的批量可以提高泛化能力，但可能增加训练时间

梯度累积：梯度累积技术可以在小批量训练中模拟大批量的效果

泛化技术：

正则化：使用L1、L2正则化或Dropout可以有效防止模型过拟合

数据增强：对训练数据进行变换（如旋转、缩放、平移等）

早停机制：在验证集性能不再提升时提前停止训练，结合学习率衰减策略，可以避免过拟合

8.什么是过拟合和欠拟合，有什么方法解决

欠拟合是在训练集和测试集上误差都很高，网络没有学习到数据背后的规律和结构，没有学习到有用的特征，只是学习到了一些噪声和表面的东西。

过拟合就是训练集上表现得太好了，在测试集上反而表现得不好，原因就是在训练集上学习的只是一些简单的特征，从而削弱了该模型的泛化性导致在测试集上表现不好。

解决办法：欠拟合很明显就是训练不够彻底，可以选择增加模型的复杂度，增加训练集数据样本多样性，多用数据增强技术。过拟合就是训练的过头了，拟合的太好了，可以采用一些较为简单的模型，或者采用正则化，如dropout，减少特征维度。

9.有什么激活函数

神经网络非线性

sigmoid(二分类)， relu ,tanh，leakyRelu, softmax（多分类）

leakrelu解决了ReLU的“死亡ReLU”问题，即使输入小于0，也有非零梯度

10.为什么Relu比Sigmod好

因为sigmod在梯度过大过小的时候存在梯度饱和问题，会发生梯度消失问题，而relu在大于0时候则不会发生梯度消失问题，稀疏性：当神经元输出小于0的时候经过relu的时候输出为0，会让神经元失活，类似dropout的效果。

本篇文章源自对知乎fp16占几个字节博主得学习

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/23337.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

神经网络八股（1）

相关文章

达梦：开发 ODBC配置指南

Python游戏编程之赛车游戏6-1

【Linux网络】序列化、守护进程、应用层协议HTTP、Cookie和Session

【Java消息队列】应对消息丢失、重复、顺序与积压的全面策略

Windows 上源码安装 FastGPT

【HeadFirst系列之HeadFirstJava】第5天之超强力方法 —— 从战舰游戏到循环控制

软件单元测试的技术要求

‌挖数据平台对接DeepSeek推出一键云端部署功能：API接口驱动金融、汽车等行业智能化升级

QPainter绘制3D 饼状图

VMWare安装Debian操作系统

Compose 常用UI组件

基于Python+django+mysql旅游数据爬虫采集可视化分析推荐系统

R 语言科研绘图 --- 散点图-汇总

3分钟idea接入deepseek

【数据结构】(12) 反射、枚举、lambda 表达式

基于Flask的去哪儿网海南旅游攻略数据分析系统的设计与实现

从零开始构建一个小型字符级语言模型的完整详细教程（基于Transformer架构）

MyBatisPlus学习

golang内存泄漏

计算机毕业设计SpringBoot+Vue.jst房屋租赁系统(源码+LW文档+PPT+讲解)