李宏毅机器学习课程知识点摘要（6-13集）

pytorch简单的语法和结构

dataset就是数据集，dataloader就是分装好一堆一堆的

他们都是torch.utils.data里面常用的函数，已经封装好了

下面的步骤是把数据集读进来

这里是读进来之后，进行处理

声音信号，黑白照片，红绿蓝彩色照片

运算

转置

移除掉某个维度

合并起来成一个，沿着某一个维度去合并

x.shape和x.dtype

运算：

行列式，所以w^T自动为32x64，这样j与i等，可以变化形状

一个神经网络的过程

逻辑回归在神经网络中的作用

在神经网络学习的背景下，逻辑回归（Logistic Regression）是一个非常重要的基础模型，尤其是在二分类任务中。神经网络本质上是多个层次的复杂逻辑回归模型，因此理解逻辑回归对于理解神经网络的工作原理至关重要。本文将详细介绍逻辑回归在神经网络中的作用及其相关概念。

1. 逻辑回归与神经网络的关系

神经网络的核心是对输入数据进行加权求和，并通过激活函数（如 Sigmoid、ReLU 等）进行处理，从而得到最终的预测结果。逻辑回归可以看作是一个简单的神经网络，只有一个输入层和一个输出层，且激活函数通常是 Sigmoid 函数。

逻辑回归的数学表达式

逻辑回归模型的输出通过 Sigmoid 函数将线性组合的输入映射到 [0, 1] 之间。其数学表达式为：

\[
y = \sigma(z) = \frac{1}{1 + e^{-z}}
\]

其中，\( z = w_0 + w_1 x_1 + w_2 x_2 + \dots + w_n x_n \) 是输入特征的加权和（类似于神经网络中的线性变换）。这个输出是一个概率值，表示预测属于正类（1）的概率。如果这个概率大于 0.5，我们通常预测为正类（1），否则为负类（0）。

2. 神经网络中的逻辑回归

在神经网络中，Sigmoid 函数作为激活函数，通常用于二分类问题。网络中的单个神经元（即一层）可以看作是一个逻辑回归模型。多个神经元层级组合起来，就构成了一个多层神经网络。因此，理解逻辑回归的工作原理对于理解神经网络的运作至关重要。

神经网络中的 Sigmoid 激活函数

在神经网络中，Sigmoid 函数用于将每个神经元的输出映射到 [0, 1] 区间，因此非常适合处理二分类问题。例如，神经网络的输出层可以使用 Sigmoid 激活函数来输出每个类的概率，从而决定最终的类别。

Sigmoid 激活函数公式

\[
\sigma(z) = \frac{1}{1 + e^{-z}}
\]

其中，\( z = w_0 + w_1 x_1 + w_2 x_2 + \dots + w_n x_n \) 是输入特征的线性组合。

输出值的范围是 0 到 1，表示某一类别的概率。

为什么使用 Sigmoid？

Sigmoid 函数的输出是一个概率值，这使得它特别适合二分类问题。在神经网络中，使用 Sigmoid 激活函数后，输出值可以被解释为样本属于正类（1）的概率，进一步帮助我们做出分类决策。

3. 神经网络的训练与逻辑回归

神经网络的训练过程与逻辑回归类似，都是通过优化算法（例如梯度下降）来调整模型参数，以最小化损失函数。对于二分类问题，常见的损失函数是二元交叉熵（Binary Cross-Entropy），它本质上与逻辑回归中的对数损失函数（Log-Loss）相同。

训练步骤（逻辑回归与神经网络的相似性）

1. **前向传播**：计算预测值，首先通过线性变换计算 \( z \)，然后通过激活函数（如 Sigmoid）得到预测概率。

2. **计算损失**：使用损失函数（如交叉熵损失）计算预测与实际标签之间的误差。

3. **反向传播**：根据损失函数的梯度，通过反向传播调整权重，最小化误差。

在神经网络中，尽管模型更复杂，但基础的逻辑回归思想仍然存在：通过优化损失函数调整模型参数，逐步减少预测误差。

4. 神经网络的多层扩展

神经网络通过多个隐藏层和神经元的组合，能够捕捉数据中的复杂模式和非线性关系。逻辑回归是一个线性模型，适合简单的二分类问题。而神经网络通过多层的非线性变换，能够处理更加复杂的分类任务。

尽管神经网络的每一层都可以看作是逻辑回归的扩展，但通过增加更多的层次和激活函数，神经网络能够表示更加复杂的决策边界，从而提升分类的准确性。

5. 总结

- 逻辑回归是神经网络的一个基础构建块，尤其在二分类问题中，神经网络的输出层通常使用 Sigmoid 激活函数来实现类似于逻辑回归的操作。
- 神经网络通过多个层次和神经元的组合，扩展了逻辑回归的能力，能够处理更加复杂的非线性分类问题。
- 训练过程在神经网络中与逻辑回归类似，都是通过优化损失函数来调整模型的参数，最小化预测误差。