游戏AI的创造思路-技术基础-tanh函数详解

又来搞事情,总想着把sigmoid函数替换成其他函数作为激活函数,或者找到更合适某一段训练的函数,所以今天来聊聊tanh函数(谁让咱当年差点去了数学系,结果还是在数学系转过去计算机的)

目录

3.9. tanh函数详解

3.9.1. 定义

3.9.2. 发展历史

3.9.3. 公式

3.9.4. 优缺点

3.9.5. 对比sigmoid函数的优势和劣势

3.9.6. 梯度消失的处理方法

3.9.6.1. 梯度消失的原因

3.9.6.2. 处理方法

3.9.7. 死节点(dead neurons)问题

3.9.7.1. 死节点问题来源

3.9.7.2. 解决方法

3.9.8. 在游戏AI应用方面的方法

3.9.8.1. 概述

3.9.8.2. 实践

3.9.8.3. 练它

3.9.8.4. 小结

3.9.9. 总结下


3.9. tanh函数详解

3.9.1. 定义

tanh函数,全称双曲正切函数(hyperbolic tangent function),是深度学习中常用的一种激活函数。它的数学定义是:

[\tanh(x) = \frac{ex - e{-x}}{ex + e{-x}}]

其中,e代表自然对数的底数。tanh函数的输出值被映射到-1和1之间,这使得它特别适用于需要将输出值中心化到0的情况。

3.9.2. 发展历史

tanh函数作为激活函数的历史可以追溯到早期神经网络的研究中。尽管其具体的提出时间可能难以精确追溯,但tanh函数因其良好的数学性质和实际应用效果,在神经网络的发展过程中逐渐得到了广泛应用。特别是在多层感知机(MLP)和循环神经网络(RNN)等结构中,tanh函数因其输出范围的优势而被频繁使用。

3.9.3. 公式

tanh函数的公式已在上文定义部分给出,即:

[\tanh(x) = \frac{ex - e{-x}}{ex + e{-x}}]

这个公式展示了tanh函数如何通过指数运算将输入值x映射到输出范围[−1,1]内。

Python实现代码

在Python中,可以使用多种库来实现tanh函数。以下是使用NumPy和math库的实现示例:

使用NumPy库

import numpy as np  x = np.array([0, 1, -1, 2, -2])  
y = np.tanh(x)  
print(y)

使用math库(手动实现)

虽然math库直接提供了tanh函数,但为了展示其计算过程,可以手动实现:

import math  def tanh(x):  return (math.exp(x) - math.exp(-x)) / (math.exp(x) + math.exp(-x))  x = 0.5  
y = tanh(x)  
print(y)

3.9.4. 优缺点

优点

  1. 输出值中心化:tanh函数的输出值在-1和1之间,且关于原点对称,这有助于缓解梯度消失问题,特别是在训练深层网络时。
  2. 导数连续且可微:tanh函数的导数连续且易于计算,有利于使用梯度下降等优化算法进行训练。
  3. 非线性特性:tanh函数保留了非线性特性,使得神经网络能够学习复杂的模式。

缺点

  1. 计算复杂度:由于tanh函数涉及指数运算,因此在处理大规模数据时计算复杂度较高。
  2. 梯度消失问题:虽然比sigmoid函数有所改善,但当输入值非常大或非常小时,tanh函数的梯度仍然可能接近于0,导致梯度消失问题。

3.9.5. 对比sigmoid函数的优势和劣势

优势

  1. 输出范围:tanh函数的输出范围在-1和1之间,比sigmoid函数的[0,1]范围更广,这有助于模型学习到更丰富的特征表示。
  2. 梯度特性:tanh函数在0附近的梯度比sigmoid函数更陡峭,这有助于在训练初期加快收敛速度。

劣势

在深度学习的实际应用中,tanh函数和sigmoid函数都面临着梯度消失的问题。尽管tanh函数在输出范围和梯度特性上有所改进,但在处理深层网络时仍可能遇到挑战。

3.9.6. 梯度消失的处理方法

3.9.6.1. 梯度消失的原因

梯度消失通常发生在深度神经网络中,尤其是在使用sigmoid或tanh等饱和型激活函数时。

这些函数在输入值较大较小时,其导数(梯度)会接近于0

在反向传播过程中,这些微小的梯度经过多层网络逐层传递时,会不断被乘以权重矩阵(权重通常小于1),进一步导致梯度值缩小,直至几乎消失。

这种现象会严重影响网络的训练效果,使得深层网络的参数无法得到有效更新。

对于tanh函数来说,当输入值x的绝对值很大时,tanh(x)会迅速接近-1或1,此时{tanh}'(x)会迅速趋近于0,即梯度几乎消失。

这是tanh函数面临梯度消失问题的主要原因。

3.9.6.2. 处理方法

为了缓解tanh函数带来的梯度消失问题,可以采取以下几种策略:

  1. 使用非饱和型激活函数
    尽管tanh函数相对于sigmoid函数在梯度消失问题上有所改善,但使用ReLU、LeakyReLU、ELU等非饱和型激活函数可以更有效地避免梯度消失。这些函数在输入值较大时梯度不会趋于0,从而保证了梯度在网络中的稳定传播。

  2. 批标准化(Batch Normalization)
    批标准化技术可以确保每一层的输入分布接近标准正态分布,从而缓解梯度消失并加速收敛。通过对每一层的输出进行归一化处理,批标准化可以减少内部协变量偏移(Internal Covariate Shift),使得激活函数的输入值保持在敏感区域,有助于避免梯度消失。

  3. 残差连接(Residual Connections)
    残差连接通过引入跳跃连接允许信息直接从输入层传递到输出层,绕过了可能的梯度消失路径。这种方法在深度网络中尤其有效,如ResNet等网络结构就通过添加残差块来保留层之间的信息流,从而缓解梯度消失问题。

  4. 适当的权重初始化
    使用适当的权重初始化方法如Xavier初始化、He初始化等,可以使得网络的权重在初始化时不会过大或过小,有助于控制梯度的大小并缓解梯度消失问题。

  5. 降低学习率
    适当降低学习率可以减少权重更新的步长,避免在训练初期由于学习率过大导致的梯度爆炸或梯度消失问题。随着训练的进行,可以逐步调整学习率以获得更好的训练效果。

  6. 使用正则化方法
    如L1、L2正则化等正则化方法可以减少网络的复杂度并限制权重的增长范围,有助于缓解梯度消失问题并提高模型的泛化能力。

综上所述,虽然tanh函数本身受梯度消失问题的影响,但通过采取上述策略可以有效地缓解这一问题并提高深度神经网络的训练效果。

在实际应用中,需要根据具体任务和网络结构选择合适的激活函数、初始化方法、优化算法等策略来构建高效稳定的深度学习模型。

3.9.7. 死节点(dead neurons)问题

3.9.7.1. 死节点问题来源

tanh函数作为深度学习的激活函数时,虽然在一定程度上缓解了sigmoid函数输出非零中心化导致的梯度消失问题,但它仍然可能面临梯度饱和导致的训练难题,包括死节点(dead neurons)问题。

死节点问题指的是在训练过程中,某些神经元的输出长时间保持为0,导致其权重无法得到有效更新。

3.9.7.2. 解决方法

针对tanh函数可能遇到的死节点问题,可以采取以下几种解决方法:

  • 使用非饱和激活函数

ReLU及其变体:ReLU(Rectified Linear Unit)函数在输入为正时梯度恒为1,有效缓解了梯度消失问题,并且计算效率高。然而,ReLU在输入为负时输出为0,可能导致死节点。为了解决这一问题,可以使用Leaky ReLU、PReLU(Parametric ReLU)、RReLU(Randomized ReLU)等变体,这些变体在输入为负时给予一个小的非零梯度,从而避免死节点。

  • 优化学习率

合理设置学习率对于避免死节点至关重要。学习率过大会导致权重更新步长过大,可能跳过最优解甚至导致梯度爆炸;学习率过小则可能导致训练过程缓慢,且容易陷入局部最小值。通过动态调整学习率(如使用Adam、RMSprop等优化器)或使用学习率衰减策略,可以在一定程度上避免死节点问题。

  • 权重初始化

适当的权重初始化方法可以减少训练初期死节点的发生。例如,使用He初始化或Xavier初始化等方法,可以根据网络的层数和激活函数的特点来设置初始权重的大小,使得在训练初期各层的激活值和梯度保持在合理的范围内。

  • 批标准化(Batch Normalization)

批标准化通过规范化每一层的输入分布,使得激活函数的输入值保持在敏感区域内,从而减少了梯度消失或爆炸的可能性。同时,批标准化还具有一定的正则化效果,有助于提升模型的泛化能力。

  • 正则化技术

使用L1或L2正则化等技术可以对模型的权重进行约束,防止权重过大导致梯度消失或爆炸。此外,Dropout技术通过在训练过程中随机丢弃一部分神经元及其连接,可以减少神经元之间的共适应性,从而在一定程度上避免死节点问题。

  • 数据预处理和特征缩放

对输入数据进行适当的预处理和特征缩放,使得输入数据的分布更加合理,有助于提升模型的训练效率和稳定性。例如,对于tanh函数来说,由于其输出范围在-1到1之间,因此将输入数据缩放到一个合适的范围内(如-1到1)可能有助于减少死节点问题的发生。

3.9.8. 在游戏AI应用方面的方法

3.9.8.1. 概述

在游戏AI中,tanh函数和sigmoid函数等激活函数常用于神经网络模型的构建。通过引入这些激活函数,神经网络能够学习到复杂的非线性关系,从而在游戏中实现更智能的决策和行为。

具体来说,游戏AI可能会使用多层感知机(MLP)或循环神经网络(RNN)等结构来处理游戏状态信息(如玩家位置、敌人位置、资源分布等),并使用tanh函数作为激活函数来引入非线性特性。

3.9.8.2. 实践

在游戏AI中,使用tanh函数作为深度学习模型的激活函数是一种常见的做法,特别是在处理3D环境下的运动时。以下是一个简单的Python示例,展示了如何在一个简单的神经网络中使用tanh激活函数来控制3D环境中的运动。

我们将使用PyTorch库,它是一个流行的深度学习框架,提供了构建和训练神经网络所需的工具和预训练模型。

第一步,确保你已经安装了PyTorch(没安装的话就打屁屁)。如果还没有安装,可以通过以下命令安装:

pip install torch

然后,你可以使用以下代码来创建一个简单的神经网络,该网络使用tanh激活函数来控制3D环境中的运动:

import torch  
import torch.nn as nn  # 定义一个简单的神经网络类  
class SimpleMotionNetwork(nn.Module):  def __init__(self):  super(SimpleMotionNetwork, self).__init__()  # 假设输入特征数量为10,输出控制参数数量为3(例如,3D空间中的x, y, z坐标)  self.fc1 = nn.Linear(10, 64)  self.fc2 = nn.Linear(64, 32)  self.fc3 = nn.Linear(32, 3)  # 使用tanh作为激活函数  self.activation = nn.Tanh()  def forward(self, x):  x = self.activation(self.fc1(x))  x = self.activation(self.fc2(x))  x = self.fc3(x)  # 输出层通常不使用激活函数,直接输出控制参数  return x  # 创建网络实例  
network = SimpleMotionNetwork()  # 创建一个随机输入张量来模拟3D环境下的运动控制输入  
input_tensor = torch.randn(1, 10)  # 通过网络传递输入并获取输出  
output = network(input_tensor)  print("输出控制参数:", output)

在这个例子中,我们定义了一个名为SimpleMotionNetwork的神经网络类,它有三个全连接层(fc1fc2fc3),并使用tanh作为激活函数。网络的输入特征数量为10,输出控制参数数量为3,可以解释为3D空间中的x, y, z坐标。我们创建了一个网络实例,并使用一个随机生成的输入张量来模拟3D环境下的运动控制输入。最后,我们通过网络传递输入并打印输出控制参数。

3.9.8.3. 练它

训练上述定义的SimpleMotionNetwork模型通常涉及以下几个步骤:

准备数据集、定义损失函数、选择优化器、进行训练循环以及评估模型性能。

以下是一个简化的训练流程示例:

  • 准备数据集

首先,你需要一个包含输入特征和对应输出标签的数据集。在游戏AI的上下文中,输入特征可能包括游戏状态(如玩家位置、敌人位置、道具位置等),而输出标签则可能是控制参数(如速度、方向等),这些参数将用于控制游戏中的角色或对象在3D环境中的运动。

由于这个示例是简化的,我们将不会具体实现数据集的加载和预处理步骤,但你需要确保你的数据集已经准备好,并且可以被你的模型以适当的方式读取。

  • 定义损失函数

损失函数用于评估模型的预测值与真实标签之间的差异。对于回归问题(如控制参数的预测),常用的损失函数包括均方误差(MSE)或平均绝对误差(MAE)。

在PyTorch中,你可以使用torch.nn.MSELosstorch.nn.L1Loss来定义损失函数。

criterion = nn.MSELoss()  # 使用均方误差作为损失函数
  • 选择优化器

优化器用于根据损失函数的梯度来更新模型的权重。在深度学习中,常用的优化器包括SGD(随机梯度下降)、Adam等。

optimizer = torch.optim.Adam(network.parameters(), lr=0.001)  # 使用Adam优化器,学习率为0.001
  • 进行训练循环

训练循环通常包括多个epoch(训练周期),每个epoch中模型会遍历整个数据集。在每个批次(batch)中,模型会进行前向传播以计算预测值,然后进行反向传播以计算梯度,并使用优化器更新权重。

以下是一个简化的训练循环示例:

# 假设dataloader已经定义好,用于按批次加载数据  
for epoch in range(num_epochs):  for inputs, targets in dataloader:  # 前向传播  outputs = network(inputs)  loss = criterion(outputs, targets)  # 反向传播和优化  optimizer.zero_grad()  # 清除之前的梯度  loss.backward()        # 反向传播计算梯度  optimizer.step()       # 使用优化器更新权重  # 可选:在每个epoch结束时打印损失或验证模型性能  print(f'Epoch {epoch+1}, Loss: {loss.item()}')

请注意,上面的代码示例假设dataloader已经定义好,并且以(inputs, targets)元组的形式返回每个批次的数据。在实际应用中,你需要根据自己的数据集来定义dataloader

  • 评估模型性能

在训练过程中或训练完成后,你需要评估模型的性能。这通常涉及在验证集或测试集上运行模型,并计算性能指标(如损失值、准确率等)。

由于你的模型是用于预测3D环境中的运动控制参数,因此你可能需要定义一些与游戏环境相关的性能指标来评估模型的实际效果。

上述训练流程是一个高度简化的示例。在实际应用中,你可能还需要考虑更多的因素,如学习率调整、早停法(early stopping)、权重衰减(weight decay)、梯度裁剪(gradient clipping)等,以进一步提高模型的性能和稳定性。

通过训练这些网络模型,游戏AI可以学习到如何在不同游戏状态下做出最优决策。

3.9.8.4. 小结

此外,随着深度学习技术的不断发展,越来越多的游戏AI开始采用更复杂的网络结构和优化算法来提高性能和准确性。

例如,强化学习技术可以允许游戏AI通过试错学习来不断优化其决策策略;而注意力机制等新技术则可以帮助游戏AI更好地处理复杂的游戏环境和多任务场景。

3.9.9. 总结下

总的来说tanh函数作为激活函数,还是有一战之力,但需要注意其x接近0时的情况,长时间出现x为0时会造成“死节点”问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/366997.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Rust基础入门】Hello Cargo

文章目录 前言Cargo是什么?Cargo的作用查看cargo版本使用cargo创建项目Cargo.toml文件cargo build命令cargo runcargo check为发布构建 总结 前言 在Rust编程中,Cargo扮演着至关重要的角色。它是Rust的包管理器,负责处理许多任务&#xff0c…

uniapp入门

一、新建项目 进入到主界面,左上角点击新建——1.项目 输入项目名称,Vue版本选择3 二、创建页面 选中左侧文件目录里的pages文件夹,右键,选择新建页面 1输入名称 2选中“创建同名目录” 3选择模板&…

昇思25天学习打卡营第7天|网络构建

网络构建 神经网络模型由tensor操作和神经网络层构成。 MIndSporezhong,Cell是构建所有网络的基类,也是网络的基本单元。cell也由子cell构成。 定义模型类 # 继承nn.Cell类 class Network(nn.Cell):def __init__(self):super().__init__()self.flatte…

ElasticSearch 和 MySQL的区别

MySQLElasticSearch 数据库(database)索引(index)数据表(table) 类型(type) 记录文档(document,json格式) 一、ES基础命令 1. ES cat查询命令 2.…

分布式技术专题 | TCP在分布式网络中的通信机制与底层实现

深入解析分布式网络中的TCP通信协议实现 跨地域通信与资源共享网络节点与主机的定义网络技术通信机制TCP/IP协议模型TCP/IP分层机制TCP的Socket链接处理控制TCP的优势和特性自动差错控制正确性和有序性 TCP的Socket使用端口在应用程序间通信TCP的Socket使用端口套接字操作 跨地…

uniapp封装虚拟列表滚动组件

uniapp封装虚拟列表滚动组件 这里用到一个列表&#xff0c;然后数据可能有很多很多…&#xff0c;一次性全部渲染到dom上会卡顿&#xff0c;很废性能&#xff0c;于是用了这个虚拟列表就变丝滑很多很多。 组件mosoweInventedList 代码&#xff1a; <!-- 虚拟滚动列表组件&a…

GPT-4o首次引入!全新图像自动评估基准发布!

目录 01 什么是DreamBench&#xff1f; 02 与人类对齐的自动化评估 03 更全面的个性化数据集 04 实验结果 面对层出不穷的个性化图像生成技术&#xff0c;一个新问题摆在眼前&#xff1a;缺乏统一标准来衡量这些生成的图片是否符合人们的喜好。 对此&#xff0c;来自清华大…

mysql主键自增连续新增时报错主键重复-Duplicate entry “x” for key PRIMARY

mysql主键自增连续新增时报错主键重复 1、mysql数据库设置数据库主键自增的规律 id -- AUTO_INCREMENT2、可视化工具查看自增没问题 3、问题描述 新增第一个时操作成功&#xff0c;新增第二个时候操作失败报错&#xff1a; Duplicate entry “x” for key PRIMARY4、分析&a…

千益畅行,旅游卡,如何赚钱?

​ 赚钱这件事情&#xff0c;只有自己努力执行才会有结果。生活中没有幸运二字&#xff0c;每个光鲜亮丽的背后&#xff0c;都是不为人知的付出&#xff01; #旅游卡服务#

简过网:考公务员难度大吗,一般考几年才上岸!

先调查一下&#xff0c;大家考公务员都是几年才上岸的&#xff1f; 最近有网友私信小编&#xff0c;普通人考公要准备多久才能上岸&#xff0c;其实对于多久能上岸这个问题&#xff0c;并没有一个准确的数字&#xff0c;众所周知&#xff0c;公务员考试是有一定难度的&#xf…

Git入门 本地仓库 远端仓库 多分支

Git入门 Git入门本地git初始化git仓库初始化 创建远端仓库githubgitee 指定远端仓库推送至远端多分支将feature分支合并至dev分支 其他开发者 Git入门 本地git初始化 git仓库初始化 mkdir myrepo # 创建仓库文件夹 cd myrepo/ # 进入目录 git init # 初始化git仓库 (创建.g…

C - Popcorn(abs358)

题意&#xff1a;有n个摊子&#xff0c;m个爆米花&#xff0c;想花费最少去的店铺买到所有的口味的爆米花&#xff0c;找到每一列都为‘o’的最少行数。 分析&#xff1a;用dfs寻找最少路径 #include<bits/stdc.h> using namespace std; typedef long long ll; char x;…

CAN通信波形【示波器抓取】

在测试bms系统过程中&#xff0c;在上位机发现无法读取CAN通信&#xff0c;尝试使用示波器抓取CAN通信波形&#xff0c;&#xff0c;去确定CAN通信是否正常。 做一想要从车上测出can总线上的数据还不太容易。 于是我首先使用示波器&#xff08;我使用的示波器型号是TDS 220&am…

第十四届蓝桥杯省赛C++B组E题【接龙数列】题解(AC)

需求分析 题目要求最少删掉多少个数后&#xff0c;使得数列变为接龙数列。 相当于题目要求求出数组中的最长接龙子序列。 题目分析 对于一个数能不能放到接龙数列中&#xff0c;只关系到这个数的第一位和最后一位&#xff0c;所以我们可以先对数组进行预处理&#xff0c;将…

opencascade AIS_InteractiveContext源码学习7 debug visualization

AIS_InteractiveContext 前言 交互上下文&#xff08;Interactive Context&#xff09;允许您在一个或多个视图器中管理交互对象的图形行为和选择。类方法使这一操作非常透明。需要记住的是&#xff0c;对于已经被交互上下文识别的交互对象&#xff0c;必须使用上下文方法进行…

JVM专题十一:JVM 中的收集器一

上一篇JVM专题十&#xff1a;JVM中的垃圾回收机制专题中&#xff0c;我们主要介绍了Java的垃圾机制&#xff0c;包括垃圾回收基本概念&#xff0c;重点介绍了垃圾回收机制中自动内存管理与垃圾收集算法。如果说收集算法是内存回收的方法论&#xff0c;那么垃圾收集器就是内存回…

OBS 免费的录屏软件

一、下载 obs 【OBS】OBS Studio 的安装、参数设置和录屏、摄像头使用教程-CSDN博客 二、使用 obs & 输出无黑屏 【OBS任意指定区域录屏的方法-哔哩哔哩】 https://b23.tv/aM0hj8A OBS任意指定区域录屏的方法_哔哩哔哩_bilibili 步骤&#xff1a; 1&#xff09;获取区域…

【智能算法】目标检测算法

目录 一、目标检测算法分类 二、 常见目标检测算法及matlab代码实现 2.1 R-CNN 2.1.1 定义 2.1.2 matlab代码实现 2.2 Fast R-CNN 2.2.1 定义 2.2.2 matlab代码实现 2.3 Faster R-CNN 2.3.1 定义 2.3.2 matlab代码实现 2.4 YOLO 2.4.1 定义 2.4.2 matlab代码实现…

[开源软件] 支持链接汇总

“Common rules: 1- If the repo is on github, the support/bug link is also on the github with issues”" label; 2- Could ask questions by email list;" 3rd party software support link Note gcc https://gcc.gnu.org openssh https://bugzilla.mindrot.o…

作业7.2

用结构体数组以及函数完成: 录入你要增加的几个学生&#xff0c;之后输出所有的学生信息 删除你要删除的第几个学生&#xff0c;并打印所有的学生信息 修改你要修改的第几个学生&#xff0c;并打印所有的学生信息 查找你要查找的第几个学生&#xff0c;并打印该的学生信息 1 /*…