生成模型:变分自编码器-VAE

1.基本概念

1.1 概率

这里有:

  1. x为真实图像,开源为数据集, 编码器将其编码为分布参数
  2. x ^ \hat{x} x^为生成图像, 通过解码器获得
  3. p ( x ) ^ \hat{p(x)} p(x)^: 观测数据的分布, 即数据集所构成的经验分布
  4. p r e a l ( x ) p_{real}(x) preal(x): 真实世界的数据分布,这个是最理想的情况
  5. p ( x ) p(x) p(x):生成模型的分布,目的是接近 p r e a l ( x ) p_{real}(x) preal(x),避免过拟合到 p ( x ) ^ \hat{p(x)} p(x)^
  6. z ∼ N ( μ , σ ) 2 z \sim \mathcal{N}(\mu, \sigma)^2 zN(μ,σ)2 :潜空间向量, 通常希望约束于正态分布
  7. p ( z ) p(z) p(z):先验分布,即假设分布,在 VAE 中通常假设为标准正态分布
  8. q ϕ ( z ∣ x ) q_\phi(z∣x) qϕ(zx): 后验分布,是一种近似分布以逼近目标分布。依赖输入数据x,预测潜向量分布,即编码器
  9. p θ ( x ∣ z ) p_\theta(x∣z) pθ(xz): 条件分布,通过z生成x,即解码器

KL散度, 衡量分布相似性:

  • q ϕ ( z ∣ x ) = p ( z ) q_\phi(z∣x)=p(z) qϕ(zx)=p(z), 散度为 0,表示两个分布完全一致。

  • q ϕ ( z ∣ x ) ≠ p ( z ) q_\phi(z∣x)≠p(z) qϕ(zx)=p(z) 时,散度为正,值越大表示分布之间的差异越大。

KL 散度用于约束编码器生成的后验分布 q ϕ ( z ∣ x ) q_\phi(z∣x) qϕ(zx) 接近先验分布 p ( z ) p(z) p(z)

1.2 模型

VAE与普通自编码器区别如下:

  • 普通自编码器(AE) 会直接将 x映射到一个固定的潜向量z
  • 变分自编码器(VAE) 则通过学习概率分布的参数(均值 μ ( x ) \mu(x) μ(x),方差 σ 2 ( x ) \sigma^2(x) σ2(x) 来学习一个潜在分布 q ϕ ( x ∣ z ) q_\phi(x|z) qϕ(xz)

VAE训练一个自编码器, 目标是生成潜空间的分布参数,即潜向量z的均值和方差,而不是z本身。

因为学习的是一个分布参数,z具有随机性,即 x 和 z 不是一一对应的,是一对多的关系,

其设计原因分析如下:

1.数据分布复杂:真实世界中的非结构化数据分布是及其复杂且多样的。如果每个
x都严格映射到一个z,则潜在空间无法表达数据的多样性,数据映射的z存在随机性。

2.有助于模型泛化: 学习一个分布近似分布而不是固定映射。在生成任务中,随机采样z具有多样性,而不仅仅是直接复现训练数据, 适应未见过的数据。

2.方法

2.1 编码器-E

E将输入数据映射为潜在空间的概率分布参数: 均值 μ \mu μ 与 方差 σ 2 \sigma^2 σ2

μ \mu μ σ 2 \sigma^2 σ2 分别代表潜空间向量的各元素均值和方差。

这里假定 q q q是可以通过学习参数 θ \theta θ学到,公式如下:

N ( z ; μ ( x ) , σ 2 ( x ) ) \mathcal{N}(z; \mu(x), \sigma^2(x)) N(z;μ(x),σ2(x))

表示z服从正态分布,其均值为 μ ( x ) \mu(x) μ(x)$

q θ q_\theta qθ用编码器E来学习:

$E(x) = \mu(x), \sigma^2(x), z \sim ( \mu(x), \sigma^2(x)) $

2.2 解码器-D

D的目的是,输入潜向量 z,重构输入数据 x, 得到 x ^ \hat{x} x^

  • 重参数化

由于分布输出的z是随机采样,存在不确定性,这里在送入D前重参数化:

z = u + σ ⋅ ϵ , ϵ ∼ N ( 0 , 1 ) z = u + \sigma \cdot \epsilon, \epsilon \sim \mathcal{N}(0,1) z=u+σϵ,ϵN(0,1)

即z是一个确定的函数,将随机性与模型参数 μ , σ \mu, \sigma μ,σ分离。

再送入解码器:

x ^ = D ( z ) \hat{x} = D(z) x^=D(z)

2.3 训练

VAE是将E和D作为一个整体训练(即整个自编码器), 损失函数如下:

L VAE = E z ∼ q ϕ ( z ∣ x ) [ − log ⁡ p θ ( x ∣ z ) ] + D KL ( q ϕ ( z ∣ x ) ∥ p ( z ) ) \mathcal{L}_{\text{VAE}} = \mathbb{E}_{z \sim q_\phi(z|x)} \left[ -\log p_\theta(x|z) \right] + D_\text{KL}(q_\phi(z|x) \parallel p(z)) LVAE=Ezqϕ(zx)[logpθ(xz)]+DKL(qϕ(zx)p(z))

简化为:

L VAE \mathcal{L}_{\text{VAE}} LVAE = 重构损失 + KL散度

2.3.1 重构损失

表示在潜向量z按照近似后验分布 q ϕ ( z ∣ x ) q_\phi(z∣x) qϕ(zx)采样时,模型重构数据 x ^ \hat{x} x^的对数似然期望值:

− E z ∼ q ϕ ( z ∣ x ) [ log ⁡ p θ ( x ∣ z ) ] -\mathbb{E}_{z \sim q_\phi(z \mid x)}\left[\log p_\theta(x \mid z)\right] Ezqϕ(zx)[logpθ(xz)]

这里加了负号,即最大化重构概率转为损失值最小化

直观理解:

1.编码器 q ϕ ( z ∣ x ) q_\phi(z|x) qϕ(zx)为每个输入数据x提供一组潜向量z的分布参数。

2.解码器$p_\theta(x|z)尝试根据z重构原始数据x。

3.对 log ⁡ θ ( x ∣ z ) \log_\theta(x|z) logθ(xz)取期望值,是对不同z的采样重构结果进行平均。

如果解码器能很好地重构x, log ⁡ θ ( x ∣ z ) \log_\theta(x|z) logθ(xz)值就大,相反就小。

  • 如果是二值像素, 即0 和 1。可以用交叉熵,即BCE(Binary Cross Entropy)

即判断像素值接近 0 还是接近 1:

BCE = − 1 N ∑ i = 1 N [ x i log ⁡ ( x ^ i ) + ( 1 − x i ) log ⁡ ( 1 − x ^ i ) ] \text{BCE} = -\frac{1}{N} \sum_{i=1}^{N} \left[ x_i \log(\hat{x}_i) + (1 - x_i) \log(1 - \hat{x}_i) \right] BCE=N1i=1N[xilog(x^i)+(1xi)log(1x^i)]

  • 如果是[0,255],或者归一化为[0,1],[-1,1]的像素,可以用MSE

MSE = 1 N ∑ i = 1 N ( x i − x ^ i ) 2 \text{MSE} = \frac{1}{N} \sum_{i=1}^{N} (x_i - \hat{x}_i)^2 MSE=N1i=1N(xix^i)2

2.3.2 KL散度

KL 散度的定义:

D KL ( q ϕ ( z ∣ x ) ∥ p ( z ) ) = E q ϕ ( z ∣ x ) [ log ⁡ q ϕ ( z ∣ x ) p ( z ) ] D_\text{KL}(q_\phi(z|x) \parallel p(z)) = \mathbb{E}_{q_\phi(z|x)} \left[ \log \frac{q_\phi(z|x)}{p(z)} \right] DKL(qϕ(zx)p(z))=Eqϕ(zx)[logp(z)qϕ(zx)]

展开:

D KL = E z ∼ q ϕ ( z ∣ x ) [ − log ⁡ p θ ( x ∣ z ) + log ⁡ q ϕ ( z ∣ x ) p ( z ) ] D_\text{KL} = \mathbb{E}_{z \sim q_\phi(z|x)} \left[ -\log p_\theta(x|z) + \log \frac{q_\phi(z|x)}{p(z)} \right] DKL=Ezqϕ(zx)[logpθ(xz)+logp(z)qϕ(zx)]

进一步分解为:

D KL = − 1 2 ∑ i = 1 d ( 1 + log ⁡ σ i 2 − μ i 2 − σ i 2 ) D_\text{KL} = -\frac{1}{2} \sum_{i=1}^d \left( 1 + \log \sigma_i^2 - \mu_i^2 - \sigma_i^2 \right) DKL=21i=1d(1+logσi2μi2σi2)

3.代码实现

训练VAE生成手写数字。

3.1 参数设置

  • 模型:极简的7层全连接自编码器(E-4层, D-3层)

  • 数据集:pytorch自带的mnist手写数据集,每个样本像素为单通道 [28,28]

  • epoch: 50次

  • batch-size:64

  • learing-rate:1e-3 或 5e-4

3.2 代码概述

  • 导入必要的库
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt
  • 编码器:将输入数据映射为潜在变量 z 的均值 μ \mu μ 和方差 σ 2 \sigma^2 σ2
  • 解码器:从潜在变量 z 重构原始数据
class VAE(nn.Module):def __init__(self, input_dim, latent_dim):super(VAE, self).__init__()# 编码器self.encoder = nn.Sequential(nn.Linear(input_dim, 512),nn.ReLU(),nn.Linear(512, 256),nn.ReLU())self.fc_mu = nn.Linear(256, latent_dim)  # 均值self.fc_logvar = nn.Linear(256, latent_dim)  # 对数方差# 解码器self.decoder = nn.Sequential(nn.Linear(latent_dim, 256),nn.ReLU(),nn.Linear(256, 512),nn.ReLU(),nn.Linear(512, input_dim),nn.Sigmoid()  # 用 Sigmoid 将输出值压缩到 [0, 1])def reparameterize(self, mu, logvar):"""使用重参数化技巧生成潜在变量 z"""std = torch.exp(0.5 * logvar)  # 标准差eps = torch.randn_like(std)    # 标准正态分布的随机噪声return mu + eps * stddef forward(self, x):# 编码h = self.encoder(x)mu = self.fc_mu(h)logvar = self.fc_logvar(h)# 重参数化z = self.reparameterize(mu, logvar)# 解码recon_x = self.decoder(z)return recon_x, mu, logvar
  • 损失函数
def vae_loss(recon_x, x, mu, logvar):# 重构误差(BCE)recon_loss = nn.functional.binary_cross_entropy(recon_x, x, reduction='sum')# KL 散度kl_div = -0.5 * torch.sum(1 + logvar - mu.pow(2) - logvar.exp())return recon_loss + kl_div
  • 数据加载和超参数设置
# 超参数
latent_dim = 20  # 潜在空间维度
input_dim = 28 * 28  # MNIST 图像大小
batch_size = 64
epochs = 50
lr = 0.001# 数据加载器
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
dataset = torchvision.datasets.MNIST(root='./data', train=True, transform=transform, download=True)
dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)
  • 训练 VAE, 先初始化模型和优化器
vae = VAE(input_dim=input_dim, latent_dim=latent_dim).to('cuda')
optimizer = optim.Adam(vae.parameters(), lr=lr)for epoch in range(epochs):vae.train()total_loss = 0for images, _ in dataloader:# 预处理数据images = images.view(-1, input_dim).to('cuda')# 前向传播recon_images, mu, logvar = vae(images)# 计算损失loss = vae_loss(recon_images, images, mu, logvar)# 反向传播optimizer.zero_grad()loss.backward()optimizer.step()total_loss += loss.item()print(f"Epoch [{epoch+1}/{epochs}] Loss: {total_loss / len(dataloader.dataset):.4f}")
  • 生成新样本时,只需要随机从潜在空间中采样z,然后通过解码器生成数据:
vae.eval()
with torch.no_grad():# 从标准正态分布采样z = torch.randn(256, latent_dim).to('cuda')  # 16x16 = 256 个样本generated_images = vae.decoder(z).view(-1, 1, 32, 32).cpu()# 创建 16x16 的网格grid = torchvision.utils.make_grid(generated_images, nrow=16, normalize=True)# 保存生成的图像为文件torchvision.utils.save_image(grid, 'generated_images.png', normalize=True)# 显示图像plt.imshow(grid.permute(1, 2, 0))plt.axis('off')  # 去除坐标轴plt.show()

4.实验结果

4.1 损失函数

损失函数值有效下降,在数据集迭代34次(ep33)后下降约一半:

在这里插入图片描述

4.2 最终效果

  • epoch-1:

在这里插入图片描述

  • epoch-12:

在这里插入图片描述

  • epoch-33:

在这里插入图片描述

5.概率相关补充

5.1 条件概率-贝叶斯定理

p ( x , z ) = p ( x ∣ z ) p ( z ) p(x,z) = p(x|z)p(z) p(x,z)=p(xz)p(z)

p ( z ∣ x ) = p ( x , z ) p ( x ) = p ( x ∣ z ) p ( z ) p ( x ) p(z \mid x) = \frac{p(x, z)}{p(x)} = \frac{p(x \mid z) p(z)}{p(x)} p(zx)=p(x)p(x,z)=p(x)p(xz)p(z)

5.2 KL散度函数:

D K L ( q ( z ∣ x ) ∥ p ( z ) ) = E q ( z ∣ x ) [ log ⁡ p ( z ) q ( z ∣ x ) ] = ∫ q ( z ∣ x ) log ⁡ q ( z ∣ x ) p ( z ) d z = ∑ z q ( z ∣ x ) log ⁡ q ( z ∣ x ) p ( z ) D_{KL}(q(z|x) \parallel p(z)) = \mathbb{E}_{q(z|x)} \left[ \log \frac{p(z)}{q(z|x)} \right] = \int q(z|x) \log \frac{q(z|x)}{p(z)} \, dz = \sum_{z} q(z|x) \log \frac{q(z|x)}{p(z)} DKL(q(zx)p(z))=Eq(zx)[logq(zx)p(z)]=q(zx)logp(z)q(zx)dz=zq(zx)logp(z)q(zx)

KL衡量一个分布相对于另一个分布的信息损失或“距离”,是一个正数:

证明可利用:

log ⁡ x ≤ x − 1 , ∀ x > 0 \log x \leq x - 1, \quad \forall x > 0 logxx1,x>0

给log内分数上负号,颠倒分子分母,则:

∑ z q ( z ∣ x ) log ⁡ p ( z ) q ( z ∣ x ) ≤ ∑ z − p ( z ) q ( z ∣ x ) < 0 \sum_{z}q(z|x) \log \frac{p(z)}{q(z|x)} \leq \sum_z -\frac{p(z)}{q(z|x)} < 0 zq(zx)logq(zx)p(z)zq(zx)p(z)<0

5.3 概率密度函数:

p ( z ) ∼ N ( 0 , 1 ) p(z) \sim \mathcal{N}(0,1) p(z)N(0,1):

p ( z ) = 1 ( 2 π ) d / 2 exp ⁡ ( − 1 2 ∑ i = 1 d z i 2 ) p(z) = \frac{1}{(2\pi)^{d/2}} \exp \left( -\frac{1}{2} \sum_{i=1}^{d} z_i^2 \right) p(z)=(2π)d/21exp(21i=1dzi2)

注:d是维度

p ( z ) ∼ N ( μ , σ ) p(z) \sim \mathcal{N}(\mu,\sigma) p(z)N(μ,σ):

q ( z ∣ x ) = 1 ( 2 π ) d / 2 ∣ Σ ∣ 1 / 2 exp ⁡ ( − 1 2 ∑ i = 1 d ( z i − μ i ) 2 σ i 2 ) ; Σ = d i a g ( σ 1 2 , . . . , σ d 2 ) q(z|x) = \frac{1}{(2\pi)^{d/2} |\Sigma|^{1/2}} \exp \left( -\frac{1}{2} \sum_{i=1}^{d} \frac{(z_i - \mu_i)^2}{\sigma_i^2} \right); \Sigma = diag(\sigma_1^2,...,\sigma_d^2) q(zx)=(2π)d/2∣Σ1/21exp(21i=1dσi2(ziμi)2);Σ=diag(σ12,...,σd2)

也可以写成这样:

q ( z ∣ x ) = 1 ( 2 π ) d / 2 σ 1 σ 2 ⋯ σ d exp ⁡ ( − 1 2 ∑ i = 1 d ( z i − μ i ) 2 σ i 2 ) q(z|x) = \frac{1}{(2\pi)^{d/2} \sigma_1 \sigma_2 \cdots \sigma_d} \exp \left( -\frac{1}{2} \sum_{i=1}^{d} \frac{(z_i - \mu_i)^2}{\sigma_i^2} \right) q(zx)=(2π)d/2σ1σ2σd1exp(21i=1dσi2(ziμi)2)

Ref

  • Auto-Encoding Variational Bayes / Variational autoencoder
  • https://arxiv.org/abs/1312.6114
  • https://www.zhihu.com/question/579890053/answer/38625999761

本文全部代码:

  • https://github.com/disanda/GM.git

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/504122.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

攻防世界 wtf.sh-150

点进去&#xff0c;发现是一个类似于论坛的网站&#xff0c;并且对报错等做了处理 用御剑扫描一下 ​ 发现是php形式的文件&#xff0c;但点进去访问不了。看看wp&#xff0c;发现此题存在路径穿越漏洞&#xff0c;就是&#xff08;如果应用程序使用用户可控制的数据&#xff0…

Google Play开发者账号的高风险行为解析

在安卓应用开发行业里&#xff0c;Google Play 开发者账号是开发者们通向全球用户的重要桥梁。凭借它&#xff0c;开发者们能够将精心打造的应用推向市场&#xff0c;然而&#xff0c;开发者账号的使用也包含了诸多风险&#xff0c;一些不经意的操作可能会给开发者账号带来封禁…

网络安全-web应用程序发展历程(基础篇)

1.网站程序发展 web1.0 网站是别人的&#xff0c;只能是随便看看 web2.0网站是朋友的&#xff0c;可以进行交流了 web3.0网站是自己的&#xff0c;可以实现买卖交流。 静态内容阶段&#xff1a;web由大量的静态文档构成&#xff0c;web被看作成超文本共享文件服务器。别人只…

继承(6)

大家好&#xff0c;今天我们来继续学习继承的内容&#xff0c;了解一下this和super两者的一些特性和区别。话不多说&#xff0c;来看。 1.7 super 和 this super和 this都可以在成员方法中用来访问:成员变量和调用其他的成员函数,都可以作为构造方法的第一条语句,那他们之间有…

[离线数仓] 总结二、Hive数仓分层开发

接 [离线数仓] 总结一、数据采集 5.8 数仓开发之ODS层 ODS层的设计要点如下: (1)ODS层的表结构设计依托于从业务系统同步过来的数据结构。 (2)ODS层要保存全部历史数据,故其压缩格式应选择压缩比率,较高的,此处选择gzip。 CompressedStorage - Apache Hive - Apac…

3D机器视觉的类型、应用和未来趋势

3D相机正在推动机器视觉市场的增长。很多制造企业开始转向自动化3D料箱拣选&#xff0c;专注于使用3D视觉和人工智能等先进技术来简化操作并减少开支。 预计3D相机将在未来五年内推动全球机器视觉市场&#xff0c;这得益于移动机器人和机器人拣选的强劲增长。到 2028 年&#…

Mac-docker配置

1.配置的文件路径 cd ~/.docker (base) zhangyaweimacbookair .docker % ls buildx cli-plugins config.json contexts daemon.json desktop-build mutagen run (base) zhangyaweimacbookair .docker % cat daemon.json## 重启docker服务 sudo systemctl daemon-reload sudo…

SSM-SpringMVC-请求响应、REST、JSON

目录 “为什么要学 SpringMVC&#xff1f;它和 Servlet 是什么关系&#xff1f;” “什么是异步&#xff1f;为什么异步交互中常用 JSON 格式&#xff1f;异步请求和 JSON 如何配合&#xff1f;” 一、概述 SpringMVC主要负责 1 SpringMVC的常用组件 2 SpringMVC的工作流程…

【Arm】Arm 处理器的半主机(semihosting)机制

概览 通过 semihosting 机制&#xff0c;主机可以通过调试器使用目标计算机 IO 接口。 例如开发者的 PC 通过 J-Link 来使用 STM32 MCU 的输入输出。 这些功能的示例包括键盘输入、屏幕输出和硬盘 I/O。例如&#xff0c;可以使用此机制启用 C Library 中的函数&#xff0c;如…

网络安全-XSS跨站脚本攻击(基础篇)

漏洞扫描的原理 1.跨站脚本攻击介绍 xss跨站脚本攻击&#xff1a; xSS 全称&#xff08;Cross site Scripting &#xff09;跨站脚本攻击&#xff0c;是最常见的Web应用程序安全漏洞之一&#xff0c;位于OWASP top 10 2013/2017年度分别为第三名和第七名&#xff0c;XSS是指攻…

深度学习与计算机视觉 (博士)

文章目录 零、计算机视觉概述一、深度学习相关概念1.学习率η2.batchsize和epoch3.端到端(End-to-End)、序列到序列(Seq-to-Seq)4.消融实验5.学习方式6.监督学习的方式(1)有监督学习(2)强监督学习(3)弱监督学习(4)半监督学习(5)自监督学习(6)无监督学习(7)总结&#xff1a;不同…

n 维数组(张量)关于轴 axis 的理解

本文将从两个角度来理解 “轴” 的概念&#xff0c;着重阐述 1.2 节中的理解&#xff0c;并借此加深问题一和问题二的理解。 一、问题&#xff1a;如何理解 numpy 数组在轴上的 sum 操作 二、问题&#xff1a;torch 张量中的维度 dim 也是如此 一、问题&#xff1a;如何理解 n…

Vscode辅助编码AI神器continue插件

案例效果 1、安装或者更新vscode 有些版本的vscode不支持continue,最好更新到最新版,也可以直接官网下载 https://code.visualstudio.com/Download 2、安装continue插件 搜索continue,还未安装的,右下脚有个Install,点击安装即可 <

操作手册:集成钉钉审批实例消息监听配置

此文档将记录在慧集通平台怎么实现钉钉审批实例结束或发起或取消时&#xff0c;能够实时的将对应的实例数据抓取出来送入第三方系统 集成平台配置 1、配置中心库&#xff0c;存储钉钉发送的消息&#xff0c;可以忽略&#xff0c;若不配置&#xff0c;则钉钉的消息将不再记录到…

mysql -> 达梦数据迁移(mbp大小写问题兼容)

安装 注意后面初始化需要忽略大小写 初始化程序启动路径 F:\dmdbms\tool dbca.exe 创建表空间&#xff0c;用户&#xff0c;模式 管理工具启动路径 F:\dmdbms\tool manager.exe 创建表空间 创建用户 创建同名模式&#xff0c;指定模式拥有者TEST dts 工具数据迁移 mysql -&g…

MacBook Linux 树莓派raspberrypi安装Golang环境

个人还是比较喜欢用go语言开发,比java开发效率高,以后会持续更新golang相关的博客 MacBook安装golang环境 官方下载地址: https://golang.google.cn/dl/ 官方下载Mac对应版本 tar.gz包 OS macOS 版本 x86-64 #解压 tar -zxvf xxx.tar.gz #配置环境变量 vim ~/.zshrc #文件最后…

基于LabVIEW的BeamGage自动化接口应用

设置 National Instruments LabVIEW可执行程序需要被配置为使用.NET 4框架。.NET允许自定义可执行程序的运行方式。可通过以下方式实现&#xff1a; 在LabVIEW安装目录中创建一个名为LabVIEW.exe.config的文本文件&#xff08;例如&#xff1a;C:\Program Files\National Ins…

SQL概述

SQL SQL&#xff08;Structured Query Language&#xff09;是“结构化查询语言”&#xff0c;它是对关系型数据库的操作语言。它可以应用到所有关系型数据库中。如&#xff1a;MySQL、Oracle、SQL Server 等。除了 SQL 标准之外&#xff0c;大部分 SQL 数据库程序都拥有它们自…

WandB使用笔记

最近看代码&#xff0c;发现代码中有wandb有关的内容&#xff0c;搜索了一下发现是一个模型训练工具&#xff0c;然后学习了一下&#xff0c;这里记录一下使用过程&#xff0c;方便以后查阅。 WandB使用笔记 登录WandB 并 创建团队安装 WandB 并 登录模型训练过程跟踪模型版本管…

中国科技统计年鉴EXCEL版(2021-2023年)-社科数据

中国科技统计年鉴EXCEL版&#xff08;2021-2023年&#xff09;-社科数据https://download.csdn.net/download/paofuluolijiang/90028724 https://download.csdn.net/download/paofuluolijiang/90028724 中国科技统计年鉴提供了从2021至2023年的详尽数据&#xff0c;覆盖了科技…