【踩坑随笔】Tensorflow-GPU训练踩坑

【踩坑随笔】Tensorflow-GPU训练踩坑

news/2024/12/26 0:01:09/文章来源:https://blog.csdn.net/qq_44894943/article/details/143025357

一个无语的坑，4060单卡训练，8G内存本来就不够，还没开始训练就已经爆内存了，但是居然正常跑完了训练，然后一推理发现结果就是一坨。。。往回翻日志才发现原来中间有异常。

首先解决第一个问题：Could not load dynamic library 'cupti64_112.dll'
在这里插入图片描述
解决方法参考TensorFlow训练中保存tensorboard中cupti丢失问题解决，总结一下就是找到cupti64_2020.2.1.dll复制到cuda安装路径的bin目录下，并重命名为缺的这个cupti64_112.dll

最坑的来了，OOM了但是还是能正常训练完，但是结果保存的权重必然是有问题的

UserWarning: Converting sparse IndexedSlices(IndexedSlices(indices=Tensor("training/SGD/gradients/gradients/roi_align_classifier/concat_grad/sub:0", shape=(None,), dtype=int32), values=Tensor("training/SGD/gradients/gradients/roi_align_classifier/concat_grad/GatherV2_2:0", shape=(None, 7, 7, 256), dtype=float32), dense_shape=Tensor("training/SGD/gradients/gradients/roi_align_classifier/concat_grad/Shape:0", shape=(4,), dtype=int32))) to a dense Tensor of unknown shape. This may consume a large amount of memory.warnings.warn(

在这里插入图片描述
试了改小batch_size并没有用。。。。暂时没找到解决方法，初步断定就是显存不够，但是换了24G显存的卡出了新问题，直接卡在epoch1，不报错也不继续，后台程序挂起，GPU利用率为0，试遍了都没找到解决方案，解决了再来更新。。。。

在这里插入图片描述

找到了win11下的解决方案
使用GPU训练tensorflow/keras模型，Memory-Usage占用高，GPU-Util利用率低。提升GPU-Util利用率，提升模型训练速度

在这里插入图片描述
利用率终于不是0了！但是好像还是没解决根本问题，运行结果跟之前一模一样。。。。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/450322.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

k8s部署Kafka集群超详细讲解

k8s部署Kafka集群超详细讲解

准备部署环境 Kubernetes集群信息 NAMEVERSIONk8s-masterv1.29.2k8s-node01v1.29.2k8s-node02v1.29.2 Kafka：3.7.1版本，apche版本 Zookeeper：3.6.3版本准备StorageClass # kubectl get sc NAME PROVISIONER RECLA…

阅读更多...

音频文件处理 m4a 格式转为 wav 格式 - python 实现

音频文件处理 m4a 格式转为 wav 格式 - python 实现

在做音频算法开发时，有时获取的样本为 .m4a格式需要将其转为 .wav,方便之后的数据处理。安装 python 库： pip install AudioSegment 代码实现具体如下： #-*-coding:utf-8-*- # date:2024-10 # Author: DataBall - XIAN # Function: 音频文件…

阅读更多...

LIN从节点：波特率测试

LIN从节点：波特率测试

文章目录 1、为什么需要测？2、如何实现测试？3、测试结果4、注意事项 1、为什么需要测？ 调节波特率的变化，使主节点同步场位速率变化，验证从节点能否通过同步段进行调节自身位速率。对应ISO17987协议。 2、如何实现测…

阅读更多...

锥线性规划【分布鲁棒、两阶段鲁棒方向知识点】

锥线性规划【分布鲁棒、两阶段鲁棒方向知识点】

1 锥线性对偶理论本部分看似和分布鲁棒、两阶段鲁棒优化没什么关系，但值得优先学习，原因将在最后揭晓。二阶锥二阶锥（second-order cone，又称ice-cream/Lorentz cone）的形式为： 非负象限锥半正定锥 …

阅读更多...

jmeter出参保存到文件，保存失败解决

jmeter出参保存到文件，保存失败解决

1、添加JSON提取 2、添加beanshell FileWriter writer new FileWriter("C:/Users/xxx/Desktop/signUrl.csv", true); writer.write(vars.get("company_name")"\t"vars.get("signUrl")"\n"); writer.close(); 写文件的两个…

阅读更多...

python的多线程和多进程

python的多线程和多进程

首先需要明确的是，多进程和其他语言的一样，能够利用多核cpu，但是python由于GIL的存在，多线程在执行的时候，实际上，每一时刻只有一个线程在执行。相当于是单线程。然而多线程在某些情况下，还是能…

阅读更多...

Go-知识泛型

Go-知识泛型

Go-知识泛型 1. 认识泛型1.1 不使用泛型1.2 使用泛型 2. 泛型的特点2.1 函数泛化2.2 类型泛化 3. 类型约束3.1 类型集合3.2 interface 类型集合3.2.1 内置interface类型集合3.2.2 自定义interface类型集合3.2.2.1 任意类型元素3.2.2.2 近似类型元素3.2.2.3 联合类型元素 3.2.3 …

阅读更多...

Windows上安装Go并配置环境变量(图文步骤)

Windows上安装Go并配置环境变量(图文步骤)

前言 1. 本文主要讲解的是在windows上安装Go语言的环境和配置环境变量； Go语言版本：1.23.2 Windows版本：win11（win10通用） 下载Go环境下载go环境：Go下载官网链接(https://golang.google.cn/dl/) 等待…

阅读更多...

Windows的一些技巧

Windows的一些技巧

一、如何去掉桌面程序图标的小箭头 1、使用WIN + R 快捷键调出运行窗口 2、在运行窗口输入 regedit，打开注册表编辑器 3、在注册表编辑器中找到 HKEY_CLASSES_ROOT\lnkfile 4、在右侧窗格中找到 IsShortcut 项，右键删除二、WIN10如何打开图片查看器 1、使用WIN + R 快…

阅读更多...

kali——hping3的使用

kali——hping3的使用

目录前言 ping测试端口扫描编辑源IP伪造修改TTL值洪水攻击编辑前言 hping命令行工具主要用于构造和发送自定义的 TCP/IP 数据包。它是一个非常强大的工具，用于网络测试、安全审计和防火墙测试。 ping测试 hping3 -1 目标IP //此命令…

阅读更多...

Node.js基础与应用

Node.js基础与应用

目录 1.要求 2.创建第一个Node.js代码 2.1 安装 VSCode 和所需插件 2.2 安装 Node.js 和 Yarn 2.3 创建 Node.js 项目 2.3.1 在 VSCode 中打开一个新文件夹 2.3.2 初始化 Node.js 项目 2.3.3 安装 Express 2.4 编写 Node.js 应用 2.4.1 创建主文件 2.4.2 运行应用 …

阅读更多...

Golang | Leetcode Golang题解之第475题供暖器

Golang | Leetcode Golang题解之第475题供暖器

题目： 题解： func findRadius(houses, heaters []int) (ans int) {sort.Ints(houses)sort.Ints(heaters)j : 0for _, house : range houses {dis : abs(house - heaters[j])for j1 < len(heaters) && abs(house-heaters[j]) > abs(house-…

阅读更多...

【vue+printJs】前端打印, 自定义字体大小, 自定义样式, 封装共享样式

【vue+printJs】前端打印, 自定义字体大小, 自定义样式, 封装共享样式

效果示例思维导图目录 1,基本使用1, 依赖下载2, 页面导入3, 修改字体大小(可行但不推荐) 2, 自定义样式,字体大小1, 修改字体大小(推荐)2, 自定义样式3, 封装共享样式 3, 去除页面页脚内容4, 测试案例demo, 直接cv可用5, print-js的其他参数说明 1,基本使用 1, 依赖下载 …

阅读更多...

Java 小游戏《超级马里奥》

Java 小游戏《超级马里奥》

文章目录一、效果展示二、代码编写1. 素材准备2. 创建窗口类3. 创建常量类4. 创建动作类5. 创建关卡类6. 创建障碍物类7. 创建马里奥类8. 编写程序入口一、效果展示二、代码编写 1. 素材准备首先创建一个基本的 java 项目，并将本游戏需要用到的图片素材 image…

阅读更多...

小马识途海外媒体推广有何优势？

小马识途海外媒体推广有何优势？

互联网让地球变得像一个村子一样，信息可以瞬间变得人尽皆知，商品和服务也同样习惯了跨国合作。中国不少物美价廉的产品在世界各地都很受欢迎，国内小资群体对国外的服饰和美妆更是偏爱有加。小马识途营销顾问认为，中国品牌不出走国…

阅读更多...

“趋势买点”，智能捕捉市场底部的工具指标

“趋势买点”，智能捕捉市场底部的工具指标

“趋势买点”，智能捕捉市场底部的工具指标分享的这个指标包含副图与主图，不含未来函数，旨在通过分析市场波动找到可靠的买点信号，以便在底部进行抄底操作。 "趋势买点"的副图信号作为判断市场底部的重要依据&#xff0…

阅读更多...

只想简单跑个 AI 大模型，却发现并不简单

只想简单跑个 AI 大模型，却发现并不简单

之前我用 Ollama 在本地跑大语言模型（可以参考《AI LLM 利器 Ollama 架构和对话处理流程解析》）。这次想再捣鼓点进阶操作，比如 fine-tuning。我的想法是：既然有现成的大模型，为什么不自己整理些特定领域的数据集&am…

阅读更多...

6云图书管理系统-图书展示

6云图书管理系统-图书展示

1 /src/store中新增userInfo.js，用于保存用户的登录信息 import { defineStore } from "pinia" import { ref } from vueexport const userInfoStore defineStore(userInfo, () > {//1.定义用户信息const info ref({})const isAdmin ref(false)//2…

阅读更多...

css 仿微信朋友圈图片自适应九宫格

css 仿微信朋友圈图片自适应九宫格

不好用请移至评论区揍我原创代码，请勿转载，谢谢！示例效果 1 ~ 5张图与5 ~ 9张图代码实现 <view style="

阅读更多...

卸载Python

卸载Python

1、查看安装框架位置并删除 Sudo rm -rf /Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.8 2、查看应用并删除在 /Applications/Python 3.x 看是否存在，如果存在并删除。 3、删除软连接 ls -l /usr/bin/py* 或 ls -…

阅读更多...

最新文章

推荐文章