环境配置与搭建

安装pytorch

官网连链接:https://pytorch.org/

特殊包名

cv2

pip install opencv-python  

sklearn

pip install scikit-learn

PIL

pip install Pillow

使用jupyter notebook

pip install jupyter

安装显卡驱动

Windows

Linux

视频教程:
【ubuntu24 7分钟安装 cuda cudnn tensorRT】

【ubuntu系统下搭建pytorch的GPU运行环境(显卡驱动、cuda、cudnn安装)】

参考文章:Ubuntu安装和卸载CUDA和CUDNN

驱动安装

英伟达驱动下载地址:https://www.nvidia.cn/drivers/results/
选择对应的显卡驱动
在这里插入图片描述
不要直接点下载,赋值下载地址直接在服务器上用wget命令直接下载到服务器上。

在这里插入图片描述

1.下载驱动

wget https://us.download.nvidia.com/XFree86/Linux-x86_64/550.54.14/NVIDIA-Linux-x86_64-550.54.14.run

2.删除之前安装的驱动残留

sudo apt-get remove nvidia*

在这里插入图片描述

3.修改配置文件(禁用nouveau)

vim /etc/modprobe.d/blacklist.conf

打开文件后,末尾添加如下内容:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

4.重建initramfs image

echo options nouveau modeset=0|sudo tee -a /etc/modprobe.d/blacklist.conf
sudo update-initramfs -u
sudo reboot

重启后,执行下面命令,如果屏幕没有输出说明禁用nouveau成功

lsmod | grep nouveau

5.安装相关依赖

sudo apt-get update
sudo apt-get install g++ gcc make

6.执行安装命令

chmod +x NVIDIA-Linux-x86_64-550.54.14.run
sudo ./NVIDIA-Linux-x86_64-550.54.14.run --no-opengl-files

在这里插入图片描述
7.安装完成后重启服务器

sudo reboot

8.验证安装结果

nvidia-smi
安装CUDA

cuda官网下载地址:https://developer.nvidia.com/cuda-toolkit
如果需要特定版本可以修改网址如(cuda11.8.0版本):
https://developer.nvidia.com/cuda-11-8-0-download-archive

在这里插入图片描述
1.下载并安装

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run

安装过程进入安装页面:
1.输入accept
2.英伟达驱动之前已经安装(需要取消勾选)
3.安装完成
提示:
在这里插入图片描述
我们需要添加两个环境变量(PATH和LD_LIBRARY_PATH)

注意:安装完成后要注意查看提示信息,因为安装路径可能是/usr/local/cuda或者/usr/local/cuda-xx.x,这与后面添加环境变量以及安装卸载cudnn密切相关

2.添加环境变量

sudo vim ~/.bashrc
# 添加环境变量
######
# 必须
export PATH=$PATH:/usr/local/cuda-11.8/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.8/lib64
# 可选
export CUDA_HOME=:/usr/local/cuda-11.8
export CUDA_LIB_PATH=/usr/local/cuda-11.8/targets/x86_64-linux/lib
######
source ~/.bashrc

安装完成后查看CUDA版本

nvcc --version  
nvcc -V
卸载CUDNN

首先,需要找到并删除旧版本的 CuDNN 文件。假设 CUDA 安装在 /usr/local/cuda,你可以使用以下命令删除旧版本的 CuDNN 文件:

sudo rm /usr/local/cuda/include/cudnn*.h  
sudo rm /usr/local/cuda/lib64/libcudnn*  
安装CUDNN

下地址:https://developer.nvidia.com/cudnn-archive
在这里插入图片描述
在这里插入图片描述

################# 下载 ###############
# 这里下载可能需要登录验证,为了正确下载 CuDNN 文件,你需要在浏览器中登录 NVIDIA 开发者账号,并手动下载文件。然后将文件通过 SCP 或者其他文件传输方法上传到你的服务器上
wget https://developer.nvidia.com/downloads/compute/cudnn/secure/9.1.1/local_installers/12.x/cudnn-linux-x86_64-9.1.1.17_cuda12-archive.tar.xz#############  解压  ##################
tar -xvf cudnn-linux-x86_64-9.1.1.17_cuda12-archive.tar.xz###########   安装  ##################
# 拷贝(记得提前查看cudnn解压文件夹中是lib还是lib64)
sudo cp cudnn-linux-x86_64-9.1.1.17_cuda12-archive/include/cudnn*.h    /usr/local/cuda/include
sudo cp cudnn-linux-x86_64-9.1.1.17_cuda12-archive/lib/libcudnn*    /usr/local/cuda/lib64
# 加权限
sudo chmod a+r /usr/local/cuda/include/cudnn*.h   /usr/local/cuda/lib64/libcudnn*########## 验证是否安装成功 ###########
# 运行命令
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
# 若上述命令没有结果,则运行以下命令
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

验证显卡可用

nvidia-smi

pytorch验证

import torch
print(torch.__version__)
print(torch.cuda.is_available())
print(torch.version.cuda)
print(torch.backends.cudnn.version())

Pytorch

# Get cpu, gpu or mps device for training.
device = ("cuda"if torch.cuda.is_available()else "mps"if torch.backends.mps.is_available()else "cpu"
)
print(f"Using {device} device")

Tensorflow

通过docker配置深度学习环境

# 使用NVIDIA提供的CUDA 11.8镜像,基础镜像是Ubuntu 22.04  
FROM dockerproxy.net/nvidia/cuda:11.8.0-cudnn8-devel-ubuntu22.04  # 添加镜像的作者和合作信息  
LABEL com.uxhao.image.authors="ahaoao"  
LABEL com.uxhao.image.cooperation="VX:SystemUA"  # 设置时区、前端模式和路径环境变量  
ENV TZ=Asia/Shanghai \      DEBIAN_FRONTEND=noninteractive \      PATH=/opt/miniconda3/bin:$PATH   # 设置工作目录为/root  
WORKDIR /root  # 备份现有的apt源列表并替换为清华大学的源,加速软件包的下载  
RUN cp /etc/apt/sources.list /etc/apt/sources.list.back && \  rm -rf /etc/apt/sources.list  && \  echo "deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ noble main restricted universe multiverse \n\  
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ noble-updates main restricted universe multiverse \n\  
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ noble-backports main restricted universe multiverse \n\  
deb http://security.ubuntu.com/ubuntu/ noble-security main restricted universe multiverse \n" >> /etc/apt/sources.list    # 更新包列表  
RUN apt-get update  # 升级已安装的包  
RUN apt-get upgrade -y  # 安装并配置SSH服务  
RUN DEBIAN_FRONTEND=noninteractive apt-get install -y ssh && \  mkdir /var/run/sshd && \  echo 'root:root' | chpasswd && \  sed -i 's/^#PermitRootLogin.*/PermitRootLogin yes/' /etc/ssh/sshd_config && \  sed -i 's/UsePAM yes/#UsePAM yes/g' /etc/ssh/sshd_config  # 安装并配置时区数据  
RUN apt install -y tzdata && \  ln -fs /usr/share/zoneinfo/${TZ} /etc/localtime && \  echo ${TZ} > /etc/timezone && \  dpkg-reconfigure --frontend noninteractive tzdata  # 安装常用工具vim、git和net-tools  
RUN apt-get install -y vim && \  apt-get install -y git && \  apt-get install -y net-tools  # 配置SSH启动脚本,并添加到bashrc中  
RUN echo "service ssh start >>/root/start_ssh.log" >> ~/start_ssh.sh && \  chmod 777 ~/start_ssh.sh && \  echo "# <<< ssh <<< \nif [ -f /root/start_ssh.sh ]; then \n      /root/start_ssh.sh \nfi \n# <<< ssh <<<" >> ~/.bashrc  # 配置TensorBoard启动脚本,并添加到bashrc中  
RUN echo '#! /bin/bash\na=$(netstat -anp |grep 6006) \nif [ -z "$a" ] \nthen \nsource /opt/miniconda3/etc/profile.d/conda.sh \nconda activate cv \nnohup python /opt/miniconda3/envs/cv/lib/python3.10/site-packages/tensorboard/main.py --logdir /gemini/logs --bind_all > /root/start_tensorboard.log 2>&1 & \nfi' >> ./start_tensorboard.sh && \  chmod 777 ~/start_tensorboard.sh && \  echo "# <<< tensorboard <<< \nif [ -f /root/start_tensorboard.sh ]; then \n      /root/start_tensorboard.sh \nfi \n# <<< tensorboard <<<" >> ~/.bashrc  # 下载并安装Miniconda  
RUN wget -O /opt/Miniconda3-py310_24.3.0-0-Linux-x86_64.sh "https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-py310_24.3.0-0-Linux-x86_64.sh" && \  chmod +x /opt/Miniconda3-py310_24.3.0-0-Linux-x86_64.sh && \  sh -c '/bin/echo -e "\nyes\n\nyes" | sh /opt/Miniconda3-py310_24.3.0-0-Linux-x86_64.sh -b -p /opt/miniconda3'  # 设置Miniconda的路径  
ENV PATH=/opt/miniconda3/bin:$PATH  # 配置conda的源和其他设置  
RUN conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ && \  conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ && \  conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ && \  conda config --set show_channel_urls yes && \  conda config --set auto_activate_base no  && \  conda config --set ssl_verify false  # 创建名为cv的conda环境,Python版本为3.10.13  
RUN conda create --name cv python=3.10.13  # 使用bash作为默认shell,并激活conda环境  
SHELL ["/bin/bash","--login", "-c"]  
RUN export PATH=/opt/miniconda3/bin:$PATH && \  conda update --name base conda && \  conda init bash && \  source activate && \  conda activate cv && \  conda install -y --quiet numpy pyyaml mkl mkl-include setuptools cmake cffi typing && \  conda install -y --quiet -c mingfeima mkldnn && \  python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple && \  pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple && \  pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 -f https://mirrors.aliyun.com/pytorch-wheels/cu118 && \  pip install pydantic pandas pillow matplotlib comet_ml openpyxl opencv-python torchmetrics lightning scikit-learn scikit-image albumentations segmentation-models-pytorch tensorboard easydict packaging timm einops yarl typing_extensions  # 安装ffmpeg和其他依赖库  
RUN apt-get install -y ffmpeg libsm6 libxext6  # 创建目录结构  
RUN mkdir /gemini && \  mkdir /gemini/code && \  mkdir /gemini/output  # 清理不必要的文件  
RUN apt-get clean && \  rm -rf /var/lib/apt/lists/* /tmp/* /var/tmp/*      # 暴露端口  
EXPOSE 22  
EXPOSE 6006  
EXPOSE 8888  # 设置默认命令为bash  
CMD ["bash"]  
参考视频

搭建深度学习docker容器

2023完整版:深度学习环境在Docker上搭建(基于Linux和WSL)

Docker部署深度学习模型

从硬件到软件零起步搭建深度学习环境 | 配置深度学习环境: Docker + Conda + Pytorch + SSH + VS Code

Ubuntu系统卸载Miniconda3

如果安装时没有做特别的设置,那么Miniconda3将会安装在/opt/anaconda3/目录下。如果不在这个目录可以试着用find名称查找

cd /
sudo find / -name anaconda3

找到安装目录后,将其全部删除


rm -rf anaconda3
# 如果之前安装目录为miniconda3目录
rm -rf miniconda3  

然后打开~/.bashrc文件:

vim ~/.bashrc

将下面内容删除或者注释
在这里插入图片描述
Miniconda卸载完成!

Ubuntu系统安装Miniconda3

官网教程:https://docs.anaconda.com/miniconda/#quick-command-line-install

# 创建一个名为miniconda3的目录在/data目录下  
mkdir -p /data/miniconda3  
# 从Anaconda的官网上(镜像地址)下载最新版本的Miniconda安装脚本,并将其保存到刚才创建的目录中,命名为miniconda.sh  
wget https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-py310_24.3.0-0-Linux-x86_64.sh -O /data/miniconda3/miniconda.sh
# 以非交互模式安装Miniconda,-b选项表示静默安装,-u选项表示更新已存在的安装,-p选项指定安装路径为刚才创建的/data/miniconda3目录  
bash /data/miniconda3/miniconda.sh -b -u -p /data/miniconda3  
# 删除安装脚本,安装完成后不再需要该脚本  
rm /data/miniconda3/miniconda.sh  
添加环境变量

1.打开 ~/.bashrc 文件

vim ~/.bashrc  

2.在文件末尾添加以下行:

# 添加Miniconda到PATH环境变量中
export PATH=/data/miniconda3/bin:$PATH

3.更新文件

source ~/.bashrc  

4.验证conda是否正常可用

conda --version  
conda设置清华镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ 
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ 
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ 
conda config --set show_channel_urls yes 
conda config --set auto_activate_base no  
conda config --set ssl_verify false

查看设置结果

# 完整配置
conda config --show  
# 镜像通道配置
conda config --show channels  
pip设置清华镜像源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

查看设置结果

pip config list  

接下来就可以正常使用conda啦!

conda create -n yolov8 python==3.10conda activate yolov8
# 如果报错: CondaError: Run 'conda init' before 'conda activate'
# 如果执行conda init 后依然显示上面报错
# 解决方案如下:
conda init  
source ~/.bashrc  
连接pycharm

ubuntu系统的conda Executeable在哪个路径?
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/467254.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据库实验一】数据库及数据库中表的建立实验

目录 实验1 学习RDBMS的使用和创建数据库 一、 实验目的 二、实验内容 三、实验环境 四、实验前准备 五、实验步骤 六、实验结果 七、评价分析及心得体会 实验2 定义表和数据库完整性 一、 实验目的 二、实验内容 三、实验环境 四、实验前准备 五、实验步骤 六…

SpringBoot健身房管理:技术与实践

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统&#xff0c;它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等&#xff0c;非常…

CulturalBench :一个旨在评估大型语言模型在全球不同文化背景下知识掌握情况的基准测试数据集

2024-10-04&#xff0c;为了提升大型语言模型在不同文化背景下的实用性&#xff0c;华盛顿大学、艾伦人工智能研究所等机构联合创建了CulturalBench。这个数据集包含1,227个由人类编写和验证的问题&#xff0c;覆盖了包括被边缘化地区在内的45个全球区域。CulturalBench的推出&…

python登录功能实现

一.用python实现基本的登录功能 #-----------------1.基本登录功能------------------- nameinput("qq账号&#xff1a;") if name"jc":passwdinput("密码&#xff1a;")if passwd"123456":print("登录成功")else:print(&q…

如何使用Python管理环境变量

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 环境变量 📒📝 环境变量简介📝 Python 中的环境变量操作📝 获取环境变量📝 设置环境变量🔖 临时设置🔖 永久设置📝 删除环境变量📝 临时删除📝 永久删除📝 小结⚓️ 相关链接 ⚓️📖 介绍 📖 环境变量…

设置允许多用户远程登录 Windows 云服务器

操作场景 本文档以 Windows Server 2016 操作系统云服务器为例&#xff0c;指导您配置多用户远程登录 Windows 云服务器。 注意&#xff1a; 微软提供的多用户远程登录功能试用期为120天&#xff0c;若未购买多用户登录授权&#xff08;RDS CALs&#xff09;&#xff0c;则试…

喜报!景联文科技成功通过DCMM数据管理能力成熟度二级认证

10月30日&#xff0c;中国电子信息行业联合会公示了新一批DCMM贯标企业&#xff0c;景联文科技成功通过DCMM数据管理能力成熟度二级认证&#xff08;乙方认证&#xff09;。 DCMM是《数据管理能力成熟度评估模型》的简称&#xff0c;是我国在数据管理领域首个正式发布的国家标准…

Android setContentView执行流程(1)-生成DecorView

setContentView的流程主要就是讲在Activity的onCreate方法中调用setContentView方法之后&#xff0c;我们自定义的xml文件加载的过程&#xff0c;学习它可以让我们对整个View树的理解更加透彻&#xff0c;并且通过源码的学习&#xff0c;我们可以从根本上理解一些问题&#xff…

《操作系统 - 清华大学》2 -1:操作系统的启动

文章目录 0. 内容摘要1. 计算机体系机构概述2.启动2.1 启动时计算机内存和磁盘布局2.2. 内存映射 3. 系统调用、异常、中断3.1 定义3.2 背景3.3 中断、异常和系统调用的不同点3.3.1 源头3.3.2 处理时间3.3.3 响应 0. 内容摘要 两部分的内容 第一部分是启动。知道操作系统怎么是…

在服务器里安装2个conda

1、安装新的conda 下载地址&#xff1a;Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 本文选择&#xff1a;Anaconda3-2023.03-1-Linux-x86_64.sh 安装&#xff1a;Ubuntu安装Anaconda详细步骤&#xff08;Ubuntu22.04.1&#xff…

【系统集成项目管理工程师】知识点汇总

十五矩阵图 ITTO&#xff08;Input - Tools & Techniques - Output&#xff09;一览图 整合管理、范围管理 进度管理、成本管理 成本管理&#xff08;续&#xff09;、质量管理、资源管理 沟通管理、风险管理 风险管理&#xff08;续&#xff09;、采购管理、干系人管理

Java | Leetcode Java题解之第552题学生出勤记录II

题目&#xff1a; 题解&#xff1a; class Solution {static final int MOD 1000000007;public int checkRecord(int n) {long[][] mat {{1, 1, 0, 1, 0, 0},{1, 0, 1, 1, 0, 0},{1, 0, 0, 1, 0, 0},{0, 0, 0, 1, 1, 0},{0, 0, 0, 1, 0, 1},{0, 0, 0, 1, 0, 0}};long[][] re…

极品模板内容付费管理系统(PHP内容知识付费系统)

极品模板内容付费管理系统是一款基于PHP和MySQL技术开发的源码产品&#xff0c;旨在为用户提供一个功能全面、易于管理和扩展的内容付费平台。该系统支持多种付费模式&#xff0c;具备强大的内容管理功能&#xff0c;适合各类内容创作者和企业家构建知识付费、会员服务、在线教…

设计者模式之策略模式

前言 在软件构建过程中&#xff0c;某些对象使用的算法可能多种多样&#xff0c;经常改变&#xff0c;如果将这些算法都写在对象中&#xff0c;将会使对象变得异常复杂&#xff1b;而且有时候支持不频繁使用的算法也是一个性能负担。 如何在运行时根据需要透明地更改对象的算…

【AIGC】如何通过ChatGPT轻松制作个性化GPTs应用

创建个性化的GPTs应用是一个涉及技术、设计和用户体验的过程。以下是详细步骤&#xff1a; ###1.确定应用目标和用户群体 在开始之前&#xff0c;你需要明确你的应用的目标和目标用户。这将帮助你在设计、开发和个性化方面做出相应的决策。例如&#xff0c;如果你的应用是为了…

LeetCode 热题 100之 堆

1.数组中第k个最大元素 和Acwing 786 第k个数一模一样 排序 思路分析1&#xff1a;此题要求时间复杂度未为O(n)。虽然库函数sort和快速排序都能过&#xff0c;但是时间复杂度不满足条件。下面优化快速排序&#xff0c;写一个快速选择算法。我们可以引入随机化来加速这个过程&…

redis笔记-数据结构

zset zset一方面它是一个 set&#xff0c;保证了内部value 的唯一性&#xff0c;另一方面它可以给每个 value 赋予一个 score&#xff0c;代表这个 value 的排序权重。 zset的底层是由字典和跳表实现。 字典主要用来存储value和score的对应关系。跳表这个数据结构主要用来提…

day20-21之间的项目实战:若依ruoyi开发(可以跳过)

一&#xff0c;项目概述 官网文档地址&#xff1a;http://doc.ruoyi.vip/ rouyi是一个后台管理系统&#xff0c;基于经典技术组合&#xff08;spring boot&#xff0c;apache shiro&#xff0c;mybatis&#xff0c;thymeleaf&#xff09;主要是让开发者注重专注业务&#xff0…

【Android】名不符实的Window类

1.“名不符实”的Window类 Window 是一个窗口的概念&#xff0c;是所有视图的载体&#xff0c;不管是 Activity&#xff0c;Dialog&#xff0c;还是 Toast&#xff0c;他们的视图都是附加在 Window 上面的。例如在桌面显示一个悬浮窗&#xff0c;就需要用到 Window 来实现。Wi…

SDL事件相关

文章目录 事件相关的函数和数据结构用户自定义事件代码相关&#xff1a; 事件相关的函数和数据结构 SDL_WaitEvent :等待一个事件SDL_PushEvent 发送一个事件SDL_PumpEvents(): 将硬件设备产生的时间放入事件队列 &#xff0c;用于读取事件&#xff0c;在调用该函数之前&#…