KUST_LI计算机视觉实验室服务器安装与管理

第一步：安装 Linux-Ubuntu系统

系统语言设置为英文 ENGLISH，防止系统 BUG；
选择-清除整个磁盘并安装系统（不要清除机械硬盘内容）；
设置用户名和密码，实验室统一
时区设置为：中国上海
其余全部默认设置

开机后设置磁盘挂载

在系统设置中找到 desk 打开，然后在系统盘中把全部分区合并为 1 个（方便数据存储），然后初始化该分区，最后重命名分区路径到/home/user/data 并重启加载硬盘。

第二步：配置深度学习环境

安装英伟达驱动
安装 CUDA
安装 Anaconda/MiniAnaconda

# 更新包
sudo apt-get upgrade                                                                          
# 或者 
sudo apt update# 安装必备依赖：包括gcc g++ mark等必备依赖
sudo apt install build-essential
# 安装指定依赖
sudo apt install gcc-9 g++-9# 验证安装
gcc --version# 安装包
sudo sh *.sh
sudo sh *.run# 1.安装英文达驱动
sudo sh *.sh
# 如果报错记得搜索，可能原因主板驱动启动造成冲突，因此需要关闭主板驱动
# https://zhuanlan.zhihu.com/p/648606141
# 查看驱动
nvidia-smi
# 查看cuda版本
nvcc -V# 2.安装 cuda11.1
sudo sh *.sh
# 取消选择 driver，因为在 NVIDIA 驱动中已经包含了
# 此时 nvcc -V命令应该不起作用，因此需明确指向
# 打开家目录的.bashrc文件
gedit ~/.bashrc
# 在最后 2 行加上该命令，记得把 cuda 版本改成你一样的
export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# 关闭并保存更新
source ~/.bashrc
# 继续下载 cudnn 深度学习加速库，移动到对应文件夹：这一步应该是不必须的，对其进行扩充专用于深度学习加速
# 英文达官网下载对应 cuda 版本的 cuDNN
# 将解压后的文件全部放到自己cuda对应版本/usr/local/cuda-11.1的include和lib64中
# 使用命令验证安装是否成功
nvcc -V# 3.安装Anaconda：不使用sudo 命令，将其安装在 user 下，如果使用 sudo 命令会安装在 root 
下，现在安装的目录是:/home/user/anaconda
# 一直按 enter，阅读完说明才开始安装
# 最后一步初始化记得选择：yes，否则需要手动设置默认为 conda 的 base 环境
# 设置默认打开 codna 的 base 环境
vim  ~/.bashrc
# 文件最后添加
export PATH="~/anaconda3/bin":$PATH
source ~/anaconda3/bin/activate # 终端默认的 python 为 anaconda的 base
# 关闭并保存更新
source ~/.bashrc# 4.安装深度学习环境
# anaconda 操作参考：https://yidamyth.blog.csdn.net/article/details/123431626
https://pytorch.org/get-started/previous-versions/
# 找到指定版本，直接用官网的链接下载
pip install torch==1.11.0+cu102 torchvision==0.12.0+cu102 torchaudio==0.11.0 --extra-index-url https://download.pytorch.org/whl/cu102
# 查看是否安装 torch 成功
python
import torch       
torch.cuda.is_available()# 额外命令
# 打开根目录下的命令行
control+command+T                                       
# 可视化打开文本
gedit text.txt
# 安装 ssh 远程连接
sudo apt-get install openssh-server
# 查看 IP 地址
ifconfig# 禁用 nouveau
# 创建
sudo vim /etc/modprobe.d/blacklist-nouveau.conf  
# 插入
blacklist nouveau  
options nouveau modeset=0  
# 更新设置并重启sudo update-initramfs -u  sudo reboot  
# 查看，无输入即禁用成功
lsmod | grep nouveau

第三步：网络设置

首先在自己 Ubuntu 服务器上，将 IP 地址设置为手动

Gateway 和 DNS 保持一致，前面9 位与学校 IP 保持一致最后为.1，其中的 Addresses前面相同.本机端口，端口命名规则为： 100+本机号，比如6 号机位 106。
路由器上设置端口转发（路由器管理界面的高级设置中），用于本机访问路由器下的指定服务器

6 号机的外部端口命名规则为： 1000+6=1006