远程服务器连接
连接实验室服务器流程记录
注意:需要在校园网环境下连接操作
一、通过 XShell 等其他 SSH 远程终端软件连接到服务器的 IP
根据群内文档的用户名和密码登录
登陆后会自动创建自己的家目录
二、编辑个人的配置文件
在 .bashrc
文件加入如下代码
1 | export PATH=/usr/local/cuda/bin${PATH:+:${PATH}} |
保存后使用 source ~/.bashrc
命令立即更新配置
三、基本环境配置
conda 虚拟环境配置
编辑家目录中的
.condarc
文件,配置 conda 镜像源创建完自己的虚拟环境后通过
source activate
激活端口转发
设置 XShell 的隧道转发或登录时使用命令
ssh -L8888:localhost:8888 username@IPAddress
将远程机器的端口进行映射
四、使用
输入 jupyter notebook
打开 jupyter 记事本 ,在本机浏览器端查看 8888 端口
随便试了下 ResNet 跑 Fashion- MNIST 数据集,速度为 6104.7 examples/sec,作为对比,在colab 免费版分配到 T4 的情况下同样的代码速率为 1642.0 examples/sec。
WoW!多了一个呆在寝室不去工位的理由(逃)
附:服务器基本信息
配置:四台 4 卡 RTX 3090
操作系统:Ubuntu 20.04
预装 CUDA 版本:11.7 CUDNN 版本:8302
Anaconda 默认安装目录为 /home/anaconda3
base 虚拟环境库版本:pytorch 1.12.1 ,torchvision 0.13.1,cudatoolkit 11.6
系统磁盘 500 G,挂载机械磁盘,已经挂载在每台机器的 /data 目录 下,同时映射在登录节点的 /home 目录下的 mnt0,mnt1,mnt2, mnt3 四个文件夹,分别为序号为 ai22[01-08],ai22[09-16], ai22[17-24],ai22[25-32] 的目录,具体序号参看群文件