连接实验室服务器流程记录

注意:需要在校园网环境下连接操作

一、通过 XShell 等其他 SSH 远程终端软件连接到服务器的 IP

ARNgk6Vmxw3rHFT

根据群内文档的用户名和密码登录

登陆后会自动创建自己的家目录

image-20221201185540241

二、编辑个人的配置文件

image-20221201182633929

.bashrc 文件加入如下代码

1
2
3
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export PATH=/home/anaconda3/bin:$PATH

保存后使用 source ~/.bashrc 命令立即更新配置

三、基本环境配置

  1. conda 虚拟环境配置

    编辑家目录中的 .condarc 文件,配置 conda 镜像源

    image-20221201183526089

    创建完自己的虚拟环境后通过 source activate 激活

  2. 端口转发

    设置 XShell 的隧道转发或登录时使用命令 ssh -L8888:localhost:8888 username@IPAddress 将远程机器的端口进行映射

四、使用

输入 jupyter notebook 打开 jupyter 记事本 ,在本机浏览器端查看 8888 端口

image-20221201184050902

随便试了下 ResNet 跑 Fashion- MNIST 数据集,速度为 6104.7 examples/sec,作为对比,在colab 免费版分配到 T4 的情况下同样的代码速率为 1642.0 examples/sec。

WoW!多了一个呆在寝室不去工位的理由(逃)

附:服务器基本信息

  • 配置:四台 4 卡 RTX 3090

  • 操作系统:Ubuntu 20.04

  • 预装 CUDA 版本:11.7 CUDNN 版本:8302

  • Anaconda 默认安装目录为 /home/anaconda3

  • base 虚拟环境库版本:pytorch 1.12.1 ,torchvision 0.13.1,cudatoolkit 11.6

  • 系统磁盘 500 G,挂载机械磁盘,已经挂载在每台机器的 /data 目录 下,同时映射在登录节点的 /home 目录下的 mnt0,mnt1,mnt2, mnt3 四个文件夹,分别为序号为 ai22[01-08],ai22[09-16], ai22[17-24],ai22[25-32] 的目录,具体序号参看群文件