本文共 723 字,大约阅读时间需要 2 分钟。
1、首先开机盘阵
2、开启MDS/MDT 3、开启OSS/OST 4、挂载LustreNote:这里的管理节点MN0是自动加电启动,并且在开启盘阵后需要在管理节点开启DHCP服务进行后续节点的拉核启动。
实际上在开机过程中Lustre基本上是会自动挂载的,并不需要手动挂载。但是总会有些节点无法自动挂载。
此时就需要手动挂载,以oss为例:# mount -t lustre /dev/mapper/mpatha /mnt/oss_mpatha
当oss恢复正常后,在管理节点使用查看链接,会发现正在RECOVERY,当等待一段时间后依然没有回复正常,需要强制恢复:
# lctl --device=abort_recovery
可以通过在mds上通过一下命令查询到:
[root@mds0 ~]# lctl dl
加载Lustre模块和lnet:
# modprobe lustre# modprobe lnet
今天发现有些节点无法挂载上是因为网络的问题,重启高速网命令:
# systemctl retart nionet
oss连接的盘阵查看:
# 多路径# multipath -ll# 或者# lsblk
系统启动后发现昨天的强制重启导致slurm存在问题,具体问题不知,仅仅记得同事删除了mysql.sock,特此记录一下:
# rm `which mysql.sock`
redhat 6 系统管理节点重启slurm:
# service slurmdbd restart# service mysqld restart# service slurmd restart
转载地址:http://fgarb.baihongyu.com/