博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
# 运维日志20180104—系统开机(软件部分)
阅读量:2488 次
发布时间:2019-05-11

本文共 723 字,大约阅读时间需要 2 分钟。

开机流程

1、首先开机盘阵

2、开启MDS/MDT
3、开启OSS/OST
4、挂载Lustre

Note:这里的管理节点MN0是自动加电启动,并且在开启盘阵后需要在管理节点开启DHCP服务进行后续节点的拉核启动。

挂载Lustre

实际上在开机过程中Lustre基本上是会自动挂载的,并不需要手动挂载。但是总会有些节点无法自动挂载。

此时就需要手动挂载,以oss为例:

# mount -t lustre /dev/mapper/mpatha /mnt/oss_mpatha

当oss恢复正常后,在管理节点使用查看链接,会发现正在RECOVERY,当等待一段时间后依然没有回复正常,需要强制恢复:

# lctl --device=
abort_recovery

可以通过在mds上通过一下命令查询到:

[root@mds0 ~]# lctl dl

加载Lustre模块和lnet:

# modprobe lustre# modprobe lnet

今天发现有些节点无法挂载上是因为网络的问题,重启高速网命令:

# systemctl retart nionet

后记

oss连接的盘阵查看:

# 多路径# multipath -ll# 或者# lsblk

系统启动后发现昨天的强制重启导致slurm存在问题,具体问题不知,仅仅记得同事删除了mysql.sock,特此记录一下:

# rm `which mysql.sock`

redhat 6 系统管理节点重启slurm:

# service slurmdbd restart# service mysqld restart# service slurmd restart

转载地址:http://fgarb.baihongyu.com/

你可能感兴趣的文章
C#修改JPG图片EXIF信息中的GPS信息
查看>>
从零开始的Docker ELK+Filebeat 6.4.0日志管理
查看>>
Sequelize的原始查询的时区问题
查看>>
How it works(1) winston3源码阅读(A)
查看>>
How it works(2) autocannon源码阅读(A)
查看>>
How it works(3) Tilestrata源码阅读(A)
查看>>
How it works(12) Tileserver-GL源码阅读(A) 服务的初始化
查看>>
uni-app 全局变量的几种实现方式
查看>>
echarts 为例讲解 uni-app 如何引用 npm 第三方库
查看>>
uni-app跨页面、跨组件通讯
查看>>
springmvc-helloworld(idea)
查看>>
JDK下载(百度网盘)
查看>>
idea用得溜,代码才能码得快
查看>>
一篇掌握python魔法方法详解
查看>>
数据结构和算法5-非线性-树
查看>>
数据结构和算法6-非线性-图
查看>>
数据结构和算法7-搜索
查看>>
数据结构和算法8-排序
查看>>
windows缺少dll解决办法
查看>>
JPA多条件动态查询
查看>>