织梦 帝国 学校网站网络营销公司注册找哪家
文章目录
- 1.OSD坏盘更换操作
- 2.判断OSD是否出现故障的思路
- 3.模拟osd.5故障
- 4.OSD故障更换硬盘流程
- 4.1.将故障的osd.5从集群中删除
- 4.1.1.从OSD Map中将故障的OSD删除
- 4.1.2.从Crush Map中将故障的OSD删除
- 4.1.3.在OSD列表中将故障的OSD删除
- 4.1.4.将故障的OSD认证信息删除
- 4.1.5.验证集群中是否已经将故障的OSD删除
- 4.2.换盘操作
1.OSD坏盘更换操作
在实际环境中,可能会经常遇到OSD对应的硬盘出现了故障,此时就需要对这个OSD进行操作了。
坏盘更换中包括两个阶段:
- 首先将OSD从Ceph集群中踢出,也就是所谓的缩减OSD。
- 硬盘修复完成后再以新的OSD的方式加入到集群中。
OSD从集群中踢出时,也会触发Reblanceing数据重分布机制,将OSD中的数据迁移到其他的OSD中,当OSD的数据全部同步完成后,再将OSD彻底移除。
硬盘修复成功后,以新的OSD加入到集群中,此时也会触发Reblanceing机制,将数据再次同步到这个OSD中。
2.判断OSD是否出现故障的思路
比如说ceph-node-3节点中的osd.5出现了故障,对应的状态就会是down,首先去登陆上这台机器,看看系统日志有没有说明硬盘问题。
如果硬盘出现了坏道的情况,就会影响整个集群的性能,从而拖垮整个Ceph集群,遇到这种情况执行上述命令不会显示d