手机版
你好,游客 登录 注册
背景:
阅读新闻

Proxmox ceph故障处置备忘

[日期:2019-07-20] 来源:51cto.com/sery  作者:sery [字体: ]

刚才查看proxmox集群运行状态,没想健康状态那里出个大红叉。

虽然不影响业务,但有问题,还是得马上处理。鼠标点这个红叉,看看具体是什么报错!

再点第二个小红叉后边的“i”图标,更详细的信息出来了,如下图所示:

原来是一个pg故障,尝试用ceph进行修复,具体的操作如下:

ü  登录系统(debian)确定问题是否如web管理页面的错误相一致

root@pve47:~# ceph health detail
HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistent
OSD_SCRUB_ERRORS 5 scrub errors
PG_DAMAGED Possible data damage: 1 pg inconsistent
pg 2.162 is active+clean+inconsistent, acting [3,0,10]


root@pve47:~# ceph health detail

HEALTH_ERR 5 scrub errors; Possible data damage: 1 pg inconsistent

OSD_SCRUB_ERRORS 5 scrub errors

PG_DAMAGED Possible data damage: 1 pg inconsistent

pg 2.162 is active+clean+inconsistent, acting [3,0,10]

从输出可知,确实发生了故障。

ü  执行修复

root@pve47:~#  ceph pg repair 2.162
instructing pg 2.162 on osd.3 to repair

root@pve47:~#  ceph pg repair 2.162

instructing pg 2.162 on osd.3 to repair

从修复输出可知,发生故障的磁盘是osd.3,那么就在proxmox的web管理界面界面找到它。

ü  选中磁盘osd.3,然后鼠标点击重载。等待片刻,再换回到数据中心界面进行查看。

运气还不错,故障得以恢复!

linux
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款