您好,登錄后才能下訂單哦!
仍然會監管ceph集群健康狀態 ,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
我們 需要 監測 的集群 正在 運行的各種服務進程;集群 所有 pgs 正常 狀態 為 active + clean,其余 均為 異常 狀態
集群 基礎 監測 主要包括 檢查 集群 健康狀態,容量 使用 情況,monitor、osd 守護 進程的運行狀態(up、down)
哈哈,平時 比較懶,每次都要 輸入 那么多 ceph,有點煩,原來 ceph 有個 交互模式(沒有 命令 記憶功能,哈哈哈,失算)
# ceph ## 查看 集群當前 狀態,HEALTH_OK、HEALTH_WARN、HEALTH_ERR ceph> health ## 效果 與 ceph -s 一樣 ceph> status ## 集群 mon 相關 信息 ceph> quorum_status ceph> mon_status
哈哈,還是 使用 命令行 操作吧,能通過 上下 按鍵 查找,同樣的命令 連續執行時, 不需要 不停的輸入
## 這兩個 命令 執行 的效果一樣 # ceph status # ceph -s ## health : HEALTH_OK、HEALTH_WARN、HEALTH_ERR # ceph health [detail]
備注:
集群 健康 狀態 "HEALTH_OK" 表示 集群 健康正常,若出現 "HEALTH_WARN XXX num placement group stale"時,等待 幾分鐘,一般 都可 自動 恢復 正常
某些 情況下,需要 動態 持續 的 關注 集群 事件信息
# ceph -w
集群 處于健康狀態運行,凡事都有個度,存儲集群也是一樣的,不可能一直寫入,到了后期需要關注容量狀態,畢竟數據量越大,會導致整個集群 的性能有所降低(畢竟不好好檢測容量狀態,數據阻塞導致的問題可不是那么 好解決的啦);該刪的數據就刪掉,實在沒容量啦,就擴容吧,理論上是無限擴展;還有就是數據均衡的問題
## ceph中,所有的數據都寫入數據池中(抽象出來的概念) # ceph df
一般 情況下,osd 使用超過85%,就不會往該osd 寫入數據;集群整體容量超過 95%集群就不能寫入了;可以調整配置,控制集群的容量,一般不建議調太大;osd 超過 默認告警值 就想想數據能不能均衡;集群超過告警值, 擴容吧。
## 配置文件中添加容量配置參數,記得重啟相關服務讓配置生效 ## 哈哈,其實也可以在線修改配置參數,后面單獨編寫文件介紹嘍 # vim /etc/ceph/ceph.conf ... ## 集群 整體 容量 使用 上限 mon_osd_full_ratio = "0.950000" ## 單個 osd 容量 使用 上限 mon_osd_nearfull_ratio = "0.850000" ...
一般 情況下,線上環境都會部署多個mon; 所以對集群進行數據讀寫時,需要檢查mon狀態
## dump比stat更詳細,quorum_status比dump更詳細 # ceph mon stat # ceph mon dump # ceph quorum_status -f json-pretty
in:osd 加入集群
out:osd 沒有 加入集群
down:osd 加入集群,但是服務停止
up:osd 加入集群,并且服務正在運行
## 檢查所有osd狀態 # ceph osd stat # ceph osd dump # ceph osd tree
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。