Posted 2024-09-14Updated 2025-05-294 minutes read (About 647 words)

集群频繁触发 etcdDatabaseHighFragmentationRatio 告警, PrometheusRule 内容如下：

- alert: etcdDatabaseHighFragmentationRatio
  annotations:
    description: 'etcd cluster "{{ $labels.job }}": database size in use on instance
      {{ $labels.instance }} is {{ $value | humanizePercentage }} of the actual
      allocated disk space, please run defragmentation (e.g. etcdctl defrag) to
      retrieve the unused fragmented disk space.'
    runbook_url: https://etcd.io/docs/v3.5/op-guide/maintenance/#defragmentation
    summary: etcd database size in use is less than 50% of the actual allocated
      storage.
  expr: (last_over_time(etcd_mvcc_db_total_size_in_use_in_bytes{job=~".*etcd.*"}[5m])
    / last_over_time(etcd_mvcc_db_total_size_in_bytes{job=~".*etcd.*"}[5m])) <
    0.5 and etcd_mvcc_db_total_size_in_use_in_bytes{job=~".*etcd.*"} > 104857600
  for: 10m
  labels:
    severity: warning

Posted 2024-06-29Updated 2025-05-294 minutes read (About 610 words)

节点根目录被打满导致的ETCD憨批修复记录

背景

事情发生在 UAT 环境的其中一台 Controller 节点，节点根目录被打满，同时 etcd 数据没有落盘到独立的磁盘中，导致 etcd 憨批，节点出现 notready

Posted 2024-03-19Updated 2025-05-293 minutes read (About 432 words)

etcd leader选举

etcd 是基于 raft 算法进行选举，而 raft 是一种管理日志一致性的协议，将系统中的角色分为三个

leader: 接受客户端的请求，并向 follower 发送同步请求日志
follower: 接收 leader 同步的日志
candidate: 候选者角色，在选举过程中发挥作用

背景

Links

Recents

Archives

Tags

Subscribe for updates

follow.it