通过 Nginx 实现 RKE2 高可用部署

在 RKE2 高可用部署中,需要在多个 Server 节点前提供一个固定的访问入口,作为节点注册和 Kubernetes API 访问地址。

RKE2 Server 默认监听以下端口:

  • 9345:RKE2 Supervisor 端口,用于新节点注册和集群内部通信
  • 6443:Kubernetes API Server 端口,用于 Kubernetes API 访问

因此,负载均衡器需要同时转发 93456443 两个端口。建议使用 Layer 4 TCP Load Balancer、DNS 或 VIP 作为固定入口,并在 RKE2 配置中通过 tls-san 添加 LB 的 IP 或域名,避免通过 LB 访问时出现证书校验错误。

参考文档:https://ee.docs.rancher.cn/docs/installation/kubernetes-cluster-setup/high-availability%20/rke2-ha-install-for-nginx

部署架构示意图:

Read more

Harvester VM OOM 问题排查

Harvester 版本:v1.3.2

问题现象:环境中的 VM 发生 OOM,对应的 virt-launcher Pod 重启。

Read more

SUSE Observability 使用随记

SUSE Observability(前身为 StackState)可用于观察 Kubernetes 集群及其工作负载。

SUSE Observability 主要分为 Server 和 Agent 两个部分,Server 负责存储和展示数据,Agent 负责采集数据并发送给 Server。

Server 的组件有:

  1. Topology (StackGraph)
  2. Metrics (VictoriaMetrics)
  3. Traces (ClickHouse)
  4. Logs (ElasticSearch)

Read more

RKE/RKE2 使用代理获取镜像

由于国内网络访问受限,从 Docker Hub 等海外镜像仓库拉取镜像时可能会非常缓慢,甚至出现拉取失败的情况。

如果环境中已有可用代理,可以为 RKE Docker 或 RKE2 Containerd 配置代理,从而通过代理拉取镜像。

Read more

SUSE AI 使用随记

SUSE AI 是一个开放的生成式人工智能解决方案,主要包含以下组件:

  1. Ollama:简化本地设备上大型语言模型 (LLM) 安装和管理的平台。
  2. Open WebUI:Ollama LLM 运行程序的可扩展网络用户界面。
  3. Milvus:为生成式人工智能应用构建的向量数据库,性能损失最小。

部署参考链接:https://documentation.suse.com/suse-ai/1.0/html/AI-deployment-intro/index.html

Read more

Rancher Monitoring V2 Prometheus PVC 扩容

根据 Prometheus Operator 官方文档 描述,即使 StorageClass 支持调整大小,Kubernetes(目前)也不支持通过 StatefulSets 扩展卷。这意味着在更新 Prometheus 等自定义资源的 spec.storage 字段中的存储请求时,Operator 必须删除/创建底层的 StatefulSet,而相关的 PVC 不会扩展。

Read more
You need to set client_id and slot_id to show this AD unit. Please set it in _config.yml.