Harvester 版本:v1.3.2
问题现象:环境中的 VM 发生 OOM,对应的 virt-launcher Pod 重启。
Harvester 版本:v1.3.2
问题现象:环境中的 VM 发生 OOM,对应的 virt-launcher Pod 重启。
RKE/RKE2 Nginx Ingress Controller 自定义配置
RKE 通过 cluster.yaml 中配置,RKE2 通过 HelmChartConfig 配置。
RKE2 是通过 HelmChartConfig CRD 进行附加配置,所以要配置 CoreDNS 的话,建议也是通过这种方式进行配置。
可选参数参考:https://github.com/rancher/rke2-charts/tree/main/charts/rke2-coredns/rke2-coredns
SUSE Observability(前身为 StackState)可用于观察 Kubernetes 集群及其工作负载。
SUSE Observability 主要分为 Server 和 Agent 两个部分,Server 负责存储和展示数据,Agent 负责采集数据并发送给 Server。
Server 的组件有:

SUSE AI 是一个开放的生成式人工智能解决方案,主要包含以下组件:

部署参考链接:https://documentation.suse.com/suse-ai/1.0/html/AI-deployment-intro/index.html
RKE2 Cilium 配置 Cluster Mesh 实现跨集群通信
通过 Cilium 的能力实现 Kubernetes 集群连接在一起来构建一个网状集群,在所有集群之间启用 pod-to-pod 连接,定义全局服务来平衡集群之间的负载,并执行安全策略来限制访问。
官方文档:https://docs.cilium.io/en/stable/network/clustermesh/clustermesh/#enable-clustermesh
Rancher Monitoring V2 Prometheus PVC 扩容
根据 Prometheus Operator 官方文档 描述,即使 StorageClass 支持调整大小,Kubernetes(目前)也不支持通过 StatefulSets 扩展卷。这意味着在更新 Prometheus 等自定义资源的 spec.storage 字段中的存储请求时,Operator 必须删除/创建底层的 StatefulSet,而相关的 PVC 不会扩展。
Rancher Pod Metrics 部分 Panel No data 问题排查
Rancher Pod Metrics 有部分 Panel 显示 No data,只有 Memory Utilization 显示正常:

NeuVector 有一个名为 nvprotect 的内部保护机制,用于限制用户对 NeuVector pod 的访问权限。
例如 sh、ls 等命令是无法使用的:

如果需要关闭,可以通过接口进行关闭,此处提供脚本,支持关闭 Controller、Scanner、Enforcer 的 nvprotect。