consul 集群搭建consul agent -data-dir /tmp/node0 -node=node0 -bind=192.168.64.59 -datacenter=dc1 -ui - lient=192.168.64.59 -server -bootstrap-expect 1 consul agent -data-dir /tmp/node1 -node=node1 -bind=192.168.64.94 -datacenter=dc1 -datacenter=dc1 -ui consul agent -data-dir /tmp/node2 -node=node2 -bind=192.168.64.249 -datacenter=dc1 -ui client=192.168.64.249 consul join 192.168.64.59 consul members -rpc-addr=192.168.64.59:8400 agent -data-dir /tmp/node0 -node=node0 -bind=192.168.64.59 -datacenter=dc1 -ui -server bootstrap-expect 1 consul agent -server -bootstrap-expect 3 -data-dir /tmp/consul -node 192.168.64.59-datacen er0 码力 | 2 页 | 124.59 KB | 1 年前3
36-云原生监控体系建设-秦晓辉个人主页:https://ulricqin.github.io/ 大纲 • 云原生之后监控需求的变化 • 从Kubernetes架构来看要监控的组件 • Kubernetes所在宿主的监控 • Kubernetes Node组件监控 • Kubernetes控制面组件监控 • Kubernetes资源对象的监控 • Pod内的业务应用的监控 • 业务应用依赖的中间件的监控 云原生之后监控需求的 变化 云原生之后监控需求的变化 syscall 等)做一些简 单计算。有很多采集器可以选择: Telegraf Grafana-agent Datadog-agent node-exporter Categraf Kubernetes Node 组 件的监控 Kubernetes Node - 容器负载监控 抓取方案 • Pod或者容器的负载情况,是一个需要关注的点,容器层面主要关注CPU和内存使用情况,Pod 层面主要 containerd 都可以采集到,推荐 { 抓取方案一 } • 左侧这个配置大家在网上比较容易搜到,通过kubernetes_sd_configs做服务发现,查找所有node,通过 Kubernetes apiserver 的 proxy 接口,抓取各个node(即kubelet)的 /metrics/cadvisor 接口的 prometheus 协议的数据 • 这个抓取器只需要部署一个实例,调用 apiserver0 码力 | 32 页 | 3.27 MB | 6 月前3
25-云原生应用可观测性实践-向阳容器 - K8s Node (VM/BM) 业务POD 业务POD 业务POD CNI vSwitch / Bridge DeepFlow 采集POD (HostNet) DaemonSet • 零干扰:无需对vSwitch和Node做任何配置、不监听任何端口 • 全自动:DaemonSet POD部署运行,随K8s自动扩展 • 零侵入:不侵入业务POD,可采集所有业务POD及本Node流量 虚拟化 零干扰:无需对vSwitch和KVM做任何配置、不监听任何端口 • 零依赖:用户态进程部署运行,无任何Lib依赖 • 零侵入:不侵入业务VM,一个进程采集所有业务VM流量 虚拟化 - KVM 业务VM 业务VM 业务VM (K8s Node) vSwitch / Bridge DeepFlow 采集器进程 业务 POD 业务 POD 采集 POD br • 宿主机+KVM + K8s混合场景,自动切换流量采集,最低消耗采集全网 业务 Co., Ltd. All rights reserved. 全栈混合云:KVM 宿主机+容器 K8S 虚拟机Node vSwitch DeepFlow 采集器进程 业务 POD 业务 POD 采集 POD br 业务 POD 全栈混合云:KVM 宿主机+容器 K8S 虚拟机Node vSwitch DeepFlow 采集器进程 业务 POD 业务 POD 采集 POD br 业务 POD0 码力 | 39 页 | 8.44 MB | 6 月前3
22-云原生的缘起、云原生底座、PaaS 以及 Service Mesh 等之道-高磊aS层的构建起到了非常重要的作用 现在 Node A 业务逻辑 熔断器 服务发现 网络堆栈 Node B 业务逻辑 熔断器 服务发现 网络堆栈 Node A 业务逻辑 网络堆栈 Node B 业务逻辑 网络堆栈 熔断器 服务发现 熔断器 服务发现 SideCar SideCar Node A 业务逻辑 网络堆栈 Node B 业务逻辑 网络堆栈 熔断器 服务发现0 码力 | 42 页 | 11.17 MB | 6 月前3
Volcano加速金融行业大数据分析平台云原生化改造的应用实践Volcano-scheduler … Kube-apiserver Job/JobFlow Queue vc-controller vc-scheduler vsub kubectl Node NUMA GPU Node NUMA GPU … VolcanoGlobal 架构 多中心 低成本 无绑定 VG Scheduler ETCD Karmada Controllers K8s big job-2 Job-3 Job-4 Job-5 Queue1 Queue2 weight:2 Running task Pending task Nodes node 1 node 2 node 3 Scheduler user Job-3 Job-4 Job-5 SLA 避免大作业饿死 解决方案:通过SLA配置作业的最长等待时间,降低大作业饿死的可能性 apiVersion:0 码力 | 18 页 | 1.82 MB | 1 年前3
consul 命令行内存服务器,该服务器可用于快速原型设计或针对API进行开发。在此模式下, Connect已启用,默 情况下将在启动时创建新的根CA证书。此模式不适用于生产用途,因为它不会将任何数据写入磁盘。 ● disable-host-node-id:将此设置为true将阻止Consul使用来自主机的信息生成确定性节点ID,而 生成将保留在数据目录中的随机节点ID。在同一主机上运行多个Consul代理进行测试时,这非常有用 在版本0.8 ,“debug”,“info”,“warn”和“err”。您始终可以通过consul monitor并使用任何日志级 连接到代理。此外,可以在配置重新加载期间更改日志级别。 ● -node:群集中此节点的名称。这在群集中必须是唯一的。默认情况下,这是计算机的主机名。 ● -node-id:在Consul 0.7.3及更高版本中可用,即使节点或地址的名称发生更改,这也是该节点的 一标识符。这必须是十六进制字符串的形式,长度为36个字符,例如 见的情况),则代理将在启动时生成标识符并将其保留在数据 录中, 以便在代理重新启动时保持相同。如果可能,来自主机的信息将用于生成确定性节点ID,除非 disable-host-node-id设置为true。 ● -node-meta:在Consul 0.7.3及更高版本中可用,它指定与表单节点关联的任意元数据键/值对key: alue。这可以多次指定。节点元数据对具有以下限制: ● 每个节点最多可以注册64个键/值对。0 码力 | 5 页 | 346.62 KB | 1 年前3
24-云原生中间件之道-高磊制 应用透明,全局管理视角,细粒度安全策略 Check&Report机制影响通信性能,并只涉及到服务 通信级别的安全,对node没有防护 Calico零信任 主要针对Node层的访问控制,可以让攻击者难以横向移动,隔离了风险 应用透明,全局管理视角,细粒度安全策略,针 对Node层面构建安全 采用IpTables,有一定的性能消耗 Cilium零信任 采用eBPF,为Mesh打造具备API感知和安全高效的网络层安全解决方案, 为Mesh打造具备API感知和安全高效的网络层安全解决方案, 克服了Calico SDN安全和性能方面的不足 应用透明,全局管理视角,细粒度安全策略,针 对Node层面构建安全,端到端安全需要和以上安 全方案集成。 说说应用基本依赖的四大件:数据库、存储、中间件和大数据 下单服务 交易支付 支付网关 锁定库存 库存数据库 前台类目 商品查询 BFF 商品数据库 文件存储 logging MQ 交易数据库 大数据 营销分析0 码力 | 22 页 | 4.39 MB | 6 月前3
Rainbond服务日志管理RAINBOND⾃自身⽇日志管理理机制 1.3 ⽇日志来源,以及相关原理理 node服务功能与⻆角⾊色 rbd-eventlog组件功能与⻆角⾊色 NODE服务会监视DOCKERD进程,观察其创建与销毁容器。获取⽂件系统中容器⽇志的路径, 监视来⾃容器标准输出和标准错误输出,并以UDP协议分发到RBD-EVENTLOG组件。 接收来⾃NODE服务的推送,⽤WEBSOCKET协议将⽇志内容推送到⽤户所操作的应⽤控制台。0 码力 | 11 页 | 1.62 MB | 1 年前3
Rainbond安装与运维原理解读RAINBOND安装与运维原理理解读 问题的答案: RAINBOND 线上培训(第九期) 2019/8/8 5. 组件配置如何⽣生效: 修改 /opt/rainbond/conf/*.yml ⽂文件后,执⾏行行 node service update 6. 快速获悉组件⽣生效参数: ps -ef | grep 服务组件名称 2. RAINBOND安装与运维经验分享 RAINBOND 线上培训(第九期) lem/ 该阶段⽤用户正在安装⼀一个Rainbond集群,你可能正在执⾏行行如下的命令时报错了了: ./grctl init ··· 或者 grctl node add ··· 或者 grctl node install ··· ⼀一定要来看这篇⽂文档 2. RAINBOND安装与运维经验分享 RAINBOND 线上培训(第九期) 2019/8/8 2.20 码力 | 12 页 | 311.60 KB | 1 年前3
构建统一的云原生应用 可观测性数据平台Simplify the growing complexity. 数据打通并不简单 ⑥ 应用、系统、网络的Trace之间 例如:访问一个服务的耗时究竟有哪些部分组成? App,Sidecar,Node,KVM,NFVGW? ⑥ 看云网更清晰 Simplify the growing complexity. 我们需要哪些Tag?OpenTelemetry的答案 服务属性 代码属性 实例属性 POD DeepFlow的典型客户环境中,两个微服务通信涉及到的标签多达上百个 Namespace Service Service Deployment Pod Container Node Cluster Ingress Deployment Pod Container 服务 app version env group owner stage commitId deployId =10000) int LowCard 看云网更清晰 Simplify the growing complexity. 生产环境数据:Server端资源消耗<1% • 监控600+个K8s Node(~8000个POD),共600*16vCPU • 每秒写入1M Row(50MB字节),每行100~150 Column • Server端共6*16vCPU,总计CPU消耗<150%,总计Load<600 码力 | 35 页 | 6.75 MB | 1 年前3
共 13 条
- 1
- 2













