基于Consul的多Beats接入管控与多ES搜索编排1 梁成 腾讯云, barryliang@tencent.com 基于Consul的多Beats接入 管控与多ES搜索编排 2 拥抱开源、释放云原生的力量 • 背景与挑战 • 多Beats/Logstash接入管控 • 多ES搜索编排系统 • 日志AIOps探索 3 背景与挑战 产品数量 人员规模 主机规模 100+ 1000 + 10000 + 如何降低日志接入门槛 如何降低日志接入门槛 如何保证日志实时上报 如何保障日志采集不影响业务 如何做配置标准化 如何帮助业务快速排障 如何提供方便便捷的性能分析 调优能力 … 4 多Beats/Logstash接入 管控 提供多产品接入管理,多beats标准 化、界面化、自动化的日志接入方案 5 案例:1000+业务10000+台 主机如何快速实现日志接入? 业务规模 1000+业务、 10000+业务主机、每天百T日志增量 从Consul中获取当前agent的配置组列表,并 启动多个采集进程 配置变更感知 watch到Consul对应的agent id路径,实时感 知配置变化,并对启动的进程列表做重启清理 等工作 管理多Beats/logstash Beats等以agent子进程启动其管理这些进程的 cpu/内存等资源 Agent Consul Master 获取master列表 向master发起Agent注册逻辑0 码力 | 23 页 | 6.65 MB | 1 年前3
多租户Kubernetes VM Solutions for Multi-Tenant Applications0 码力 | 33 页 | 3.34 MB | 1 年前3
开源多集群应用治理项目Clusternet 在多点生活的云原生实践陈鹏 开源多集群应用治理项目 Clusternet 在多点生活的云原生实践 陈鹏 多点生活 平台架构-基础架构工程师 个人简介 • 开源项目 MOSN 核心 Committer • 主要负责容器服务整体架构的设计与开发 • 主导 ServiceMesh 落地相关工作 目录 多集群管理现状 Operator 迭代 反思&重构 整体架构 • 多单元 • 多集群 • 多分组 多种公有云(腾讯云、微软 云等) 核心组件-Symphony CI/CD 业务方使用 对外提供统一API 运行情况展示 应用在多集群运 行状态收集 应用维护,日志 查看,故障排查 应用发布 Operator API • 对使用方屏蔽多单元、多集群的存在 • 提供简单的、无需运维介入的日常维护功能 • 结合监控,可以查看每个实例的运行情况 • 支持离线日志查看,减少对容器的理解 客户端 • CI/CD流程耦合 2019~2020 • 使用 Go 重构 CD 流程 • 多云环境适配 • Service Mesh 落地 • Multi runtime 支持 2021~ • 多商家私有云适配 • HPA 支持 • …… https://github.com/symcn/sym-ops CRD AppSet: spec: chart: "****:v1" clusterTopology:0 码力 | 22 页 | 17.18 MB | 1 年前3
多雲一體就是現在:
GOOGLE CLOUD 的
KUBERNETES
混合雲戰略多雲一體就是現在: GOOGLE CLOUD 的 KUBERNETES 混合雲戰略 安玟宇 Wayne An Customer Engineer, Google Cloud WayneAn@google.com 安玟宇 Wayne An Customer Engineer, Google Cloud WayneAn@google.com 多雲一體就是現在: Google Cloud 涵蓋Web/App/DB皆有多 樣化代管服務可以組合出 最適架構 自動化部署 與開放平台以及開發環境 整合,加速應用上線 Google Cloud Taiwan 優勢 Google Infrastructure event driven functions web apps & APIs orchestrate containers infrastructure 使用多層次的架構重塑雲端佈署0 码力 | 32 页 | 2.77 MB | 1 年前3
阿里云上深度学习建模实践-程孟力训练推理: 高qps, 低rt 支持超大模型 性价比 流程长、环节多: 推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动 实人认证: 卡证识别 + 人脸检测 + 活体检测 + 人脸 识别 … 模型构建: 问题: ✗ 方案复杂周期长/见效慢 ✗ 细节多难免踩坑 解决方案: 标准化 标准化模型库 标准化解决方案 1.方案复杂 Parameter Server MPI TreeModel SQL MapReduce Blink 场景丰富: 图像/视频/推荐/搜索 大数据+大模型: Model Zoo 跨场景+跨模态 开箱即用: 封装复杂性 白盒化, 可扩展性强 积极对接开源系统+模型 FTRL SGD Adam Solutions Librarys 优势: Components Framework 训练优化: 数据并行 模型并行 推理优化: Blade 推荐模型优化: 千亿特征 3. 工程优化 RingAllReduce + 层级级联 EasyVision 多机多卡性能对比 工程优化: 数据并行 M6模型 Transformer模型: RapidFormer 人脸分类模型: 超大softmax 3D卷积模型 M6模型 RapidFormer性能0 码力 | 40 页 | 8.51 MB | 1 年前3
云计算白皮书热点领域和热点方向,试图在市场上抢得先机。 四是云计算技术不断推陈出新,助力产业高质量发展。随着上 云进程持续加深,企业需求逐步向用云转移,效率、性能、安全等 成为用户关注点,应用现代化、一云多芯、平台工程、云成本优化、 系统稳定性、云原生安全等新技术层出不穷,满足用户多样性场景 需求,助力产业数字化升级。 在此背景下,中国信息通信研究院继《云计算白皮书(2012 年)》 之后第 9 to Reach Nearly $600 Billion in 2023》,Gartner, 2023 年 4 月 云计算白皮书(2023 年) 4 从区域层面来看,全球云计算发展呈现“一超多强”态势。2022 年,北美洲占据了全球 52.14%的公有云市场规模,较 2021 年增长 20.4%。欧洲、亚洲位列市场占比二三位,分别为 23.41%、18.35%。 大洋洲、南美洲、非洲均处于“云发展中”,三大洲占比总和仅 化方 法体系。 来源:中国信息通信研究院 图 7 应用现代化架构图 架构层面,一云多芯既可以贴合多元算力新需求,又能够支撑 业务场景多形态。一云多芯作为云计算的全新技术架构,通常指用 一套云操作系统来管理不同类型芯片、架构、接口、技术栈等硬件 服务器集群。在如今算力需求爆炸的 AI 时代,一云多芯为各行各业 践行数字化转型提供了有力支持。一方面,它可以提供统一管理、 云计算白皮书(20230 码力 | 47 页 | 1.22 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112关英文文献时,不至于感到陌生。 尽管每天都有深度学习相关算法论文的发布,但是作者相信,深度学习的核心思想和基 础理论是共通的。本书已尽可能地涵盖其中基础、主流并且前沿的算法知识,但是仍然有很 多算法无法涵盖,读者学习完本书后,可以自行搜索相关方向的研究论文或资料,进一步学 习。 深度学习是一个非常前沿和广袤的研究领域,鲜有人士能够对每一个研究方向都有深刻 的理解。作者自认才疏学浅,略懂 ,使得网络下一次能够预测更精准。常 见的有监督学习有线性回归、逻辑回归、支持向量机、随机森林等。 无监督学习 收集带标签的数据往往代价较为昂贵,对于只有样本?的数据集,算法需 要自行发现数据的模态,这种方式叫作无监督学习。无监督学习中有一类算法将自身作为 监督信号,即模型需要学习的映射为??: ? → ?,称为自监督学习(Self-supervised Learning)。在训练时,通过计算模型的预测值 游戏平台中的 49 个游戏上取得了 与人类相当甚至超越人类的水平;在围棋领域,DeepMind 提出的 AlphaGo 和 AlphaGo Zero 智能程序相继打败人类顶级围棋专家李世石、柯洁等;在多智能体协作的 Dota2 游戏 平台,OpenAI 开发的 OpenAI Five 智能程序在受限游戏环境中打败了 TI8 冠军队伍 OG 队,展现出了大量专业级的高层智能操作。图 1.9 列出了 20060 码力 | 439 页 | 29.91 MB | 1 年前3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入GPT-3对GPT-2追求无监督与零次学习的特征进行了改进 ◼ GPT-3利用了过滤前45TB的压缩文本,在诸多NLP数据集中实现了强大性能 ✓ GPT-3是一个具有1750亿个参数的自回归语言模型,比之前的任何非稀疏语言模型多10倍。对于所有任务(在few-shot设置下测试其 性能),GPT-3都是在没有任何梯度更新或微调的情况下应用的,仅通过与模型的文本交互来指定任务和few-shot演示。 ✓ GPT-3在许多 (自动推断)从例子中显现出来 随着深度学习, 用于预测的高级 特征出现 有了基础模型,甚至出现了情境学习等高级 功能 ChatGPT核心技术优势 42 ChatGPT以基础模型为杠杆,可适用多类下游任务 ◼ ChatGPT采用了GPT3.5(InstructGPT)大规模预训练模型,在 自然语言理解和作品生成上取得极大性能提升 ✓ 鉴于传统NLP技术的局限问题,基于大语言模型(LLM)有助于充分利 的增长,日 志丢失呈现平稳的改善趋势。 资料来源:《On the Opportunities and Risks of Foundation Models 》论文 图:基础模型可以集中来自各种模态的所有数据的信息, 然后这一模型可以适用于广泛的下游任务 ChatGPT核心技术优势 43 参考文献 1. IAN GOODFELLOW等,《深度学习》,人民邮电出版社,2017 2.0 码力 | 44 页 | 2.36 MB | 1 年前3
QCon北京2018-《深度学习在微博信息流排序的应用》-刘博Ø 模型算法是手段 • 模型算法殊途同归 • 业务和数据决定模型算法的应用场景 • 计算力和算法架构是保障 总结展望 Ø 未来工作 • 更多的融合网络结构适用于CTR预估场景 • 多模态—更好的对非结构化内容进行表征 • 用户行为序列embedding0 码力 | 21 页 | 2.14 MB | 1 年前3
OpenShift Container Platform 4.6 发行注记PHP。 OpenShift Container Platform 基于 Red Hat Enterprise Linux 和 Kubernetes,为当今的企业级应用程序 提供了一个更加安全、可扩展的多租户操作系统,同时提供了集成的应用程序运行时及程序库。 OpenShift Container Platform 可以满足用户对安全性、隐私、合规性及监管的要求。 1.1. 关于此版本 Red Hat 如需更多信息,请参阅 OLM 描述符引用。 1.2.5.7. 资 资源 源页 页面中的 面中的栏 栏管理 管理 现在,Manage 栏图标 被添加到一些资源页面中,如 Pods 页面。当您点击图标时,会使用模态 providerSpec: value: preemptible: true OpenShift Container Platform 4.6 发 发行注 行注记 记 18 左 expiration 周期值,且没有其他 Report 或 ReportQuery CR 依赖于过期的 Report CR,Metering Operator 会在保留期结束后从集群中删除 Report CR。如需更 多信息,请参阅 metering Report CR 过期。 1.2.15. 节点 1.2.15.1. 配置 配置节 节点 点审计 审计日志策略 日志策略 现在,您可以通过选择要使用的审计日志策略0 码力 | 91 页 | 1.15 MB | 1 年前3
共 214 条
- 1
- 2
- 3
- 4
- 5
- 6
- 22













