 第29 期| 2023 年9 月- 技术雷达Copilot、Tabnine 和 Codeium。我们兴奋于 open-source LLMs for coding 在工具领域可能带来的变革,并且我们看到了在编码之外的辅助领域中工具和能力的爆炸式增 长,如用户故事编写辅助、用户研究、电梯演讲和其他基于语言的任务。同时,我们希望开发人员能够负责任 地使用所有这些工具,并且始终掌控主导权,比如 hallucinated dependencies 就是其中一个需要注意的安全 OpenAI 的 ChatGPT,Google Bard,Meta 的 LLaMA 以及亚马逊的 Bedrock 等)在我们的讨论中占据重要地位。更广泛来说,大语言模型可以应用于从 内容生成(文本、图片和视频)、代码生成到总结概述和翻译等各种问题。通过自然语言的抽象层,这些大模型 成为了强大的工具库,被诸多信息工作者广泛使用。我们讨论了大语言模型的各个方面,包括自托管式大语言 模型,相较 这样的外部工具。我们仍然处于定义这一学科 的早期阶段,但到目前为止,ReAct 及其后继方法已指引出大语言模型最令人兴奋的一些应用领域。 10. 检索增强生成 试验 检索增强生成(RAG) 是一种结合预训练参数和非参数记忆的文本生成技术。它使你能够通过你的领域内特有 的包含上下文的知识,来强化预训练模型中的现有知识。使用 RAG,你会先从非参数记忆中去检索相关文档集 (一般是通过在向量数据库中的相似性搜索),再使用 LLM0 码力 | 43 页 | 2.76 MB | 1 年前3 第29 期| 2023 年9 月- 技术雷达Copilot、Tabnine 和 Codeium。我们兴奋于 open-source LLMs for coding 在工具领域可能带来的变革,并且我们看到了在编码之外的辅助领域中工具和能力的爆炸式增 长,如用户故事编写辅助、用户研究、电梯演讲和其他基于语言的任务。同时,我们希望开发人员能够负责任 地使用所有这些工具,并且始终掌控主导权,比如 hallucinated dependencies 就是其中一个需要注意的安全 OpenAI 的 ChatGPT,Google Bard,Meta 的 LLaMA 以及亚马逊的 Bedrock 等)在我们的讨论中占据重要地位。更广泛来说,大语言模型可以应用于从 内容生成(文本、图片和视频)、代码生成到总结概述和翻译等各种问题。通过自然语言的抽象层,这些大模型 成为了强大的工具库,被诸多信息工作者广泛使用。我们讨论了大语言模型的各个方面,包括自托管式大语言 模型,相较 这样的外部工具。我们仍然处于定义这一学科 的早期阶段,但到目前为止,ReAct 及其后继方法已指引出大语言模型最令人兴奋的一些应用领域。 10. 检索增强生成 试验 检索增强生成(RAG) 是一种结合预训练参数和非参数记忆的文本生成技术。它使你能够通过你的领域内特有 的包含上下文的知识,来强化预训练模型中的现有知识。使用 RAG,你会先从非参数记忆中去检索相关文档集 (一般是通过在向量数据库中的相似性搜索),再使用 LLM0 码力 | 43 页 | 2.76 MB | 1 年前3
 云计算白皮书解决方案,加速推动第二梯队企业上云用云实施落地。 第三梯队行业上云用云处于探索期,云平台建设与应用处于规 划和发展阶段,如石油化工、钢铁冶金、煤矿、建筑等行业。第三 梯队行业上云一般具有业务流程长且复杂、数据来源多且流通差、 IT 技术储备不足等特点,具体表现为:一是应用系统多样复杂,难 以云化改造。当前,第三梯队行业信息化整体程度较低,系统技术 依赖性强、二次开发难度高,难以实现应用现代化改造,如石油化 据复杂化也加速云计算向能够一体化调度、处理计算、网络、存储 资源的操作系统方向演进。 向上来看,数字应用呈现出分布式、多模态、超大量级的特点。 以 ChatGPT 为例,ChatGPT 的模型参数已达千亿,且模型训练数据 涉及文本、图片、音视频等多个模态,基于分布式训练框架实现了 超大规模量级的并行计算,这对部署模型的云计算平台提出新的需 求。云计算的焦点不仅仅在提升单点应用的研运效能,更要发挥出 面向大规模分布式应用协调、分发、部署的中枢管控能力。模型构0 码力 | 47 页 | 1.22 MB | 1 年前3 云计算白皮书解决方案,加速推动第二梯队企业上云用云实施落地。 第三梯队行业上云用云处于探索期,云平台建设与应用处于规 划和发展阶段,如石油化工、钢铁冶金、煤矿、建筑等行业。第三 梯队行业上云一般具有业务流程长且复杂、数据来源多且流通差、 IT 技术储备不足等特点,具体表现为:一是应用系统多样复杂,难 以云化改造。当前,第三梯队行业信息化整体程度较低,系统技术 依赖性强、二次开发难度高,难以实现应用现代化改造,如石油化 据复杂化也加速云计算向能够一体化调度、处理计算、网络、存储 资源的操作系统方向演进。 向上来看,数字应用呈现出分布式、多模态、超大量级的特点。 以 ChatGPT 为例,ChatGPT 的模型参数已达千亿,且模型训练数据 涉及文本、图片、音视频等多个模态,基于分布式训练框架实现了 超大规模量级的并行计算,这对部署模型的云计算平台提出新的需 求。云计算的焦点不仅仅在提升单点应用的研运效能,更要发挥出 面向大规模分布式应用协调、分发、部署的中枢管控能力。模型构0 码力 | 47 页 | 1.22 MB | 1 年前3
 Kubernetes全栈容器技术剖析:更快的弹性,更高的资源利用率 持续发布: 小时级->分钟级 弹性伸缩: 分钟级->秒级 应用交互性能提 升1~2倍 资源利用率提 升50% 挑战 收益 传统虚机应用上线慢 业务扩容时间长 同业务压力下资 源利用率低 传统虚机应用交 互性能低 • 应用可以基于容器镜像一站式自动化“构建发布上线” • 应用快速上线、扩容、升级,秒级弹性扩缩容 • 基于容器更细粒度共享,提升资源利用率 镜像仓库 研发交付 容器镜像 Node 客户问题: •用户流量存在明显波峰波谷,传统部署方式伸缩效率低 •服务器开服频繁,传统部署耗时长 •特性迭代快速,升级频繁,传统方式效率低,断服时间长 •公司遗留内部运维(CI/CD)系统,需要对接公有云 •国内其他云厂商的容器服务问题较多、很不成熟 华为方案价值: •支持丰富的弹性伸缩指标策略,秒级伸缩应对流量变化 •支持模板方式一键部署,分钟级完成开服 (一半时间利用 率<10%),造成资源极大浪费 •升级耗时长、易出错:APP迭代需求快,如新游戏上线、特性增强等,每周2~3次补丁发布,需手工操作,升级工作耗时2小时,效率低 •新业务上线周期长:开发、测试、验收、生产割裂,无法实现端到端的自动化,新需求上线需要2周时间 华为方案价值:采用了华为PaaS平台,在裸金属上部署容器应用,并与客户CI/CD流程集成。 22 案例: 基于ARM0 码力 | 26 页 | 3.29 MB | 1 年前3 Kubernetes全栈容器技术剖析:更快的弹性,更高的资源利用率 持续发布: 小时级->分钟级 弹性伸缩: 分钟级->秒级 应用交互性能提 升1~2倍 资源利用率提 升50% 挑战 收益 传统虚机应用上线慢 业务扩容时间长 同业务压力下资 源利用率低 传统虚机应用交 互性能低 • 应用可以基于容器镜像一站式自动化“构建发布上线” • 应用快速上线、扩容、升级,秒级弹性扩缩容 • 基于容器更细粒度共享,提升资源利用率 镜像仓库 研发交付 容器镜像 Node 客户问题: •用户流量存在明显波峰波谷,传统部署方式伸缩效率低 •服务器开服频繁,传统部署耗时长 •特性迭代快速,升级频繁,传统方式效率低,断服时间长 •公司遗留内部运维(CI/CD)系统,需要对接公有云 •国内其他云厂商的容器服务问题较多、很不成熟 华为方案价值: •支持丰富的弹性伸缩指标策略,秒级伸缩应对流量变化 •支持模板方式一键部署,分钟级完成开服 (一半时间利用 率<10%),造成资源极大浪费 •升级耗时长、易出错:APP迭代需求快,如新游戏上线、特性增强等,每周2~3次补丁发布,需手工操作,升级工作耗时2小时,效率低 •新业务上线周期长:开发、测试、验收、生产割裂,无法实现端到端的自动化,新需求上线需要2周时间 华为方案价值:采用了华为PaaS平台,在裸金属上部署容器应用,并与客户CI/CD流程集成。 22 案例: 基于ARM0 码力 | 26 页 | 3.29 MB | 1 年前3
 深度解析CNCF社区⾸个基于Kubernetes的边缘计算平台KubeEdge设备管理理 & 实战� ➔ 后续规划 & 社区贡献 & 技术交流� 边缘计算� 云计算是集中化的,离终端设备(如摄像头、传感器器等)和⽤用户较远,对于实时性要求⾼高的计算需求,把计算放在云上会引起较⻓长的⽹网络延 时、⽹网络拥塞、服务质量量下降等问题。⽽而终端设备通常计算能⼒力力不不⾜足,⽆无法与云端相⽐比。在此情况下,边缘计算应运⽽而⽣生,将云端计算能⼒力力 延伸到靠近终端设备的边缘节点,就近 推动边缘计算快速发展的四⼤大因素:� ➔ 低时延:为满⾜足低时延的要求,需要在离业务现场最近的边缘构建解决⽅方案,减少业务处理理时延。� ➔ 海海量量数据:物联⽹网时代边缘数据爆炸性增⻓长,难以直接回传⾄至云端且成本⾼高昂,数据在本地进⾏行行分析和过滤,节省⽹网络带宽。� ➔ 隐私安全:数据涉及到企业⽣生产和经营活动安全,在边缘处理理企业保密信息和个⼈人隐私。� ➔ 本地⾃自治0 码力 | 20 页 | 2.08 MB | 1 年前3 深度解析CNCF社区⾸个基于Kubernetes的边缘计算平台KubeEdge设备管理理 & 实战� ➔ 后续规划 & 社区贡献 & 技术交流� 边缘计算� 云计算是集中化的,离终端设备(如摄像头、传感器器等)和⽤用户较远,对于实时性要求⾼高的计算需求,把计算放在云上会引起较⻓长的⽹网络延 时、⽹网络拥塞、服务质量量下降等问题。⽽而终端设备通常计算能⼒力力不不⾜足,⽆无法与云端相⽐比。在此情况下,边缘计算应运⽽而⽣生,将云端计算能⼒力力 延伸到靠近终端设备的边缘节点,就近 推动边缘计算快速发展的四⼤大因素:� ➔ 低时延:为满⾜足低时延的要求,需要在离业务现场最近的边缘构建解决⽅方案,减少业务处理理时延。� ➔ 海海量量数据:物联⽹网时代边缘数据爆炸性增⻓长,难以直接回传⾄至云端且成本⾼高昂,数据在本地进⾏行行分析和过滤,节省⽹网络带宽。� ➔ 隐私安全:数据涉及到企业⽣生产和经营活动安全,在边缘处理理企业保密信息和个⼈人隐私。� ➔ 本地⾃自治0 码力 | 20 页 | 2.08 MB | 1 年前3
 QCon北京2017/支撑海量业务的互联网架构/知乎基于 Kubernetes 的 Kafka 平台探索和实践Kafka 深度耦合 多 Kafka 集群⽅方式 根据 Topic 类型划分集群 同⼀一类型 Topic 的集群细分 • Topic 服务等级、容量量和规模划分 资源规划 多变需求引发集群规模增⻓长 • Broker, Topic 规模 服务器器资源利利⽤用率 • 单机运⾏行行多 Broker ⽅方式 多集群问题 磁盘是不不得不不考虑的问题 • ⽇日志落盘,⽇日志失效 ⽅方案 •0 码力 | 34 页 | 2.64 MB | 1 年前3 QCon北京2017/支撑海量业务的互联网架构/知乎基于 Kubernetes 的 Kafka 平台探索和实践Kafka 深度耦合 多 Kafka 集群⽅方式 根据 Topic 类型划分集群 同⼀一类型 Topic 的集群细分 • Topic 服务等级、容量量和规模划分 资源规划 多变需求引发集群规模增⻓长 • Broker, Topic 规模 服务器器资源利利⽤用率 • 单机运⾏行行多 Broker ⽅方式 多集群问题 磁盘是不不得不不考虑的问题 • ⽇日志落盘,⽇日志失效 ⽅方案 •0 码力 | 34 页 | 2.64 MB | 1 年前3
 Kubernetes 异常配置检测框架Pod Master API Server Pod Kubernetes 典型异常 网络异常 • 安全组、路由表配置错误 • 节点防火墙软件等修改 iptables、内核参数 • 网络链路长,手动排查成本高 异常影响 • 应用间无法正常通信 • 集群内 Controller 无法正常工作 YUM 安装自动运维工具 自动安装依赖 firewalld 网络未知原因导致异常 Node0 码力 | 31 页 | 9.57 MB | 1 年前3 Kubernetes 异常配置检测框架Pod Master API Server Pod Kubernetes 典型异常 网络异常 • 安全组、路由表配置错误 • 节点防火墙软件等修改 iptables、内核参数 • 网络链路长,手动排查成本高 异常影响 • 应用间无法正常通信 • 集群内 Controller 无法正常工作 YUM 安装自动运维工具 自动安装依赖 firewalld 网络未知原因导致异常 Node0 码力 | 31 页 | 9.57 MB | 1 年前3
 逐灵&木苏-阿里巴巴 K8S 超大规模实践经验UnitedDeployment (coming soon) https://openkruise.iok8s 规模及性能优化实践性能优化 RT/QPS 资源使用率 链路RT/QPS 服务异常 队列长度 gRPC监控 长连接分布 请求分布 限流 Authorization Authenticatio n 序列化 压缩 版本转换 Admission Cache Storage Filter Chain API0 码力 | 33 页 | 8.67 MB | 6 月前3 逐灵&木苏-阿里巴巴 K8S 超大规模实践经验UnitedDeployment (coming soon) https://openkruise.iok8s 规模及性能优化实践性能优化 RT/QPS 资源使用率 链路RT/QPS 服务异常 队列长度 gRPC监控 长连接分布 请求分布 限流 Authorization Authenticatio n 序列化 压缩 版本转换 Admission Cache Storage Filter Chain API0 码力 | 33 页 | 8.67 MB | 6 月前3
 张海宁:使用Kubernetes部署超级账本FabricSACC2017 公有链的不足之处 • 比特币、以太坊等公有链项目,不能满足商用的需求 – 无保密性(Confidentiality) – 无法溯源(Provenance) – 确认时间长(Slow confirmation) – 无最终性(Finality) – 吞吐量低(Throughput) – 软件许可(license) – 极客主导 • 需要新的解决方案 60 码力 | 45 页 | 2.70 MB | 1 年前3 张海宁:使用Kubernetes部署超级账本FabricSACC2017 公有链的不足之处 • 比特币、以太坊等公有链项目,不能满足商用的需求 – 无保密性(Confidentiality) – 无法溯源(Provenance) – 确认时间长(Slow confirmation) – 无最终性(Finality) – 吞吐量低(Throughput) – 软件许可(license) – 极客主导 • 需要新的解决方案 60 码力 | 45 页 | 2.70 MB | 1 年前3
 Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践Informer 启动后会通过 reflector 的 list & watch 机制获取某种资源的 全量 objects。list 可以简单理解为一个 HTTP GET 请求,watch 为一 个 HTTP/2 长连接 Cache 如何保持与 API Server 一致性 list & watch 机制中,list 获取 API Server 中数据的一份快照,并记 录 ResourceVersion 版本信息,watch0 码力 | 21 页 | 3.06 MB | 9 月前3 Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践Informer 启动后会通过 reflector 的 list & watch 机制获取某种资源的 全量 objects。list 可以简单理解为一个 HTTP GET 请求,watch 为一 个 HTTP/2 长连接 Cache 如何保持与 API Server 一致性 list & watch 机制中,list 获取 API Server 中数据的一份快照,并记 录 ResourceVersion 版本信息,watch0 码力 | 21 页 | 3.06 MB | 9 月前3
 k8s操作手册 2.3myssh-key-secret Opaque 2 3m43s # kubectl get secret database-auth -oyaml #secret的文本信息均以base64编码 存储 apiVersion: v1 data: password: cGFzc3dkMTIz #base64编码 username: cm9vdA==0 码力 | 126 页 | 4.33 MB | 1 年前3 k8s操作手册 2.3myssh-key-secret Opaque 2 3m43s # kubectl get secret database-auth -oyaml #secret的文本信息均以base64编码 存储 apiVersion: v1 data: password: cGFzc3dkMTIz #base64编码 username: cm9vdA==0 码力 | 126 页 | 4.33 MB | 1 年前3
共 10 条
- 1














