PyConChina2022-杭州-ARM芯片的Python+AI算力优化-朱宏林ARM 芯片的 Python + AI 算力优化 主讲人: 朱宏林 – 阿里云程序语言与编译器团队 简介 • 当今开发者们大量使用 Python 语言编写的 AI 程序。过去这些程序总跑在 GPU 或者 x86 架构的 CPU 上。然而综合考虑到功耗、成本、性能等因素,云厂商们开始建设 ARM 架构的服务平台,如 何整合 Python + AI 的相关软件并使其在该平台上发挥最高的性能成为了工程师们关注的焦点。0 码力 | 24 页 | 4.00 MB | 1 年前3
敏捷开发/朱宏强:敏捷领导力0 码力 | 27 页 | 3.76 MB | 1 年前3
Rust语言核心竞争力-庄晓立Rust编程语言 核心优势和核心竞争力 庄晓立,北京,QCon2016 liigo@qq.com 2016-4-23 新人分享新语言 2015年5月Rust语言刚刚发布1.0版本 2013年末我开始关注Rust,但尚未深入实践 在重大场合正式演讲这是人生第一次 2016年春节至今认真准备讲稿近三个月 如有错误或纰漏,敬请谅解! 感谢臧秀涛主编盛情邀请! Rust 安全、高效、并发的系统编程语言 三维建模/动画/渲染 数据中心 • CPU/GPU • 内存/硬盘 • 电力 • 网络流量 • 其他设备和人员维护费用 都是白花花的银子,“硬件很便宜”的说法不靠 谱 你能买最新硬件,对手也能,无助于提升竞争力 物联网 • 需要大批量部署,必须控制硬件成本 • 受限于成本控制,硬件性能不强 • 受限于电池供电,功耗不能高 这就要求系统和应用软件要高效利用硬件 程序运行在VM上,或后台跑GC 白白浪费了宝贵的CPU和内存资源 C语言无法从类型系统上区分有效指针和无效指针(NULL),却又习惯把NULL指针用 作特殊标记(空缺的参数或返回值)。一旦程序员忽略NULL指针检查,往往会触发 很严重的内存错误。人难免因疏忽而犯错,编译期检查对此无能为力。 并发安全 一个入口:std::thread::spawn() 两大门神:Send、Sync 编译期保证:没有数据竞争(No Data Race) Safe V.S. Unsafe // A0 码力 | 51 页 | 1.09 MB | 1 年前3
阿里云上深度学习建模实践-程孟力阿里云深度学习实践 程孟力 花名: 杨熙 阿里巴巴-计算平台-PAI 个性化推荐 视频理解 智能对话系统 图像检索 更多场景 OCR识别 人脸核身 智能风控 自动驾驶 语音助手 • • • 优势: 效果 显著超越 传统模型(线性层模型 / 树模型 / SVM模型 / … ) 深度学习应用场景 沙漠 湖泊 旅行 深度学习应用主要的挑战: 2.模型效果优 化困难 全面: 同分布 模型选型: 容量大 计算量小 训练推理: 高qps, 低rt 支持超大模型 性价比 流程长、环节多: 推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动 实人认证: 卡证识别 + 人脸检测 + 活体检测 + 人脸 识别 … 模型构建: 问题: ✗ 方案复杂周期长/见效慢 ✗ 细节多难免踩坑 解决方案: 标准化 开源 PAI平台(Platform of Artificial Intelligence) Deep Learning Container 数据量大而全 先进的模型结构 业务场景复杂 计算力强、性价比高 提供 支撑 支撑 支撑 促进 促进 开源生态 系统 硬件 模型 生态系统 外循环 内循环 贡献 对接 PAI平台的优势 1. 机器学习PAI: https://help0 码力 | 40 页 | 8.51 MB | 1 年前3
Service Mesh落地之后_为sidecar注入灵魂 - 周群力1 周群力 Co-founder of Layotto Service Mesh 落地之后: 为 sidecar 注入灵魂 2 • Multi Runtime: 从 sidecar 到机甲 • Runtime API: 解决跨云部署和厂商绑定难题 • WebAssembly in sidecar: 让业务逻辑跑在sidecar里 • Service Mesh 回顾 • 展望2022:待解决的问题0 码力 | 63 页 | 880.85 KB | 1 年前3
2.Go语言实现中的几个研究课题_毛康力Go语⾔言实现中的⼏几个研究课题 ⽑毛康⼒力 @舜⻜飞科技 关于我 • Go发布1.0时开始关注 • 最早接触是在2012年 • 喜欢研究底层实现 • http://www.zenlife.tk/ 有同事称我⼤大神或⼤大师(湿?) 其实,我只是⼀一个研究僧 ⼤大纲 • 并发 • 接⼝口 • 垃圾回收 • 调度 • 死锁检测 并发 • goroutine提供轻量的并发机制0 码力 | 37 页 | 566.26 KB | 1 年前3
云计算白皮书护。转载、摘编或利用其它方式使用本白皮书文字或者观 点的,应注明“来源:中国信息通信研究院”。违反上述声 明者,本院将追究其相关法律责任。 前 言 党的二十大报告提出,要构建新一代信息技术等一批新的增长 引擎,打造具有国际竞争力的数字产业集群。云计算是信息技术发 展和服务模式创新的集中体现,是信息化发展的重大变革和必然趋 势,是信息时代国际竞争的制高点和经济发展新动能的助燃剂。云 计算引发了软件开发部署模式的创新,成为承载各类应用的关键基 深度挖掘云计算产业价值。我国政策指引云计算应用创新,持续推 动云计算与实体经济融合走深。 二是全球云计算市场稳定增长,我国保持快速发展。2022 年, 全球云计算市场规模为 4,910 亿美元,增速 19%,预计在大模型、 算力等需求刺激下,市场仍将保持稳定增长,到 2026 年全球云计算 市场将突破万亿美元。2022 年,我国云计算市场规模达 4,550 亿元, 较 2021 年增长 40.91%。相比于全球 19%的增速,我国云计算市场 四是云计算技术不断推陈出新,助力产业高质量发展。随着上 云进程持续加深,企业需求逐步向用云转移,效率、性能、安全等 成为用户关注点,应用现代化、一云多芯、平台工程、云成本优化、 系统稳定性、云原生安全等新技术层出不穷,满足用户多样性场景 需求,助力产业数字化升级。 在此背景下,中国信息通信研究院继《云计算白皮书(2012 年)》 之后第 9 次发布云计算白皮书。本白皮书聚焦过去一年多来云计算 产业的新发展新变化,总结梳理国内外云计算政策、市场、技术、0 码力 | 47 页 | 1.22 MB | 1 年前3
openEuler 21.03 技术白皮书容的软件生态体系。openEuler 旨在通过社区合作,打造创新平台,构建支持多种处理器架构、统一和开放的操作系统社区, 推动软硬件应用生态繁荣发展。 2019 年 12 月 31 日,一个面向多样性算力的操作系统开源社区 openEuler 正式成立。 2020 年 3 月 30 日,首个 openEuler 20.03 LTS (Long Term Support,简写为 LTS,中文为长生命周期支持)版本 openEuler 面向多样性算力的创新 openEuler 支持 X86、Arm、RISC-V 等多处理器架构,是一个推动多样性计算架构不断创新的操作系统平台。 openEuler 支持以 Intel/ 兆芯为代表的 X86 架构,以鲲鹏、飞腾为代表的 ARM 架构,同时发布了 RISC-V 的体验版本。 openEuler 希望与广大用户和开发者一起加速完善多样化算力的生态和性能体验。 openEuler openEuler 希望把工作负载和最合适的算力单元进行匹配,通过软件优化提升并行处理能力,高效的释放多样性算力。 openEuler 版本管理 openEuler 20.03 LTS openEuler 系统镜像下载 openEuler 社区主线 openEuler 20.09 openEuler 21.03 长生命周期版本 创新版本 首个创新版 内核创新版 云原生创新版0 码力 | 18 页 | 1.30 MB | 1 年前3
openEuler 24.03 LTS 技术白皮书,支持多样性计算, 致力于提供安全、稳定、易用的操作系统。通过为应用提供确定性保障能力,支持 OT 领域应用及 OT 与 ICT 的融合。 openEuler 社区通过开放的社区形式与全球的开发者共同构建一个开放、多元和架构包容的软件生态体系,孵化支持多种处 理器架构、覆盖数字基础设施全场景,推动企业数字基础设施软硬件、应用生态繁荣发展。 2019 年 12 月 31 日,面向多样性计算的操作系统开源社区 等关键技术;同时发布边缘和 嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本, 聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 年 9 月 30 日,发布 openEuler 22.09 创新版本,持续补齐全场景的支持。 2022 年 12 月 长生命周期版本 采用 6.x 内核提前进行技术探索,方便开发者进行硬件适配、基础技术创新及上层应用创新。 2023 年 6 月 30 日,发布 openEuler 22.03 LTS SP2 版本,场景化竞争力特性增强,性能持续提升。 2023 年 9 月 30 日,发布 openEuler 23.09 创新版本,是基于 6.4 内核的创新版本(参见版本生命周期),提供更多新特性和功能, 给开发者和用户0 码力 | 45 页 | 6.18 MB | 1 年前3
3 Thautwarm 解放python的表达力 性能和安全性 语法和语义扩展 JIT 静态检查解放Python的 表达力,性能和安全性 Thautwarm 目录 CONTENTS 语法和语义扩展 JIT 静态类型 语法和语义扩展 表达力的扩展, 可用性的保留,白来的午餐? 演示一小部分: 模式匹配, Quick Lambda, Pipe运算 语言决定思维模型 GNU-APL C++ Haskell 说 到 质 数 � 人 们 想 到 什 么 � 语言决定思维模型 程语言走向未来必然经过的一个极其不起眼 的、实现简单的基础设施。 语言决定思维模型 在 实 际 业 务 中 处 理 数 据 � Python 语言决定思维模型 语言中的语法和语义, 决定了 它真实的表达力。 大多数语言都不是“万金油” 的,这是客观事实。 但它们不够“万金油”的问题 来源,不一定是不能解决的。 扩展语言,开阔思维 我预期的语法(及语义) 扩展系统: 1. 首行用moshmosh? 基于template-python扩展实现。 性能比Pampy高数量级倍。 简单直接的自定义pattern,真实的tree pattern matching。 Match的每个分支是语句而不是表达力有限的表达式。 … benchmark.py Moshmosh实现 Quick-Lambda & Pipeline moshmosh/extensions/quick_lambdas.py0 码力 | 43 页 | 10.71 MB | 1 年前3
共 728 条
- 1
- 2
- 3
- 4
- 5
- 6
- 73













