积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部云计算&大数据(60)机器学习(14)Kubernetes(12)OpenShift(7)云原生CNCF(5)Service Mesh(4)Hadoop(3)RocketMQ(3)Apache APISIX(3)Docker(2)

语言

全部中文(简体)(49)英语(4)中文(繁体)(4)中文(简体)(2)

格式

全部PDF文档 PDF(59)DOC文档 DOC(1)
 
本次搜索耗时 0.044 秒,为您找到相关结果约 60 个.
  • 全部
  • 云计算&大数据
  • 机器学习
  • Kubernetes
  • OpenShift
  • 云原生CNCF
  • Service Mesh
  • Hadoop
  • RocketMQ
  • Apache APISIX
  • Docker
  • 全部
  • 中文(简体)
  • 英语
  • 中文(繁体)
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱

    样本读取 样本解析 基于GPU的多级存储训练:更⾼的性价⽐ � 推荐模型GPU训练的挑战 � 显存(A100最⼤80GB)放不下TB级的模型 � GPU多线程并⾏计算能⼒对稀疏数据不友好 � ⽅案 � 原有:内存能够存储的参数->对应的样本量Group � 新增:显存能够存储的参数->对应的样本量Pass � 新增:GPU并⾏操作友好->CSR格式的显存数据访问 SSD磁盘 10TB CPU型服务 Feature 2.2 Hotkey缓存优化 <10台 内存型服务 并发查询优化 数⼗台 ⽹络型服务 TB级模型实时上线 � 问题:TB模型实时多地传输和加载成本⾼ � ⽅案:⾼低频分别上线 � 更灵活的⽤法:模型多切⽚,按需上线 � Dssm � wdl ... 分布式Serving集群 副本1 副本2 Group 1 Group N 副本1 副本2 推理节点 的特点) 通讯量可以变⼩来提升训练速度么?---参数,梯度压缩 � 问题: � 参数w和梯度g占据主要的通讯量,拉⻓了请求时间 � 常规的数值⽆损的压缩⽅法效果不明显 � 业界主流做法: � 量化 � 稀疏化。累计发 送,需要做本地 梯度修正 float32->float16->int8->int4->2bit 直接压缩->训练算法补偿 [2020] Compressed Communication
    0 码力 | 22 页 | 6.76 MB | 1 年前
    3
  • pdf文档 第29 期| 2023 年9 月- 技术雷达

    员和平台团队之间提供了公开的合约。这个合约可能涉及在不同环境中提供云环境、数据库、监控、身份验证 等功能。这些工具强制执行组织标准,同时允许开发人员通过配置自主访问多种环境。这些平台编排系统的案 例包括 Kratix 和 Humanitec Platform Orchestrator。我们建议平台团队考虑这些工具,作为自己的脚本、本 地工具和基础设施即代码(infrastructure as 声称更加面向应用程序而不是工作负载为中心。 21. 自托管式大语言模型 评估 大语言模型(LLMs)通常需要大量的 GPU 基础设施才能运行,但目前有强烈的推动力使它们可以在更简单的 硬件上运行。对大语言模型进行量化可以减少内存需求,使高保真度模型可以在成本更低廉的硬件甚至是 CPU 上运行。像 llama.cpp 这样的工作使大语言模型可以在包括树莓派、笔记本电脑和通用服务器在内的硬件上运 行成为可能。 CPU 推理。它定义了一种分布式大语言模型(LLMs)的二进制格 式。为此,GGML 采用了量化技术,这种技术可以使 LLM 在用户的硬件上运行有效的 CPU 推理。GGML 支持 多种量化策略(例如 4 位、5 位、以及 8 位量化),每种策略动都在效果和性能之间提供了不同的取舍。一种快 捷地对使用这些量化模型的应用进行测试、运行和构建的方法是使用一个叫做 C Transformers 的 Python
    0 码力 | 43 页 | 2.76 MB | 1 年前
    3
  • pdf文档 Envoy原理介绍及线上问题踩坑

    总结:Envoy在处理响应后尝试检测连接状态,存在时间窗口没有检测到断开,并重用此连接发送后续请求而 遇到网络RST,并且Envoy连接池不会对当前连接发送失败后进行重试,导致Envoy返回503UC报错。 解 决 方 案 1、禁止服务侧Envoy对上游重用连接,通过设置maxRequestsPerConnection=1可以动态生效,但会有一定性能 下降。同时不影响上游连接数maxConnetions(默认1024 灰度发布全流程自动化管理:  灰度版本一键部署,流量切换一键生效  配置式灰度策略,支持流量比例、请求内容 (Cookie、OS、浏览器等)、源IP  一站式健康、性能、流量监控,实现灰度发布过程 量化、智能化、可视化 • 策略化的智能路由与弹性流量管理 无侵入智能流量管理:  权重、内容等路由规则,实现应用灵活灰度发布  HTTP会话保持,满足业务处理持续性诉求  限流、熔断,实现服务间链路稳定、可靠
    0 码力 | 30 页 | 2.67 MB | 1 年前
    3
  • pdf文档 动手学深度学习 v2.0

    85 3.1.1 线性回归的基本元素 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.1.2 矢量化加速 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 3.1.3 正态分布与平方损失 softmax运算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 3.4.5 小批量样本的矢量化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 3.4.6 损失函数 . . . . . . 小批量随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457 11.5.1 向量化和缓存 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457 11.5.2 小批量 . .
    0 码力 | 797 页 | 29.45 MB | 1 年前
    3
  • pdf文档 AI大模型千问 qwen 中文文档

    Qwen 成为可能。该库是 一个纯 C/C++ 实现,不依赖任何外部库,并且针对 x86 架构提供了 AVX、AVX2 和 AVX512 加速支持。此 外,它还提供了 2、3、4、5、6 以及 8 位量化功能,以加快推理速度并减少内存占用。对于大于总 VRAM 容量的大规模模型,该库还支持 CPU+GPU 混合推理模式进行部分加速。本质上,llama.cpp 的用途在于运行 GGUF(由 GPT 生 色扮演的乐趣,并使用不同类型的量化模型。您可 以训练诸如 LoRA 这样的算法,并将 Stable Diffusion 和 Whisper 等扩展功能纳入其中。赶快去探索更多高级 用法,并将它们应用于 Qwen 模型中吧! 1.7 AWQ 对于量化模型,我们推荐使用 AWQ 结合 AutoAWQ 。AWQ 即激活感知权重量化,是一种针对 LLM 的低比 特权重量化的硬件友好方法。而 AutoAWQ 是一个易于使用的工具包,专门用于 4 比特量化模型。相较于 FP16,AutoAWQ 能够将模型的运行速度提升 3 倍,并将内存需求降低至原来的 1/3。AutoAWQ 实现了激活 感知权重量化(AWQ)算法,可用于 LLM 的量化处理。在本文档中,我们将向您展示如何在 Transformers 框 架下使用量化模型,以及如何对您自己的模型进行量化。 1.7.1 如何在 Transformers 中使用 AWQ 量化模型 现在,Transformers
    0 码力 | 56 页 | 835.78 KB | 1 年前
    3
  • pdf文档 深度学习在电子商务中的应用

    论文,并有10多项相关领域的专利。  业余爱好: 骑行 个人简介 电子邮箱: jim.cheng@ususing.com 5 议程 • 深度学习与商品搜索  矢量化搜索技术简介  基于词语聚类的矢量化  基于用户会话的矢量化  原型评测结果及效果示例 • 深度学习与聊天机器人  聊天机器人简介  聊天机器人主要模块及架构  深度学习探索  聊天机器人评测结果 6 • 语义词汇差异 尚未进入生产线。 8 • 搜索数值矢量化  传统搜索基于文字匹配, 商品包含搜索词或者不包含搜索词  利用深度学习技术, 将搜索词和商品全部数值矢量化, 将文字匹配转化为数值矢量计算  词语矢量化是进一步进行各种深度学习的基础。 • 矢量化模型介绍  Mikolov(Google员工)等人2013发表了两篇关于Word2Vec的文章, 成为词语矢量化表示的基础  Word2vec的优点: vec(中国) )  矢量化模型的现况  词语的矢量化模型已经有开源实现方案  句子和文档的矢量化还在摸索阶段,尚不成熟  已经有一些在词语相似度,舆情分析等方面的应用 矢量化搜索模型 9 词语矢量化模型 CBOW: 通过上下文词语 来预测词语本身出现的概 率 Skip-gram: 通过词语本身 来预测上下文词语出现的 概率 10 基于词语聚类的矢量化模型 • Word2vec等工具可以有效地将词语转化为向量
    0 码力 | 27 页 | 1.98 MB | 1 年前
    3
  • pdf文档 机器学习课程-温州大学-02深度学习-神经网络的编程基础

    深度学习-神经网络的编程基础 黄海广 副教授 2 本章目录 01 二分类与逻辑回归 02 梯度下降 03 计算图 04 向量化 3 1.二分类与逻辑回归 02 梯度下降 01 二分类与逻辑回归 03 计算图 04 向量化 4 符号定义 ?:表示一个??维数据,为输入数 据,维度为(??, 1); ?:表示输出结果,取值为(0,1); (?( (1−?) (1−?)) ⋅ ?(1 − ?) = ? − ? ?=??? + ? 9 2.梯度下降 02 梯度下降 01 二分类与逻辑回归 03 计算图 04 向量化 10 梯度下降 ? 学习率 步长 11 梯度下降的三种形式 批量梯度下降(Batch Gradient Descent,BGD) 梯度下降的每一步中,都用到了所有的训练样本 随机梯度下降(Stochastic − ?(?) ?? (?) (同步更新?? ,(j=0,1,...,n )) 17 3.计算图 02 梯度下降 01 二分类与逻辑回归 03 计算图 04 向量化 18 3.计算图 ? = ?? ? = 3? ? = ? + ? ? ?, ?, ? = 3(? + ??), ? = 5, ? = 3, ? = 2 ? = 5 ? = 3 ? =
    0 码力 | 27 页 | 1.54 MB | 1 年前
    3
  • pdf文档 微博在线机器学习和深度学习实践-黄波

    特征深度化:特征embedding • 模型深度化:深度学习模型, Wide&Deep;DeepFM 4 深度学习 物料粗排 特征向量化 基于Item2vec的 博主召回和微博 召回 物料精排 向量索引 DSSM/FM/FF M生成博主与物 料向量,采用 向量进行召回 特征向量化:Item2vec 向量索引:FM/FFM/ DSSM 模型召回:DIN/DIEN/TDM 模型召回 融入用户近期互动行 分布式模型推理框架:WeiServing 异构CPU集群 kubernetes/ol-submit RPC服务框架 LR/GBDT DNN/DeepFM/W&D 负载均衡/统一版本管理/动态加载/批量化机制 特征映射 Embedding 数据处理 异构GPU集群 CNN 业务应用 模型服务 框架 排序模型服务 多媒体分析服务 自然语言分析服务 集群调度层 核心架构层 算法模型层
    0 码力 | 36 页 | 16.69 MB | 1 年前
    3
  • pdf文档 sealos 以 kubernetes 为内核的云操作系统

    全隔离,存储隔离且获得本地 磁盘同等IO能力 , 可以把整个集群像Docker 一样打包,一键交付 , 有轻量化、超高性能、极易管 理等特点 自研 负载均衡器, 可支撑超大规模数万节点 集群运行 ,运行速度全球领先,毫秒级发布 更高稳定性 实现安全隔离 轻量化 数万节点集群运行 运行速度 全球领先 超高性能 极易管理 使用场景 私有云 完全 离线 公有云 注册 使用
    0 码力 | 29 页 | 7.64 MB | 9 月前
    3
  • pdf文档 石油巨头与Kubernetes, Microservice & DevOps 共舞1114最终版

    需求理解 • 编码实现 • 产出交付 ⽀撑的场景 需求管理 开发管理 持续部署 持续测试 持续集成 持续监控 需求提出 需求管理场景 需求完成 需求处理 需求规划排期 ü 需求管理⼯具量化跟踪 ü 需求分级处理 ü 统⼀需求管理流程 ü 需求⾯板跟踪 ü 需求分级管理 ü 责任到⼈ ü 处理状态跟踪 ü 知识管理⼯具对知识协 同共享 ü 需求处理过程全链路追 溯 ü 18个阶段性汇报 10操作⼿册 6x14x3 6⼤主流程 14 ⼦流程 3个标准管道 13x7x5 13个开源⼯ 具 7个插件 5套环境 13x5x71 13个成熟度领域 5个可量化领域 71个⼯具⾃动分 析指标 2x6x4x1 2⼤认证体系 6 个测试场景 4个课件 1个实验室环境 1 | 参考⽂档 2 | 阶段成果 6 | 操作⼿册 3 | 指南 4 |
    0 码力 | 33 页 | 7.49 MB | 1 年前
    3
共 60 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
前往
页
相关搜索词
推荐模型基础特点大规规模大规模深度学习系统设计292023技术雷达Envoy原理介绍及线问题动手v2AI千问qwen中文文档电子商务电子商务应用机器课程温州大学02神经网络神经网神经网络编程微博在线实践黄波sealoskubernetes内核操作操作系统石油巨头KubernetesMicroserviceDevOps共舞1114最终最终版
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩