TensorRT - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

TVM@AliOS

曾硬证 0 Mobilenet 1.0 densenet121 量TVM (with Auto Tuning) 目MXNet+ TensorRT 目TVM +TensorRT AiiOS ! 驱动万物智能 THANKS9 Ali0S ! 驱动万物智能

0 码力 | 27 页 | 4.86 MB | 5 月前
3
PAI & TVM Meetup - Shanghai 20191116

INT8 Inference on PAI- 引FTe[= PAI-Blade Model Analysis Graph optimization Blade Graph Optimizer TensorRT Customized OptimizeT TAO Compiler (XLA) cuUBLAS/VcuDNNVCUTL， Blade Kernel Lib S， ation 计算平台事业部

0 码力 | 26 页 | 5.82 MB | 5 月前
3
TVM Meetup: Quantization

a zero point http://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf 𝑟𝑒𝑎𝑙_𝑣𝑎𝑙𝑢𝑒 = 𝑠𝑐𝑎𝑙𝑒 ∗ (𝑞𝑢𝑎𝑛𝑡𝑖𝑧𝑒𝑑_𝑣𝑎𝑙𝑢𝑒 − 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡)© 2019

0 码力 | 19 页 | 489.50 KB | 5 月前
3
2024 中国开源开发者报告

Azure AI、谷歌 Vertex AI 等，允许应用开发者轻松部署和使用标准化或定制化的 AI 模型，并通过 API 接口调用这些模型。  最后一类是本地推理，SGLang、vLLM、TensorRT-LLM 在生产级 GPU 服务负载中表现出色，受到许多有本地托管模型需求的应用开发者的欢迎，此外，Ollama 和 LM Studio 也是在个人计算机上运行模型的优选方案。 62

0 码力 | 111 页 | 11.44 MB | 8 月前
3

共 4 条前往

页

TVM AliOS PAI Meetup Shanghai 20191116 Quantization 2024 中国开源开发开发者报告