Deepseek R1 本地部署完全手册DeepSeek-R1-Q4_K_M 404 GB ≥500 GB ⾼性能服务器/云GPU 下载地址: HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议 硬件类型 推荐配置 性能表现(短⽂本⽣成) 消费级设备 Mac Studio(192GB统⼀内存) 10+ token/秒 ⾼性能服务器 4×RTX 4090(96GB显存+384GB内存) 7-8 token/秒(混合推理)0 码力 | 7 页 | 932.77 KB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502• 安全人才规模全球领先 • 漏洞挖掘能力全球领先 四个全球领先 世界的360 • 实战能力第一,实战是检验安全企业能力的唯一标准 • 安全研发投入第一,相当于第2名到第10名的总和 • 服务器和算力投入安全行业第一 • 创新能力第一,专利申请1.5万件,安全行业最多 • 服务和响应能力第一 • 用户数量第一,覆盖225个国家和地区的15亿终端 • 企业客户规模第一的网安公司 • 件分析平台 分析研判平台 端 • 服务全球15亿终端 • 覆盖全球225个国家 和地区 终端探针密布 云 数 智 知识 人 云端数据汇聚 • 探针数据上传到云 端 • 20万台服务器 • 210个数据中心 • 4000G出口带宽 • 1000P算力规模 大数据分析 • 总规模2.2EB,每天新 增1.5PB • 测绘数据300亿条 • 90亿+域名信息 • 存活网址库总量500000 码力 | 76 页 | 5.02 MB | 5 月前3
国家人工智能产业综合标准化体系建设指南(2024版)口协议、性能评定、试验方法等技术要求,包括智能传感器的架 构、指令、数据格式、信息提取方法、信息融合方法、功能集成 方法、性能指标和评价方法等标准。 4. 计算设备标准。规范人工智能加速卡、人工智能加速模 组、人工智能服务器等计算设备,及使能软件的技术要求和测试 方法,包括人工智能计算设备虚拟化方法,人工智能加速模组接 口协议和测试方法,及使能软件的访问协议、功能、性能、能效 的测试方法和运行维护要求等标准。 50 码力 | 13 页 | 701.84 KB | 1 年前3
开源中国 2023 大模型(LLM)技术报告:这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 :它们提供工具来有效地加 载、处理和迭代大型数据集,这对于训练大 型模型尤为重要。 国产深度学习框架 OneFlow 架构 (图源:https://www.oneflow.or0 码力 | 32 页 | 13.09 MB | 1 年前3
OctoML OSS 2019 11 8Meetup 11/8/2019 Jared Roesch OctoML is a new company building DL deployment solutions using the Apache (incubating) TVM project. A goal is to nurture the TVM community and contribute new infrastructure t3: Tensor Q octoML Coalesced t1: Tensor t2: Tensor t3: Tensor 13 Acknowledgments e The Apache(incubating) community members. e ASF Mentors and PMC members who make this awesome project Possiblel0 码力 | 16 页 | 1.77 MB | 5 月前3
TVM: Where Are We GoingIntel, … Incubated as Apache TVM recently. Independent governance, allowing competitors to collaborate. Open Code Open Development Open GovernanceAcknowledgement Apache (incubating) TVM community0 码力 | 31 页 | 22.64 MB | 5 月前3
Bring Your Own Codegen to TVMor its Affiliates. All rights reserved. Thank You and Q&A System Prototyping https://github.com/apache/incubator-tvm/pull/4258 RFC https://discuss.tvm.ai/t/bring-your-own-codegen-to-tvm/4501© 20190 码力 | 19 页 | 504.69 KB | 5 月前3
Manus AI:Agent元年开启52-2169-0770 ÷¬ûüÛresearch@htsc.com http://www.htsc.com.hk fg(:nµr•jklm µrýîþÿ!"g#h10î41õnýî10001• ÷øÛ+212-763-8160/ùúÛ+917-725-9702 ÷¬ûü: Huatai@htsc-us.com http://www.htsc-us.com ©‚ƒ,j2022¹fg(:hijklm0 码力 | 23 页 | 4.87 MB | 5 月前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modelhave solved question answering? try arc, the AI2 reasoning challenge. CoRR, abs/1803.05457, 2018. URL http://arxiv.org/abs/1803.05457. K. Cobbe, V. Kosaraju, M. Bavarian, M. Chen, H. Jun, L. Kaiser, M. Plappert Shazeer. Fast transformer decoding: One write-head is all you need. CoRR, abs/1911.02150, 2019. URL http://arxiv.org/abs/1911.02150. N. Shazeer, A. Mirhoseini, K. Maziarz, A. Davis, Q. V. Le, G. E. Hinton0 码力 | 52 页 | 1.23 MB | 1 年前3
TVM Meetup: Quantizationfor FP32 number (not a downcast) • Quantized tensor is represented with a scale and a zero point http://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf 𝑟𝑒𝑎𝑙_𝑣𝑎𝑙𝑢𝑒0 码力 | 19 页 | 489.50 KB | 5 月前3
共 11 条
- 1
- 2













