清华大学 DeepSeek 从入门到精通模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google), 5. 执行需求 需完成具体操作(代码/ 计算/流程) 任务 + 步骤约束 + 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。"0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单元知AI综述工具依托于真实的学术数据库,具备较强的学术性和深度,尤其在学术研究领域具有较大优势。其生成内容结构严谨、内容全面, 并提供了有益的可视化工具,增强了综述的直观性与理解度。 PubScholar平台在内容多样性和研究视角多样性方面表现良好,但引用格式和参考文献管理方面有待提高。 知网研学平台则在中文文献分析和结构化内容生成方面具有优势,引用格式较为规范。 斯坦福STORM在行业报告的生成中表现突出,能 , 对 模 型 进 行 最 终 的 强 化 学 习 , 以 对 齐 人 类 偏好。 降本提能:架构创新,技术增效 DeepSeek通过架构创新和模型蒸馏技术,在提升模型性能的同时,显著降低计算成本和内存占用。这些技术不仅在 长文本处理、代码生成、数学推理等任务中表现出色,还为大模型的轻量化和实际应用提供了有力支持。 模型蒸馏技术 DeepSeek采用模型蒸馏技术,通过将知识从大型复杂模型 系列和Llama 系列 架构创新 通过将模型划分为多个专家模块,实 现高效计算和推理。DeepSeek通过 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 内存和计算开销,在推理中降低了 KV缓存占用空间。 多头潜在注意力(MLA)机制0 码力 | 85 页 | 8.31 MB | 8 月前3
基于 KUBERNETES 的 容器器 + AI 平台58s 视频演示 Kubeflow 的应⽤用 Kubeflow 之上 构建集群与管理理资源 多集群和镜像仓库 • 企业想要的 • 隔离性和安全性 • 容错性与混合云 • 功能多样性与上线流程 • 如何实现 • K8s - 单『控制集群』, 多『⽤用户集群』 • 镜像仓库 - 单『默认仓 库』,多仓库集成 管理理集群和节点 • 技术概览 • cloud provider0 码力 | 19 页 | 3.55 MB | 1 年前3
Ubuntu 桌面培训 2010. . . . . . . 485 XI.I.I AMD64 只能用在 AMD 的处理器上吗? . . . . . . . . . . . . . . . 485 XI.I.II 如何查看自己的计算机是否支持 AMD64? . . . . . . . . . . . . . 485 XI.I.III 64 位 Ubuntu 的可用软件会不会很少? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 III.56 Ubuntu One 添加您的计算机页面 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 III.57 Ubuntu One 首选项 . . Ubuntu 的帮助 • 如何创建分区和使用双启动选项 目标对象和前提要求 本课程为家庭用户和办公室用户提供 Ubuntu 操作系统的培训。目标对象不必预先了 解 Ubuntu,但必须具备基本的计算机使用能力。要开始学习本课程,请先在您的计 算机硬盘上安装 Ubuntu 10.04 LTS。 28 学生职责 目录 Lucid Lynx 本课程以模块为单位来组织。在教室中进行全日制学习的话,两天就可以学习完整个0 码力 | 540 页 | 26.26 MB | 1 年前3
消息中间件RocketMQ原理解析 - 斩秋processQueue 的 lock 属性是否为 true,lock 属性是否过期,如果为 false 或者过期, 放到本地线程稍后锁定在消费。 如果 lock 为 true 且没有过期,开始消费消息 计算任务执行的时间如果大于一分钟且线程数小于队列数情况下,将 processqueue, messagequeue 重新构建 ConsumeRequest 加到线程池 10ms 后在消费,这样防止个别队列被 获取,此函数如果集合中一个也没有创建一个,如果最后一个写满了也创 建一个新的。 MapedFileQueue 在获取 getLastMapedFile 时,如果需要创建新的 MapedFile 会计算出下 一个 MapedFile 文件地址,通过预分配服务 AllocateMapedFileService 异步预创建下一个 MapedFile 文件,这样下次创建新文件请求就不要等待,因为创建文件特别是一个 indexCount 4 位 int 类型,索引文件中构建的索引个数 槽位 slot, 默认每个文件配置的 slot 个数为 500 万个, 每个 slot 是 4 位的 int 类型数据 计算消息的对应的 slotPos=Math.abs(keyHash)%hashSlotNum 消息在 IndexFile 中的偏移量 absSlotPos = IndexHeader.INDEX_HEADER_SIZE0 码力 | 57 页 | 2.39 MB | 1 年前3
Apache Pulsar,云原生时代的消息平台 - 翟佳
⾃我介绍 • 开源项⽬爱好者: • Apache Pulsar PMC成员 • Apache BookKeeper PMC成员 • EMC -> StreamNative • 华中科⼤ -> 中科院计算所 • Pulsar 的根本不同 • Apache Pulsar 简介 • Pulsar 的⽣态和社区 streamnative.io Apache Pulsar 简介 - 跨地域复制 • 解除存储计算耦合 • 运维痛点:替换机器、服务扩容、数据 rebalance • 减少⽂件系统依赖 • 性能难保障: 持久化(fsync)、⼀致性(ack: all)、多Topic • IO不隔离:消费者读Backlog的时候会影响其他⽣产者和消费者 streamnative.io Apache Pulsar 特性 • 云原⽣架构: • 存储计算分离 • 分层 + 分⽚ • Pulsar 简介 • Pulsar 的云原⽣架构 • 企业级流存储: BookKeeper streamnative.io Pulsar: 云原⽣的架构 —— 分层 + 分⽚ • 存储和计算分离 • 节点对等 • 独⽴扩展 • 灵活扩容 • 快速容错 streamnative.io Broker 容错 ⽆感知容错 零数据catchup streamnative.io Bookie容错0 码力 | 39 页 | 12.71 MB | 6 月前0.03
2022 Apache Ozone 的最近进展和实践分享(300M FILES) AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OZONE (2 BILLION Objects) AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OTHER WORKLOADS OTHER WORKLOADS X • 可⽤于承载实时和批处理的业务 • 更易于运维的控制⾯ • 只需要⼀个运维团队⽽不是多个 运维价值 OZONE STORAGE AI/ML HIVE/IMPALA/ SPARK KAFKA / Flink 计算 数据科学 数据仓库 S3 应⽤ S3 API OTHER WORKLOADS ⽬录 • Apache Hadoop HDFS⾯临的问题 • Apache Ozone介绍 • Apache (越⾼越好) 1-replica 0 100% 3-replica 2 33% EC RS(6,3) 3 67% EC RS(10, 4) 4 71% EC RS(3,2) 2 60% 以计算为代价,在不降低数据可靠性的同 时,降低数据存储成本 数据可靠性 vs. 存储效率 纠删码策略 • 内建⽀持的策略 • RS-3-2-1024K • RS-6-3-1024K • XOR-2-1-1024K0 码力 | 35 页 | 2.57 MB | 1 年前3
RocketMQ v3.2.4 开发指南1. 根据消息从 DB 查询数据 1 2. 根据消息从 DB 查询数据 2 3. 复杂的业务计算 4. 吐 DB 揑入数据 3 5. 吐 DB 揑入数据 4 返条消息的消费过程不 DB 交互了 4 次,如果挄照每次 5ms 计算,那举总共耗时 20ms,假设业务计算耗时 5ms, 那举总过耗时 25ms,如果能把 4 次 DB 交互优化为 2 次,那举总耗时就可以优化到0 码力 | 52 页 | 1.61 MB | 1 年前3
基于go和flutter的实时通信/视频直播解决方案 段维伟WebRTC 可以做什么 02. 副标题 • 用实现网页音/视频通话 • 低延迟直播系统(在线课堂) • 多人视频会议系统 • 高质量SIP/VOIP系统 • 视频监控系统 • 机器学习,视觉计算等 如何使用它 01. 副标题 • 在Web中使用JS API • 基于google libwebrtc实现原生客户端开发 (ios/android/c++) • 使用第三方堆栈实现兼容功能(Go)0 码力 | 38 页 | 2.22 MB | 1 年前3
Kubernetes Operator 实践 - MySQL容器化MySQL 容器化 刘林 搜狗资深工程师 关于我 搜狗商业平台研发部 资深开发工程师 l 主要从事商业平台研发工作,在构建高性能、高可用大规模 系统方面有丰富的实践经验 l 目前专注于云计算、DevOps 等相关领域,负责搜狗商业云 平台的设计研发工作 刘林 1. 背景介绍 2. Operator 的基本原理 3. MySQL Operator 设计实践 4. 小结 搜狗商业平台0 码力 | 42 页 | 4.77 MB | 1 年前3
共 11 条
- 1
- 2













