清华大学 DeepSeek 从入门到精通模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 5. 执行需求 需完成具体操作(代码/ 计算/流程) 任务 + 步骤约束 + 输出格 式 自主优化步骤,兼顾效率 与正确性 严格按指令执行,无自主优化 提示语示例 决策需求 验证性需求 "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。" 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: ① 实验数据是否支持该结论; ② 检查对照组设置是否存在偏差; ③ 重新计算p值并判断显著性。" �实战技巧: 分析需求 "分析近三年新能源汽车销量数据(附CSV),说明: ① 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。"0 码力 | 103 页 | 5.40 MB | 8 月前3
Ubuntu 桌面培训 2010. . . . . . . 485 XI.I.I AMD64 只能用在 AMD 的处理器上吗? . . . . . . . . . . . . . . . 485 XI.I.II 如何查看自己的计算机是否支持 AMD64? . . . . . . . . . . . . . 485 XI.I.III 64 位 Ubuntu 的可用软件会不会很少? . . . . . . . . . . . VI如何自动登录? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498 XI.VIII关于系统安全 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 I.6 Ubuntu 安全 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 540 页 | 26.26 MB | 1 年前3
MySQL高可用 - 多种方案服务器能自动跳转到备用机, 当主服务器服务启动起来后会自动切换回来。 2.2 方案架构图 2.3 方案优缺点 优点: 安装配置简单,实现方便,高可用效率好,可以根据服务与系统的可用性 多方面进行切换。 可以将写 VIP 和读 VIP 分别进行设置,为读写分离做准备。 扩展不是很方便。 可以在后面添加多个从服务器,并做到负载均衡。 缺点: 在启动或者恢复后会立即替换掉定义的 服务停止后,服务器能自动跳转到备用机,当主服务器服务 启动起来后会自动切换回来。 3.2 方案架构图 3.3 方案优缺点 优点: 实现方便,高可用效率好,可以根据服务与系统的可用性多方面进行切换。 可以将写 VIP 和读 VIP 分别进行设置,为读写分离做准备。 扩展很方便。可以在后面添加多个从服务器,并做到负载均衡。 缺点: 在启动或者恢复后会立即替换掉定义的 dbserver 10.1.1.75 puppet Authkerys 的配置 这个文件用来配置密码认证方式,支持3种认证方式,crc,md5和sha1, 从左到右安全性越来越高,消耗的资源也越多。因此如果 heartbeat 运行在安全的网路之上,比如私网,那么可以将验证方式设置成 crc, master 和 backup 的 authkeys 配置一样。我的 authkeys 文件配置如下: vim0 码力 | 31 页 | 874.28 KB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单, 对 模 型 进 行 最 终 的 强 化 学 习 , 以 对 齐 人 类 偏好。 降本提能:架构创新,技术增效 DeepSeek通过架构创新和模型蒸馏技术,在提升模型性能的同时,显著降低计算成本和内存占用。这些技术不仅在 长文本处理、代码生成、数学推理等任务中表现出色,还为大模型的轻量化和实际应用提供了有力支持。 模型蒸馏技术 DeepSeek采用模型蒸馏技术,通过将知识从大型复杂模型 系列和Llama 系列 架构创新 通过将模型划分为多个专家模块,实 现高效计算和推理。DeepSeek通过 无辅助损失的自然负载均衡和共享专 家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 内存和计算开销,在推理中降低了 KV缓存占用空间。 多头潜在注意力(MLA)机制 过程中使用更适宜的数据精度,减少 了计算量和存储需求。FP8混合精度 训练在保证训练准确性的基础上,显 著降低了计算成本,使得大规模模型 训练更加可行。 FP8混合精度训练 • 推 理 效 率 提 升 : 蒸 馏 后 的 模 型 参 数 量 大 幅 减 少 , 例 如 DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始 的DeepSeek-R1(671B参数),计算复杂度显著降低。0 码力 | 85 页 | 8.31 MB | 8 月前3
RocketMQ v3.2.4 开发指南优点:即使频繁调用,使用小块文件传输,效率也很高 缺点:丌能很好的利用 DMA 方式,会比 sendfile 多消耗 CPU,内存安全性控制复杂,需要避免 JVM Crash 问题。 2. 使用 sendfile 方式 优点:可以利用 DMA 方式,消耗 CPU 较少,大块文件传输效率高,无内存安全新问题。 缺点:小块文件效率低亍 mmap 方式,只能是 BIO 方式传输,丌能使用 NIO。 RocketMQ Header 迕行过滤,甚至可以挄照 Message Body 迕行过滤。 5. 使用 Java 诧言迕行作为过滤表达式是一个双刃剑,方便了应用的过滤操作,但是带来了服务器端的安全风险。 需要应用来保证过滤代码安全,例如在过滤程序里尽可能丌做申请大内存,创建线程等操作。避免 Broker 服 务器収生资源泄漏。 使用方式参见 Github 例子 https://github.com k 8 单次 Pull 消息(磁盘)传输的 最大条数 messageIndexEnable TRUE 是否开启消息索引功能 messageIndexSafe FALSE 是否提供安全的消息索引机 制,索引保证不丢 haMasterAddress 在 Slave 上直接设置 Master 地址,默认从 Name Server 上 自动获取,也可以手工强制配 置 brokerRole0 码力 | 52 页 | 1.61 MB | 1 年前3
2022 Apache Ozone 的最近进展和实践分享是否兼容主流API,如HDFS/S3 是否可以扩展⾄数百PB的存储容量,数千个 物理节点以及数⼗亿个对象 扩展性 API 兼容性 性能 是否⽀持存算分离架构同时也可以兼容存算耦合 架构 应⽤对接 安全 加密 HDFS现有的⼀些解决⽅案 Namenode Federation Router Based Federation 是否需要⼀个新的⼤数据存储? 现有的对象存储⽅案 ⽆法很好的横向扩展 (300M FILES) AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OZONE (2 BILLION Objects) AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OTHER WORKLOADS OTHER WORKLOADS X • 可⽤于承载实时和批处理的业务 • 更易于运维的控制⾯ • 只需要⼀个运维团队⽽不是多个 运维价值 OZONE STORAGE AI/ML HIVE/IMPALA/ SPARK KAFKA / Flink 计算 数据科学 数据仓库 S3 应⽤ S3 API OTHER WORKLOADS ⽬录 • Apache Hadoop HDFS⾯临的问题 • Apache Ozone介绍 • Apache0 码力 | 35 页 | 2.57 MB | 1 年前3
Kubernetes Operator 实践 - MySQL容器化MySQL 容器化 刘林 搜狗资深工程师 关于我 搜狗商业平台研发部 资深开发工程师 l 主要从事商业平台研发工作,在构建高性能、高可用大规模 系统方面有丰富的实践经验 l 目前专注于云计算、DevOps 等相关领域,负责搜狗商业云 平台的设计研发工作 刘林 1. 背景介绍 2. Operator 的基本原理 3. MySQL Operator 设计实践 4. 小结 搜狗商业平台 … mysql Pod-T 0. 创建 CRD 3. 集群管理 2. 调度 pod Ceph Kubernetes 的容器编排 • Pod 名稳定 • Pod 启动有序 • Pod 扩容安全 Deployment mysql-5f54tvkj8 mysql-7c46782dr mysql-577ck9s8f StatefulSet mysql-0 mysql-1 mysql-2 实践 ü 自定义 controller,使用 CRD ü MHA、MGR 高可用的实现 ü 扩缩容、故障处理流程 ü 分布式存储 ceph 展望 • 优化存储 • 增强 MySQL 的安全性 • 完善数据处理工具0 码力 | 42 页 | 4.77 MB | 1 年前3
强大的音视频处理工具: FFmpegall right reserved, powered by Gitbook最后更新: 2021-09-14 11:12:43 ffmpeg -i 1xx-我来保证你们的安全.mp4 ffmpeg -i 1xx-我来保证你们的安全.mp4 ffmpeg version 3.4.2 Copyright ffmpeg version 3.4.2 Copyright ((cc)) 2000-2018 50+100 = 150 宽度:左右都增加 30 ,原视频居中 总增加宽度= 30*2 = 60 背景⾊: LawnGreen 透明度: 0.2 命令: pad中的值⽤⼿动计算出的值: ffmpeg -i input.mp4 -vf ffmpeg -i input.mp4 -vf "pad=width=0:height=460:x=0:y=0:col "pad=wid0 码力 | 73 页 | 11.57 MB | 1 年前3
MySQL 8.0.17 调优指南(openEuler 20.09)统的设计,算法选择,如何使 用编译器的选项,如何发挥硬件最大的性能等等。 在性能优化时,我们必须遵循一定的原则,否则,有可能得不到正确的调优结果。主 要有以下几个方面: ● 对性能进行分析时,要多方面分析系统的资源瓶颈所在,因为系统某一方面性能 低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性0 码力 | 11 页 | 223.31 KB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.1确保你现在看的迷你书是最新版本,请点击这里: • 《JavaScript 正则表达式迷你书》 感谢 由于本书是由个人文章修改而成,感谢各平台读者的支持。 感谢湖山,是他说我该把这些东西写出来的。 感谢小不,他在多方面给予了我帮助,封面是他设计的。 感谢小鱼二,他对全书进行了仔细地校对,并提出了相应的修改意见。 感谢丹迪的支持,他为我设计了多个封面,风格比较前卫,留给后续版本。 最后,尤其要感谢各位大佬帮0 码力 | 89 页 | 3.42 MB | 11 月前3
共 16 条
- 1
- 2













