Moonshot AI 介绍智能。随后⼤家意识到,数据线的 输⼊是有限的,这就是所谓的数据瓶颈问题,下⼀代AI需要拔掉数据线,做到只要源源不断地输⼊电 ⼒,就能源源不断地输出智能。 这两个核⼼问题导致在第三层有巨⼤的空间,包括long-context、不同模态的⽣成、模型多步规划的 能⼒、指令遵循的能⼒、各种agent的功能等。 这些上层的东西都会有巨⼤的差异化,因为中间存在两个重要的技术变量。我认为这是我们的机会。 ⾼的efficiency,多出来的efficiency就是各⾃的优势。 现在很多⼈觉得做出MoE就可以实现GPT-4。我觉得这是⽚⾯的说法,最终更实质的可能还是如何有 ⼀个统⼀的表⽰空间以及可规模化的数据⽣产。 海外独⻆兽:如果算⼒⾜够,会有⼈想做⼀个万亿参数的densemodel吗? 杨植麟:取决于推理成本的下降速度,但我觉得肯定会有。现在⼤家是因为推理成本太⾼,所以都在 看可能性的话,今天的⼀切都会变化。这么多语⾔被训练到⼀起,对⽂化、价值观都有影响。⼈的时 间分配可能也会产⽣很多变化,真正为了钱⼯作的⼈可能会变少,更多时间可能花在精神世界⾥⾯, 最后可能会有⼀个巨⼤的虚拟的精神空间。要实现Metaverse,可能其实是要先实现AI。 另外,我相信AGI最终是全球化的。 海外独⻆兽:但是现在我们判断领先的模型⼜强⼜便宜,会有很强的⻢太效应,最后格局还是很收 敛。0 码力 | 74 页 | 1.64 MB | 1 年前3
DeepSeek从入门到精通(20250204)表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" �实战技巧: 执行需求 �实战技巧: "将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。" 创造性需求 "设计一款智能家居产品,要求: ① 解决独居老人安全问题; ② 结合传感器网络和AI预警; 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语 利用类比、反向思考等技巧拓展AI输出的可能性 巧妙结合不同领域概念,产生跨界创新 结果优化能力 分析AI输出,识别改进空间 通过迭代调整提示语,优化输出质量 设计评估标准,量化提示语效果 跨域整合能力 将专业领域知识转化为有效的提示语 利用提示语桥接不同学科和AI能力 创造跨领域的创新解决方案 系统思维0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" �实战技巧: 执行需求 �实战技巧: "将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。" 创造性需求 "设计一款智能家居产品,要求: ① 解决独居老人安全问题; ② 结合传感器网络和AI预警; 设计清晰、精确的提示语结构 创意引导能力 设计能激发AI创新思维的提示语 利用类比、反向思考等技巧拓展AI输出的可能性 巧妙结合不同领域概念,产生跨界创新 结果优化能力 分析AI输出,识别改进空间 通过迭代调整提示语,优化输出质量 设计评估标准,量化提示语效果 跨域整合能力 将专业领域知识转化为有效的提示语 利用提示语桥接不同学科和AI能力 创造跨领域的创新解决方案 系统思维0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利l 文本创作 文章/故事/诗歌写作 营销文案 、广告语生成 社交媒体内容(如推文 、帖子) 剧本或对话设计 l 摘要与改写 长文本摘要(论文 、报告) 文本简化(降低复杂度) 多语言翻译与本地化 l 结构化生成 表格 、列表生成(如日程安排 、 菜谱) 代码注释 、文档撰写 文本生成 文本生成 03 02 01 语义分析 • 语义解析 • 情感分析(评论、反馈) 你已经预料到会被问到婚姻 问题。七大姑八大姨们纷纷关心你的婚恋状况,问题接二连三地抛来,让你感到压力重重。 目标:在不伤害长辈感情的情况下,妥善处理亲戚的催婚问题,维护家庭和谐,同时保护自己的个人空间和选择。 对话技巧 p 使用“我”语句:如“我感到…”,避免指责。 p 运用幽默:如“现在我还是专心工作,等以后有了 对象再来麻烦您操心!” p 避免冲突:寻找共同点,如“您说得对,婚姻很重 p 坦诚交流,表达立场 示例:温和地说明,“我现在在工作上有些目标想要实 现,婚姻大事需要时间和精准的选择。” p 设定界限,明确底线 示例:礼貌但坚定地说,“我会认真考虑,但希望能有 自己的空间去选择。” p 转移话题,缓解气氛 示例:主动询问,“您最近有什么新鲜事吗?我听说您 最近在学习摄影?” p 寻求家长支持 示例:私下对父母说,“我知道大家都很关心我,但我 希望能有时间去寻找合适的伴侣,希望您能理解和支持0 码力 | 65 页 | 4.47 MB | 8 月前3
2024 中国开源开发者报告先别急。大 模型底层框架还存在底层路线之争。 32 / 111 我们知道,Transformer 架构呈现了 O(n²)的理论计算复杂度,这里的 n 指的是大模型输入 序列的 token 数量,但其前任语言模型担当 RNN 只有 O(n)的理论计算复杂度。 最近,以 Mamba、RWKV 为代表的类 RNN 结构死灰复燃,公开挑战 transformer 地位。 更有最新研究【13】从理论上表明,RNN 一个世界领先的通用大模型加上 RAG(搜索增强生成)行业知识库,做出的专业模型效果往往 超过开源模型加上一些垂直领域数据微调得到的行业模型。因此,专业模型虽然训练、推理成本 都较高,但考虑到较高的溢价空间,投入是值得的。 由于通用大模型的通用性,难以建立差异化壁垒,也难以形成网络效应,因此基础模型公司 的竞争将非常激烈,算力将成为长期竞争力的关键。 对于大公司而言,能否集中算力、数据和人才,保持组织高效很关键。创业公司需要更多的 的强推理能力模型也不一定需要很 大,未来将成为个人模型的标配,经常算错数的模型将被淘汰。 手机、PC 和空间计算设备的端侧个人模型将足够满足大多数日常需求,智能汽车可能成为 家庭计算中心。云端模型将作为端侧模型的补充,用于处理较复杂的任务和处理大量数据。模型 的多模态能力将使 AR/VR 等空间计算设备成为更自然的人机交互入口。推理能力将使得模型可 38 / 111 以可靠处理复杂任务,真正0 码力 | 111 页 | 11.44 MB | 8 月前3
2023年中国基础软件开源产业研究白皮书流设备的全覆盖。除南向支持多样设备,北向覆盖应用场景外,openEuler还通过分布式套件与OpenHarmony系统互通,从而提 供更全面、更丰富的解决方案。这种融合不仅有助于促进用户之间的无缝交互,也为开发者提供了更多的创新空间和灵活性。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 openEuler连接全景图 主流场景100%支持 | 含3.5W+主流应用 + + 工业控制 云原生 大数据 CDN www.iresearch.com.cn 中国开源数据库图谱 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 关系型数据库 时序数据库 图数据库 键值数据库 向量及空间数据库 数据库 内核 中国开源数据库 多数基于国外成 熟的数据库内 核,仅少部分厂 商自研 24 ©2023.11 iResearch Inc. PingCAP 兼具开源与商 业发行版数据 库 openGauss 华为 传统行业中最 重要的开源数 据库厂商,数 据库为集中 式,注重安全 稳定 互联网行业开源已成主流;国产化替代趋势下,传统行业市场空间巨大 互联网开源数据库对传统行业的渗透: 传统行业逐步互联网化,一些C端业务 可以适用开源数据库 鼓励国产化替代,降低传统行业对海外 数据库(Oracle、DB2等)的依赖 受限于行业差异,渗透势头不大0 码力 | 43 页 | 4.69 MB | 1 年前3
KiCad PCB 编辑器 5.1
pretty_writing_to_this_dir”选项添加到 封装库表条目的“选项”设置中。 此选项是“库路径”,用于本地存储从 GitHub 存储库读取的修改过的封装副本。 保存到此路径的占用空间与 GitHub 存储库 的只读部分组合以创建封装库。 如果缺少此选项,则 GitHub 库是只读的。 如 果 GitHub 库存在该选项,则对该混合库的任何写入都将转到本地“*.pretty”目 录。 需要时始终可用。 这样做的缺点是您可能需要搜索大量的库来查找您正在寻找的足迹。 您可以根据项目特定定义所有库。 这样做的好处在于你仅需要定义你在某个项目中需要用到的封装,这将 大大减小搜索的复杂度。 缺点是您始终需要记住为每个项目添加所需的每个封装库。 您还可以在全局和项目中专门定义封装库。 一种用法模式是全局定义最常用的库,而库只需要项目特定库表中的项目。 您如何定义库没有限制。 修改PCB项目中的封装 PCB。 这也意味着您可以单独编辑 PCB 上的封装,而不会影响相同封装的其他实例 (在同一 PCB 或其他 PCB 上)。 但是,如果修改库占用空间,则下次放置实例时,它将与现有的同名封装不匹 配。 提示 通常的做法是将您使用的所有占用空间复制到单独的版本控制位置, 以便此项目不会因系统或用户库的更改而意外受到影响。 此外,它确 保用于 PCB 的所有封装资源都可以轻松地与 PCB 文件一起分发。0 码力 | 304 页 | 3.02 MB | 1 年前3
KiCad PCB 编辑器 5.1
_pretty_writing_to_this_dir”选项添加到封装库表条目的“选项”设 置中。此选项是“库路径”,用于本地存储从 GitHub 存储库读取的修改过的封装副本。保存到此路径的占用空间与 GitHub 存储库的只读部分组合以创建封装库。如果缺少此选项,则 GitHub 库是只读的。如果 GitHub 库存在该选 项,则对该混合库的任何写入都将转到本地“*.pretty”目录。 可用。 – 这样做的缺点是您可能需要搜索大量的库来查找您正在寻找的足迹。 • 您可以根据项目特定定义所有库。 – 这样做的好处在于你仅需要定义你在某个项目中需要用到的封装,这将大大减小搜索的复杂度。 – 缺点是您始终需要记住为每个项目添加所需的每个封装库。 • 您还可以在全局和项目中专门定义封装库。 一种用法模式是全局定义最常用的库,而库只需要项目特定库表中的项目。您如何定义库没有限制。 响 PCB。 这也意味着您可以单独编辑 PCB 上的封装,而不会影响相同封装的其他实例(在同一 PCB 或其他 PCB 上)。 但是,如果修改库占用空间,则下次放置实例时,它将与现有的同名封装不匹配。 Tip 通常的做法是将您使用的所有占用空间复制到单独的版本控制位置,以便此项目不会因系统或用户库的更改而意外 受到影响。此外,它确保用于 PCB 的所有封装资源都可以轻松地与 PCB 文件一起分发。0 码力 | 175 页 | 4.56 MB | 1 年前3
Deepseek R1 本地部署完全手册码补全 7B - RAM: 8-10GB - GPU: GTX 1680(4-bit量 化) - 存储: 8GB - 内存: 16GB(M2 Pro/M3) - 存储: 8GB 中等复杂度问答、代码 调试 14B - RAM: 24GB - GPU: RTX 3090(24GB VRAM) - 存储: 20GB - 内存: 32GB(M3 Max) - 存储: 20GB 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile: 5. 运⾏模型: 4. 性能调优与测试 GPU利⽤率低:升级⾼带宽内存(如DDR5 5600+)。 扩展交换空间: 六、注意事项与⻛险提示 1. 成本警示: 70B模型:需3张以上80G显存显卡(如RTX A6000),单卡⽤户不可⾏。 671B模型:需8xH100集群,仅限超算中⼼部署。 2. 替代⽅案:0 码力 | 7 页 | 932.77 KB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单家机制,解决了专家模块工作量不平 衡的问题。 混合专家(MoE)架构 通过低秩压缩减少推理时的内存占用, 同时保持与传统多头注意力(MHA) 相当的性能。MLA在训练中减少了 内存和计算开销,在推理中降低了 KV缓存占用空间。 多头潜在注意力(MLA)机制 通过序列化预测未来多个令牌,增强 模型的上下文建模能力,并支持推测 解码加速推理。MTP在特定场景下同 时预测多个令牌,提高信号密度,减 少上下文漂移和逻辑连贯性问题。 蒸 馏 后 的 模 型 参 数 量 大 幅 减 少 , 例 如 DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始 的DeepSeek-R1(671B参数),计算复杂度显著降低。 • 性能优化:在代码和数学基准测试中,蒸馏技术显著提升了模 型性能。例如,在基准测试中,蒸馏后的DeepSeek-V2.5模 型在Pass@1和Length指标上均显著优于基线模型。 芯片、 云平台、操作系统等产业的发展。 技术深化:突破局限,能力提升 DeepSeek R1展示了强化学习技术和算法创新在 AI 领域的巨大潜力,但其仍然处于发展阶段,存在一定局限性和优化 空间。未来,随着技术的不断进步和创新,DeepSeek R1 可能会在以下几个方面实现进一步的突破: 通用能力提升 解决语言混杂问题 目前,DeepSeek R1在函数调用、多轮 对话、复杂角色扮演和0 码力 | 85 页 | 8.31 MB | 8 月前3
共 159 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16













