 2024 中国开源开发者报告型厂商提供一些技术支持即可。同时因为大模型运行在本地,开发者在构建大模型应用时,为了 物理部署上的便利,很可能会在应用与模型之间创造出物理部署上的耦合性。 当然这种“开源策略”不是进攻的方法,而是“先为不可胜,以待敌之可胜”。目标是以最 小的代价,尽可能多地消耗闭源对手的资源与心气。 顾钧 资深开发者社区运营专家,目前担任杭州映云科技 (EMQ) 市场&开发者 社区总监一职。 2004 年,顾钧从北京大学计算机系本科毕业,其后在工商银行、IBM、 Recursively Generated Data’ 【15】The Platonic Representation Hypothesis 傅聪 浙江大学计算机博士,美国南加州大学访问学者,《业务驱动的推荐系 统:方法与实践》作者。高性能检索算法 NSG、SSG 的发明者,知乎 科技博主“傅聪 Cong”。 前阿里巴巴算法专家,目前就职于 Shopee(新加坡)任资深算法专家。 在顶会和期刊 等,把《Her》等 科幻电影中的场景变为现实。 一般认为,同时具备 GPT-4o 多模态能力和 o1 推理能力的模型就可以满足个人模型的需求, 目前国内的头部 AI 公司也已接近个人模型的技术目标。但目前端到端多模态模型和推理模型的 成本仍然较高,且在一些场景下还不够稳定。 但 2023 年以来,模型知识密度有每 8 个月提升一倍的“类摩尔定律”趋势,加上硬件的摩 尔定律和推理框架的优0 码力 | 111 页 | 11.44 MB | 8 月前3 2024 中国开源开发者报告型厂商提供一些技术支持即可。同时因为大模型运行在本地,开发者在构建大模型应用时,为了 物理部署上的便利,很可能会在应用与模型之间创造出物理部署上的耦合性。 当然这种“开源策略”不是进攻的方法,而是“先为不可胜,以待敌之可胜”。目标是以最 小的代价,尽可能多地消耗闭源对手的资源与心气。 顾钧 资深开发者社区运营专家,目前担任杭州映云科技 (EMQ) 市场&开发者 社区总监一职。 2004 年,顾钧从北京大学计算机系本科毕业,其后在工商银行、IBM、 Recursively Generated Data’ 【15】The Platonic Representation Hypothesis 傅聪 浙江大学计算机博士,美国南加州大学访问学者,《业务驱动的推荐系 统:方法与实践》作者。高性能检索算法 NSG、SSG 的发明者,知乎 科技博主“傅聪 Cong”。 前阿里巴巴算法专家,目前就职于 Shopee(新加坡)任资深算法专家。 在顶会和期刊 等,把《Her》等 科幻电影中的场景变为现实。 一般认为,同时具备 GPT-4o 多模态能力和 o1 推理能力的模型就可以满足个人模型的需求, 目前国内的头部 AI 公司也已接近个人模型的技术目标。但目前端到端多模态模型和推理模型的 成本仍然较高,且在一些场景下还不够稳定。 但 2023 年以来,模型知识密度有每 8 个月提升一倍的“类摩尔定律”趋势,加上硬件的摩 尔定律和推理框架的优0 码力 | 111 页 | 11.44 MB | 8 月前3
 2023年中国基础软件开源产业研究白皮书与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 展 持 续 动 力 收 益 直 接 企业倾向在自身技术实力较强、产品能 力较扎实的领域选择开源 社区运营是开源人力投入的焦点,头部 企业社区人员投入量超过千名 为方便各职能开源人员交流和开源业务 整合,企业针对性调整组织架构 基础软件是底层技术投入较多的领域之 一,需要企业持续供给技术资源 开源项目的研发、运营、激励都需要 “真金白银”的投入 企业作为开源发起者,应主导开源生态 的建设,努力引入战略合作伙伴 www.iresearch.com.cn 开放原子开源基金会 以培育开源生态、孵化开源项目、构筑技术优势为目标的中国本土基金会 秉持科技、公益、慈善的属性,华为、阿里巴巴、百度等多家行业龙头于2020年发起设立开放原子开源基金会,是目前为止中国境 内最重要的开源产业非盈利机构,为行业中各参与者提供战略咨询0 码力 | 43 页 | 4.69 MB | 1 年前3 2023年中国基础软件开源产业研究白皮书与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 展 持 续 动 力 收 益 直 接 企业倾向在自身技术实力较强、产品能 力较扎实的领域选择开源 社区运营是开源人力投入的焦点,头部 企业社区人员投入量超过千名 为方便各职能开源人员交流和开源业务 整合,企业针对性调整组织架构 基础软件是底层技术投入较多的领域之 一,需要企业持续供给技术资源 开源项目的研发、运营、激励都需要 “真金白银”的投入 企业作为开源发起者,应主导开源生态 的建设,努力引入战略合作伙伴 www.iresearch.com.cn 开放原子开源基金会 以培育开源生态、孵化开源项目、构筑技术优势为目标的中国本土基金会 秉持科技、公益、慈善的属性,华为、阿里巴巴、百度等多家行业龙头于2020年发起设立开放原子开源基金会,是目前为止中国境 内最重要的开源产业非盈利机构,为行业中各参与者提供战略咨询0 码力 | 43 页 | 4.69 MB | 1 年前3
 2023 中国开源开发者报告解决方案”。 当前 LLM 行业面临的一个大方向上的问题是:还没有很好 地从“解决方案”的角度去做技术或者应用。 所谓“解决方案”,是指在设计和开发 LLM 技术和应用时, 首先明确用户的目标,然后围绕目标进行技术研发和应用设 计,并且它带有“整体解决”、“解决的不只是某个单点问题” 的含义。只有这样,才能确保 LLM 能够真正解决实际问题, 而不是成为“应付式”的工具。 “应付式”问题主要表现在以下几个方面: ,还会在给新用户装机 的时候,故意使用破旧光猫,也就是之前强迫用户换新留下的,而再过一段 时间之后,又会告诉用户使用的是旧光猫无法匹配,必须换新。联通公司还 会故意关掉用户的短信服务,在后台增加增值业务,之后再把短信功能打开, 以此牟利。 这种强制更换光猫的行为并非新 鲜事。早在 2022 年上半年,就有 不少用户投诉联通公司,以宽带 升级为由强制用户更换光猫,否 则就无法上网。其中有的投诉明 确是河南联通公司,有的则未明 四川省攀枝花市公安机关网安部门在 2023 年成功侦破一起非法控制计算机 信息系统案。 经警方调查,犯罪嫌疑人与老年手机方案商、生产商勾结,在老年机生产环节 中植入木马程序,在手机使用者不知情的情况下,后台订购 SP 增值业务,并 与 SP 商分成获利(SP 即 Service Provider,服务提供商)。 2023 年 2 月,公安机关对该案开展集中收网,专案民警分别赶赴广东、北京、 海南、湖南等地共抓获嫌疑人 290 码力 | 87 页 | 31.99 MB | 1 年前3 2023 中国开源开发者报告解决方案”。 当前 LLM 行业面临的一个大方向上的问题是:还没有很好 地从“解决方案”的角度去做技术或者应用。 所谓“解决方案”,是指在设计和开发 LLM 技术和应用时, 首先明确用户的目标,然后围绕目标进行技术研发和应用设 计,并且它带有“整体解决”、“解决的不只是某个单点问题” 的含义。只有这样,才能确保 LLM 能够真正解决实际问题, 而不是成为“应付式”的工具。 “应付式”问题主要表现在以下几个方面: ,还会在给新用户装机 的时候,故意使用破旧光猫,也就是之前强迫用户换新留下的,而再过一段 时间之后,又会告诉用户使用的是旧光猫无法匹配,必须换新。联通公司还 会故意关掉用户的短信服务,在后台增加增值业务,之后再把短信功能打开, 以此牟利。 这种强制更换光猫的行为并非新 鲜事。早在 2022 年上半年,就有 不少用户投诉联通公司,以宽带 升级为由强制用户更换光猫,否 则就无法上网。其中有的投诉明 确是河南联通公司,有的则未明 四川省攀枝花市公安机关网安部门在 2023 年成功侦破一起非法控制计算机 信息系统案。 经警方调查,犯罪嫌疑人与老年手机方案商、生产商勾结,在老年机生产环节 中植入木马程序,在手机使用者不知情的情况下,后台订购 SP 增值业务,并 与 SP 商分成获利(SP 即 Service Provider,服务提供商)。 2023 年 2 月,公安机关对该案开展集中收网,专案民警分别赶赴广东、北京、 海南、湖南等地共抓获嫌疑人 290 码力 | 87 页 | 31.99 MB | 1 年前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 建立AI信仰 6政企、创业者必读 大模型不是泡沫,而是新一轮工业革命的驱动引擎 蒸汽革命 电气革命 信息革命 20政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地  能够调用各种工具,具有行动能力  调用企业专业知识,更懂企业  将日常重复性业务流程形成Playbook,实现流程自动化  通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43政企、创业者必读  人工智能的目标是星辰大海,是为了让人类在科技上有突破  基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五 科学研究:打造科研新范式0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 建立AI信仰 6政企、创业者必读 大模型不是泡沫,而是新一轮工业革命的驱动引擎 蒸汽革命 电气革命 信息革命 20政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地  能够调用各种工具,具有行动能力  调用企业专业知识,更懂企业  将日常重复性业务流程形成Playbook,实现流程自动化  通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43政企、创业者必读  人工智能的目标是星辰大海,是为了让人类在科技上有突破  基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五 科学研究:打造科研新范式0 码力 | 76 页 | 5.02 MB | 5 月前3
 人工智能安全治理框架 1.0图片、音频、视频等高仿真内容,可能绕过现有人脸识别、语音识别等身份认 证机制,导致认证鉴权失效。 (c)不当使用引发信息泄露风险。政府、企业等机构工作人员在业务工 作中不规范、不当使用人工智能服务,向大模型输入内部业务数据、工业信息, 导致工作秘密、商业秘密、敏感业务数据泄露。 (d)滥用于网络攻击的风险。人工智能可被用于实施自动化网络攻击或- 6 - 人工智能安全治理框架 提高攻击效率,包括挖掘利用 工智能两用物项和 技术,对国家安全、经济安全、公共卫生安全等带来严重风险。包括极大降低 非专家设计、合成、获取、使用核生化导武器的门槛;设计网络武器,通过自 动挖掘与利用漏洞等方式,对广泛潜在目标发起网络攻击。 3.2.3 认知域安全风险 (a)加剧 “信息茧房” 效应风险。人工智能将广泛应用于定制化的信息 服务,收集用户信息,分析用户类型、需求、意图、喜好、行为习惯,甚至特 定 (a)研发者应在需求分析、项目立项、模型设计开发、训练数据选用等 关键环节,切实践行“以人为本、智能向善”理念宗旨,遵循科技伦理规范,采 取开展内部研讨、组织专家评议、科技伦理审查、听取公众意见、与潜在目标 用户沟通交流、加强员工安全教育培训等措施。- 13 - 人工智能安全治理框架 (b)研发者应重视数据安全和个人信息保护,尊重知识产权和版权,确 保数据来源清晰、途径合规。建立完善的数据安全管理制度,确保数据安全性0 码力 | 20 页 | 3.79 MB | 1 月前3 人工智能安全治理框架 1.0图片、音频、视频等高仿真内容,可能绕过现有人脸识别、语音识别等身份认 证机制,导致认证鉴权失效。 (c)不当使用引发信息泄露风险。政府、企业等机构工作人员在业务工 作中不规范、不当使用人工智能服务,向大模型输入内部业务数据、工业信息, 导致工作秘密、商业秘密、敏感业务数据泄露。 (d)滥用于网络攻击的风险。人工智能可被用于实施自动化网络攻击或- 6 - 人工智能安全治理框架 提高攻击效率,包括挖掘利用 工智能两用物项和 技术,对国家安全、经济安全、公共卫生安全等带来严重风险。包括极大降低 非专家设计、合成、获取、使用核生化导武器的门槛;设计网络武器,通过自 动挖掘与利用漏洞等方式,对广泛潜在目标发起网络攻击。 3.2.3 认知域安全风险 (a)加剧 “信息茧房” 效应风险。人工智能将广泛应用于定制化的信息 服务,收集用户信息,分析用户类型、需求、意图、喜好、行为习惯,甚至特 定 (a)研发者应在需求分析、项目立项、模型设计开发、训练数据选用等 关键环节,切实践行“以人为本、智能向善”理念宗旨,遵循科技伦理规范,采 取开展内部研讨、组织专家评议、科技伦理审查、听取公众意见、与潜在目标 用户沟通交流、加强员工安全教育培训等措施。- 13 - 人工智能安全治理框架 (b)研发者应重视数据安全和个人信息保护,尊重知识产权和版权,确 保数据来源清晰、途径合规。建立完善的数据安全管理制度,确保数据安全性0 码力 | 20 页 | 3.79 MB | 1 月前3
 全球开源发展态势洞察(2023年第八期)实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; • 防止部署不合规的工作负载,减少潜在爆炸 半径; • 扫描漏洞并为运行的容器生成SBOM。 OpenSIL的目标不是取代UEFI,而是集成在 其他主固件中,比如核心启动、重启、Forti- BIOS,可以与主固件静态链接,绕过任何主 固件协议。 Google、AWS(亚马逊)、Meta(Face- book)、AMI等行业巨头,都是AMD Nutanix Data Services for Kubernetes。具体 功能如下: • NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 添加所有查询加载的样本总数指标。 OpenYurt v1.3.0发布 OpenYurt是由阿里云开源的基于原生Kuberne- tes构建的、业内首个对于Kubernetes非侵入式 的边缘计算项目,目标是扩展Kubernetes以无 缝支持边缘计算场景。它提供了完整的Kuber- netes API兼容性;支持所有 Kubernetes工作负 载、服务、运营商、CNI插件和CSI插件;提供良 好的节点自治能力,即使边缘节点与云端断网,0 码力 | 22 页 | 1.99 MB | 1 年前3 全球开源发展态势洞察(2023年第八期)实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; • 防止部署不合规的工作负载,减少潜在爆炸 半径; • 扫描漏洞并为运行的容器生成SBOM。 OpenSIL的目标不是取代UEFI,而是集成在 其他主固件中,比如核心启动、重启、Forti- BIOS,可以与主固件静态链接,绕过任何主 固件协议。 Google、AWS(亚马逊)、Meta(Face- book)、AMI等行业巨头,都是AMD Nutanix Data Services for Kubernetes。具体 功能如下: • NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 添加所有查询加载的样本总数指标。 OpenYurt v1.3.0发布 OpenYurt是由阿里云开源的基于原生Kuberne- tes构建的、业内首个对于Kubernetes非侵入式 的边缘计算项目,目标是扩展Kubernetes以无 缝支持边缘计算场景。它提供了完整的Kuber- netes API兼容性;支持所有 Kubernetes工作负 载、服务、运营商、CNI插件和CSI插件;提供良 好的节点自治能力,即使边缘节点与云端断网,0 码力 | 22 页 | 1.99 MB | 1 年前3
 2021 中国开源年度报告足需求或者转移成本过高而放弃对软件的继续使用。 2021 中国开源年度报告 79 图表 7 :开源项目可以为软件的开发和产品获客提供杠杆 资料来源:云启资本 2.2.3 开源可以带来技术和业务创新的良性循环 只有当技术创新与商业创新相结合时,开源的全部潜力才能实现。Andreessen Horowitz(a16z)分 析指出,开源是一种技术驱动的模式,它可以加速产品反馈和创新、提高软件可靠性、扩展支持、推动 件可靠性、扩展支持、推动 采用并汇集技术人才。然而正是有支持付费、Open Core 和 SaaS 模式等商业模式的出现,才有了现 在的开源发展。经济利益创造了一个良性循环。开源的业务创新越多,开发者社区就越大,这会刺激更 多的技术创新,从而增加对开源的经济激励,形成一个良性循环。 开源 3.0 时代下的技术创新与商业创新正在齐头并进。技术层面上,人工智能、开源数据和区块链是新 兴创新的 收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的全托管云产 品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 业务收入同比增长 210%。 Confluent 云收入年增长率为 186%,MongoDB 的云收入现在占其总收入一半以上,2021 年 SaaS 收入增长达到 83%。 图表 13 : 20210 码力 | 132 页 | 14.24 MB | 1 年前3 2021 中国开源年度报告足需求或者转移成本过高而放弃对软件的继续使用。 2021 中国开源年度报告 79 图表 7 :开源项目可以为软件的开发和产品获客提供杠杆 资料来源:云启资本 2.2.3 开源可以带来技术和业务创新的良性循环 只有当技术创新与商业创新相结合时,开源的全部潜力才能实现。Andreessen Horowitz(a16z)分 析指出,开源是一种技术驱动的模式,它可以加速产品反馈和创新、提高软件可靠性、扩展支持、推动 件可靠性、扩展支持、推动 采用并汇集技术人才。然而正是有支持付费、Open Core 和 SaaS 模式等商业模式的出现,才有了现 在的开源发展。经济利益创造了一个良性循环。开源的业务创新越多,开发者社区就越大,这会刺激更 多的技术创新,从而增加对开源的经济激励,形成一个良性循环。 开源 3.0 时代下的技术创新与商业创新正在齐头并进。技术层面上,人工智能、开源数据和区块链是新 兴创新的 收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的全托管云产 品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 业务收入同比增长 210%。 Confluent 云收入年增长率为 186%,MongoDB 的云收入现在占其总收入一半以上,2021 年 SaaS 收入增长达到 83%。 图表 13 : 20210 码力 | 132 页 | 14.24 MB | 1 年前3
 2021 中国开源年度报告leverage for software development and acquiring customers with products 资料来源:云启资本 2.2.3 开源可以带来技术和业务创新的良性循环 只有当技术创新与商业创新相结合时,开源的全部潜力才能实现。Andreessen Horowitz(a16z) 分析指出,开源是一种技术驱动的模式,它可以加速产品反馈和创新、提高软件可靠性、扩展 软件可靠性、扩展 支持、推动采用并汇集技术人才。然而正是有支持付费、Open Core 和 SaaS 模式等商业模式 的出现,才有了现在的开源发展。经济利益创造了一个良性循环。开源的业务创新越多,开发 者社区就越大,这会刺激更多的技术创新,从而增加对开源的经济激励,形成一个良性循环。 The full potential of open source can only be realized 块的营收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的 全托管云产品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 业务收 入同比增长 210%。Confluent 云收入年增长率为 186%,MongoDB 的云收入现在占其总收 入一半以上,2021 年 SaaS 收入增长达到 83%。 open source0 码力 | 199 页 | 9.63 MB | 1 年前3 2021 中国开源年度报告leverage for software development and acquiring customers with products 资料来源:云启资本 2.2.3 开源可以带来技术和业务创新的良性循环 只有当技术创新与商业创新相结合时,开源的全部潜力才能实现。Andreessen Horowitz(a16z) 分析指出,开源是一种技术驱动的模式,它可以加速产品反馈和创新、提高软件可靠性、扩展 软件可靠性、扩展 支持、推动采用并汇集技术人才。然而正是有支持付费、Open Core 和 SaaS 模式等商业模式 的出现,才有了现在的开源发展。经济利益创造了一个良性循环。开源的业务创新越多,开发 者社区就越大,这会刺激更多的技术创新,从而增加对开源的经济激励,形成一个良性循环。 The full potential of open source can only be realized 块的营收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的 全托管云产品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 业务收 入同比增长 210%。Confluent 云收入年增长率为 186%,MongoDB 的云收入现在占其总收 入一半以上,2021 年 SaaS 收入增长达到 83%。 open source0 码力 | 199 页 | 9.63 MB | 1 年前3
 DeepSeek从入门到精通(20250204)文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险0 码力 | 103 页 | 5.40 MB | 8 月前3
共 174 条
- 1
- 2
- 3
- 4
- 5
- 6
- 18














 
  
 