2023年中国基础软件开源产业研究白皮书门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 www.iresearch.com.cn 开源操作系统图谱 头部操作系统开源衍生链路较长,长链路呈纺锤形分布,L2环节的商用 企业角色较活跃,版本多定位于服务器与桌面操作系统场景 注释:产业链展示了部分企业LOGO,并且在L1-L3中仅展示了中国参与者,但实际上也不乏国外项目参与其中。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 L0级:基础开源OS L1级:基于上游的开源OS 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 关系型数据库 时序数据库 图数据库 键值数据库 向量及空间数据库 数据库 内核 中国开源数据库 多数基于国外成 熟的数据库内 核,仅少部分厂 商自研 24 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021CMMI (三级) 认证 大数据技术认证资质 信通院第十二批“大数据产品能力评测”(有数BI) 工信部一所信创适配测试认证 华为鲲鹏技术兼容性测试认证 QUALIFICATION 数帆资质(部分) 06 及以前 《Gartner 2020 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院“大数据'星河'案例-行业大数据应用优秀案例” 信通院 OSCAR 尖峰开源创新(二次开发)奖 教育部科技进步一等奖( “海量混合时态数据融合处理关键技术及应用”项目) 全球云计算大会“全球最佳实践奖” 2021 2020 2019 2018 HONOR 数帆荣誉 07 (部分) 北京嗨学网教育科技股份有限公司 北京卡车之家信息技术股份有限公司 北京世纪好未来教育科技有限公司 北京新唐思创教育科技有限公司 北京直客通科技有限公司 北京自如信息科技有限公司 博时基金管理有限公司 浙江省银行业协会 浙江中控技术股份有限公司 招联消费金融有限公司 中山大学附属第七医院(深圳) 浙商银行股份有限公司 卓望数码技术(深圳)有限公司 中移(杭州)信息技术有限公司 (部分签约客户,按照A-Z顺序排列,服务不分先后) COSTOMER 客户名录 08 网易数帆轻舟团队基于云原生技术栈协助德邦快递建立了统一 的 DevOps 体系,通过轻量容器平台和 CICD 研发流水线,实现0 码力 | 43 页 | 884.64 KB | 1 年前3
2024 中国开源开发者报告Insight 生产力-协作开发指数 本部分图表仅用于数据展示,不涉及先后排名 作为国内及业内领先的 AI 开发基础设施,本部分图表 中的开发框架、向量数据库、 开发平台、大模型均表现出 色,代表着它们的代码提交 频率、参与者、代码合并比 率等协作开发工作保持着较 高的水平。 17 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名 稳健性-活跃度 稳健性-活跃度 作为 AI 开发生态中的关键组 成部分,本部分图表中的开发 框架、大模型及相关工具在活 跃度的表现各有千秋。 如应用开发平台 Dify 受行业 技术更新影响较小,其活跃度 始终保持着较高水平;而大语 言模型 MOSS 则较易受技术 更新影响,活跃度随时间整体 呈下滑趋势。 18 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名 创新力-组织活跃度 创新力-组织活跃度 开源组织的活跃程度成为衡量 社区生态建设是否繁荣的重要 指标之一。 本部分图表中的多个组织在社 区活跃度上表现各有差异。 如某些组织在开源项目中长期 保持较高的贡献水平,展现出 其对生态建设的持续支持;而 部分组织的活跃度则随时间推 移逐渐下降,可能受到内部资 源调整或技术方向变化的影响。 19 / 111 本章汇集了来自不同领域专家和开发者对开源大模型和人工 智能技术的0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告去套壳的“创新应用”的命? 十三、报告介绍 作为《2023 中国开源开发者报告》的引导,这里还是把 话题拉回来,简介一下整个报告。 前边讲到的 LLM 领域大放异彩,自然是会作为报告中的 一个重要部分,我们策划了一个《2023 LLM 技术报告》 篇章,整体围绕 LLM Tech Map 梳理逻辑来展开。 从基础设施、大模型、Agent、AI 编程、工具和平台,以 及算力几个方面,为开发者整理了当前 董事会。现任首席技术官 Mira Murati 将临时 担任首席执行官,该任命立即生效。 LangChain 是封装了大量 LLM 应用开发逻辑和工具集成的开源 Python 库, 提供了一套工具、组件和接口,简化创建由 LLM 和聊天模型提供支持的应 用程序的过程。 创新工场董事长兼 CEO 李开复今年 3 月创办 AI 大模型创业公司 “零一万物”。 11 月,零一万物推出 Yi-34B 和 Yi-6B in HuggingFace》,介绍了一个大模型协作系统。该系统提出了一种让 LLM 充 当控制器的新方法,让 LLM 来管理现有的 AI 模型,来完成多模态的复杂 AI 任务,并且使用语言作为通用接口。 2023 年 2 月,谷歌首席执行官 Sundar Pichai 宣布,他们将在未来几周内面 向公众推出由 LaMDA 提供支持的实验性对话式 AI 服务,称为 Bard——与流 行的 ChatGPT0 码力 | 87 页 | 31.99 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示 词注入”技术。人工智能研究员Simon Willison 详细介绍了提示词注入的危险,这种技术可以令 语言模型偏离正轨,执行创建者想要回避的操 作。在DEF CON大会期间,参与者将通过主办方 全球开源态势洞察|第十期 07 04 开源热点 芬兰南萨沃计划建立 开源能力中心 Decidim参与式民主的开源平台 正在被日本广泛使用 作为欧盟所资助的Open MemoryLab项目的一 部分,芬兰南萨沃地区正在评估确定该地区企 业在采用和使用开源软件(OSS)方面所需的 支持。 Decidim是致力于参与式民主的开源平台,正 在被越来越多的国家使用。 2020年,它被日本Code for 责。现已将源代码上传至其创建的GitHub公开存 储库中,使当地社区能够利用该平台。 Code for Japan组织致力于在日本公共部门中推 广开源作为公民参与社会和民主变革的工具。作 为更广泛的Code for all网络的一部分,Code for Japan在日本各地组织了90多个地方团体,这使 得解决方案能够在全国范围内轻松地被广泛复用。 自2020年10月,日本兵库县加古川市政府采用 Decidim以来,该平台已在以下项目中被广泛0 码力 | 22 页 | 1.99 MB | 1 年前3
中国开源软件产业研究报告的其他软件放置各种限制 公平性、中立性准则 • 开源项目不得对任何个人、组织以及用途等规定歧视性条款 • 开源项目的内容须在无需进一步许可的条件下适用于所有获得 该项目的主体 • 开源许可不得以某种特定技术或接口为前提,须保持技术中立 6 ©2022.2 iResearch Inc 经修改后的软件无法“闭源”。也就是说,企业可以对这一 软件进行收费,但同时也需要免费提供这一软件,从一般的商业逻辑上看这有些矛盾,正是在这个层面上,传染性开源许可证 与“商用”有一定的冲突。 • 部分开源许可证整体上具备“传染性”,但是能够在满足一定条件的情况下允许闭源,变得不存在任何商用的阻碍,典型代表 即为上表中右侧的LGPL、EPL。 • 各开源许可证通常还对代码修改后的发布、销售、宣传 我国企业云计算开源应用规模 基础云服务 代表开源软件产品 PaaS IaaS 虚拟机 已大规模部 署,虚拟服 务器>1000, 33.5% 已部署,虚拟服务 器>500, 25.8% 已少部分试 用部署,虚 拟服务器 ≤500, 35.4% 计划于1年内部署, 5.3% 21 ©2022.2 iResearch Inc0 码力 | 68 页 | 3.63 MB | 1 年前3
Moonshot AI 介绍作,吸引了来⾃Google、Meta、Amazon等全球领先科技公司的海外⼈才加⼊: i. ⼤模型⽅⾯。团队成员发明了RoPE相对位置编码,是MetaLLaMa和GooglePALM等⼤多数 主流模型的重要组成部分;发明了groupnormalization,是StableDiffusion等AI模型成功 的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 和ChatGPT的也会不同,⽐如long-context和搜索的结合。 当模型完全不hallucinate或者概率⾮常低,就不需要解释了,因为它说的东西都是对的。⽽且解释有 可能也只是alignment的⼀部分,⽐如说chain-of-thought也可以被认为是⼀种解释。 Hallucination是可以通过scalinglaw来解决。但不⼀定是在pre-training环节,因为其实 这个过程中,对于那些 不确定的可能性,也要分配⾜够的概率。举个例⼦,如果要⽣成⼀张图⽚,那么它的loss会⽐⽣成⼀ 段⽂字更⾼,这是因为图⽚包含了更多的混沌和信息量,但只需捕捉其中你能掌握的部分,剩余的部 分可以认为是有概率发⽣的。⽐如,⽔杯的颜⾊是绿⾊还是红⾊就是有概率会发⽣的,但颜⾊这个信 息不会改变“⽔杯⻓什么样”这件事,所以这⾥⾯需要重点学习的就是⽔杯的形状,⾄于它的颜⾊, 就要做⼀个概率分配。0 码力 | 74 页 | 1.64 MB | 1 年前3
2020 中国开源年度报告
岁⼈群,相⽐去年⽐例仍在上升,⽽在开源社区的年龄 分布中,20-30 岁⼈群占据了 64%,说明开发者的年龄仍在趋于年轻化; 相较于 2019 年,今年参与调研的开发者中,还未⼯作的⼈群占了绝⼤部分,从参与者从 事领域和职位分布也可以看出,这些“还未⼯作”⼈群多数指向学⽣群体,这和当前社会普 遍追求更⾼学历深造有关,和本次问卷传播形式有关,但是同时也能说明开源在教育领域 取得了不错的进展; 议将成为常态。 4.4 开源收⼊ 可以看到,很多⼈参与开源并不追求物质回报,有三成参与者没有开源收⼊,但依然热衷于开 源⼯作,同时,我们还可以注意到有 12% 的参与者表示企业会⽀付⼯资⽀持员⼯全职/部分 参与开源,有 23% 的参与者表示学校科研项⽬或社团投⼊⽅⾯有在⽀持参与开源,可⻅现在 企业和学校都开始逐渐关注并重视开源。 【专家点评】 吴晟:能够获得开源收⼊⽐例和开源参与时间超过 20 Google,⽽在国内企业中, Alibaba、Huawei 和 Baidu 分别占据前三名。 4.9 机器⼈流程⾃动化 对于开源项⽬是否继承了 RPA,即机器⼈流程⾃动化⼯具,有四成参与者表示⼀部分项⽬集 成了 RPA,16% 的参与者表示⼏乎所有项⽬都有集成 RPA,同时也有 24% 的参与者表示从 来没有在开源项⽬中集成过 RPA。 5、开源社区参与现状 5.1 开源最吸引你的因素0 码力 | 46 页 | 4.09 MB | 1 年前3
2021 中国开源年度报告如下一些重要发现: 参与者的年龄集中在 20-39 岁,受教育程度普遍在本科及以上,其中男性占比约为 82%, 女性为 18%,与去年持平。 相较于 2020 年,今年的问卷参与者中,还未工作的人群占了绝大部分,从参与者从事领 12 域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍 追求更高学历深造有关。 公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 件的购买中,半数的人会考虑软件供应商对开源社区的贡献,但不是主 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要通过公司领导,工程团队负责人进行决策。 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉 同时也要求技术产品的采购在决策流程上透明化,更看重产品在技术指标上的优势。客观来看,这对开源的发 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 在于让部分厂商为了取得差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放 式创新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术竞争力以及产品 本身的可维护性。0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告82% are men and 18% are women, which is the same as last year. 相较于 2020 年,今年的问卷参与者中,还未工作的人群占了绝大部分,从参与者从事领 域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍追 求更高学历深造有关。 Compared with 2020, the majority little difference in product performance. 【专家点评】/ [Expert Comment] 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的 选型是由在一线的开发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要 通过公司领导,工程团队负责人进行决策。 Jiang Ning: Are the open 势是不可避免的。这同时也要求技术产品的采购在决策流程上透明化,更看重产品在技术 指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放式创 新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术 竞争力以及产品本身的可维护性。0 码力 | 199 页 | 9.63 MB | 1 年前3
共 12 条
- 1
- 2













