2024 中国开源开发者报告与发展,为开发者和企业带来更多价值,助力知识共享与技术协作。 Lu Cheng Hugging Face Fellow,致力于推动 AI 和开源软件的采纳和开发者 体验。拥有超过十年的开发者关系、产品营销和开源生态构建的经验, 曾在 Google 负责多个开发技术的深度推广和社区建设,包括 Android、Flutter 和 TensorFlow 等。他坚信开源是推动技术进步和 开发 演提供了可贵的素材。对软件商业化问题感兴趣的朋友一定要长期关注这个赛道。只有这样的对 象才能更有力地说明开源策略的重要性。 其次,我们得明确一点——大模型竞争的赛点是什么?常用的判断依据包括:技术的先进性, C 端用户基数,依赖这个软件的生态系统大小等等。其中哪个更关键一点? 技术先进是好事,但大模型领域的先进技术远没有达到能为大模型企业带来可观收入的程度。 整个大模型赛道还处在商业化的摸索阶段。这个时间点上的“技术先进性”更多是用于公关宣传 智能体作为学术术语由来已久,从上世纪的“符号、专家系统”【1】,到十年前风头无两的 强化学习(代表作 AlphaGo【3】),再到现在的 LLM,agent 底层技术经历了三个大的阶段。 符号系统的缺点在于过于依赖人工定义的“符号”和“逻辑”,强化学习苦于训练数据的匮 乏和“模态墙”,而 LLM 一次性解决这些问题。 人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 然地0 码力 | 111 页 | 11.44 MB | 8 月前3
2021 中国开源年度报告要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要通过公司领导,工程团队负责人进行决策。 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉至工程团队技术负责人的趋势是不可避免的。这 同时也要求技术产品的采购在决策流程 3.15 数据库 数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,SQL Server 与 Oracle 跟随其后。 专家点评 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 26 3.16 版本控制工具 毫无疑问的是,Git 一枝独秀,具有绝对性优势。SVN、TFS、CVS 目 前仍有不少参与者在使用。 3.17 AI 开发框架 在一年以上。 专家点评 杨丽蕴:如果是想表达近两年参与开源的人越来越多,那么:在 1-2 年内接触开源的参与者越来越多,与我 国近两年开源政策引导、开源社区快速发展并受到越来越多的关注等等外部因素有密切关系。 32 4.5 在开源中的时间投入 约有 55% 的受访者每周在开源上的时间投入不足 5 小时,每周对开源 投入时间在 5-20 个小时的受访者约有 30%,与去年相比,每周在开源 上的时间投入不足0 码力 | 132 页 | 14.24 MB | 1 年前3
2023 中国开源开发者报告多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆 盖了不同的领域和场景,构建了多元化的大模型生态。 大模型方面,百花齐放:百度的文心一言、抖音的云雀大模 the Enterprise”报告显示: 54% 的 AI 用户预计 AI 的最大好处是提高生产力。 77% 的受访者使用 AI 来辅助编程。其中提到的具体 应用包括欺诈检测、教学和客户关系管理。 AI 用户表示,AI 编程(66%)和数据分析(59%) 是最需要的技能。 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 月正式发布。Blink 是无特权用户空间虚拟机,支 持在任何 POSIX 平台上模拟 x86-64-linux 二进制文件,声称是最小的 x86 Linux 模拟器。 总的来说,它是一个 220kb 的无依赖静态二进制文件,实现了大约 600 条 x86 指令和 180 条 Linux 系统调用。 距离 Svelte 3 发布过去了四年多的时间, Svelte 4 稳定版本于 2023 年 6 月正式发0 码力 | 87 页 | 31.99 MB | 1 年前3
2021 中国开源年度报告【专家点评】/ [Expert Comment] 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的 选型是由在一线的开发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要 通过公司领导,工程团队负责人进行决策。 Jiang Ning: Are the open source products herein referred to as commercial with SQL Server and Oracle trailing behind. 【专家点评】/ [Expert Comment] 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 Duan Xihua: The comparison between Mysql and Postgres is also different at home Comment] 杨丽蕴:如果是想表达近两年参与开源的人越来越多,那么:在 1-2 年内接触开源的参与 者越来越多,与我国近两年开源政策引导、开源社区快速发展并受到越来越多的关注等等 外部因素有密切关系。 Yang Liyun: If it is to express the increasing number of people involved in open source in the0 码力 | 199 页 | 9.63 MB | 1 年前3
Moonshot AI 介绍leNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅ 重要的是理解两者之间的关系。 AGI和产品对我们来说并不是⼿段和⽬的的关系,两个都是⽬的。同时,在追求AGI的过程中,我认为 所谓的数据⻜轮是很重要的,尽管它是⼀个⽼套的概念。 像ChatGPT这样的产品,还没有完全建⽴起基于⽤⼾数据的持续进化。我觉得这很⼤程度上是base model还在进化,进化了⼀代,之前的⽤⼾数据就没什么⽤了。这跟发展阶段有关系⸺现 在“吃”的 上scalinglaw刻画的是loss跟参 数量之间的关系。MoE改变了这个函数,让你能够⽤更⼤的参数,但同时FLOPs不变。合成数据改变 的是另⼀个关系,FLOPs不变的情况下让数据规模增⻓。 沿着scalinglaw⼀直⾛是个有确定性的事情,⼤家通过试图改变scalinglaw⾥的具体关系来获得更 ⾼的efficiency,多出来的efficiency就是各⾃的优势。0 码力 | 74 页 | 1.64 MB | 1 年前3
中国开源软件产业研究报告各种主体,聚焦企业开源领域,企业开源与商业化并不矛盾,开源软件的“引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 好的软件作品,往往源自于开发者的个人需要——按说这是显而易见的(正如 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 开源产业主体及产业关系 开源社区运营为核心,注重开源用户和贡献者的反馈 从产业主体的角度上看,开源软件产业市场上的主体包括软件的源作者(个人/企业)、开源基金会、开源社区(包括代码 托管平台、软件论坛、行业联盟)、二 市场推广、版 本迭代更新、版权管理和安全管理等内容,这些环节和商业企业的软件项目有一些相似之处,但更加注重从社区的使用者 和贡献者处得到观点和启发,并用以驱动项目未来的发展。 开源软件主体和产业链关系 源作者 软件作品 企业开源 开源基金会 开 源 社 区 代码托管平台 开源软件论坛 专家指导 产业联盟 法律服务 市场宣传 二次开发者 软件用户 • 开源代码的源作者/最初贡献0 码力 | 68 页 | 3.63 MB | 1 年前3
Gitea,新一代的代码托管平台优势总结 2 代码托管平台的发展历程 阶段一 阶段二 阶段三 •单用户本地编辑; •没有网络功能; •典型产品:RCS、SCCS。 本地代码管理 •C/S 架构体系,支持网络化协作; •依赖中央存储库; •典型产品:CVS、 SVN、VSS、 TFS、 ClearCase。 集中式代码管理 •去中心化,稳定性和可用性增强; •更高效的代码协同机制; •典型产品:GitHub、GitLab、 数量统计截至 2023 年 11 月。 Star 39,000+ 接近 GitHub 使用体验、可私有化部署的新一代的代码托管平台 DevSecOps 延伸能力 CI / CD 包/发布管理 依赖项扫描 百科管理 项目管理 其他能力… 合并请求 代码审查 分支管理 代码仓库 Git代码托管 核心能力 新一代的代码托管平台 Gitea 的定位 遵循典型的 Git flow 来进行项目管理组织;支持工单看板功能, 可以将项目中的工单按照需求拖动到不同泳道中进行管理。 Issues 管理 跟踪项目的需求,功能和缺陷;工单支持标签、里程碑、指派、 时间跟踪、到期时间、依赖关系等功能。 Gitea 延伸能力:百科管理(Wiki) 百科 Wiki 基于 Git 版本控制系统的文档托管,使用 Markdown 语法书写文档,实现项目知识库管理; 可以托管任何类型的文档,包括开发文档、技术文档、0 码力 | 30 页 | 14.34 MB | 1 年前3
2020 中国开源年度报告
年以代码和测试为主转变为以代码和⽂档为主,社区和项⽬正在 意识到⽂档的重要性,更多开源贡献者投⼊到了⽂档撰写中; 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源 活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区⾄关重要。⽽对于更 倾向于线上还是线下的会议,结果竟惊⼈地持平; 在 2020 年 COVID-19 这个⼤背景下,各⾏各业都不可避免受到了冲击和影响;82% 也是值得关注的现象。 【专家点评】 吴晟:微信、QQ 群的⾼强度使⽤,仍然显示出开源圈⼦缺少国际化社交和协作能⼒的⼀贯性 短板。同样反映出中⽂依然是绝⼤部分的开源参与者唯⼀热衷的交流⽅式。 5.6 社区与代码的关系 有近九成的参与者认为在开源社区中,社区的价值⼤于或等同于代码,因为围绕代码⽽⽣的社 区,会让代码变得更加优秀。 【专家点评】 ⾼阳:很⾼兴看到⼤家对于社区价值的认同,在我们看来,⼀个健康的社区远⽐优秀的代码更 岁以上的开 发者,正⾯反应了中国资深⼯程师的缺乏。缘起中国的开源项⽬的⼤规模崛起,将⼗分依赖此 部分⼈的⽐例提升。 5.8 开源软件安全 有近七成的参与者表示不会有不安全感,但同时也仍有 25% 的参与者表示会有此类担忧,开 源软件的安全问题仍然值得我们关注。 【专家点评】 红薯:开源软件由于其机制的关系,通过开源社区不断地发现问题并维护,其安全问题可能并 不是开发者们的主要关注点。其实0 码力 | 46 页 | 4.09 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021巨石(单体)应用 代码级的依赖,容易出现代码冲突,以及影 响范围扩散,导致大量的沟通,开发效率低 随着规模增加 编译时间快速增加 代码级的依赖,需要全量测试 测试回归周期长 代码修改对整个应用有影响,需要全量测试 无法有效对需求快速变化 单一技术架构 技术演进需要全部重写,成本高 开发效率 编译时间 测试周期 应对需求变化 技术演进 对比项 微服务应用 基于服务接口的依赖 各服务间独立开发,开发效率高 各服务间独立开发,开发效率高 微服务独立编译 编译时间短 基于服务接口的依赖 仅需要测试相关服务,测试回归周期短 仅相关服务需要开发 无需全量测试,能够快速应对需求变化 微服务可以技术独立演进 成本低 PRODUCT 13 PRODUCT 基于可视化编程语言 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 ETL 、自助取数、驾驶舱、数据 大屏、复杂报表、数据填报、智能决策等数据应用,支撑企业智能化决策。 通过信通院“大数据产品能力评测”商务智能工具评测 产品荣誉 文件类(CSV/TXT) 关系型/分布式数据库 API 接口 填报数据 大数据平台 数据连接 数据接入 SQL语句数据建模 可视化数据建模 轻量化 ETL 建模 对接数据中台模型 数据建模 数据分析 报告0 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1) www.iresearch.com.cn 中国开源数据库图谱 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 关系型数据库 时序数据库 图数据库 键值数据库 向量及空间数据库 数据库 内核 中国开源数据库 多数基于国外成 熟的数据库内 核,仅少部分厂 商自研 24 ©2023.11 iResearch 统行业市场空间巨大 互联网开源数据库对传统行业的渗透: 传统行业逐步互联网化,一些C端业务 可以适用开源数据库 鼓励国产化替代,降低传统行业对海外 数据库(Oracle、DB2等)的依赖 受限于行业差异,渗透势头不大 蚂蚁 25 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
共 11 条
- 1
- 2













