2020 中国开源年度报告
重要发现: 开源参与者的主⼒依旧是 20-39 岁⼈群,相⽐去年⽐例仍在上升,⽽在开源社区的年龄 分布中,20-30 岁⼈群占据了 64%,说明开发者的年龄仍在趋于年轻化; 相较于 2019 年,今年参与调研的开发者中,还未⼯作的⼈群占了绝⼤部分,从参与者从 事领域和职位分布也可以看出,这些“还未⼯作”⼈群多数指向学⽣群体,这和当前社会普 遍追求更⾼学历深造有关,和本次问卷传播形式有关,但是同时也能说明开源在教育领域 年以上的约 2 成。 在参与者中,有近七成参与者从事互联⽹开发/软件开发领域,其次则是教育/学术/科研领域 的参与者,占⽐约 15%,⾦融银⾏、媒体⼴告娱乐等领域也在积极参与开源。 3.3 职位分布 参与者中学⽣和开发者占绝⼤多数,相⽐于 2019年,学⽣占⽐⼤⼤增加,约 37%,开发者 占⽐约 36%。 3.4 所从事的技术⽅向 参与者所从事的技术⽅向以后端开发为主,占⽐约 31%,其次是 远程办公是当下⾮常重要的⼀种办公⽅式,在参与者中,有⼋成认为远程办公是重要的,并且 有接近九成的参与者有过远程办公的经历。 【专家点评】 ⾼阳:远程办公会变成⼀种常态化的办公和协作⽅式融⼊到我们的⼯作和⽣活中,开源运动和 分布式、远程协同本来就是天然融合的。 4.6 第⼀次接触的开源产品 有 32% 的参与者第⼀次接触的开源产品为互联⽹产品,紧随其后的便是操作系统相关的产品 与开发⼯具,调查结果与以往基本⼀致,说明0 码力 | 46 页 | 4.09 MB | 1 年前3
中国开源软件产业研究报告,变得不存在任何商用的阻碍,典型代表 即为上表中右侧的LGPL、EPL。 • 各开源许可证通常还对代码修改后的发布、销售、宣传等环节有其他要求,但相比上述的“传染性”问题重要性较低,本报告 不一一列举,读者可通过OSI组织及对应开源组织官网进行了解。 开源软件的“商用”问题本质上说是“传染性”问题 9 ©2022.2 iResearch Inc 8.9% 可扩展标记语言 6.8% 数据库 5.7% web框架 5.4% 网络客户端 5.4% 内容 4.6% 构造管理 4.6% 云 3.5% 其他 21.1% 全球开源项目分布 总量持续上升,项目类型反映市场需求与热度 全球对开源的热情不减,开源项目数量持续攀升。Apache基金会目前为350多个开源项目及社区提供支持,从项目类型上 看,2020年Apache开源社区 开发工具 其他 来源:GitHub2021年度报告,Gitee,中国信通院,新思科技《2020年开源安全与风险分析报告》,艾瑞咨询研究院根据公开资料研究及绘制。 2020年开源项目功能分布 2020年开源项目语言使用分布 根据Gitee发布的2020年度报告,程序开发、 WEB应用开发以及手机/移动开发占据了开 源项目的一半以上,其中开发工具于2020 得到巨大发展 开源项目增长迅速,在各行业中的渗透率加深0 码力 | 68 页 | 3.63 MB | 1 年前3
2023 中国开源开发者报告年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处 理约 40 万字的文本,成为当时全球大模型中最长的上下文 窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 2023 年的 LLM、 GenAI。根据金融数据和软件公司 PitchBook 的数据,从 才是未来 Amazon 的流媒体平台 Prime Video 在 2023 年 3 月 22 日 发布了一篇技术博客《规模化 Prime Video 的音视频监控服 务,成本降低 90%》,副标题: “从分布式微服务架构到单体应 用程序的转变有助于实现更高 的规模、弹性和降低成本”。 这种话题与业内推崇的微服务 架构形成了鲜明的对比,从而在 技术圈引起了热议。 是微服务架构不香还是云不香? Asahi 正式毕业,成为 ASF 顶级项目 2023 年 1 月 19 日,Apache 软件基金会(ASF)官方宣布 Apache Kyuubi 正式毕业,成为顶级项目(TLP)。 Apache Kyuubi 是一个分布式和多租户网关,用于在数据仓库和湖仓上提 供无服务器 SQL。项目最初由网易数帆开发并于 2018 年开源,2021 年 6 月捐赠 Apache 基金会,经过 1 年多的孵化,顺利毕业成为 Apache0 码力 | 87 页 | 31.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021数帆历程 关于数帆 数帆实力 荣誉资质 客户名录 客户口碑 业务全景 产品篇 网易有数 网易轻舟 网易易智 客户案例篇 解决方案篇 数据中台解决方案 业务中台解决方案 金融分布式解决方案 金融大数据解决方案 零售大数据解决方案 零售行业 金融行业 制造行业 综合行业 02 03 04 02 01 04 05 06 08 09 10 12 31 35 38 39 25 26 27 28 29 COMPANY 企业篇 COMPANY HISTORY 升级轻舟云原生软件生产力平台及有数全链路数据生产力平台;发布金融分布式、金融大数据、零售大数据、制造业智慧供应链等行业解决方案。 发布轻舟低代码平台 2.0 。 大数据开源项目 Kyuubi 全票进入 Apache 软件基金会孵化器。 有数 BI 个人版永久 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 Spark 3.x 版本开发;开源企业级数据湖探索平台 Kyuubi ;发布首个开源项目分布式存储系统 Curve。 2019 发布全链路数据中台解决方案。 2018 发布轻舟微服务、“瀚海”私有云及国内首款云计算全栈一体机。 2017 加入云原生计算基金会(CNCF)。0 码力 | 43 页 | 884.64 KB | 1 年前3
2021 中国开源年度报告& 性别 ………………………………………………………………………………… 13 3.2 受访者从业时间 …………………………………………………………………………………… 15 3.3 受访者职位分布 …………………………………………………………………………………… 16 3.4 受访者所在的企业类型 …………………………………………………………………………… 17 3.5 公司购买开源产品的决策 ……………………………………………………………………………………… 65 2.3 增速最快语言 ……………………………………………………………………………………… 66 6 2.4 新增开源项目领域分布 …………………………………………………………………………… 66 2.5 年度最受开发者关注的用户 ……………………………………………………………………… 67 2.6 年度最受开发者关注的组织 岁,受教育程度普遍在本科及以上,其中男性占比约为 82%, 女性为 18%,与去年持平。 相较于 2020 年,今年的问卷参与者中,还未工作的人群占了绝大部分,从参与者从事领 12 域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍 追求更高学历深造有关。 公司在购买开源产品时,多由工程团队负责人(技术总监 / 架构师 /TL)来进行产品的选择, 而且在同0 码力 | 132 页 | 14.24 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机制造业已经完成了从集中式制造向分布式制造的演进,⼤型制造企业往往在境内外拥有多个⽣产基地,需要借助堡垒机实现 分布式 IT 资产的统⼀运维安全审计。 政府及国有企业 政府机构及国有企业拥有⼤量机密信息,运维的安全等级要求很⾼,堡垒机是提⾼其安全合规⽔平的必备选择。 服务业 传统服务⾏业,以及包括了物流交通⾏业在内的、依托于信息技术发展演进的现代服务业,普遍具有分布式基础设施的安全 管控需求,同 医疗医药 医疗医药⾏业的信息化⽔平呈现⾼速发展的态势,IT 资产规模快速扩张,迫切需要通过堡垒机实现⼤规模 IT 资产的统⼀管 理与安全运维。 房地产及酒店 房地产和酒店⾏业的业务系统通常随业务经营场所分布式构建,IT 基础设施⾼度分散,需要通过堡垒机实现 IT 基础设施的 统⼀安全运维。 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 堡垒机企业版 堡垒机企业版部分⽤户。 强⼤的市场影响⼒:堡垒机 = JumpServer JumpServer 堡垒机的特⾊功能 体验极佳的 Web Terminal ⼴泛的 多云管理⽀持 超⼤规模 分布式资产⽀持 全⾯的数据库 运维安全审计⽀持 ⽀持审计录像 的云端存储 内置多组织体系 强⼤的 远程应⽤发布能⼒ 灵活的 软件 / 硬件 部署⽅案选择 1 3 6 8 20 码力 | 40 页 | 6.66 MB | 1 年前3
2021 中国开源年度报告18% are women, which is the same as last year. 相较于 2020 年,今年的问卷参与者中,还未工作的人群占了绝大部分,从参与者从事领 域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍追 求更高学历深造有关。 Compared with 2020, the majority of participants development of open source and make an outstanding contribution; the future is predictable. 3.3 受访者职位分布 / 3.3 Respondents' position distribution 受访者中学生和开发者占绝大多数,学生占比约 47%,开发者占比约 29%。 The majority of to master the open source development model, understanding, and open source culture. 江波:我觉得这个数字分布只能体现出我们问卷覆盖的人群中,学生占比相对比较大(毕 竟样本数量只有 500 多),不能提现行业现状。所以我个人对于各位专家对于开源教育的 乐观分析有所保留,我认为目前学生群体参与开源的现状应该有在逐年上升,但远未到占0 码力 | 199 页 | 9.63 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 开源操作系统图谱 头部操作系统开源衍生链路较长,长链路呈纺锤形分布,L2环节的商用 企业角色较活跃,版本多定位于服务器与桌面操作系统场景 注释:产业链展示了部分企业LOGO,并且在L1-L3中仅展示了中国参与者,但实际上也不乏国外项目参与其中。 来源:根据专家访 景的不断创新增加,生态适配性问题日渐复杂,仅靠单个操作系统发行 商进行生态匹配难以解决问题,需要开源集合更多的开发者力量进行帮助。 开源帮助操作系统优化性能、提升使用体验:在常见的操作系统开源sig分布中,大量的开发者有序的渗入到不同功能板块的代码仓 中,帮助客户端进一步用好更好的操作系统,同时,sig常见的社区治理类板块,更好的发挥了社区的“网络效应”,实现人才生态 的“源远流长”。 来源:根 openEuler通过全栈原子化解耦和榫卯架构,可以做到版本灵活构建和服务自由组合,从而实现一套操作系统架构对全场景应用、主 流设备的全覆盖。除南向支持多样设备,北向覆盖应用场景外,openEuler还通过分布式套件与OpenHarmony系统互通,从而提 供更全面、更丰富的解决方案。这种融合不仅有助于促进用户之间的无缝交互,也为开发者提供了更多的创新空间和灵活性。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。0 码力 | 43 页 | 4.69 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)http://www.openatom.org/legal-IP 撰稿:刘博雅;审校:王荷舒 PingCAP 平凯星辰 主要创始团队 PingCAP平凯星辰成立于2015年,是一家企 业级开源分布式数据库厂商,提供包括开源分 布式数据库产品、解决方案与咨询、技术支持 与培训认证服务,致力于为全球行业用户提供 稳定高效、安全可靠、开放兼容的新型数据服 务平台,解放企业生产力,加速企业数字化转 作者,曾任职豌豆荚/京东,擅长分 布式数据库和分布式缓存。 黄东旭 联合创始人 兼CTO 开源分布式缓存服务Codis 的作者,资深infrastructure 工程师,开源狂热分子。 崔秋 联合创始人 开源爱好者。 开源项目梳理 项目名称 项目开源 时间 技术领域 项目归属 托管平台 GitHub 信息 开源 许可证 2015年开源 分布式HTAP 数据库 公司项目 Apache GitHub GitHub GitHub GitHub Apache 2.0 Apache 2.0 Apache 2.0 / 公司项目 CNCF CNCF 公司项目 分布式HTAP 数据库 云原生 混沌工程平台 开源软件洞察工具 分布式Key-Value 数据库 2022年开源 2019年开源 2018年开源 / TiDB TiFlash Chaos Mesh ossinsight TiKV0 码力 | 22 页 | 1.99 MB | 1 年前3
Moonshot AI 介绍ediction⾜够好的时候,它能够平衡创造性和事实 性。 事实性⼀般是对统计模型的挑战,但是今天的语⾔模型可以有⾮常尖峰的分布。让它回答“中国的⾸ 都”,模型对“北”这个字能给出99%的概率。同时,如果我今天让它写⼀本⼩说,那它可能下⼀个 词的概率分布就会很均匀。概率其实是⼀个通⽤的表⽰⽅式。本质上这个世界上有⼤量的熵,抓住确 定性的东西,让本⾝是混沌的东西继续混沌。 通往A 后花⼀倍的成本来训练。会出现新的范式,推理即训练,⽽且这个推理不是为任何⽤⼾服务的,只为 ⾃⼰本⾝的合成数据服务。 出现这种情况的话,能源的问题也解决了,因为推理是可以分布式的。⽽且它不违背定律,本质还是 个能源守恒。只不过我把计算范式改变了,让能源能够以分布式的⽅式解决。 超级应⽤:模型的微调可能最终不存在 海外独⻆兽:Google和抖⾳背后的搜索和推荐有很强的⻜轮效应,算法能根据⽤⼾的⾏为实时反 36氪:什么叫“预测下⼀个字段”,应该要怎么理解? 杨植麟:本质上,做下⼀个token的预测,其实等价于“对整个世界的这个概率去进⾏建模”,就是现 在给你任何⼀个东西,你都能给他估算⼀个概率。这个世界本来就是⼀个巨⼤的概率分布,⾥⾯有⼀ 些是不可建模的不确定性,你不知道下⾯会发⽣什么。但有⼀些是你能确定的,能排除掉⼀些东西 的,这是⼀个通⽤的、对世界去进⾏建模的模型。有很多历史学家来对这个事情做过研究,⽐如 Den0 码力 | 74 页 | 1.64 MB | 1 年前3
共 12 条
- 1
- 2













