2023年中国基础软件开源产业研究白皮书来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 常见许可证: • MIT • Apache2.0 • BDS2.0-clause • 木兰宽松许可证 类别二 一定条件下允许二 次闭源发行 常见许可证: • LGLP2.1,商业 软件通过代码类 库引用(软件代 码与引用的源代 码 呈 “ 松 耦 合 性” )的方式 下可以闭源发行 类别三 不允许二次闭源发 行 常见许可证: • GPL ( 其 2.0 版 本不允许闭源发 行,3.0版本在 建议。 企业开发者旨在实现商业收益,选取优秀开源代码,并根据自身的行业Knowhow,在其上二次开发产出定制化的行业发行版本。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 两类开源开发者行为差异 参与开源目的 代码贡献特征 付费意愿 平台权益 个人开发者 企业开发者 出于兴趣或求知欲进入 开源社区,希望学习社 区内优秀代码,并与 “大神”交流 以商业视角出发,希望0 码力 | 43 页 | 4.69 MB | 1 年前3
Moonshot AI 介绍和⽂本,basemodel的scaling效果仍然远远超过⽤⼾的,但我认为最终会转移到⽤⼾的scaling law,只是个时间问题。 现在⾯对数据瓶颈,这⼀点尤为重要。特别是⼈类偏好数据,它⾮常有限,但没有它⼜不⾏。我觉得 这也是每⼀个AI-Native产品现在最值得思考的问题之⼀。所以,⼀个不⾜够关⼼⽤⼾的公司最终可能 也没法实现AGI。 海外独⻆兽:怎么看 定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic⼀直在提模型的可解释性,这⼀点其实有蛮多争论。你是如何思考可解释性 的?因为刚刚你也提到了模型是⼀个⿊盒,并且其实⼈类到现在还没有弄清楚⾃⼰的⼤脑是怎么⼯作 的。 杨植麟:可解释性核⼼是个信任的问题。建⽴⼀个信任的⼼智是很重要的,对应的应⽤场景甚⾄可能 和ChatGPT的也会不同,⽐如long-context和搜索的结合。 AI成为了朋友,那所有事情都可以跟它 说。 InflectionPi的motivation其实是很好的,想要建⽴强信任,只是Pi可能要再往前推⼀步,到底怎样 跟⽤⼾去建⽴信任,⼈类社会可能并不接受指派⼀个终⾝搭档的做法,这有点反⼈性。 海外独⻆兽:⽉之暗⾯想做超级应⽤,你⾃⼰理想中的超级应⽤⻓什么样⼦?多⼤才算超级? 杨植麟:还是看破圈程度。周围的亲戚都在⽤,你才真正成0 码力 | 74 页 | 1.64 MB | 1 年前3
2024 中国开源开发者报告一次性解决这些问题。 人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 然地存在大量数据可用于训练,还蕴含了人类的思维模式。 在此基础上训练得到的 LLM,自然具备被诱导出类人思考的潜力。在 COT(思维链)【4】、 TOT(思维树)【5】等技术的加持下,大模型正在学习拆解自己的“思维”,OpenAI 的 o1 就是 典型案例,强化了推理能力的同时,也大大缓解了幻觉问题。 架构呈现了 O(n²)的理论计算复杂度,这里的 n 指的是大模型输入 序列的 token 数量,但其前任语言模型担当 RNN 只有 O(n)的理论计算复杂度。 最近,以 Mamba、RWKV 为代表的类 RNN 结构死灰复燃,公开挑战 transformer 地位。 更有最新研究【13】从理论上表明,RNN 对比 Transformer 的表达力,只差一个 in-context-retrieval。 目前国内的头部 AI 公司也已接近个人模型的技术目标。但目前端到端多模态模型和推理模型的 成本仍然较高,且在一些场景下还不够稳定。 但 2023 年以来,模型知识密度有每 8 个月提升一倍的“类摩尔定律”趋势,加上硬件的摩 尔定律和推理框架的优化,一到两年后,个人模型的成本将达到可以让用户随时使用的水平,就 像互联网应用一样,通过广告和少数订阅即可盈利。类似 o1 的强推理能力模型也不一定需要很0 码力 | 111 页 | 11.44 MB | 8 月前3
中国开源软件产业研究报告中国的开源软件法制建设:国内涉及开源的法律诉讼主要包含两种,其一是软件侵权案被告 方以原告所诉软件为开源软件为由进行抗辩,其二是开源软件作者起诉被告企业未遵守开源 协议。国内开源司法实践以保护软件研发的创造性劳动为核心,对上述两类案件通常支持原 告方立场。涉及开源的法律法规建设正在进一步完善,有望为我国的开源软件产业创设更有 序的发展环境。 SMS 中国的开源软件产业发展:得益于政策支持、软件产业高速发展、软件行业人才不断累计, 开源是软件市场“后进者”扩大市场影响力的重要手段 从市场竞争战略的视角上看,软件开源通常是软件市场的“后进者”扩大市场影响力、追赶头部企业的重要手段。观察PC 操作系统、移动操作系统、DBMS(核心数据库)三大类典型基础软件产品的开源/闭源情况,整体来看后出现的软件产品 更有可能是开源的,这一情况在DBMS情况尤为显著。通过开源,新的产品能够能更快地打入市场,开放的源代码也更容 易获得顾客的信任和了解;在市场 9%,其次为大数据以及网络服务器类型。 Linux基金会已经向累计多于750个开源项目及社区提供服务,2021年Linux基金会中云计算、容器和虚拟化开源项目的占 比最大,达到22.7%。整体来看,全球开源项目类型集中在开发框架、文档类开源项目、云计算等相关领域。此外,开源 项目的类型往往能反映当前市场关注的热点,如容器与云原生应用技术、人工智能开发框架等技术的流行。 来源:Apache软件基金会,艾瑞咨询研究院根据公开资料研究及绘制。0 码力 | 68 页 | 3.63 MB | 1 年前3
2020 中国开源年度报告
化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 随着越来越多中国开源项⽬的影响⼒不断增加、⽊兰协议的推出、开放原⼦基⾦会的成⽴, Gitee 邮箱的有相当⼀部分来⾃于海外,这部分成员领取志愿者证书的⽐例相 对较少等。 【社区成员擅⻓领域饼状图,总数 1,606】 从社区成员擅⻓领域的分析结果来看,社区成员在选择⾃⼰所擅⻓领域时,更多地会选择宣传 或者设计类的领域,这也解释了为什么 Wuhan2020 宣传组成员严重过剩,⽽且能有很多宣 传组成员在活动结束后仍然留在社区当中。这当然也跟数据来源⼤多来⾃于微信⽽不是 Slack 有关,在 GitHub 2020 数字年报》,X-lab 开放式实验室,预计 2 ⽉中旬式发布 《2020 Gitee 开源报告》,Gitee,已正式发布 开源软件已经成为⼈类数字社会的基⽯,也是全⼈类共同努⼒协作的结晶;我们希望让更多的 ⼈认识到开源协作对⼈类⽂明的发展所起到的巨⼤推动作⽤;谨以此《中国开源年度报告》 作品形式表达我们对开源事业的热爱!0 码力 | 46 页 | 4.09 MB | 1 年前3
2023 中国开源开发者报告累,没法速成。” 长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的 token 上训练的,微调 Chat 模型是在 100 万人类标 记数据上训练的。 7 / 87 1 1 开源开发者事件回顾 Auto-GPT 横空出世,席卷 AI 圈 “零一万物”发布 Yi 系列开源大模型 Vercel 发布"v0":根据文本生成 流等更新的方法脱颖而出,允许 以高性能向用户交付复杂的 Web 应用程序。 Dart 3 正式发布,100% 健全的空安全 Dart 3 包含了三个主要改进:完成了 100% 健全的空安全;添加了记录、 模式和类修饰符的新语言特性;以及对未来进行了预览,即,通过 Wasm 编 译扩大了对网络原生代码的平台支持。 Cython 3.0 正式发布 经过近五年的漫长岁月,Cython 3.0 于 2023 年 7 osc_78692802:我们两三个人的开发团队开发个并发不到 300 的产品竟然 使用 java+spring+微服务。本机调试个项目开一大堆工具、idea 都得开 3 个。 改个 java 类还得等热部署,写个极其简单的功能实体类、DTO、mapper、接 口等要建 20 多个文件,还要应对经常变化多端的业务,搞毛线啊。 nginx+php+db 不香吗?大规模、高并发 nginx 负债均衡不就完了?简单的0 码力 | 87 页 | 31.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021标签管理 画像分析 群组管理 API管理 支持数据产品研发 无代码平台,与 BI 、数据填报、复杂报 表、智能决策深度融合。 开放与集成能力 以标准类接口开放所有资源,支持集 成,兼容性强。 内置增强分析 内置高级分析模型,如预测、聚类,离 散;支持智能问答、智能分析等多种分 析场景。 产品特色 产品能力 业务流程覆盖数据收集、加工、分析、应用等全链路环节,内置可视化报告、自助式 ETL ETL 、自助取数、驾驶舱、数据 大屏、复杂报表、数据填报、智能决策等数据应用,支撑企业智能化决策。 通过信通院“大数据产品能力评测”商务智能工具评测 产品荣誉 文件类(CSV/TXT) 关系型/分布式数据库 API 接口 填报数据 大数据平台 数据连接 数据接入 SQL语句数据建模 可视化数据建模 轻量化 ETL 建模 对接数据中台模型 数据建模 数据分析 报告0 码力 | 43 页 | 884.64 KB | 1 年前3
Gitea,新一代的代码托管平台Actions 高度兼容:大部分 GitHub Actions 插件可复用; • 工作流程/操作语法兼容:与 GitHub Actions 工作流程、操作语 法高度兼容。 生态兼容 • 类 Github 的使用体验,使用习惯无缝衔接; • 完全兼容 Git 命令,无额外学习成本; • 提供 Tea 命令,操作方便、快捷、高效。 使用简单 • 支持多种部署方式,几条命令快速安装和升级0 码力 | 30 页 | 14.34 MB | 1 年前3
2021 中国开源年度报告王蓉:期待后续榜单能以项目为单位聚合同一个大项目的 repository,这样我们 & 开发者能看到更多的 top 中国开源项目。 段夕华:我觉得以 actor 和 comment 来衡量项目的活跃度也似乎也有失偏颇,小体量的工具类开源项目如 node.js 的 co、java 的 fastjson 一般这两个数字也不会很大,但被四处应用,star 数也不少。为保证公平起 见,我觉得可以考虑以上数字除以代码行数,另外,挤掉水分后的 金会已 在孵化 5 个国产开源操作系统项目,分别是龙蜥操作系统(Anolis OS)、openEuler、OpenHarmony、 TecentOS Tiny、AliOS Things,此外还有类 Redis 存储系统 PIKA、云原生分布式数据库 ZNBase 等, 隐有成为中国开源基础软件大本营之势。 2021 年 10 月 28 日,开放原子开源基金会技术监督委员会投票通过开源项目 OpenCloudOS0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告can see more top Chinese open source projects. 段夕华:我觉得以 actor 和 comment 来衡量项目的活跃度也似乎也有失偏颇,小体量 的工具类开源项目如 node.js 的 co、java 的 fastjson 一般这两个数字也不会很大,但 被四处应用,star 数也不少。为保证公平起见,我觉得可以考虑以上数字除以代码行数, 另外,挤掉水分后的 源基金会已在孵化 5 个国产开源操作系统项目,分别是龙蜥操作系统(Anolis OS)、 openEuler、OpenHarmony、TecentOS Tiny、AliOS Things,此外还有类 Redis 存储系 统 PIKA、云原生分布式数据库 ZNBase 等,隐有成为中国开源基础软件大本营之势。 The Open Atom Open Source Foundation is currently0 码力 | 199 页 | 9.63 MB | 1 年前3
共 10 条
- 1













