2023 中国开源开发者报告经典的“AI 原生”应用。此概念目前还处在萌芽期,明确 的概念、应用场景、架构、技术栈细节等尚未完成自洽。 换一种视角来看,这个概念的提出其实都没技术什么事, 有人称之为“造商业概念”,这里按下不表。 十、 镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更 多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 进行提取,搜证中发现,操作者很有可能 是管理网站后台系统的员工,监守自盗的 可能性较大。 程序员篡改 ETC 余额 河南联通强迫用户更换光猫 河南周口联通为了强迫用户更 换光猫,公司在后台停掉用户 的宽带账号,导致用户无法上 网,然后让工程师上门 “维修”, 谎称光猫损坏,需要花 299 元 换新。更换完后,联通再在后 台恢复用户的网络。 员工盗用公司游戏源代码 中国人民大学一名硕士毕业生涉嫌在校期间非法获取全校学生的个人信息, 万元,总计 260 余万元。最终曹某因涉嫌盗窃罪被 依法刑事拘留。 “换皮”上线 半年盈利 1.5 亿 为了成功上线,离职员工还套用了原公司的《计算机软件著作权登记证》和《网 络游戏出版核发单》。警方鉴定发现,两款游戏在服务器数据表和服务器战斗 服上的相似度达到 100%,服务器游戏服和客户端相似度也在 90%左右。 据统计,自盗版游戏上线半年以来,盈利超过 1. 5 亿,盗取源代码的三名员 工分得利润超过0 码力 | 87 页 | 31.99 MB | 1 年前3
2021 中国开源年度报告种“历史感”。当我们更多具备这样的历史感,更多以将来会被人回 看的心态,来做这些事情时,我们又该如何抉择?又该如何行动呢? 当然,千里之行,始于足下。那个我们无限向往的未来,也只能由 我们的点滴努力来塑造。与诸位共勉吧! 庄表伟,开源社理事长 2022 年 1 月 14 日 4 2021 中国开源年度报告问卷篇 …………………………………………… 10 1 报告背景 …………………………………………………………………………………… 30 到 39,120,22% 参与者年龄分布 参与者性别分布 男 女 男,441,82% 女 ,96,18% 14 注:问卷篇中饼图的数据标签,例如“硕士 ,107,20%”,其中硕士表 示选项,107 是选择该选项的人数,20% 是选择该选项人数所占的比例。 专家点评 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 IT 行业整体参与者性别比 例失调 资料来源:Battery Ventures,云启资本 开源软件企业着重加强云战略布局,以加速和推动持续性增长。开源软件企业的 SaaS 服务模块的营 收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的全托管云产 品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 业务收入同比增长 210%。 Confluent 云收入年增长率为0 码力 | 132 页 | 14.24 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021教育部科技进步一等奖( “海量混合时态数据融合处理关键技术及应用”项目) 全球云计算大会“全球最佳实践奖” 2021 2020 2019 2018 HONOR 数帆荣誉 07 (部分) 北京嗨学网教育科技股份有限公司 北京卡车之家信息技术股份有限公司 北京世纪好未来教育科技有限公司 北京新唐思创教育科技有限公司 北京直客通科技有限公司 北京自如信息科技有限公司 博时基金管理有限公司 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 流程开发,可支持如请假、入职、离职等 企业内常用流程场景。 大数据底座 Hadoop Spark Flink RDBMS MPP Arctic 数据传输中心 离线数据传输 实时数据传输 运维中心 离线开发平台 实时计算平台 集群运维 任务运维 文件管理 任务开发 租户管理 自助分析 权限管理 可视化调度 数据开发及管理平台 标签画像 消费者运营平台 机器学习平台 BI 有数优势 有数全链路数据生产力平台2.0能力全景图 易用0 码力 | 43 页 | 884.64 KB | 1 年前3
中国开源软件产业研究报告关于开源软件的内容(代码) • 开源软件必须包含可理解与运用的源代码,或提供简便的获取 源代码的方式;且开源代码必须允许以源码或编辑后文件的形 式传播 • 开源许可须允许源码修改及其他衍生工作 关于开源软件传播的规范 • 开源许可不得限制开源软件的再传播,不得以此为由收费;仅 当配合补丁文件一起发布时,开源许可证可以禁止修改的代码 的发布;必须允许修改后的代码生成的软件的发布 • 开源许可不得将项目内容限制于特定软件,也不得对一起发布 即为上表中右侧的LGPL、EPL。 • 各开源许可证通常还对代码修改后的发布、销售、宣传等环节有其他要求,但相比上述的“传染性”问题重要性较低,本报告 不一一列举,读者可通过OSI组织及对应开源组织官网进行了解。 开源软件的“商用”问题本质上说是“传染性”问题 9 ©2022.2 iResearch Inc 衡量开源战略的商务价值,对比常规的闭源商业软件业务模式,开源软件在用户触达、加深产品了解、便捷化试用这三个 主要的“售前”环节具备显著的优势,而在初期的“售中”流程方面可能遇到一些困难——换言之,整体来看软件开源代 表着一种“广触达,少转化”的推广模式。从商业成功的角度上讲,促进转化的关键仍然是产品本身的创新性、竞争力以 及付费业务的价值量,企业开源运营能够帮助企业进行软件创新,但这更与企业本身的投入规模、战略规划等有关。0 码力 | 68 页 | 3.63 MB | 1 年前3
2021 中国开源年度报告Open Source Annual Report · Data GitHub 数据 GitHub Data 说明 Description 为了方便后续处理,每个表格后都附上了 csv 文件。Each table has a csv file attached to it for ease of follow-up. 活跃度公式 Activity formula: Yunqi Partners 开源软件企业着重加强云战略布局,以加速和推动持续性增长。开源软件企业的 SaaS 服务模 块的营收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的 全托管云产品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 业务收 入同比增长 210%。Confluent 云收入年增长率为 interest generated by the developer community. 企业应具有强大的线上和线下宣传运营能够吸引更多的开发者参与到开源项目中,以此增加项 目的影响力。线上运营方面,官网要有清晰的目标、蓝图和路线,让开发者理解项目本质,从而 吸引开发者参与。并且要积极进行社交网络的运营,例如维护公众号等社交媒体,发表高质量 的技术文章,以解决问题的心态帮助开发者等等。对 GitHub0 码力 | 199 页 | 9.63 MB | 1 年前3
2024 中国开源开发者报告够理解和修复包含图像或其他视觉元素的 GitHub 问题。 和工具集成的框架:可以支持智能体在处理复杂任务时进行更好的任务管理和执行,并促进 不同 AI 模型和工具之间的协作。 例如 Composio SWE-Kit 集成文件操作、代码分析、Shell 命令执行、知识库管理和数据 库操作等工具或能力,优势互补,将 SWE-bench verified 大幅度提升到 48.6%。再比如 OpenHands+CodeAct ,它的优点是什 么?以及它和主要竞争技术之间的现状是怎么样的? RAG 最开始被大家热推,更多是因为以下三个原因:可以避开大模型的上下文窗口长度的 限制;可以更好地管理和利用客户专有的本地资料文件;可以更好地控制幻觉。 这三点到现在来看依然还是成立的,但上下文窗口这个优势已经慢慢淡化了,因为各大模型 的上下文窗口都在暴涨,如 Baichuan2 的 192K,doubao、GLM-4 的 用户心智的模型。虽然这些模型是否内置了 RAG 技术不好说,但是 RAG 解决上下文窗口长度 限制的特点已经不太能站得住脚。 但是第二点管理和利用专属知识文件,以及第三点控制幻觉,现在反而是我认为 RAG 最大 的杀手锏。 (一)专属知识文件管理 因为 RAG 这种外挂文件的形式,我们便可以构建一个知识文件管理的系统来维护系统内的 知识,包括生效和失效时间,知识的协作,以及便捷地为知识更新内容等。RAG 在知识维护上, 既不需要像传统0 码力 | 111 页 | 11.44 MB | 8 月前3
全球开源发展态势洞察(2023年第八期)缝支持边缘计算场景。它提供了完整的Kuber- netes API兼容性;支持所有 Kubernetes工作负 载、服务、运营商、CNI插件和CSI插件;提供良 好的节点自治能力,即使边缘节点与云端断网, 在边缘节点中运行的应用程序也不会受影响。 OpenYurt可以轻松部署在任何Kubernetes集群 服务中,让强大的云原生能力扩展到边缘。 Rainbond v5.14.0发布 Prometheus Contour是基于Kubernetes的Ingress控制 器,通过将Envoy代理部署为反向代理和负载 均衡器来实现其功能。Contour提供开箱即用 的动态配置更新机制,同时保持了轻量级的配 置文件结构。此外,Contour引入全新入口 API HTTPProxy,该API通过自定义资源定义 (CRD)来实现。其主要目标是扩展Ingress API的功能,以提供更丰富的用户体验并解决 原始设计中的局限性。 助用户识别并解决容器镜像中的安全漏洞。它 支持多种容器镜像格式和操作系统,并提供全 面的漏洞扫描功能。Trivy能检测操作系统和软 件组件的漏洞,以及配置错误等安全问题。此 外,Trivy还具备对容器镜像中的文件权限和可 疑配置选项等安全配置问题进行全面检查的能 力。借助Trivy,用户能够轻松地进行容器镜像 的安全评估和漏洞修复工作。 近日,Trivy v0.41.0发布,版本特性更新如下: • 支持使用Vulnerability0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书子基金会在包括操作系统、中间件、数据库的基础软件及其他共12个重点领域已通过32个开源项目的技术准入,汇聚产业领袖、行 业专家与“技术大神”,履行了“提升我国对全球开源贡献”这一重要使命。 来源:开放原子开源基金会官网,2023年11月;公开资料,由艾瑞咨询研究院自主研究及绘制。 开放原子开源基金会 技术指导 营销指导 项目指导 用户指导 项目工作委员会 开源战略咨询:帮助企业制定开源战略布局,规划开源成功路 Linux kernel Uniproton 驱动 HDF统一驱动框架 开发框架与系统服务 分布式基座 图 形 部 件 媒 体 部 件 Ability 部 件 ArkUI 部 件 网 络 部 件 安 全 部 件 通 信 部 件 传 感 器 部 件 …… 政务 金融 制造 交通 教育… 桌面 电话 设备栏 设置… 22 ©2023.11 iResearch 逐步向传统行业渗透的趋势,但由于两类行业差异明显,云原生数据库在传统行业中的占比仍然较小。 互联网行业及传统行业数据库开源情况及影响因素 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 互 联 网 行 业 传 统 行 业 数据库通用性 系统架构 运营方式 封闭性强: 与某一适配 的数据库无 法适配其他 行业 政 府 ( 工 业 交 通 金 融 ) 通用性强: 同一数据库 可以轻松扩0 码力 | 43 页 | 4.69 MB | 1 年前3
Moonshot AI 介绍过去四五年投⼊了相应的资源。 第⼆层现在有两个核⼼问题。⾸先是如何通⽤地表⽰这个世界?真正的“通⽤”是像计算机⼀样,⽤ 0和1就能表⽰整个世界。对于基于transformer的语⾔模型来说,它能表⽰⼀本书、⼀篇⽂章、甚 ⾄⼀个视频,但表⽰⼀个更⼤的3D世界或你硬盘上的所有⽂件还有难度,没做到token-in-token- out,离所谓的unifiedreprese ⾼的efficiency,多出来的efficiency就是各⾃的优势。 现在很多⼈觉得做出MoE就可以实现GPT-4。我觉得这是⽚⾯的说法,最终更实质的可能还是如何有 ⼀个统⼀的表⽰空间以及可规模化的数据⽣产。 海外独⻆兽:如果算⼒⾜够,会有⼈想做⼀个万亿参数的densemodel吗? 杨植麟:取决于推理成本的下降速度,但我觉得肯定会有。现在⼤家是因为推理成本太⾼,所以都在 事实性⼀般是对统计模型的挑战,但是今天的语⾔模型可以有⾮常尖峰的分布。让它回答“中国的⾸ 都”,模型对“北”这个字能给出99%的概率。同时,如果我今天让它写⼀本⼩说,那它可能下⼀个 词的概率分布就会很均匀。概率其实是⼀个通⽤的表⽰⽅式。本质上这个世界上有⼤量的熵,抓住确 定性的东西,让本⾝是混沌的东西继续混沌。 通往AGI的话,long-context会是⼀个很重要的点。所有问题都是long-context的问题⸺历史上所0 码力 | 74 页 | 1.64 MB | 1 年前3
2020 中国开源年度报告
后的各种意外,做好准备呢?这些都是 值得⻓期思考并改进的领域。 作为⼀份⼒图完整、客观、全⾯、丰富的报告,值得探讨的问题当然不⽌上述这些,也欢迎朋 友们阅读下⾯的报告,并随时与我们交流。 庄表伟,开源社理事⻓ 2021 年 1 ⽉ 16 ⽇ 特邀点评专家: 吴晟,Apache 软件基⾦会 Member,Apache Local Community 联合创始⼈ ⻩东旭,PingCAP ⻢艳军,百度深度学习技术平台部⾼级总监 蒋涛,CSDN 创始⼈ & 董事⻓,极客帮创投创始合伙⼈ ⾼阳,SegmentFault 思否创始⼈ & CEO 红薯,开源中国创始⼈ & CTO 庄表伟,开源社理事⻓ 陈阳,开源社副理事⻓ 王伟,开源社执⾏⻓ 刘天栋,开源社理事 ⼀、问卷篇 1、报告背景 2016 年初,开源社发布了《2015 年中国开源社区参会调查报告》,随后的⼏年中,持续发 Agent、OpenTracing、Operator Framework、SPIFFE、SPIRE、Thanos 等。 毕业(graduated):包括提交毕业提案模板、TOC 成员开始为期两周的在 TOC 邮件列 表公开评论和 TOC 投票三个步骤。⽬前该阶段的项⽬有containerd、CoreDNS、 Envoy、etcd、Fluentd、Harbor、Helm、Jaeger、Kubernetes、Prometheus、Rook、0 码力 | 46 页 | 4.09 MB | 1 年前3
共 13 条
- 1
- 2













