2024 中国开源开发者报告性, C 端用户基数,依赖这个软件的生态系统大小等等。其中哪个更关键一点? 技术先进是好事,但大模型领域的先进技术远没有达到能为大模型企业带来可观收入的程度。 整个大模型赛道还处在商业化的摸索阶段。这个时间点上的“技术先进性”更多是用于公关宣传 的素材。考虑到数据获取、加工的成本,模型训练的成本,这是一种相当昂贵的宣传方式。 C 端用户指那些把大模型当成智能个人助理来使用的普通个人用户。OpenAI 是目前已知最好的智能体底层技术。 智能体作为学术术语由来已久,从上世纪的“符号、专家系统”【1】,到十年前风头无两的 强化学习(代表作 AlphaGo【3】),再到现在的 LLM,agent 底层技术经历了三个大的阶段。 符号系统的缺点在于过于依赖人工定义的“符号”和“逻辑”,强化学习苦于训练数据的匮 乏和“模态墙”,而 LLM 一次性解决这些问题。 人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 还有一点就是上半年加我微信好友的很多独立开发者或在职的个人,多半也已经在寻觅了半 年机会之后放弃了继续探索,这一点在和他们交流,以及他们朋友圈的内容变化中可以明显感知。 49 / 111 图:技术采用生命周期。现阶段的 AI 大模型市场似乎正处于过高期望之后的下坡过程中 但是这并不是坏事,上图已经告诉我们,这是必然规律。 (二)价值开始显现 目前还奔跑在 AI 大模型应用赛道的公司,很多已经开始创造出客户价值,有了自己的优势。0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 Stable 示(EmotionPrompt)”,提示词工程俨然在将 LLM 一 点一点解剖,试图让人类成为可以将其掌控的“咒术师”。 八、 AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM 发展的新阶段。LLM Agent 是一种基于 LLM 的智能代 理,它能够自主学习和执行任务,具有一定的“认知能力 和决策能力”。LLM Agent 的出现,标志着 LLM 从传 统的模型训练和应用模式,转向以 的受访者使用 AI 来辅助编程。其中提到的具体 应用包括欺诈检测、教学和客户关系管理。 AI 用户表示,AI 编程(66%)和数据分析(59%) 是最需要的技能。 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试0 码力 | 87 页 | 31.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021网易杭州研究院启动私有云研发,支撑网易集团互联网产品全面上云。 2006 网易成立杭州研究院,构建互联网技术体系。 1997 网易早期云存储产品诞生,支撑网易邮箱运行。 数帆阶段 网易云阶段 前身阶段 数帆历程 04 COMPANY 背靠24 年互联网技术积累 成熟可靠 年 24 140 余项技术专利 140 12 亿终端用户体验支持 亿 12 100 余家行业头部客户 响范围扩散,导致大量的沟通,开发效率低 随着规模增加 编译时间快速增加 代码级的依赖,需要全量测试 测试回归周期长 代码修改对整个应用有影响,需要全量测试 无法有效对需求快速变化 单一技术架构 技术演进需要全部重写,成本高 开发效率 编译时间 测试周期 应对需求变化 技术演进 对比项 微服务应用 基于服务接口的依赖 各服务间独立开发,开发效率高 微服务独立编译 编译时间短 基于服务接口的依赖 仅需要测试相关服务,测试回归周期短 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 云部署。 高效 联动数据链路多环节,从系统 层面加快业务高效运营和有 效决策。 灵活 组件式插件化产品架构,基于 用户的发展阶段,提供量身定 制的大数据产品和解决方案。 16 网易数帆旗下大数据技术与服务品牌 网易有数以“数据价值”为导向,聚焦于企业 “看数”、“管数”、“用数”等业务场景,提供全链路大数据技术及产品服0 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 版本发行 社区生态管理 服务器 云计算 边缘计算 智能终端 桌面 … 操作系统应用场景 处理器 … 服务器 端设备 内存 系统软件 … 数据库管 理软件… 应用软件 编译软件 开源促进“更好的”操作系统被“更好地”使用 硬件适配 软件适配 19 ©2023.11 iResearch Inc. DataPod 资源池化架构 全站可观测、可追踪、全加密 SQL引擎插件化 开箱性能即最佳 openGauss DataKit 插件化架构 标准化插件接口 数据全生命周期管理 覆盖部署开发运维等阶段 社区发行版 打造根技术、提供企业级内核能力 商业发行版 集中式数据库、多模数据库 企业自用版 金融、运营商、能源交通等行业 openGauss基于自主化根技术,聚焦数据库内核与架构,0 码力 | 43 页 | 4.69 MB | 1 年前3
2020 中国开源年度报告
桌⾯办公软件(GNOME, OpenOffice)和浏览器(Mozilla)掀起了第⼀波开源的浪 潮;近年来随着互联⽹的兴起,开源的项⽬和技术越来越百花⻬放,从数据库到中间 件,从前端到后端,从编程语⾔到编译器,从物联⽹到微服务,从⼤数据到⼈⼯智能, 开源的技术和项⽬越来越丰富和多样化。 4、开源⼯作现状 4.1 接触开源的时间 有近三成参与者接触开源的时间在 1-2 年,近⼋成参与者接触开源时间在⼀年以上。 处理。项⽬被拒绝时,可能是“⽬前不合适”这种情况,并且可以⿎励该项⽬在解决问题后 重新申请。整个过程所需的时间并不固定。⽬前该阶段有 Artifact Hub、Backstage 等 44 个项⽬。 孵化(incubating):同沙箱流程,所有的例外情况(包括拒绝)均由 TOC 来处理。⽬ 前该阶段的项⽬有 Argo、Buildpacks、CloudEvents、CNI、Contour、Cortex、CRI- 投票三个步骤。⽬前该阶段的项⽬有containerd、CoreDNS、 Envoy、etcd、Fluentd、Harbor、Helm、Jaeger、Kubernetes、Prometheus、Rook、 TiKV、TUF、Vitess 等。 CNCF 托管已毕业,正在孵化和沙盒中的项⽬。尽管 CNCF 为所有项⽬提供了⼀套共享服 务,但并未为沙盒项⽬提供实质性的营销服务,因为它们是属于早期阶段的项⽬,需要轻型中0 码力 | 46 页 | 4.09 MB | 1 年前3
2021 中国开源年度报告年的关键词,应该是“助跑”。迹象已经 非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 …………………………………………………………… 83 3.1 开源软件商业化可以选择的路径和案例 ………………………………………………………… 84 3.2 开源项目的 life cycle 以及软件供应商在对应阶段的重点工作 ……………………………… 85 3.3 商业化过程中的风险点 …………………………………………………………………………… 87 4 投资——如何找到下一个开源独角兽 …………………………………………………… 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养 , 越来越多的学生参与到开 源开发中,开源人才培养周期前置,越来越多的学校开设开源课程,希望后续可以实现在学习计算机、编译原 理、软件工程等理论知识的同时,让学生学习掌握开源开发模式、理解认同开源文化。 参与者职位分布 产品经理,9,2% CTO/CEO 公司负责人,26,5% CTO/CEO 公司负责人 产品经理0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地面到天空,意味着整个行为的模式都会发生深刻的变化。我们原来只需要 在一个二维平面思考路径与方向,而到了天空,在三维空间里,我们多了无数选择。 For China's 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养,越来 越多的学生参与到开源开发中,开源人才培养周期前置,越来越多的学校开设开源课程, 希望后续可以实现在学习计算机、编译原理、软件工程等理论知识的同时,让学生学习掌 握开源开发模式、理解认同开源文化。 Yang Liyun: China's open source talent reserve is sufficient; 【专家点评】/ [Expert Comment] 堵俊平:一般而言,每周投入法定工作时间的 50% 以上(即 20 个小时)即可视为全职 开源开发者,这个比例大概是 13%,相对偏低。可以看到,现阶段,在中国,大多数的 开源贡献者更多是出于爱好,而非全职投入。换句话说,开源开发还没有成为广大开发者 可以赖以谋生的职业手段,这距离开源生态的真正繁荣还有差距。 Du Junping: Generally0 码力 | 199 页 | 9.63 MB | 1 年前3
Moonshot AI 介绍所谓的数据⻜轮是很重要的,尽管它是⼀个⽼套的概念。 像ChatGPT这样的产品,还没有完全建⽴起基于⽤⼾数据的持续进化。我觉得这很⼤程度上是base model还在进化,进化了⼀代,之前的⽤⼾数据就没什么⽤了。这跟发展阶段有关系⸺现 在“吃”的是basemodel的scalinglaw,未来可能会去“吃”⽤⼾这个数据源的scalinglaw。 历史上基本所有的互联⽹产品要跑出来,最终都要靠⽤⼾ 不 能分享下当年的决策逻辑? FounderPark ,赞15 杨植麟:我的认知在过去⼏年⾥⾯发⽣了⾮常⼤的变化。 ⼀开始觉得语⾔模型可能是个⼯具,可以去提升很多不同场景的效果;第⼆个阶段,认为语⾔模型可 能对很多任务都有⽤。后来⼤家认为语⾔模型可能成为AI唯⼀的⼀个(要解决的)问题⸺所有的问 题,都可以通过把语⾔模型做得更好,把nexttokenprediction做得更好来解决。 应⽤共同成⻓,你的数据集、 测试集要不断变化,引擎要不断变化,⽣命⼒得掌握在⾃⼰⼿⾥。 杨植麟:没错。⽽且,很多模型的基础能⼒,也需要跟市⾯上的commodity(⾏活)有差距,现阶段 还处于技术驱动的阶段,通过更好的基座模型,可以转化成产品优势。 但最终肯定不是,⽐如再过10年20年,技术上会陷⼊⼀种commoditized(⾏活化)的情况,那你 可能就需要利⽤先发优势,把0 码力 | 74 页 | 1.64 MB | 1 年前3
中国开源软件产业研究报告浅尝初试,开源在中国开发者中的普及度高而渗透率低 中国的开源开发者基数大,2021年GitHub上的中国用户数达到755万人,大部分中国开发者仅使用过开源软件,对开源项 目的参与度低,大部分仍处于浅尝初试阶段。开源概念及开源软件在中国开发者中的普及率很高,92%的开发者了解自己 曾经使用过开源软件,仅有5%的开发者对开源软件的定义尚不明确。开源项目在中国开发者中的渗透率较低,实际参与 到开源项目中的开发 www.iresearch.com.cn 中国开源社区平台 从幼稚走向成熟,呈现出繁荣多元的特征和整合规范趋势 开源社区的发展需要经历触发期、发展期、协作期、结晶期与流行期五个阶段,中国的开源社区平台大多处于前三个阶段, 仅有极少数开启了商业化良性互动。中国开源社区平台有以下四种形式:1)开发者社区,代表有技术交流社区CSDN、 OSCHINA等,其中CSDN是全球第二大开发者社区,内容不仅限于 内只有一家开源基金会—— 开放原子基金会;4)开源组织,如中国开源软件推进联盟等。 来源:中国信通院,艾瑞咨询研究院根据公开资料研究及绘制。 中国信通院可信开源社区评估体系及当前国内开源社区发展阶段 有途径/可预期参与社区治理/运营/开发;可放心使用社区发布的项目 可信社区 言行一致、知行合一、社区优先、勇于革新、自我进化、尊重守信 可信价值观 社区可信(组织可信) 项目可信(产品可信)0 码力 | 68 页 | 3.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Initialization Library(OpenSIL)代 替AMD Generic Encapsulated Software Architecture(AGESA)固件的计划。新固件 将经历四个阶段的开发周期预计到2026年开始 投入使用。 OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 固件协议。 Google、AWS(亚马逊)、Meta(Face- book)、AMI等行业巨头,都是AMD Open- SIL的合作伙伴。 AMD为实现OpenSIL设定了四个阶段的POC (概念验证)评估工作,第一阶段已开始, 兼容Zen4架构的四代霄龙(Genoa),接下 来经过Zen5架构的五代霄龙(Turin),最 终在2026年Zen6架构的六代霄龙上成为默认 值,届时AGESA则会退出。 丁不 会默认启用,它涉及到对Windows启动管理器 进行永久性的更改,最终将导致现有的Win- dows启动媒介无法启动。 为避免突然导致用户系统无法启动,补丁将会 分三个阶段推出更新。直到2024年第一季度将 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模0 码力 | 22 页 | 1.99 MB | 1 年前3
共 11 条
- 1
- 2













