2021 中国开源年度报告Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 …………………………………………………………………………………… 24 3.15 数据库……………………………………………………………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 专家点评 段夕华: 科技型初创公司用开源来实现技术能力展现,吸引潜在合作伙伴,这个趋势不容忽视。这其中国内 最为抢眼的就是 PingCAP/TiDB,其开源策略、战术均值得大家学习借鉴。 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和 政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认可。尤其是开源与数据(数据库 & 大数据) 以及 要的考虑因素,只有在产品性能差别不大时,才会选择对开源社区贡献 大的供应商。 专家点评 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的选型是由在一线的开 发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要通过公司领导,工程团队负责人进行决策。 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉至工程团队技术负责人的趋势是不可避免的。这 同时也要求技术产品的采购在决策流程0 码力 | 132 页 | 14.24 MB | 1 年前3
2023 中国开源开发者报告本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆 盖了不同的领域和场景,构建了多元化的大模型生态。 大模型方面,百花齐放:百度的文心一言、抖音的云雀大模 型、智谱 AI 的 GLM 大模型、中科院的紫东太初大模型、 百川智能的百川大 大模型、上海人工智能实验室的书生通用大模型、腾 讯的混元大模型、蚂蚁的百灵大模型等。 另一方面,除了大模型本身,中国在 LLM 相关技术领域也 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 the Enterprise”报告显示: 54% 的 AI 用户预计 AI 的最大好处是提高生产力。 77% 的受访者使用 AI 来辅助编程。其中提到的具体 应用包括欺诈检测、教学和客户关系管理。 AI 用户表示,AI 编程(66%)和数据分析(59%) 是最需要的技能。 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。0 码力 | 87 页 | 31.99 MB | 1 年前3
2021 中国开源年度报告Internet companies, accounting for 39% and 25%, respectively. 【专家点评】/ [Expert Comment] 段夕华: 科技型初创公司用开源来实现技术能力展现,吸引潜在合作伙伴,这个趋势不 容忽视。这其中国内最为抢眼的就是 PingCAP/TiDB,其开源策略、战术均值得大家学习 借鉴。 Duan Xihua: Technology learning. 堵俊平:这两年,一个很明显的趋势是越来越多的初创企业参与开源。这一方面得益于 ToB 赛道成为市场和政策导向的热点,另一方面开源所代表的开放式创新也被投资界所认 可。尤其是开源与数据(数据库&大数据)以及 AI 等热点技术相结合,更是为市场带来 了极大的想象空间。 Du Junping: In the past two years, a clear trend has been that 【专家点评】/ [Expert Comment] 姜宁:这里的开源产品是指基于开源项目的商业化产品吧!大部分的情况下,开源项目的 选型是由在一线的开发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要 通过公司领导,工程团队负责人进行决策。 Jiang Ning: Are the open source products herein referred to as commercial0 码力 | 199 页 | 9.63 MB | 1 年前3
2024 中国开源开发者报告目 录 Part 2: TOP101-2024 大 模 型 观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 平台相关公开数据 15 / 111 OSS Compass Insight 2024 中国开源开发者报告重点聚焦大模型,本章节以大模 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 / 111 OSS Compass Insight 生产力-协作开发指数 本部分图表仅用于数据展示,不涉及先后排名 作为国内及业内领先的 AI 开发基础设施,本部分图表 中的开发框架、向量数据库、 开发平台、大模型均表现出 色,代表着它们的代码提交 频率、参与者、代码合并比 率等协作开发工作保持着较 高的水平。 17 / 111 OSS Compass Insight 本部分图表仅用于数据展示,不涉及先后排名0 码力 | 111 页 | 11.44 MB | 8 月前3
中国开源软件产业研究报告各种主体,聚焦企业开源领域,企业开源与商业化并不矛盾,开源软件的“引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 好的软件作品,往往源自于开发者的个人需要——按说这是显而易见的(正如 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 开源产业主体及产业关系 开源社区运营为核心,注重开源用户和贡献者的反馈 从产业主体的角度上看,开源软件产业市场上的主体包括软件的源作者(个人/企业)、开源基金会、开源社区(包括代码 托管平台、软件论坛、行业联盟)、二 市场推广、版 本迭代更新、版权管理和安全管理等内容,这些环节和商业企业的软件项目有一些相似之处,但更加注重从社区的使用者 和贡献者处得到观点和启发,并用以驱动项目未来的发展。 开源软件主体和产业链关系 源作者 软件作品 企业开源 开源基金会 开 源 社 区 代码托管平台 开源软件论坛 专家指导 产业联盟 法律服务 市场宣传 二次开发者 软件用户 • 开源代码的源作者/最初贡献0 码力 | 68 页 | 3.63 MB | 1 年前3
2020 中国开源年度报告
年以代码和测试为主转变为以代码和⽂档为主,社区和项⽬正在 意识到⽂档的重要性,更多开源贡献者投⼊到了⽂档撰写中; 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源 活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区⾄关重要。⽽对于更 倾向于线上还是线下的会议,结果竟惊⼈地持平; 在 2020 年 COVID-19 这个⼤背景下,各⾏各业都不可避免受到了冲击和影响;82% 作为当时开源项⽬的主战场,Linux 操作系统、 桌⾯办公软件(GNOME, OpenOffice)和浏览器(Mozilla)掀起了第⼀波开源的浪 潮;近年来随着互联⽹的兴起,开源的项⽬和技术越来越百花⻬放,从数据库到中间 件,从前端到后端,从编程语⾔到编译器,从物联⽹到微服务,从⼤数据到⼈⼯智能, 开源的技术和项⽬越来越丰富和多样化。 4、开源⼯作现状 4.1 接触开源的时间 有近三成参与者接触开源的时间在 品和操作系统相关产品仍然是⼤家了解 和接触开源的最初窗⼝。 4.7 最希望能够开源的产品 相⽐于 2019 年,开发⼯具在今年成为⼤家最希望能够开源的产品类型第⼀名,紧接着的是操 作系统,数据库产品与中间件产品也是很多⼈希望能够开源的产品类型。 4.8 企业对开源的贡献 在参与者眼中,GitHub 对于开源软件的贡献最⼤,其次是 Google,⽽在国内企业中, Alibaba、Huawei0 码力 | 46 页 | 4.09 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求 其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生,0 码力 | 43 页 | 4.69 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)添加EDS支持(Endpoint Discovery Service)。 近日,OpenYurt v1.3.0发布,版本特性更新如下: • 重构Openyurt控制平面组件; • 允许用户为静态Pod定义Pod模板和升级模 型; • NodePort Service支持节点池隔离。 近日,Rainbond v5.14.0发布,版本特性更新 如下: • 各语言源码构建包版本升级; • 支持一键删除应用及应用下相关资源; • 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示 代码的功能及其在软件中所起的作用进行判断。最终确定被传染的部分应当是与原开源软件形成 密切通信使得二者高度牵连融合成一体的程序,而非只要有数据交换就会构成传染。未来公司软 件的主程序与涉案GPL开源代码存在函数调用关系,且该开源代码实现的压缩功能系投标文件上 传前不可或缺的功能,故主程序为该开源代码的衍生程序,受GPL协议约束。而预览程序与主程 序相互独立,预览程序文件连同不包含GPL开源代码的DLL文件在脱离主程序后,预览程序、主0 码力 | 22 页 | 1.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021云计算开源产业联盟云原生十大优秀案例 infoQ 中国技术力量年度榜单 InfoQ2020 最有价值技术团队 InfoQ2020 最佳技术社区驱动力奖 思否 SegmentFault 中国技术品牌影响力企业 DTCC 第十一届中国数据库技术大会创新产品奖 《Gartner 2021 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院可信云计算最佳实践服务网格 2021 数博会“十佳大数据案例” 《Gartner 2019中国 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 流程开发,可支持如请假、入职、离职等 企业内常用流程场景。 ETL 、自助取数、驾驶舱、数据 大屏、复杂报表、数据填报、智能决策等数据应用,支撑企业智能化决策。 通过信通院“大数据产品能力评测”商务智能工具评测 产品荣誉 文件类(CSV/TXT) 关系型/分布式数据库 API 接口 填报数据 大数据平台 数据连接 数据接入 SQL语句数据建模 可视化数据建模 轻量化 ETL 建模 对接数据中台模型 数据建模 数据分析 报告 智能图表推荐0 码力 | 43 页 | 884.64 KB | 1 年前3
Moonshot AI 介绍leNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅ 重要的是理解两者之间的关系。 AGI和产品对我们来说并不是⼿段和⽬的的关系,两个都是⽬的。同时,在追求AGI的过程中,我认为 所谓的数据⻜轮是很重要的,尽管它是⼀个⽼套的概念。 像ChatGPT这样的产品,还没有完全建⽴起基于⽤⼾数据的持续进化。我觉得这很⼤程度上是base model还在进化,进化了⼀代,之前的⽤⼾数据就没什么⽤了。这跟发展阶段有关系⸺现 在“吃”的 上scalinglaw刻画的是loss跟参 数量之间的关系。MoE改变了这个函数,让你能够⽤更⼤的参数,但同时FLOPs不变。合成数据改变 的是另⼀个关系,FLOPs不变的情况下让数据规模增⻓。 沿着scalinglaw⼀直⾛是个有确定性的事情,⼤家通过试图改变scalinglaw⾥的具体关系来获得更 ⾼的efficiency,多出来的efficiency就是各⾃的优势。0 码力 | 74 页 | 1.64 MB | 1 年前3
共 12 条
- 1
- 2













