2024 中国开源开发者报告开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 2019 年 2020 年 2021 年 2022 年 2023 年 2024 年 3600 万 2024年Gitee总仓库数 500 万 2024年Gitee新增仓库数 6 / 111 和开源共同体拥抱开放透明 100 240 3,000 25,000 70,000 110,000 160,000 200,000 330,000 380,000 400 开放透明的组织协同。 7 / 111 本年度最受开发者关注的开源组织 2024 年,技术大厂及其大型项 目依然备受关注,它们推动着技 术的快速发展和广泛应用。 同时,「民间」开源组织虽然在 关注度上不及大厂主导的项目, 但它们在某些技术细分领域中却 拥有非常强的影响力和活跃的开 发者社区。 两者的不同发展模式相互补充, 共同推动了国内开源生态的繁荣 与多样化。 最受关注开源组织指2024年获得 Star0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。 二、 New Bing(Bing AI)代表了微软在 LLM 领域的野心和 决心,它首次把当时世人能想到最有价值又可行的 大有干掉搜索行业和问答社区的趋势,而后事实证明,全 球 最 强 IT 问 答 社 区 Stack OverFlow 深 受 其 害 。 Google 紧随其后推出 Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 潮卷到天际。 四、 Stable Diffusion 和 Midjourney 这两大图像生成系统 的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应 用,它们突破了传统图像生成方式的局限,仅需要用户提供 文字描述,就可以生成高质量的数字艺术作品。它们的图像 生成质量、样式多样性和用户便捷性都是极大的突破。这为 广大的个人用户和创意行业提供了强有力的工具,彻底改变 了数字艺术内容的创作方式。同时,它们也引发了人工智能0 码力 | 87 页 | 31.99 MB | 1 年前3
中国开源软件产业研究报告www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 摘要 SMS 开源与云计算:开源软件与云计算产业既有互相促进的良性合作,也有因利益纠纷带来的冲 突和矛盾。一方面,云计算产业的大量的基础软件都是开源软件,开源生态为云计算行业的 产品创新提供了持续的动力,而云服务企业的平台也为众多开源软件提供了市场分发渠道; 另一方面,由于全球范围内普遍存在云企业托 内 所谓的“开源”概念还包含其他诸多基本要求和限制,需要作者和使用者共同遵循一些规范。OSI(Open Source Initiative)组织是全球范围内开源软件标准的权威发布机构,在该机构的界定中,规范的开源项目和软件除了在开放源代 码这一基本要求之外,其开源许可(open source license)还需要满足关于源代码的使用和修改、关于软件传播以及公平 性、中立性等方面的诸多要求,这些要 性、中立性等方面的诸多要求,这些要求加强了开源产业的规范性,构建了诸多开源商业模式的基础。 来源:OSI,艾瑞咨询研究院根据公开资料研究及绘制。 OSI组织对“开源”核心概念和要求的界定 关于开源软件的内容(代码) • 开源软件必须包含可理解与运用的源代码,或提供简便的获取 源代码的方式;且开源代码必须允许以源码或编辑后文件的形 式传播 • 开源许可须允许源码修改及其他衍生工作 关于开源软件传播的规范 • 开源许可0 码力 | 68 页 | 3.63 MB | 1 年前3
Moonshot AI 介绍公司。公司致⼒于 寻求将能源转化为智能的最优解,通过产品与⽤⼾共创智能,实现普惠AI。 • 成⽴时间:2023年3⽉1⽇ • 产品 ◦ Kimi智能助⼿(⽹⻚版:kimi.ai、App和⼩程序搜索“Kimi智能助⼿”即可),发布时间 2023年10⽉9⽇ ◦ MoonshotAI开放平台(公测中https://platform.moonshot.cn/),发布时间2023年11⽉2⽇ 欢迎关注公众号,了解更多动态 公司亮点 1.团队拥有世界级的⼈才密度: a. 创始⼈杨植麟是中国35岁以下NLP领域引⽤最⾼的研究者,Transformer-XL和XLNet两篇重要 论⽂的第⼀作者;两位联合创始⼈周昕宇和吴育昕都有10000+的GoogleScholar引⽤。 b. 团队成员囊括NLP,CV,RL(强化学习),Infra⽅⾯新⽣代⼈才,主导了很多有世界影响⼒的⼯ etaLLaMa和GooglePALM等⼤多数 主流模型的重要组成部分;发明了groupnormalization,是StableDiffusion等AI模型成功 的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 与DeepMind和CMU合作研究,⾸次0 码力 | 74 页 | 1.64 MB | 1 年前3
2020 中国开源年度报告
是:“这是最好的时代,这是最坏的时代”。 也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚 ⾄“每⼀天都在亲历历史,每⼀天都是活久⻅!”新冠疫情与中美贸易战,在同⼀年加剧。⽽因 为疫情和贸易战,世界正在加速发⽣变化。 在这样的历史⼤背景下,我们在开源界,也发现了以下三个趋势: 1. 开源⼤发展以及由实向虚进发的趋势 从各种数据,以及我们⾃⼰的感觉都能发现:全球开源都出现⼀个⼤发展的趋势。GitHub 则是我们的⼀个猜测:疫情以 来,越来越多的⼈开始远程办公,事实上促进了更多的⼈有机会“斜杠化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 如果中国的开源,以⼀种与世界隔离的⽅式 “崛起”,这并不是我们希望看到的未来。 3. 开源向善以及我们尚未做好准备 疫情爆发以来,众多的开源⼈奉献⾃⼰的时间、精⼒、技术和智慧,投⼊到⼀个⼀个的抗疫相 关的开源项⽬之中,也因此诞⽣了诸多⾯向医学、防疫、公益、救援的开源组织和开源项⽬。 其中 wuhan2020 就是典型的代表。 因此,在 2020 年的中国开源年会筹办期间,我们毫不犹豫的选择了 “开源向善(Open0 码力 | 46 页 | 4.09 MB | 1 年前3
2021 中国开源年度报告非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 : 开源软件商业化模式发展历程 …………………………………………………………………… 80 3 开源软件公司商业化路径选择 …………………………………………………………… 83 3.1 开源软件商业化可以选择的路径和案例 ………………………………………………………… 84 3.2 开源项目的 life cycle 以及软件供应商在对应阶段的重点工作 ……………………………… 85 3.3 商业化过程中的风险点 布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结 合数据分析手段和调查报告等多种形式,绘制一份 2021 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要一环,不基于调研的分析报告不过是纸上谈兵。问卷 从两个角度展开,其中包括个人信息(包括工作信息和开发者技术信息)和开源社区参与 情况,与往年不同的是,今年我们加入了开源社区度量和开源商业化相关的话题,欢迎大 家参与问卷并发表自己的想法。0 码力 | 132 页 | 14.24 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立的服务网格解决方案,包括处理在Kuberne- tes集群上运行的微服务的流量管理、策略执行 和可观测性等任务,以简化应用程序的部署和 管理。OSM于2020年8月推出,同年加入云原 生计算基金会(CNCF)。不久后,该项目成为 云原生计算基金会(CNCF)沙箱级别的项目。 2022年初,OSM正式发布v1.0.0版本。 KSOC推出业内首个实时 Kubernetes安全态势管理平台 近日,KSOC推出业内首个实时Kubernetes安 全态势管理平台。Kubernetes安全态势管理平 台可以通过实时上下文以及当前和历史信息准 确定位攻击活动,同时还可以根据集群的当前 状态提供可操作的补救措施。具体功能包括: • 实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 Mirantis发布轻量级 Kubernetes发行版k0s v1.27 Docker和Kubernetes开发公司Mirantis发布0 码力 | 22 页 | 1.99 MB | 1 年前3
2021 中国开源年度报告an unknown direction at high speed. 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年,则是起飞之 前的助跑阶段。从地面到天空,意味着整个行为的模式都会发生深刻的变化。我们原来只需要 get to the sky, we have countless more options in three-dimensional space. 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 :所有人都在奋力奔跑, 奋勇向前。 Although we cannot predict and grasp the future and the state in the air, Background 2016 年初,开源社发布了《2015 年中国开源社区参会调查报告》,随后的几年中,持续发布 了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数据 分析手段和调查报告等多种形式,绘制一份 2021 年中国开源世界的地图。 In early 2016, KaiYuanShe released the 2015 China Open Source Community0 码力 | 199 页 | 9.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、性能优越性、产品成熟度及安全可靠性等方面得到了 各行业客户的验证。目前已服务各领域头部客户百余家,包括工商银行、 信、德邦快递 等诸多大中型客户。 以“开放、开源、跨云”为技术理念,网易数帆大力推动技术研究,先后取 得“工信部云计算服务能力标准首批试点单位”、“国家企业技术中心”、“信 通院云计算标准和开源推进委员会成员”、“信通院大数据技术标准推进委 员会成员”、“信创工委会成员”等机构资质。同时,网易数帆积极推动跨厂 商的数字化技术融合发展,与AWS、阿里云、百度云、华为鲲鹏云计算、 浪潮、新华三等多家企业完成技术兼容性认证。 大数据系统软件浙江省工程实验室 浙江省网易大数据重点企业研究院 浙江省云计算和大数据省级企业研究院 人工智能技术机构资质 浙江省增强现实与智能交互工程技术研究中心 省级组织资质 浙江省重点企业研究院 浙江省企业技术中心 云计算技术机构资质 工信部云计算服务能力标准首批试点单位 信通院云计算标准和开源推进委员会成员 信通院首批开源供应商 浙江省云计算和大数据省级企业研究院 CNCF 官方认可的 Kubernetes0 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 开源内容传播应用与 迭代升级,达到社会 集体效应最大化 5 ©2023.11 iResearch Inc. 开发者商用开源代码时容易出现的违规风险:不同开源许可证对 于二次发行有不同程度的开源要求,要求越严格,开发者越难保护商 业版本发行的机密性,不知情企业闭源发行时越容易有侵权风险 类别一 允许二次闭源发行, 需要保留原始版权 和许可声明 常见许可证: • MIT • Apache2.0 • BDS2.0-clause • 木兰宽松许可证 类别二 一定条件下允许二 次闭源发行 常见许可证: • LGLP2.1,商业0 码力 | 43 页 | 4.69 MB | 1 年前3
共 12 条
- 1
- 2













