2024 中国开源开发者报告2024 年,我们还看到了“AI 程序员”Devin 的诞生,Devin 能够独立完成复杂的编码和 调试任务、自主查找和修复代码库中的错误,构建和部署应用程序。在 SWE-bench 编码基准测 试中,Devin 能够解决 GitHub 中 13.86%的真实问题,有了很大提升。 说起 SWE-bench 编码基准测试(https://www.swebench.com/),2024 年进步很快,以 技术检索历史上已知的代码缺陷模式和已知问题,从而比较 准确地识别潜在的缺陷和安全漏洞,甚至能够分析代码的功能意图,全面提升代码评审的能 力。 有些团队,根据 UI 设计图,让 LLM 自动生成相应的前端代码,大大减少了手动编码的时间, 加快了从设计到实现的流程。 43 / 111 从应用效果看,前面调研的数据可供参考。在国内 AI 编程开展比较好的大厂,超过 80%的 工程师在使用 AI 编程工具完成日常的编程工作,近 本)的统计(概率),因此,开放 的数据和算法能够在更大程度上确保样本的质量,从而避免更多未知的风险。例如就在 2024 年 12 月 1 日,用户发现 ChatGPT 在需要输出“David Mayer”这个名字的时候会突然提示拒绝: 此事件一度被解读为 GPT 模型在训练过程中被植入了特定的样本或算法,以避免讨论特定 53 / 111 的人名。虽然后续的一系列测试表明,这种限制似乎只存在于0 码力 | 111 页 | 11.44 MB | 8 月前3
Moonshot AI 介绍RL(强化学习),Infra⽅⾯新⽣代⼈才,主导了很多有世界影响⼒的⼯ 作,吸引了来⾃Google、Meta、Amazon等全球领先科技公司的海外⼈才加⼊: i. ⼤模型⽅⾯。团队成员发明了RoPE相对位置编码,是MetaLLaMa和GooglePALM等⼤多数 主流模型的重要组成部分;发明了groupnormalization,是StableDiffusion等AI模型成功 的关键组件;发明 只到 这⼀步,那它可能就不是真实的规模化。 我会从两个例⼦来展开介绍,到底什么是真实的规模化。我们认为,Transformer是新时代的计算 机。这跟⽼的计算机不⼀样,⽼的计算机可能是你通过编码⽅式实现⼀个确定性的需求,但在 Transformer上,你可能是通过Prompt作为编程语⾔,⽤数据作为桥梁去嫁接你的产品和研发。 在这种新的计算范式下⾯,它会产⽣新的计算,会产⽣新的内存。⽐如说参数数量可能就会决定计算 的,基本上很少存在今天这种APP突然不知道怎么开发,或者我这个定义了需求,结果没有被实现的 情形。因为它是⼀个确定性的事件,只需要经过⼈在计算机上⽤编码让计算机理解,就可以被实现。 但是AGI是不⼀样的,我很难去规划,今天要去完成⼀个什么样的需求、然后完成到什么程度,因为 它是没有办法被硬编码、被规则表⽰的。AGI做事情的⽅式不是这种前置的规划性的创新,⽽是后置性 的,我可能要去试⼀下才知道。AGI得有⼀个底0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告线的开 发人员决定的,但是由于公司决策链的关系,商业产品的购买还是要通过公司领导,工程团队负责人进行决策。 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉至工程团队技术负责人的趋势是不可避免的。这 同时也要求技术产品的采购在决策流程上透明化,更看重产品在技术指标上的优势。客观来看,这对开源的发 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 生存时代? 堵俊平:与二三十年前开源项目凤毛麟角的情况不同,当前各种开源项目层出不穷,只有通过有效的运营活动 才能快速吸引开发者的眼球。“酒好不怕巷子深”的思路已经不再适用于开源项目推广。当然,要避免另一个 极端,即过度包装和营销,开源最后还是要回归代码 -“talk is cheap, show me the code”. 王蓉:后疫情时代,线下 + 线上的 hybrid event 将长 解客户的需求,并且发掘出用户需要的使用场景。因此,相对于单一的闭源软件供应商,开源社区有着 2021 中国开源年度报告 77 更清晰的研发方向,能致力于开发出更多的功能,并创造出对用户更有价值的产品,避免不必要的开发 成本支出。除此之外,企业可以聘用贡献者来保证开发的活跃性,向开发者提供灵活的工作地点与模式, 提高自身的人才储备来加速产品开发。 图表 5 :开源提高开发人员生产力 资料来源:GitHub0 码力 | 132 页 | 14.24 MB | 1 年前3
2023 中国开源开发者报告英伟达凭借各国、初创公司、大型科技公司和研究人员 对其 GPU 的巨大需求,跻身市值万亿美元俱乐部; 主要芯片供应商开发了不受出口管制影响的替代产品; 在 ChatGPT 的带领下,生成式 AI 的应用在图像、 视频、编码、语音等领域取得了突破性的进展,带动了 180 亿美元的风险投资和企业投资。 O'Reilly 发 布 的 “ 2023 Generative AI in the Enterprise”报告显示: OpenAI 前成员创立的 Anthropic 发布对话 AI 产品 Claude,包含 520 亿个参数。 与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、 摘要、写作、编码,以及响应用户的提问。 四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长, 可通过 API 访问。此外还上线了面向公众的 beta 网站 claude 故,并对大量相关领导做出了处罚。 4 月 12 日,工业和信息化部信息通信管理局听取腾讯公司关于 “3・29” 微 信业务异常情况汇报,要求腾讯公司进一步健全安全生产管理制度、落实网 络运行保障措施,坚决避免发生重大安全生产事故,切实提升公众业务安全 稳定运行水平。 16 / 87 1 1 语雀 10.23 重大服务故障 开源开发者事件回顾 阿里云 11.12 重大服务故障 2023 年 100 码力 | 87 页 | 31.99 MB | 1 年前3
2021 中国开源年度报告front-line staff, and the boss is to approve the process 堵俊平:由于技术领域的发展日新月异,技术采购决策权下沉至工程团队技术负责人的趋 势是不可避免的。这同时也要求技术产品的采购在决策流程上透明化,更看重产品在技术 指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 era? 堵俊平:与二三十年前开源项目凤毛麟角的情况不同,当前各种开源项目层出不穷,只有 通过有效的运营活动才能快速吸引开发者的眼球。“酒好不怕巷子深”的思路已经不再适 用于开源项目推广。当然,要避免另一个极端,即过度包装和营销,开源最后还是要回归 代码 -“talk is cheap, show me the code”. Du Junping: Unlike the situation 这比闭源软件开发更能了解客户的需求,并且发掘出用户需要的使用场景。因此,相对于单一 的闭源软件供应商,开源社区有着更清晰的研发方向,能致力于开发出更多的功能,并创造出 对用户更有价值的产品,避免不必要的开发成本支出。除此之外,企业可以聘用贡献者来保证 开发的活跃性,向开发者提供灵活的工作地点与模式,提高自身的人才储备来加速产品开发。 Open source brings about rapid0 码力 | 199 页 | 9.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021支持单体架构向微服务架构、微服务架 构向服务网格架构平滑演进。 开放兼容 全面覆盖主流微服务开发技术选型,增 强、扩展开源服务网格。 异构应用统一治理 多框架、多协议、多语言服务的统一治 理,避免技术栈重复建设。 异构集成 支持异构协议转换为 HTTP 协议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 产品能力 云原生微服务统一管理平台,助力企业分布式技术架构演进。 经营决策分析 经营管理驾驶舱 数据安全 数据治理中心 数据地图 数据质量 数据资产 数仓设计 数据服务中心 可视化建模 交互式建模 EasyAIOS 服务创建 服务测试 服务发布 免编码拖拽 建模 模型/数据市场 数据源管理 专家开发环境 Jupyter交互式 建模 Jupyter模型 市场 训练服务 训练可视化 作业管理 自定义算子 服务管理 SOLUTIONS 客户收益: 最大程度地打通获客渠道 支撑极致的客户体验 提高用户的重复转化率 满足现有技术需求和长期发展需要 快速响应风控、营销、运营等场景需求 集团算法模型资产统一管理、自主可控 客户需求: 避免严重资源浪费 降低高成本维护 提高交付效率 解决方案: 建设分布式体系基础中间件支撑平台 提供全行统一的基础中间件交付 端到端覆盖基本管理和高级运维场景 客户收益: 基础技术能力服务化 大幅提升应用交付效率0 码力 | 43 页 | 884.64 KB | 1 年前3
2020 中国开源年度报告
活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区⾄关重要。⽽对于更 倾向于线上还是线下的会议,结果竟惊⼈地持平; 在 2020 年 COVID-19 这个⼤背景下,各⾏各业都不可避免受到了冲击和影响;82% 的 ⼈认为疫情对于参加开源社区的活动产⽣了影响,但也具有推动作⽤,11% 的⼈认为毫 ⽆影响,7% 的⼈认为疫情的负⾯影响⼤于正⾯影响; 在在线⽂档协作⼯具的使⽤ ⽬治理等⽅⾯的基础设施; 提供⽤于捐赠的法律实体:建⽴⼀个独⽴的法⼈实体,公司和个⼈可以向其捐赠资源,并 确保这些资源将⽤于公共利益; 提供法律保护框架:为个⼈志愿者提供法律保护框架,避免针对基⾦会项⽬的法律诉讼; 提供 Apache 商标保护:保护其软件产品的“ Apache”商标,防⽌被其他组织滥⽤。 Apache 软件基⾦会的使命是为公共利益⽽提供软件。基⾦会帮助独⽴个体和组织去理解开源 布图。在此,我们选择三个⼯作时间分布有明显特征的项⽬进⾏简单分析。 apache/carbondata,Apache CarbonData 是⼀种新的融合存储解决⽅案,利⽤先进 的列式存储、索引、压缩和编码技术提⾼计算效率,从⽽加快查询速度,其查询速度⽐ PetaBytes 数据快⼀个数量级。 apache/incubator-teaclave,⼀个开源的通⽤安全计算平台,使对隐私敏感的数0 码力 | 46 页 | 4.09 MB | 1 年前3
中国开源软件产业研究报告软件成熟度 作为终端用户,需要考虑 开源技术是否符合自身应 用场景需要;作为软件厂 商,需要考虑开源技术能 否满足客户需求 需求满足度 考虑软件的商业化能力, 需要关注开源软件所选用 的许可证协议,避免出现 如GPL系列许可证带来的 开源传染性问题 开源许可证 软件是否具备完整的开源 方案日志、服务商能否为 客户提供技术支持,能否 及时响应客户需求,是否 提供权益保障服务…… 运维能力 开源软件所使用的技术是 多样性 公开 合规 可交付 安全 社区治理 成员管理 文档管理 组织架构 组织架构 社区运营 会议活动 外部合作 开发者生态 社区活跃度监测 用户生态 社区开发 依赖管理 编码规范 构建管理 分支管理 漏洞管理 需求管理 基础设施 测试平台 构建平台 安全漏洞扫描 发布平台 许可证扫描 CLA签署工具 网站 代码仓库 触发期 协作期 流行期 发展期0 码力 | 68 页 | 3.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)攻击者所利用。该修复措施与许多优先级较高 的Windows修复措施存在显著差异,新补丁不 会默认启用,它涉及到对Windows启动管理器 进行永久性的更改,最终将导致现有的Win- dows启动媒介无法启动。 为避免突然导致用户系统无法启动,补丁将会 分三个阶段推出更新。直到2024年第一季度将 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven 本案的意义在于:确立开源软件使用规则,维护开源社区秩序,是对“十四五”规划关于建设有 国际影响力的开源社区的响应。本案对软件企业的开源合规管理提出了很高的要求,在充分了解 开源协议的基础上,一方面,要合规使用开源软件,避免不合规导致自身权利无法得到保护,另 一方面,如果不想将自己开发的源代码贡献给社区,则要做好技术隔离措施,根据开源协议的要 求,从技术上将自己开发的代码与开源软件隔离开来。 商标裸许可(naked0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 开源企业洞察(1/2) 避免聚焦ROI的短视思维,树立长期战略意识,持续加码开源项目运营 基础软件的开源发起者一般为企业级开发者,对于他们来讲,开源项目从设立、运营到最终成熟是一个长期的过程。不同于传统项 目具有明确、可量化0 码力 | 43 页 | 4.69 MB | 1 年前3
共 10 条
- 1













