2023 中国开源开发者报告2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个 经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720 亿个阿拉伯语词块和 2790 亿个英语 / 代码词块的数据集上进行训练。 谷歌发布 AI 代码编辑器:Project IDX 2023 年 8 月,Meta 开源了号称是编程领域 “最先进的大语言模型”——Code Llama,完全免费且可用于研究和商业用途。 Apache 2.0 许可下 发布。 Dragonfly 1.0 完全支持 Redis 最常见的数 据类型和命令,以及快照、主从复制和高可用 等特性。 DragonflyDB 是一个现代化的开源内存数据 库,兼容 Redis 和 Memcached API,迁移时 无需修改任何代码,可作为两者的替代方案。 Slint 1.0 于 2023 年 4 月发布,标志着项目已顺利从开发阶段 “毕业”, Doris 2.0.0 版本正式发布 sudo-rs 是互联网安全研究小组 (ISRG) 发起的 Prossimo 项目——用 Rust 重写 sudo 和 su,目标是提升它们在内存方面的安全性,确保它们不再遭 受内存安全漏洞的困扰,并进一步增强 Linux 和开源生态系统的安全性。 Bun 发布 1.0 正式版本 2023 年 9 月 8 日,JavaScript 运行时 Bun 正式发布0 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍单点问题。⼤模型时代,实现个性化的⼀种⽅式是微调,但我认为微调可能不是本质的⽅法,⻓期来 看可能不会存在模型的微调。为什么?当你的模型指令跟随能⼒、推理能⼒、上下⽂⼀致性能⼒越来 越强时,所有东西只需要放在内存⾥就可以。⽐如你的⼤模型内存有⼀堆prefix这样的东西⽤来 follow,成本可以降到⾮常低。最终,你对模型个性化的过程实际上就是你所有的交互历史,也是⼀ 个包含了你的偏好和反馈的集合,这些反馈会⽐上 ntext这个决策是怎么做出来的? 杨植麟:我觉得最重要的还是以终为始地思考这个事。⼤模型作为新的计算机肯定也需要很⼤的内 存,因为旧的计算机的内存在过去⼏⼗年的时间⾥⾯⾄少增⻓了⼏个数量级,⽽且旧的计算机也是⼀ 开始的时候只有很少的内存。第⼆点就在于AI的终极价值是个性化。 海外独⻆兽:OpenAI其实也有⼀定的long-context了。 杨植麟:它还没有把⽤⼾的 ⽂本处理能⼒,该 产品⽀持约20万字中⽂的上下⽂⻓度,使得整体表现⾮常惊艳。杨植麟认为,如今基于Transformer架 构的⼤模型,是“新时代的计算机”,参数数量决定计算复杂度,上下⽂⻓度决定内存⼤⼩⸺因此, 上下⽂⻓度是毫⽆疑问的关键所在。 上下⽂⻓度也正是近期AI圈中的⽐拼热点,各家都在这⼀指标上你追我赶。但这背后的核⼼问题在 于:什么才是真正有效的规模化? 在演讲中,杨植麟表⽰0 码力 | 74 页 | 1.64 MB | 1 年前3
2024 中国开源开发者报告Edge 1.5B 模型通过与 高通 GenAI 扩展的联合优化,在搭载骁龙 8 Gen 4 处理器的手机上实现了每秒 65 个 tokens 的推理速度,接近人类语音的平均输出速率。尽管存在电池续航和内存占用过大等挑战, 端上模型代表了 AI 技术隐私保护和成本优化的未来方向。中国在这一领域的探索,为行业提供 了宝贵经验。 推理扩展法则的潜力释放 通过推理扩展法则,模型性能可通过延长“思考时间”而进一步优化。这一技术模拟了人类 赖关系等数据,新的代码生成模型则具有更强的上下文感知能力。 41 / 111 在此基础上,基于 AI 的编程工具能够根据给定的上下文(如函数名、注释、部分代码等) 检索出最相关的代码片段和文档,能够提供完整的函数或代码块建议。这也使得 LLM 能够参考 海量的代码库和技术文档,这不仅能缓解大模型的幻觉问题,显著提升代码生成与理解的准确性, 而且能符合上下文的代码,更能满足开发的业务需求。 未来,研发人员和多个智 者进一步细分为事件记忆、语义记忆和程序记忆,并基于此抽象出一套记忆管理 SDK。Zep 通 过时态知识图谱管理和更新用户信息,跟踪事实变化并提供最新数据线索。MemGPT 借鉴了计 64 / 111 算机操作系统内存管理机制,模拟虚拟内存工作原理,构建了一套记忆管理系统。这些项目使 AI 应用能够记住对话历史,提供更个性化、上下文感知的交互体验,极大地增强了用户的满意 度。 此外,代理应用的另一个探索方向是多个代理之间的协同工作。开源社区中出现了许多解决0 码力 | 111 页 | 11.44 MB | 8 月前3
2023年中国基础软件开源产业研究白皮书测试 行业解决方案 治理类 职能组织 社区基础设施 版本发行 社区生态管理 服务器 云计算 边缘计算 智能终端 桌面 … 操作系统应用场景 处理器 … 服务器 端设备 内存 系统软件 … 数据库管 理软件… 应用软件 编译软件 开源促进“更好的”操作系统被“更好地”使用 硬件适配 软件适配 19 ©2023.11 iResearch Inc. 对数据库外层能力的优化给 予贡献。同时,由于国内数 据库大多基于国外数据库内 核,开发者生态随开源项目 分布较为分散 开发者生态分散 项目1 生态1 项目2 生态2 … … SQL 引擎 内存 引擎 26 ©2023.11 iResearch Inc. 分布式解决方案 2022.09 Preview 3.1 资源池化 数据安全生命周期自动化管理 2023.09 Release 5.1 可插拔数据库引擎PDE 多样性算力 内存池化服务DMS 内存互联 储存池化服务DSS 多样性存储 智能运维 资源管理 安装部署 数据迁移 数据建模 数据开发 openGauss DataPod 资源池化架构 全站可观测、可追踪、全加密0 码力 | 43 页 | 4.69 MB | 1 年前3
2021 中国开源年度报告incentives for open source and creating a virtuous circle. 开源 3.0 时代下的技术创新与商业创新正在齐头并进。技术层面上,人工智能、开源数据和区 块链是新兴创新的一些例子。而得益于时刻保持创新的开发者社区,开源已成为云计算,SaaS 服务,下一代数据库,移动设备,互联网甚至区块链的基础。下一代商业模式可能包括广告支 持的 OSS,类似于大型 Ventures,云启资本 Source: Battery Ventures, Yunqi Partners 开源软件企业着重加强云战略布局,以加速和推动持续性增长。开源软件企业的 SaaS 服务模 块的营收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的 全托管云产品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS 和移动数据库及同步平台 MongoDB Realm。公司对于不同产品采用不 同的定价方式,企业版按服务器节点订阅,云产品按需付费。以云数据库产品 MongoDB Atlas 为例,公司面向小型团队提供共享集群,共享内存和算力,并根据不同的存储空间按使用时长 计费;面向专业开发团队提供专属集群,根据不同的 RAM、算力和存储空间按使用时长计费。 MongoDB is the world's leading NoSQL0 码力 | 199 页 | 9.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)RBAC过滤器的功能,以根据IP地址允许或 拒绝请求; • 支持将追踪数据导出到OpenTelemetry, 以便进行更全面的分析和监控; • 支持对所有主机进行外部授权; • HttpProxy的条件块还增加了对精确路径匹 配条件的支持; • 支持内部重定向; • 对基于HTTPProxy资源的路由实现了HTTP 查询参数匹配功能。 Flagger v1.31.0发布 Flagger是基于Kubernetes的开源工具,用 Exchange(VEX)对检测到的漏洞进行 过滤; • 支持为虚拟机镜像生成CycloneDX和SPDX 等格式的SBOM(软件物料清单); • 支持嵌套JAR路径; • 支持通过分析文件内容来识别dpkg和Go模 块的许可证类型; • 支持使用自定义的Docker socket。 全球开源态势洞察|第十期 06 03 开源安全 DEF CON将举办全球最大规模 AI黑客大赛 微软将用近一年时间完成对0-day0 码力 | 22 页 | 1.99 MB | 1 年前3
2020 中国开源年度报告
在按照⾃⼰的节奏,和国内外的商业化⼚商、个⼈开发者、公司⼆ 次开发团队⼀起,迅速地成熟和壮⼤。 ⻩东旭(PingCAP CTO,pingcap/tidb,tikv/tikv) TiDB 今年社区运营的重点可以分为:⽤户、开发者两块。从业务⻆度来看,可以分为项⽬打 磨和完善,⼈才的培养和⽣态建设,⽤户场景的挖掘和业务成功推进。所以,运营⼀个好的开 源社区,最重要的是以⼈为中⼼,与他们共同成⻓。 对于 TiDB 社区来说,过去的⼀年发展还算迅速,去年 ⼀个系统⼯程,离不开所有贡献者们的密切协作,再次向⼤家表示感谢。 2020 中国开源年度报告最⼤的创新莫过于在往年问卷调查的基础上,增加了 GitHub 和 Gitee 两⼤开源平台的数据分析篇,关于这两块的内容,敬请关注完整的报告: 《GitHub 2020 数字年报》,X-lab 开放式实验室,预计 2 ⽉中旬式发布 《2020 Gitee 开源报告》,Gitee,已正式发布 开源软件0 码力 | 46 页 | 4.09 MB | 1 年前3
2021 中国开源年度报告动数据库及同步平台 MongoDB Realm。公司对于不同产品采用不同的定价方式,企业版按服务器节点 订阅,云产品按需付费。以云数据库产品 MongoDB Atlas 为例,公司面向小型团队提供共享集群,共 享内存和算力,并根据不同的存储空间按使用时长计费 ; 面向专业开发团队提供专属集群,根据不同的 RAM、算力和存储空间按使用时长计费。 2021 中国开源年度报告 109 图表 53 :Atlas r 共 128 发布了四个版本,分别是 20.03 LTS 版本、20.09 创新版本、21.03 创新版本和 21.09 创新版本。 2021 年 3 月,openEuler 在内核热升级和内存分级管理上做了创新,21.03 创新版本推出 ;9 月, 21.09 创新版本发布,该版本不仅增强了服务器和云计算场景能力,还实现了对于边缘计算和嵌入式 场景的支持。 2021 年 11 月,华为 的 Hacker News 头条,是 2021 年上半年全球开源社区关注 度最高的移动 Linux 操作系统。 八、Rust 迈上新征程 作为一门开源的通用系统级编程语言,Rust 由于其出色的内存安全机制、不亚于 C 语言的性能优势等 特点,吸引了大量开发人员关注。2021 年,Rust 告别“动荡”,在多个维度上都迈出了一大步。 专家点评 段夕华:在基础软件及隐私计算领域领域,Rust0 码力 | 132 页 | 14.24 MB | 1 年前3
Gitea,新一代的代码托管平台多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 简单易用 采用 Go 编写,资源占用为 GitLab的 1/4,运行速度为 GitLab 的 3 倍 相同机器配置:2C4G • 无负载时内存占用:GitLab 约 3GB,Gitea 约 200MB; • 启动时间(从启动到可以接收请求):GitLab 约 2 分 钟,Gitea 约 5 秒; • 平均页面打开时间:GitLab 约0 码力 | 30 页 | 14.34 MB | 1 年前3
中国开源软件产业研究报告兆芯 华三 华为 紫光恒越 交换机 第三方云与虚拟化环境 ZStack Mini 边缘计算一体机 ZStack Ceph企业版 ZStack 云平台 ZStack CMP 多云管理平台 块储存 文件储存 对象储存 软硬件一体 开箱即用 双节点冗余 容错高可靠 管理运维层(多租户、多区域、计量计费、监控运维) 资源调度层(高可用、热迁移、快照、克隆、弹性伸缩) 计算资源 网络资源0 码力 | 68 页 | 3.63 MB | 1 年前3
共 10 条
- 1













