2021 中国开源年度报告男,441,82% 女 ,96,18% 14 注:问卷篇中饼图的数据标签,例如“硕士 ,107,20%”,其中硕士表 示选项,107 是选择该选项的人数,20% 是选择该选项人数所占的比例。 专家点评 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 IT 行业整体参与者性别比 例失调的趋势是一致的。尽管越来越多的开源项目都在争取吸引更多的女性开发者大力来参与开源,但整体 受访者从业时间 受访者中还未参加工作的人数最多,占比约 43%,其次则是从业时 间为 3-5 年、10-15 年的参与者占比分别为 13%、12%,从业时 间在 10 年以上的约 3 成。 专家点评 郭悦:开源参与中 43% 还未参与工作的学生群体占比最大,这证实了近两年我国开源文化推广成果,能反 映出开源项目的推广已下沉影响到学生群体。不论是 gitee 开源暑期活动、中科院开源软件点亮计划以及 受访者职位分布 受访者中学生和开发者占绝大多数,学生占比约 47%,开发者占比 约 29%。 专家点评 堵俊平:参加开源项目的开发者有超过四成是学生。这一方面说明高校学生参与开源的热情高涨,学校里老师 们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源领域投入的比例偏小。开源领域资深专家 的比例偏低,技术人员梯度不够合理,也是国内各大开源社区在吸引贡献者方面,可以优化的地方。0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告number of people who chose that option, and 20% is the proportion of people who chose that option. 【专家点评】/ [Expert Comment] 堵俊平:整体而言,在开源领域,男性在参与人数上仍然占据绝对优势,这一点和 IT 行 业整体参与者性别比例失调的趋势是一致的。尽管越来越多的开源项目都在争取吸引更多 been working for more than ten years. 【专家点评】/ [Expert Comment] 郭悦:开源参与中 43%还未参与工作的学生群体占比最大,这证实了近两年我国开源文化 推广成果,能反映出开源项目的推广已下沉影响到学生群体。不论是 gitee students and 29% developers. 【专家点评】/ [Expert Comment] 堵俊平:参加开源项目的开发者有超过四成是学生。这一方面说明高校学生参与开源的热 情高涨,学校里老师们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源 领域投入的比例偏小。开源领域资深专家的比例偏低,技术人员梯度不够合理,也是国内 各大开源社区在吸引贡献者方面,可以优化的地方。0 码力 | 199 页 | 9.63 MB | 1 年前3
2024 中国开源开发者报告观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 高瞻,Gitee AI 运营 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 1110 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 Google 紧随其后推出 Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 广大的个人用户和创意行业提供了强有力的工具,彻底改变 了数字艺术内容的创作方式。同时,它们也引发了人工智能 在创作领域的伦理和法律讨论。LLM 杀进多媒体领域。往 后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大0 码力 | 87 页 | 31.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021大数据应用最佳实践案例 中国长三角数字经济大会“数字经济优秀案例企业” CTDC 年度优秀微服务创新产品奖 浙江省大数据应用服务创新奖 信通院 OSCAR 尖峰开源用户奖 教育部科技进步一等奖( “海量混合时态数据融合处理关键技术及应用”项目) 全球云计算大会“全球最佳实践奖” 2021 2020 2019 2018 HONOR 数帆荣誉 07 (部分) 北京嗨学网教育科技股份有限公司 持续交付平台 CICD 流水线 容器部署 主机部署 策略部署 开放 治理 监控 事务 管理 DevOps 多云部署 服务治理 能力扩展 中间件高可用 全链路监控 容器平台NCS 轻舟混合云 多云管理 多集群管理 镜像仓库 容器管理 轻舟低代码 应用管理 可视化开发 WebIDE 一键发布 资产中心 轻舟中间件 中间件PaaS RDS MySQL Redis Kafka PRODUCT 基于可视化编程语言 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化0 码力 | 43 页 | 884.64 KB | 1 年前3
中国开源软件产业研究报告重从社区的使用者 和贡献者处得到观点和启发,并用以驱动项目未来的发展。 开源软件主体和产业链关系 源作者 软件作品 企业开源 开源基金会 开 源 社 区 代码托管平台 开源软件论坛 专家指导 产业联盟 法律服务 市场宣传 二次开发者 软件用户 • 开源代码的源作者/最初贡献 者可能是企业、个人、工作 室等主体,没有任何限制 • 源作者开源软件作品的动机, 可能是企业的战略和市场决 源基金会进行直接的 项目运营 • 此处的开源社区指代一个开源项目在运营中所处环境,由不同的开源市 场主体协同构成,以代码托管平台和开源软件论坛为核心(二者可能合 而为一),辅以市场宣传、法律服务、专家指导、产业联盟等机构和服 务能力,协同开展项目的开源运营活动,促进项目发展 • 开源项目的代码在托管平台上开放, 二次开发者和最终用户均可以免费取 得 • 在二次开发和使用过程中,开发者和 用户也会通过开源社区指出项目缺陷, www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 企业的开源商业模型(一) 软件开源为企业带来直接收益、渠道收益、行业生态收益 从商业成功的角度上看,企业发布开源软件能够为自身带来直接商业化收益、渠道收益和市场影响力提升带来的产业协同 收益。其中,直接商业化收益0 码力 | 68 页 | 3.63 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, www.iresearch.com.cn 软件开源规范 不同许可证对软件再发行是否需要开源有不同要求,企业需根据自身商业 需求谨慎选择开源代码使用 来源:参考可信开源合规计划,根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 使用开源许可证需注意的风险点 审判机关 开发者 开源许可证 “两者的契约” 开源者 将许可证视为“合同”,基于《著作权法》、 《专利法》等法律法规对相关纠纷进行判决0 码力 | 43 页 | 4.69 MB | 1 年前3
2020 中国开源年度报告
值得⻓期思考并改进的领域。 作为⼀份⼒图完整、客观、全⾯、丰富的报告,值得探讨的问题当然不⽌上述这些,也欢迎朋 友们阅读下⾯的报告,并随时与我们交流。 庄表伟,开源社理事⻓ 2021 年 1 ⽉ 16 ⽇ 特邀点评专家: 吴晟,Apache 软件基⾦会 Member,Apache Local Community 联合创始⼈ ⻩东旭,PingCAP 联合创始⼈兼 CTO ⻢艳军,百度深度学习技术平台部⾼级总监 3、开发者群体特征 3.1 参与者普遍年轻且学历较⾼,男性占⽐⼋成 参与者的年龄集中在 20-39岁,受教育程度普遍在本科及以上,其中男性占⽐约为 84%,⼥ 性为 16%,与去年持平。 【专家点评】 刘天栋:⼥性参与开源的⽐例这和过去2~3年的调查数据相似,但是和国际平均数据(约 10~12%)相⽐⾼。期盼未来国内能有更多⼥性参与开源,形成⼀道美丽的开源⻛景线。 陈阳:多元化一直是 参与者所从事的技术⽅向以后端开发为主,占⽐约 31%,其次是 Web 前端、AI 以及⼤数据 分析⽅向,占⽐分别为10%、9%、9%,⾮技术⼈员以及其他⾏业的从业者占⽐均为 7%,说 明开源已经越来越受到社会各界的关注。 【专家点评】 陈阳:开源早期的时候, 开源 = Linux。 作为当时开源项⽬的主战场,Linux 操作系统、 桌⾯办公软件(GNOME, OpenOffice)和浏览器(Mozilla)掀起了第⼀波开源的浪0 码力 | 46 页 | 4.09 MB | 1 年前3
Moonshot AI 介绍海外⼈才加⼊: i. ⼤模型⽅⾯。团队成员发明了RoPE相对位置编码,是MetaLLaMa和GooglePALM等⼤多数 主流模型的重要组成部分;发明了groupnormalization,是StableDiffusion等AI模型成功 的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团队聚焦底层技术创新,技术Vision强 a. 引领⼤模型的“⽆损⻓上下⽂”时代。2023年10⽉上旬,在产品Kimi智能助⼿中实现“⽆损 ⻓上下⽂窗⼝(LosslessLongContextWindow)”,⽀持20万汉字输⼊,实现对⻓⽂本的⽆ 和中⽂能⼒上Kimi智能助⼿依然领先。 b. 聚焦底层技术创新,不⾛技术捷径。最早提出“LosslessLongContext可以解决90%以上的 模型定制问题”,坚持对数据的⽆损压缩,实现模型能⼒的提升,不⾛技术捷径(通过滑动窗 ⼝、降采样、⼩模型等技术实现上下⽂窗⼝延⻓,都是“技术捷径”) c. 通过这篇⽂章,您可以了解更多技术⽅⾯信息:专访⽉之暗⾯杨植麟:losslesslongcontextis0 码力 | 74 页 | 1.64 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Face、微软、英伟达与Stability AI等 顶尖人工智能提供商,共同参与对生成式人工 智能系统的公开安全评估。 AI Village组织方将这个合作活动描述为“有史 以来规模最大的人工智能模型红队演习”。将 有数千人参与对公共人工智能模型的评估,期 间使用的评估平台由Scale AI负责开发。 近日,微软发布了一个补丁,用于修复Secure Boot绕过漏洞。在2023年1月份,微软释出补 丁修复了编号为CVE-2022-21894的漏洞,但 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示 词注入”技术。人工智能研究员Simon Willison 详细介绍了提示词注入的危险,这种技术可以令 语言模型偏离正轨,执行创建者想要回避的操 作。在DEF CON大会期间,参与者将通过主办方 提供的笔记本电脑定时访问多个大语言模型。并 将会有一个夺旗式的积分系统,促进测试各种潜 在威胁。积分最高的参与者将获得英伟达高端 GPU作为奖品。AI Village公告中写道,“我们将 公布从此次竞赛中得到的启发,帮助其他想要做 类似尝试的人们。希望越来越多的人能知晓该如 何使用大语言模型,了解这些模型的局限性。” 注释:“红队”测试,是指安全专家尝试在组织系 统中发现漏洞或缺陷,以提高整体安全性和弹性的0 码力 | 22 页 | 1.99 MB | 1 年前3
共 11 条
- 1
- 2













