2021 中国开源开发者报告0 码力 | 35 页 | 36.74 MB | 1 年前3
2023 中国开源开发者报告1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 十、 镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更 多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编 李泽辰,Gitee 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111 开发者是社区的力量源泉0 码力 | 111 页 | 11.44 MB | 8 月前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值 将实现功能的代码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, www.iresearch.com.cn 软件开源规范 不同许可证对软件再发行是否需要开源有不同要求,企业需根据自身商业 需求谨慎选择开源代码使用 来源:参考可信开源合规计划,根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 使用开源许可证需注意的风险点 审判机关 开发者 开源许可证 “两者的契约” 开源者 将许可证视为“合同”,基于《著作权法》、0 码力 | 43 页 | 4.69 MB | 1 年前3
中国开源软件产业研究报告企业、高校、协会之间的交流与合作有望加深,成立更多的本土开源基金会。 开源概念铺陈:软件的“源”即其源代码,“开源”的核心概念是软件的编写者将源代码免 费提供给使用者,同时要求使用者遵循一定的开源规范。开源的发起者可以是个人、企业等 各种主体,聚焦企业开源领域,企业开源与商业化并不矛盾,开源软件的“引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 好的软件作品,往往源自于开发者的个人需要——按说这是显而易见的(正如 老话说“需要是发明之母”),但太多的软件开发人员并不需要也不热爱他们 正在开发的软件,他们把编程当差事,为的只是拿薪酬。Linux世界里可不是 这样——也许这可以解释为什么Linux社区里原创软件的平均质量是如此之高。 开放源代码为基本内涵,还需符合修改、传播等方面的规范 软件的“源”即其源代码,“开源”的核心概念是软件的编写者将源代码(通常)免费提供给使用者。然而,软件行业内 所谓的“开源”概念还包含其他诸多基本要求和限制,需要作者和使用者共同遵循一些规范。OSI(Open Source Initiative)组织是全球范围内开源软件标准的权威发布机构,在该机构的界定中,规范的开源项目和软件除了在开放源代 码这一基本要求之外,其开源许可(open0 码力 | 68 页 | 3.63 MB | 1 年前3
国家人工智能产业综合标准化体系建设指南(2024版)产模式和经济发展形态,将对加快建设制造强国、网络强国 和数字中国发挥重要的支撑作用。人工智能产业链包括基础 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 要包括算力、算法和数据,框架层主要是指用于模型开发的 深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 工智能的基础性、框架性、总体性标准。基础支撑标准主要 规范数据、算力、算法等技术要求,为人工智能产业发展夯 实技术底座。关键技术标准主要规范人工智能文本、语音、 图像,以及人机混合增强智能、智能体、跨媒体智能、具身 智能等的技术要求,推动人工智能技术创新和应用。智能产 品与服务标准主要规范由人工智能技术形成的智能产品和 服务模式。赋能新型工业化标准主要规范人工智能技术赋能 制造业全流程智能化以及重点行业智能升级的技术要求。行 制造业全流程智能化以及重点行业智能升级的技术要求。行 业应用标准主要规范人工智能赋能各行业的技术要求,为人 工智能赋能行业应用,推动产业智能化发展提供技术保障。 安全/治理标准主要规范人工智能安全、治理等要求,为人 4 工智能产业发展提供安全保障。 图 1 人工智能标准体系结构图 (二)人工智能标准体系框架 人工智能标准体系框架主要由基础共性、基础支撑、关 键技术、智能产品与服务、赋能新型工业化、行业应用、安0 码力 | 13 页 | 701.84 KB | 1 年前3
人工智能安全治理框架 1.0………………………… 7 4.2 针对人工智能应用安全风险 ………………………… 9 5. 综合治理措施 ……………………………………………… 10 6. 人工智能安全开发应用指引 ……………………………… 12 6.1 模型算法研发者安全开发指引 ……………………… 12 6.2 人工智能服务提供者安全指引 ……………………… 13 6.3 重点领域使用者安全应用指引 ……………………… 14 6 点 和落脚点,构建各方共同参与、技管结合、分工协作的治理机制,压实相关主 体安全责任,打造全过程全要素治理链条,培育安全、可靠、公平、透明的人 工智能技术研发和应用生态,推动人工智能健康发展和规范应用,切实维护国 家主权、安全和发展利益,保障公民、法人和其他组织的合法权益,确保人工 智能技术造福于人类。 1.1 包容审慎、确保安全。鼓励发展创新,对人工智能研发及应用采取 包容态度。严 应用场景,提出通过安全软件开发、数据质量提升、安全建设运维、测评监测 加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性- 3 - 人工智能安全治理框架 的措施。 2.3 综合治理措施方面。明确技术研发机构、服务提供者、用户、政府 部门、行业协会、社会组织等各方发现、防范、应对人工智能安全风险的措施 手段,推动各方协同共治。 2.4 安全开发应用指引方面。明确模型算法研发者、服务提供者、重点0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单本内容,测试模型对中、长文本处理效果 2、整理集成可视化的数据表格 3、按照日期规范排序 任务 Open AI o3mini 一般文本(7000token): 能够高效提取文本中的数据, 并整理成可视化数据表格, 格式工整、简洁,数据准确 但数据维度有所缺失。 长文本(15000token): 反应迅速,高效提取文本中 数据,输出格式规范的数据 表格,但集成数据维度仍然 不够全面。 DeepSeek 末尾缺失,需要重复尝试生成。 长文本(15000token):暂时 无法给出答复。 【所需阅读文本】请根据以上文本完成以下三个任务:1、阅读 文本内容;2、整理集成可视化的数据表格;3、按照日期规范排 序(直接分析并输出结果,不使用python) 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 文本数据集成 析法律文本,提取关键信息,自动生成合同草 案、法律意见书等,提高律师工作效率。 • 智能医疗数据分析与诊断:构建智能医疗 平台,分析病历、检查报告和基因数据,帮助 医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理:开发金融风险分析 工具,收集并分析市场数据,预测风险并为金 融机构提供管理建议。 • 智能文学创作辅助:为作家提供创作灵感 和文本构思,生成符合中文文学传统的故事情 节和诗句,助力突破创作瓶颈。 •0 码力 | 85 页 | 8.31 MB | 8 月前3
Pro Git 中文版 第2版 2.1.66共享标签 删除标签 检出标签 Git 别名 总结 Git 分支 分支简介 分支创建 分支切换 分支的新建与合并 新建分支 分支的合并 遇到冲突时的分支合并 分支管理 分支开发工作流 长期分支 主题分支 远程分支 推送 跟踪分支 拉取 删除远程分支 变基 变基的基本操作 更有趣的变基例子 变基的风险 用变基解决变基 变基 vs. 合并 总结 服务器上的 一个自定义的导入器 总结 Git 内部原理 底层命令与上层命令 Git 对象 树对象 提交对象 对象存储 Git 引用 HEAD 引用 标签引用 远程引用 包文件 引用规范 引用规范推送 删除引用 传输协议 哑协议 智能协议 协议总结 维护与数据恢复 维护 数据恢复 移除对象 环境变量 全局行为 版本库位置 路径规则 提交 网络 比较和合并 大概在五年前吧,我坐下来写这 本书时(写完第一个版本花了我不少时间),我开始在一个知名度极小的开发 Git 托管网站的公司工作,这家公司就是 GitHub。 本书出版时大概有几千人 在使用 GitHub 网站,而为其工作的只有我们四个人。 在我写这篇介绍时, GitHub 宣布我们托管了 1000 万个项目、拥有大概 500 万注册开发者账户与 大概 230 名员工。 爱它也好,恨它也罢,当我坐下来写第一版时,GitHub0 码力 | 670 页 | 13.59 MB | 1 年前3
Pro Git 中文版 第2版 2.1.66. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 分支开发工作流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 引用规范 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 大概在五年前吧,我坐下来写这本书时(写完第一个版本花了我不 少时间),我开始在一个知名度极小的开发 Git 托管网站的公司工作,这家公司就是 GitHub。 本书出版时大概 有几千人在使用 GitHub 网站,而为其工作的只有我们四个人。 在我写这篇介绍时,GitHub 宣布我们托管了 1000 万个项目、拥有大概 500 万注册开发者账户与大概 230 名员工。 爱它也好,恨它也罢,当我坐下来写第一 版时,GitHub0 码力 | 501 页 | 19.30 MB | 1 年前3
共 179 条
- 1
- 2
- 3
- 4
- 5
- 6
- 18













