开源中国 2023 大模型(LLM)技术报告LLM 技术报告 大语言模型(LLM) 技术作为人工智能领域的一项重要创 新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM 理领域,GPT 系列模型在文本生成、问答系统和对话生成 等任务中展现出色的性能。在知识图谱构建、智能助手开发 等方面,LLM 技术也发挥了关键作用。此外,它还在代码 生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech Map 向量数据库 数据库向量支持 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 方法为语言任务提供0 码力 | 32 页 | 13.09 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021领先的数字化转型技术与服务提供商 网易数帆是网易集团旗下 TO B 企业服务品牌,定位于领先的数字化转型 技术与服务提供商,为客户提供创新、可靠的国产软件基础平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、性能优越性、产品成熟度及安全可靠性等方面得到了 各行业客户的验证。目前已服务各领域头部客户百余家,包括工商银行、 浙商银行、银监会、人保金服、深圳证券交易所、华泰证券、名创优品、 古茗、百胜集团、温氏集团、万向集团、大华股份、宁波钢铁、一汽解放、 以“开放、开源、跨云”为技术理念,网易数帆大力推动技术研究,先后取 得“工信部云计算服务能力标准首批试点单位”、“国家企业技术中心”、“信 通院云计算标准和开源推进委员会成员”、“信通院大数据技术标准推进委 员会成员”、“信创工委会成员”等机构资质。同时,网易数帆积极推动跨厂 商的数字化技术融合发展,与AWS、阿里云、百度云、华为鲲鹏云计算、 浪潮、新华三等多家企业完成技术兼容性认证。 数帆使命:帮助所有客户成功实现数字化转型0 码力 | 43 页 | 884.64 KB | 1 年前3
人工智能安全治理框架 1.0全国网络安全标准化技术委员会 2024年9月 人工智能 安全治理框架1. 人工智能安全治理原则 …………………………………… 1 2. 人工智能安全治理框架构成 ……………………………… 2 3. 人工智能安全风险分类 …………………………………… 3 3.1 人工智能内生安全风险 ……………………………… 3 3.2 人工智能应用安全风险 ……………………………… 5 4. 技术应对措施 ……………………………………………… 和落脚点,构建各方共同参与、技管结合、分工协作的治理机制,压实相关主 体安全责任,打造全过程全要素治理链条,培育安全、可靠、公平、透明的人 工智能技术研发和应用生态,推动人工智能健康发展和规范应用,切实维护国 家主权、安全和发展利益,保障公民、法人和其他组织的合法权益,确保人工 智能技术造福于人类。 1.1 包容审慎、确保安全。鼓励发展创新,对人工智能研发及应用采取 包容态度。严守安全底线,对危害国家安全、社会公共利益、公众合法权益的 1.2 风险导向、敏捷治理。密切跟踪人工智能研发及应用趋势,从人工 智能技术自身、人工智能应用两方面分析梳理安全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发0 码力 | 20 页 | 3.79 MB | 1 月前3
JumpServer ⼴受欢迎的开源堡垒机(《信息安全技术-信息系统安 全等级保护定级指南》GB/T22240、 《信息安全技术-信息系统安全等级保 护基本要求》GB/T22239-2008)相关 标准发布实施。 《中华⼈⺠共和国⽹络安全法》发 布,这是⽹络安全的“基本法”,具有 强制性规范作⽤。 《信息安全技术⽹络安全等级保护 2.0 标准》正式实施,等级保护正式 进⼊ 2.0 时代。 堡垒机助⼒企业满⾜等保三级技术要求 安全物理环境 资产的统⼀运维安全审计。 政府及国有企业 政府机构及国有企业拥有⼤量机密信息,运维的安全等级要求很⾼,堡垒机是提⾼其安全合规⽔平的必备选择。 服务业 传统服务⾏业,以及包括了物流交通⾏业在内的、依托于信息技术发展演进的现代服务业,普遍具有分布式基础设施的安全 管控需求,同时需要兼顾海量资产的纳管和⾼可⽤,堡垒机是其必备的 IT 安全组件。 互联⽹ 互联⽹⾏业拥有⼤量的异构云资产,并持续追求 IT 系统 ⼀体机及信创⽅案 3 5 ⽬ 录 JumpServer 堡垒机是谁? 项⽬创⽴并成为中国明星开源项⽬; 正式加⼊ FIT2CLOUD ⻜致云; OSCAR 尖峰开源技术创新奖; IT 产品信息安全认证证书(⽹络安全审查技术与认证中⼼颁发); 计算机信息系统安全专⽤产品销售许可证(公安部颁发); 项⽬创始⼈⼴宏伟获评中国开源先锋 33 ⼈; ⽹络安全专⽤产品安全检测证书(公安部颁发)。0 码力 | 40 页 | 6.66 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书码按照一定的开源规范 开放,任何人可以查看、使用、贡献,同时,使用者也要遵循一定的开源规范。 基础软件开源范畴界定 国内基础软件开源界定 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, ,由艾瑞咨询研究院自主研 究及绘制。 中外软件开源对比(2) 国内九成以上开发者使用开源软件,其中近半数人员参与开源,新增贡 献者占比世界靠前 中国开源产业起步晚,发展尚不成熟的现象可以从信息技术发展环境、权威性组织的建立这两个角度看出。权威性组织的建立方面, 全球开源软件标准的权威发布机构OSI于1998年成立,但国内第一个权威性开源软件推进联盟成立于2004年;再如阿帕奇软件基金 会于1 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开发者选择要参与的开源项目;4)开源产业联盟往往会对行业贡献 技术指标、开源规范等,引导行业专业化发展。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 开源产业链 运营: 发起者为运营者 开源技术论坛\开源社区评估机构\开源产业联盟0 码力 | 43 页 | 4.69 MB | 1 年前3
2024 中国开源开发者报告40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 量达到了40万个,越来越多的开 发者选择凝聚在一起,共同拥抱 开放透明的组织协同。 7 / 111 本年度最受开发者关注的开源组织 2024 年,技术大厂及其大型项 目依然备受关注,它们推动着技 术的快速发展和广泛应用。 同时,「民间」开源组织虽然在 关注度上不及大厂主导的项目, 但它们在某些技术细分领域中却 拥有非常强的影响力和活跃的开 发者社区。 两者的不同发展模式相互补充, 共同推动了国内开源生态的繁荣 与多样化。 Star 数方面,更加注重创 新和技术探索「民间」开源组织 更加「接地气」,受到了更多开 发者的喜爱。 虽然面临资源的挑战,但它们的 灵活性和社区驱动力使得它们获 得了更多开发者的支持。 9 / 111 本年度最活跃的开源组织 不同开源组织在 Issue 解决 和 PR 处理数量上的差异,反映了它 们在开发活跃度、社区参与度和 技术成熟度上的不同战略。 技术大厂主导的项目往往具有较 高的资源投入和社区管理效率,0 码力 | 111 页 | 11.44 MB | 8 月前3
2021 中国开源年度报告COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经 非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 对抗的背景,很多人开始从国际政治、国家实力、国家安全的角度, 来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也 许还会继续持续下去。 生态责任 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是 自由的。但是,在软件吞噬世界、开源吞噬软件的今天,开源技术, 2021 中国开源年度报告 3 已经成为整个世界的基础设施之一。能力越大,责任越大。应用越广, 受访者所在的企业类型 …………………………………………………………………………… 17 3.5 公司购买开源产品的决策 ………………………………………………………………………… 18 3.6 受访者所从事的技术方向 ………………………………………………………………………… 19 3.7 开发语言 …………………………………………………………………………………………… 20 3.8 Java 开发框架0 码力 | 132 页 | 14.24 MB | 1 年前3
Gitea v1.21.1 中文文档github.com/mattn/go-sqlite3 github.com/denisenkom/go-mssqldb 请访问 Awesome Gitea 获得更多的第三方集成支持 浏览器支持 技术栈 集成支持 Gitea是什么? - 7 - 本文档使用 书栈网 · BookStack.CN 构建 对比 Gitea 与其它 Git 托管工具 数据库准备 使用二进制文件安装 使用包管理器安装 PostgreSQL 配置为监听您的 IP 地址: 1. listen_addresses = 'localhost, 203.0.113.3' 2. PostgreSQL 默认使用 md5 质询-响应加密方案进行密码身份验证。现在这个方案不再被认为是安全的。 改用 SCRAM-SHA-256 方案,通过编辑数据库服务器上的 postgresql.conf 配置文件: 1. password_encryption Gitea 和数据库运行在同一台服务器 上,那么可以省略本节,因为 Gitea 和数据库实例之间的安全性不会受到严重威胁。但是,如果数据库实例位于公 共网络上,请使用 TLS 对数据库连接进行加密,以防止第三方拦截流量数据。 您需要两个有效的 TLS 证书,一个用于数据库实例(数据库服务器),一个用于 Gitea 实例(数据库客户 端)。两个证书都必须由受信任的 CA 签名。 数据库证书必须在0 码力 | 303 页 | 3.88 MB | 1 年前3
亿图脑图 MindMaster 用户手册 V10.0---------------- 109 撤消和重做 ----------------------------------------------------------------- 110 文件加密 ------------------------------------------------------------------- 111 文件恢复 --------------------- 7.手绘风格 亿图脑图 MindMaster 让用户将导图由常规风格一键切换至手绘风格。 8.大纲模式 大纲模式使用户在文字大纲格式下对导图内容一目了然。 9.文件加密 亿图脑图 MindMaster 文件加密可以保护文件不被侵权和随意查看。 10.上钻/下钻 通过下钻功能来折叠或展开主题,有助于制图者集中注意力于特定主题,避免了其他主题 对思维的干扰。 11.文件恢复 如果软件意外关闭导致未及时保存,亿图脑图 可以将幻灯片导出为 PPT 或打印出 来。 4. 高级菜单 在高级菜单,您可以创建、编辑和导出甘特图;也可以对主题的边距和宽度进行设置。同 时,高级菜单里面也支持对文件的历史版本、恢复情况、加密情况等进行设置操作。最后, 还能对文档进行拼写检查。 5. 视图菜单 在视图菜单,您可以选择在不同视图下展示思维导图, 单独显示某一个主题或分支。您可 以放大或缩小导图,还可以一键单击使导图适应操作界面大小。0 码力 | 149 页 | 7.39 MB | 1 年前3
亿图脑图 MindMaster 用户手册 V10.0---------------- 109 撤消和重做 ----------------------------------------------------------------- 110 文件加密 ------------------------------------------------------------------- 111 文件恢复 --------------------- 7.手绘风格 亿图脑图 MindMaster 让用户将导图由常规风格一键切换至手绘风格。 8.大纲模式 大纲模式使用户在文字大纲格式下对导图内容一目了然。 9.文件加密 亿图脑图 MindMaster 文件加密可以保护文件不被侵权和随意查看。 10.上钻/下钻 通过下钻功能来折叠或展开主题,有助于制图者集中注意力于特定主题,避免了其他主题 对思维的干扰。 11.文件恢复 如果软件意外关闭导致未及时保存,亿图脑图 可以将幻灯片导出为 PPT 或打印出 来。 4. 高级菜单 在高级菜单,您可以创建、编辑和导出甘特图;也可以对主题的边距和宽度进行设置。同 时,高级菜单里面也支持对文件的历史版本、恢复情况、加密情况等进行设置操作。最后, 还能对文档进行拼写检查。 5. 视图菜单 在视图菜单,您可以选择在不同视图下展示思维导图, 单独显示某一个主题或分支。您可 以放大或缩小导图,还可以一键单击使导图适应操作界面大小。0 码力 | 149 页 | 8.67 MB | 1 年前3
共 174 条
- 1
- 2
- 3
- 4
- 5
- 6
- 18













