2023 中国开源开发者报告Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 讯的混元大模型、蚂蚁的百灵大模型等。 另一方面,除了大模型本身,中国在 LLM 相关技术领域也 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 AI 模型,速度相比传统 数值预报提速0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI MindSpore openGauss Ascend dromara anolis OpenCloudOS Stream UBML 解决 Issue 处理 PR 10 / 111 编程语言流行趋势 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 Java JavaScript Python PHP C# 2024年,Gitee上的编 程语言依然由Java、 JavaScript、Python引 领潮流。 与此同时变化也在悄然进 行中:凭借AI开发热潮, C与C++依然在今年焕发 着生命力,流行度已与十 年前不相上下。 TypeScript依然强势增 长,随着越来越多的开发 者从JavaScript转向 TypeScript,其未来的 发展更值得期待。 11 / 111 本年度增长最快编程语言 35.71%0 码力 | 111 页 | 11.44 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告LLM 技术报告 大语言模型(LLM) 技术作为人工智能领域的一项重要创 新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM LLM 在多个领域都取得了令人瞩目的成就。在自然语言处 理领域,GPT 系列模型在文本生成、问答系统和对话生成 等任务中展现出色的性能。在知识图谱构建、智能助手开发 等方面,LLM 技术也发挥了关键作用。此外,它还在代码 生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained0 码力 | 32 页 | 13.09 MB | 1 年前3
普通人学AI指南. . . . . . . . . 9 2.3.9 EBSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4 AI 编程工具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 DEvv . . . . . . . . . . . 务,如自然语言理解、图像识别、语音识别等。 闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其 高效的学习能力和强大的通用性而受到关注。 开源大模型以 Meta 的 Llama 系列,2024 年 4 月,Llama3 发布,包括 8B 和 70B 模型。 图 2,时间线主要根据技术论文的发布日期(例如提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 1.4.1 上下文窗口 上下文窗口指的是模型一次可以处理的最大文本长度。这个长度通常用“to- kens”(标记)来表示,每个标记可以是一个单词、子词或单个字符,具体取决0 码力 | 42 页 | 8.39 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单训练和微调,适应特定需求。 Open AI o3 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 数据分析 Open AI o3mini 响应速度快,高效输出数据分析 结果,分析各因素对关键指标生 存率的影响,语言表达自然,重 点突出结合历史背景对数据规律 进行验证,但没有察觉数据异常。 DeepSeek R1 详细展示长思维链,精准提取关键指 标“幸存率”,分析多个因素特征对 幸存率的影响,结合历史背景对数据 3.5 sonnet 基于数据集,在整体数据概括后提供多个 深入数据挖掘方向,根据需求输入研究倾 向,高效生成多个维度的数据分析,语言 简洁,挖掘深度较浅。 Kimi k1.5 提供数据的潜在用途方向,深入分 析过程中,从多个维度(如时间、 语言、地区)深入挖掘数据意义和 关联性,进一步总结趋势结论并提 出相关建议。 Kimi k1.5该任务中表现最为出色,对特征进行精准0 码力 | 85 页 | 8.31 MB | 8 月前3
2023年中国基础软件开源产业研究白皮书正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件),其编写者将实现功能的代码按照一定的开源规范 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 通过技术准入 15个孵化期 开源项目 17个捐赠期 开源项目 40+个储备开 源项目 工业开源体系 区块链 云原生与超算 RISC-V芯片 终端操作系统 设计自动化 人工智能 开发环境及语言 中间件、数据库 工具软件 服务器操作系统 安全体系 16 中国开源基础软件 产业细分领域洞察 03 17 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
2021 中国开源年度报告公司购买开源产品的决策 ………………………………………………………………………… 18 3.6 受访者所从事的技术方向 ………………………………………………………………………… 19 3.7 开发语言 …………………………………………………………………………………………… 20 3.8 Java 开发框架 ……………………………………………………………………………………… 21 3.9 PHP …………………………………………………………………………… 65 2.1 总体趋势 …………………………………………………………………………………………… 65 2.2 总体语言趋势 ……………………………………………………………………………………… 65 2.3 增速最快语言 ……………………………………………………………………………………… 66 6 2.4 新增开源项目领域分布 …………………………………………………………………………… 的比例偏低,技术人员梯度不够合理,也是国内各大开源社区在吸引贡献者方面,可以优化的地方。 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人单位越来越认可学生 在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应该也不乏各种刷榜行为,需要开源项目所 有者更多关注学生贡献者增多所带来的质量、合规等问题。 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告be optimized to attract contributors. 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人 单位越来越认可学生在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应 该也不乏各种刷榜行为,需要开源项目所有者更多关注学生贡献者增多所带来的质量、合 规等问题。 Duan Xihua: In recent years, the affairs, public policy and other areas to achieve better development. 3.7 开发语言 / 3.7 Development Languages 开发语言呈现多超多强的状态,Python 后来居上,超过 Java 成为榜首, JavaScript/TypeScript 位居第三。 The development Scala)是绝对主力,比如大家耳熟能详的 Hadoop, HBase, Spark 等,而开源的 AI 框架类项目,如:TensorFlow, PyTorch, MindSpore 等,则主要 由 Python 语言所构成。未来,这两大语言还将持续在各自擅长的领域发光发热。 Du Junping: Python and Java go hand in hand, which to some extent reflects0 码力 | 199 页 | 9.63 MB | 1 年前3
Krita 4.x 官方文档中文版 2021-08-06A创建选区 编辑选区 移除选区 选区显示模式 全局选区蒙版 (绘制选区) 按照图层透明度建立选区 像素选区和矢量选区 选区工具的常用配套快捷键 Python 脚本编程 安装和管理 Python 插件 Krita Python 脚本编程入门 Krita Python 插件编写教程 标签管理 新建标签 指定标签 重命名标签 删除标签 色彩校样 超出色域警告 矢量图形 矢量图形介绍 创建矢量图形的工具 至关重要,因为要是图层没有透明区域的话,把画面内容 分成几个图层又有什么意义呢? 透明度和颜色使用相同的方式进行保存,所以它也有自己的通道。我们通常把 这条通道叫做 阿尔法通道 或者简称为 alpha。这是因为希腊字母“α”被用于在 编程中表示透明度。为了方便初学者理解,我们在 Krita 中将其翻译为 透明度 通道 。 某些老旧的应用程序会默认创建不带透明度的图像,把背景显示为白色。而 Krita 在任何情况下都会创建带有透明度通道的图像,如果图像本身不含透明 + Shift + Alt + 鼠标左键点击 图层缩 略图。 Python 脚本编程 本章节将介绍 Krita 的 Python 脚本编程。 目录: 安装和管理 Python 插件 如何安装第三方 Python 插件 如何获取插件 如何启用或者停用某个插件 Krita Python 脚本编程入门 Python 脚本简介 技术细节 Krita Python 插件编写教程 创建0 码力 | 1373 页 | 74.74 MB | 1 年前3
Krita 5.2 官方文档中文版 2023-12-08A创建选区 编辑选区 移除选区 选区显示模式 全局选区蒙版 (绘制选区) 按照图层透明度建立选区 像素选区和矢量选区 选区工具的常用配套快捷键 Python 脚本编程 安装和管理 Python 插件 Krita Python 脚本编程入门 Krita Python 插件编写教程 标签管理 新建标签 指定标签 重命名标签 删除标签 色彩校样 超出色域警告 矢量图形 矢量图形介绍 创建矢量图形的工具 区域的话,把画面内容分成几个图层又有什么意义呢? 透明度和颜色使用相同的方式进行保存,所以它也有自己的通道。 我们通常把这条通道叫做 阿尔法通道 或者简称为 alpha。这是因 为希腊字母“α”被用于在编程中表示透明度。为了方便初学者理 解,我们在 Krita 中将其翻译为 透明度通道 。 某些老旧的应用程序会默认创建不带透明度的图像,把背景显示为 白色。而 Krita 在任何情况下都会创建带有透明度通道的图像,如 Ctrl + Shift + Alt + 鼠标左键点击 图层缩略图。 Python 脚本编程 本章节将介绍 Krita 的 Python 脚本编程。 目录: 安装和管理 Python 插件 如何安装第三方 Python 插件 如何获取插件 如何启用或禁用插件 Krita Python 脚本编程入门 Python 脚本简介 技术细节 Krita Python 插件编写教程 创建 Krita0 码力 | 1685 页 | 91.87 MB | 1 年前3
共 160 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16













