2023 中国开源开发者报告模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 LLM 直接催生出来的新“学科”, 它的核心在于研究人类如何与 LLM 更好地进行“沟通”, 找到让 LLM 能够准确理解人类意图的方法。提示词工程探 索如何以 LLM 可以解析的方式来表达需要它完成的任务, 寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词 工程建立了一套“人机交互语法”,来更精准地向 LLM 高效、准确的“沟通桥梁”提供了可能性。什么“链式思考 1 1 (CoT)”、“自动推理并使用工具(ART)”、“思维 树(ToT)”……甚至运用心理学对 LLM 进行“情绪提 示(EmotionPrompt)”,提示词工程俨然在将 LLM 一 点一点解剖,试图让人类成为可以将其掌控的“咒术师”。 八、 AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM 发展的新阶段。LLM Agent 是一种基于0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告今年属于纯增长,目前情 况还不错,但在企业应用领域,多 Agents 的编排依然存在理解能力不足和生成幻觉等问题有待 提高。 如果去预测明年的企业级市场趋势,我觉得应用(Application)可能会是最大的关键词, 甚至会超过 Agent 的热度。其实今年下半年已经能明显的看出来,越来越多传统大企业开始将 大模型技术引入到业务中,而且他们的特点是要求高、需求刚、付费爽。而一旦大家开始在大模 型的应用侧竞赛,RAG 的数据和算法能够在更大程度上确保样本的质量,从而避免更多未知的风险。例如就在 2024 年 12 月 1 日,用户发现 ChatGPT 在需要输出“David Mayer”这个名字的时候会突然提示拒绝: 此事件一度被解读为 GPT 模型在训练过程中被植入了特定的样本或算法,以避免讨论特定 53 / 111 的人名。虽然后续的一系列测试表明,这种限制似乎只存在于 ChatGPT 产品中,通过 分析原因,再结合智能体根据运行错误,自动修代码复问题等;在测试 领域,AI 除了辅助进行测试用例的生成,还可以生成对应的单元测试代码,甚至是自动化测试 代码;在 UI 设计领域,AI 可以直接生成对应的代码,基于提示词来修改 UI,所生成的是最终 的 UI 代码,而不是设计稿。 58 / 111 诸如此类的变化,使得 AI 所能辅助的范围更加广泛,从而使得 AI 在软件工程中的应用更加 全面。 演进路径:个体、团队、组织0 码力 | 111 页 | 11.44 MB | 8 月前3
全球开源发展态势洞察(2023年第八期)人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示 词注入”技术。人工智能研究员Simon Willison 详细介绍了提示词注入的危险,这种技术可以令 语言模型偏离正轨,执行创建者想要回避的操 作。在DEF CON大会期间,参与者将通过主办方 提供的笔记本电脑定时访问多个大语言模型。并0 码力 | 22 页 | 1.99 MB | 1 年前3
Moonshot AI 介绍⼤多数 主流模型的重要组成部分;发明了groupnormalization,是StableDiffusion等AI模型成功 的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 与DeepMind和CMU合作研究,⾸次实现⼩样本性能逼近全监督学习的⾼效对⻬⽅法。 性。 事实性⼀般是对统计模型的挑战,但是今天的语⾔模型可以有⾮常尖峰的分布。让它回答“中国的⾸ 都”,模型对“北”这个字能给出99%的概率。同时,如果我今天让它写⼀本⼩说,那它可能下⼀个 词的概率分布就会很均匀。概率其实是⼀个通⽤的表⽰⽅式。本质上这个世界上有⼤量的熵,抓住确 定性的东西,让本⾝是混沌的东西继续混沌。 通往AGI的话,long-context会是⼀个很重要的点。 问题⸺历史上所 有的架构演进本质上都是在提升有效的contextlength。word2vec最近拿了NeurIPS的Testof Time奖。它在10年前⽤⼀个词去预测周围的词,相当于contextlength是5。RNN把有效的 contextlength提升到了20。LSTM涨到⼤⼏⼗。transformer到了⼏千。现在我们能做到⼏⼗万。0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告25 月。看起来一切都没有变化,我们 依然在 COVID 之中。但是,从另一个角度来看,世界正在发生巨变, 我们所处的世界,正在高速朝着某个未知的方向前进。 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经 非常明显,工信部信息技术发展司发布了《“十四五”软件和信息技 术服务业发展规划》,就是一个典型的信号,开源领域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 平台提供,内容撰写方面做出贡献的小组成员包括 :李泽辰。 72 2021 中国开源年度报告 73 2021 中国开源年度报告 商业化篇 74 1 概述 1998 年开源(Open Source)一词诞生,这种新提法的出现很大程度上是为了消除人们 对于自由软件(Free Software)中 “Free”的模糊理解,使其更加商业友好。可以说开 源软件从诞生之初,就和商业化之间并无矛盾,开源不等于免费。近年来,随着一些开源 Apache License 2.0,允许分发完全自由、允许项目代码被 修改、允许作为开源或商业化软件再次发布,法律层面上 Apache License 约束不了这样的行为。在这 件事上,双方各执一词,引起了人们对开源项目技术归属问题的重视与思考。 图表 18 :Apache Doris 与 Doris DB 的分裂 资料来源:公开资料,云启资本 3.3.2 代码安全风险0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告undergoing tremendous changes and moving in an unknown direction at high speed. 对于中国开源而言,2021 年的关键词,应该是“助跑”。迹象已经非常明显,工信部信息技术 发展司发布了《“十四五”软件和信息技术服务业发展规划》,就是一个典型的信号,开源领域 即将起飞了。从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 China Open Source Annual Report - Commercialisation 1. 概述 Overview 1998 年开源(Open Source)一词诞生,这种新提法的出现很大程度上是为了消除人们对于自 由软件(Free Software)中 “Free”的模糊理解,使其更加商业友好。可以说开源软件从诞 生之初,就和商业化之间并无矛盾,开源不等 Apache License 2.0,允许分发完全自由、允许项目代码被修改、允许作为开源或商 业化软件再次发布,法律层面上 Apache License 约束不了这样的行为。在这件事上,双 方各执一词,引起了人们对开源项目技术归属问题的重视与思考。 Apache Doris argues that DorisDB, a Fork from Apache Doris, has not only failed0 码力 | 199 页 | 9.63 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书www.iresearch.com.cn 典型案例:华为中间件 不局限于“分布式”“云原生”“基础软件”关键词,能力进一步扩展 到边缘云,赋能开发者高效开发与企业敏捷创新 • 华为中间件的开源范围涵盖底层资源弹性调用、中层服务管理编排、顶层开发协助工具等多个方面,结合华为内部丰富的磨合经 验,充分发挥中间件0 码力 | 43 页 | 4.69 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机JumpServer 企业版 (旗舰) JumpServer 堡垒机企业版(旗舰)不限资产数量,包含 X-Pack 增强包和原⼚企业级⽀持服务(增强级)。 ⽀持单机、热备或⾼ 可⽤三种部署⽅式 按套 按年 提示:⾮旗舰版⽀持热备份(Keeplived、负载均衡模式等)、应⽤组件⾼可⽤、Kubernetes 集群部署等模式,需要额外的实施及维护费⽤。 X-Pack 增强包 组织管理 资产同步 账号备份0 码力 | 40 页 | 6.66 MB | 1 年前3
共 8 条
- 1













