2024 中国开源开发者报告RAG(Retrieval Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了 1+1>=2 的效果。 RAG 可以被理解为智能体的最简单形式。未来的智能体可以实现多种工具的混合使用,甚 AST)、代码依 赖关系等数据,新的代码生成模型则具有更强的上下文感知能力。 41 / 111 在此基础上,基于 AI 的编程工具能够根据给定的上下文(如函数名、注释、部分代码等) 检索出最相关的代码片段和文档,能够提供完整的函数或代码块建议。这也使得 LLM 能够参考 海量的代码库和技术文档,这不仅能缓解大模型的幻觉问题,显著提升代码生成与理解的准确性, 而且能符合上下文的代码,更能满足开发的业务需求。 第二个阶段涉及通过组合一系列提示词和第三方工具或 API 来编排复杂的工作流,这是目 前成熟的 AI 应用构建思路之一。值得注意的是,RAG 技术的出现,得益于大语言模型天然适 合处理知识密集型任务,RAG 通过从外部记忆源检索相关信息,不仅提高了模型生成的精确性 和相关性,还解决了大语言模型在数据隐私保护、实时数据处理和减少幻觉问题等方面的局限。 RAG 技术在数据预处理和索引构建方面的努力,直接影响最终应用的效果。0 码力 | 111 页 | 11.44 MB | 8 月前3
中国开源软件产业研究报告科技 已推出了KubeSphere容器平台、RadonDB云原生数据库、Xenon高可用组件、OpenPitrix多云应用管理平台、OpenELB 负载均衡器、全象云低代码、OpenFunction函数计算平台、tKeel物联网开放平台等60多个优质开源项目,从0到1运营了 KubeSphere、RadonDB等开源社区,与CNCF、Linux基金会合作,与英特尔、思科等上下游厂商打造精选开源解决方案, 守信 可信价值观 社区可信(组织可信) 项目可信(产品可信) 透明 多样性 公开 合规 可交付 安全 社区治理 成员管理 文档管理 组织架构 组织架构 社区运营 会议活动 外部合作 开发者生态 社区活跃度监测 用户生态 社区开发 依赖管理 编码规范 构建管理 分支管理 漏洞管理 需求管理 基础设施 测试平台 构建平台 安全漏洞扫描 发布平台 如果项目被基金会接受,也就意味着项目 的知识产权由发起企业转移至基金会,基 金会开展后续运营 项目能否进入基金会通常由一个评估委员 会通过民主投票决定 借助基金会的平台效应,项目能够得到更多 外部贡献者的关注和用户反馈 孵化过程是项目在开源基金会中停留时间 较长的阶段,可长达数年 基金会将提供用于代码管理、协同开发、成 员沟通等的软硬件基础设施,并为项目提供 专家指导和包括法律、市场宣传等在内的社0 码力 | 68 页 | 3.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Contour的HTTPProxy支持配置Envoy的 RBAC过滤器的功能,以根据IP地址允许或 拒绝请求; • 支持将追踪数据导出到OpenTelemetry, 以便进行更全面的分析和监控; • 支持对所有主机进行外部授权; • HttpProxy的条件块还增加了对精确路径匹 配条件的支持; • 支持内部重定向; • 对基于HTTPProxy资源的路由实现了HTTP 查询参数匹配功能。 Flagger v1.31 支持通过Kube-bench检查集群是否符合CIS Kubernetes基准; • ·警报内容包括根本信息分析(RCA)和解决 方案建议; • ·完全支持Istio; • ·支持ARM64机器; • ·支持外部Load Balancer。 Trivy v0.41.0发布 Trivy是一款专业的容器漏洞扫描工具,旨在帮 助用户识别并解决容器镜像中的安全漏洞。它 支持多种容器镜像格式和操作系统,并提供全 代码的功能及其在软件中所起的作用进行判断。最终确定被传染的部分应当是与原开源软件形成 密切通信使得二者高度牵连融合成一体的程序,而非只要有数据交换就会构成传染。未来公司软 件的主程序与涉案GPL开源代码存在函数调用关系,且该开源代码实现的压缩功能系投标文件上 传前不可或缺的功能,故主程序为该开源代码的衍生程序,受GPL协议约束。而预览程序与主程 序相互独立,预览程序文件连同不包含GPL开源代码的DLL文件在脱离主程序后,预览程序、主0 码力 | 22 页 | 1.99 MB | 1 年前3
Moonshot AI 介绍才会提升模型的能⼒。 杨植麟:你可以认为带MoE和不带MoE是两条scalinglaw。本质上scalinglaw刻画的是loss跟参 数量之间的关系。MoE改变了这个函数,让你能够⽤更⼤的参数,但同时FLOPs不变。合成数据改变 的是另⼀个关系,FLOPs不变的情况下让数据规模增⻓。 沿着scalinglaw⼀直⾛是个有确定性的事情,⼤家通过试图改 36氪:你从博⼠阶段就已经开始创业,之前创⽴第⼀家AI公司“循环智能”的经验,会给你什么启 发? 杨植麟:现在⽉之暗⾯还是处在第⼀阶段,更重要的任务是降低不可预测性等偏技术上的⼯作,其实 不会太受到外部因素的影响。 但从⼤环境上来说,不可预测性肯定是要⽐之前更多了。⼏年前的年景更好,可以顺着市场做扩张, 做营收;但市场不好时,反⽽是需要做成本控制、降低烧钱速度。这也是我从上⼀段创业经验学到最 模化后的情况。这样可以涵盖⼤概主 要的影响因素,剩下的少部分可以通过⼀些经验和试错来推断。 ⽬前我们前期已经验证完,开始去⽤更⼤的数据集去训练,以使训练更稳定,保证代码的正确性,以 及优化损失函数,训练⼤模型。 机器之⼼:很多⼤模型创业公司的初期⽬标都是超过GPT4,“达到或者超越”的标准会是什么? 杨植麟:我认为最重要的标准其实是模型的压缩⽐。 如果基于第⼀性原则来思考,智能的⾸要0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告年,近七成受访者接触开源时间 在一年以上。 专家点评 杨丽蕴:如果是想表达近两年参与开源的人越来越多,那么:在 1-2 年内接触开源的参与者越来越多,与我 国近两年开源政策引导、开源社区快速发展并受到越来越多的关注等等外部因素有密切关系。 32 4.5 在开源中的时间投入 约有 55% 的受访者每周在开源上的时间投入不足 5 小时,每周对开源 投入时间在 5-20 个小时的受访者约有 30%,与去年相比,每周在开源 亿元,相对于 2019 年 348 亿的市场规模,增速达到 28%。 通过在自有云和 Serverless 基础上运行开源,开源方案成本降低。Serverless 平台会根据请求的数量 来创建对应的函数实例来执行,无需人工干预,瞬间弹性扩容,应对流量爆发。更大程度上降低了云基 础设施成本以及维护扩张成本。除此之外,基于 Serverless 开源解决方案能够以零支出在世界各地部署, 并且在运营 客户转化率低,通常只能将不到 1% 的用户转化为付费客户,主要是因为只有那 些依赖关键任务系统项目的客户才愿意为支持付费。 然而,那些严重依赖项目的人自然会随着时间的推 移投入自己的工程努力来了解项目,从而减少对外部支持的需求。选择 Support 支持服务商业路径的主 要公司案例是 Red Hat。 Hosting 托管——供应商将其开源软件作为服务托管在云上,通过收取每月 / 每年的托管和服务费获利。0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告[Expert Comment] 杨丽蕴:如果是想表达近两年参与开源的人越来越多,那么:在 1-2 年内接触开源的参与 者越来越多,与我国近两年开源政策引导、开源社区快速发展并受到越来越多的关注等等 外部因素有密切关系。 Yang Liyun: If it is to express the increasing number of people involved in open source 34.8 billion yuan in 2019. 通过在自有云和 Serverless 基础上运行开源,开源方案成本降低。Serverless 平台会根据请 求的数量来创建对应的函数实例来执行,无需人工干预,瞬间弹性扩容,应对流量爆发。更大 程度上降低了云基础设施成本以及维护扩张成本。除此之外,基于 Serverless 开源解决方案能 够以零支出在世界各地部署,并且在运营 客户转化率低,通常只能将不到 1% 的用 户转化为付费客户,主要是因为只有那些依赖关键任务系统项目的客户才愿意为支持付费。 然 而,那些严重依赖项目的人自然会随着时间的推移投入自己的工程努力来了解项目,从而减少 对外部支持的需求。选择 Support 支持服务商业路径的主要公司案例是 Red Hat。 Support services - provide paid technical support and consulting0 码力 | 199 页 | 9.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021管理模式“兼容并包” 支持多数据源、多租户、多对 象和多种数据模型管理。 系统可“拔插” 可搭配数据中台产品建立一 站式数据平台,也可适配企业 自身大数据系统,快速落地。 行业知识赋能 基于网易集团内外部客户的 实践,将标签与画像的方法 论融于产品设计中。 标签全生命周期管理 支持标签从创建、生产、使 用、评估、治理、下线等全流程 管理。 PRODUCT 多对象标签管理与应用平台,借助标签圈 数据资产 数据治理中心 API申请 API生成 API发布 API管理 数据服务中心 用户中心 权限管理 系统管理 集团组织 用户管理 数据权限 身份认证 全剧配置 应用配置 外部服务管理 系统日志 SOLUTIONS 帮助零售行业迅速提升人效、品效、坪效,驱动业务快速增长,高效整合线上线下用户数据,全面掌控渠道和用户, 提升营销和运营效率,重塑企业零售时代竞争力。 零售大数据解决方案 逐步实现未来物流精益化管理、优化系 统架构,提升作业效率 解决方案: 以物流要素标准化为基础编制IT高 阶方案,精益化流程设计、合理化功 能布局、标准化操作过程,锁定需求 边界、设计功能原理、明确与外部系 统交互内容 客户收益: 有机整合供应商、物流配送、车间等 各单元协作资源,提升生产、研发、仓 储、销售等全链路业务运转效率 客户需求: 传统开发模式无法快速响应业务需求 多个产品线之间信息互通困难0 码力 | 43 页 | 884.64 KB | 1 年前3
2023 中国开源开发者报告论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 七、 “提示词工程”,这是 LLM 直接催生出来的新“学科”, Collector、支持在 fluent-operator 部署添加注释、支持为 fluent-operator 和 fluent-bit pods 添加标签、新增在 fluent-bit-watcher 中添加外部插件 标志、支持为 Fluent Bit DaemonSet 添加注释等。 Solon v2.0 大版本发布 Solon 是一个高效的 Java 应用开发 框架:更快、更小、更简单。 不是 Spring,没有 大模型聚合平台 LLMOps 开发 工具 66 / 87 LLM 的工具和平台:LLMOps �� LangChain 是一个帮助开发者使用 LLM 创建应用的开源框 架,它可以将 LLM 与外部数据源进行连接,并允许与 LLM 进行交互。 LangChain 于 2022 年 10 月作为开源项目推出,并于 2023 年 4 月注册成立公司,累计获得超过 3000 万美元的 投资,估值达到了0 码力 | 87 页 | 31.99 MB | 1 年前3
共 8 条
- 1













