2023 中国开源开发者报告ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, “Llama 2 一开源,全球范围内进入了百模混战阶段”, 这个说法一点也不为过。 年底的“虚假宣传” Gemini 与“磁力链开源” Mistral 8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂 潮卷到天际。 四、 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆 盖了不同的领域和场景,构建了多元化的大模型生态。 大模型方面,百花齐放:百度的文心一言、抖音的云雀大模 型、智谱 AI 的 GLM 大模型、中科院的紫东太初大模型、 百川智能的百川大模型、商汤的日日新大模型、MiniMax 的 ABAB 大模型、上海人工智能实验室的书生通用大模型、腾 讯的混元大模型、蚂蚁的百灵大模型等。 大模型创业公司 “零一万物”。 11 月,零一万物推出 Yi-34B 和 Yi-6B 两个开源大模型,对学术研究完全开放。 2023 年 3 月,由清华技术成果转化的公司智谱 AI 宣布开源中英双语对话模 型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用。 Sam Altman 被“逐出”OpenAI 如此突发的重磅消息震惊了全世界,有人称之为美国硅谷史上最大的“夺权” 事件。经历 1050 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍但是在今天,技术范式发⽣了很⼤的改变。⾸先是前端变成了对话式的ConversationUI,未来可能会 有越来越多的产品采⽤这种UI,后端也被极⼤程度的统⼀了,统⼀到了⼀个「语⾔模型」上。这个模 型处理的不光是语⾔,它能处理世界上所有的信息,本质上是对世界上所有信息进⾏编码和⽆损压 缩。 这两个都确定之后,⼤部分应⽤层的产品开发其实都不涉及后端的计算构架或者前端的Lauguage 杨植麟:我们⽬前没有开源计划。我认为,开源和闭源在整个⽣态⾥⾯会扮演不同的⻆⾊,开源很⼤ ⼀个作⽤是在ToB端的获客,如果想做头部的SuperApp,⼤家肯定都是⽤闭源模型去做的,在开源模 型上做C端应⽤很难做出差异化。 36氪:你从博⼠阶段就已经开始创业,之前创⽴第⼀家AI公司“循环智能”的经验,会给你什么启 发? 杨植麟:现在⽉之暗⾯还是处在第⼀阶段,更重要的任务是降低不可预测性等偏技术上的⼯作,其实 最终⽬标不是超越OpenAI 机器之⼼:你们⽬前的初始⽬标是实现GPT4的开发,现在进展如何? 杨植麟:我们⾸先要做的是预测,然后才能做规模化。在投⼊⼤量的资⾦去规模化前,我们需要知道规 模化后会发⽣什么。通过很多预测⼯作,总结规律,然后预测规模化后的情况。这样可以涵盖⼤概主 要的影响因素,剩下的少部分可以通过⼀些经验和试错来推断。 ⽬前我们前期已经验证完,开始去⽤更⼤的数据集去训练,以使训练更稳定,保证代码的正确性,以0 码力 | 74 页 | 1.64 MB | 1 年前3
2024 中国开源开发者报告目 录 Part 2: TOP101-2024 大 模 型 观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 本章节数据来源:2024年1月至2024年12月 OSS Compass 平台相关公开数据 15 / 111 OSS Compass Insight 2024 中国开源开发者报告重点聚焦大模型,本章节以大模 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM 更精准的方式满足多样 化需求,帮助人工智能在实际应用场景中落地。 开源多元化与应用细分 中国开源模型的发展不仅体现在技术突破上,还在生态建设中展现出巨大的活力。中国开源 模型从竞争激烈的“百模大战”逐步迈向多元化和深度细分,国内社区在今年发布了大量高质量 开源模型,尤其是多模态理解与生成模型: 多模态理解:Qwen2-VL、Ovis、InternVL2、DeepSeek JanusFlow、GOT-OCR2_0;0 码力 | 111 页 | 11.44 MB | 8 月前3
全球开源发展态势洞察(2023年第八期)添加EDS支持(Endpoint Discovery Service)。 近日,OpenYurt v1.3.0发布,版本特性更新如下: • 重构Openyurt控制平面组件; • 允许用户为静态Pod定义Pod模板和升级模 型; • NodePort Service支持节点池隔离。 近日,Rainbond v5.14.0发布,版本特性更新 如下: • 各语言源码构建包版本升级; • 支持一键删除应用及应用下相关资源; Exchange(VEX)对检测到的漏洞进行 过滤; • 支持为虚拟机镜像生成CycloneDX和SPDX 等格式的SBOM(软件物料清单); • 支持嵌套JAR路径; • 支持通过分析文件内容来识别dpkg和Go模 块的许可证类型; • 支持使用自定义的Docker socket。 全球开源态势洞察|第十期 06 03 开源安全 DEF CON将举办全球最大规模 AI黑客大赛 微软将用近一年时间完成对0-day 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 的锁定难度远超想象,部分原因在于所谓“提示0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书openGauss基于自主化根技术,聚焦数据库内核与架构,通过技术创新解决行业需求。内核方面,不断夯实高性能、高可靠、高安 全、高智能的“四高”能力,同时注重智能化建设;架构方面,围绕多样性算力融合,提升资源利用率,使能多模多态,打造资源 池化插件化的架构,满足千行百业场景的诉求。通过内核与架构的双引擎创新,实现技术突破,为中国乃至全球的数据库的优质发 展贡献力量。 多模态 HATP 智能运维 机密计算 数据智能 27 中华人民共和国数据 安全法(2021.06.10) 中华人民共和国电子 签名法(2019.04.23) • 这里的安全中间件是 指支持国家标准密码 算法及其他国际算法, 通过参数转换、对象 管理、接口调度等模 块,完成身份认证、 安全邮件、安全传输 等安全业务场景的中 间件 • 安全中间件开源厂商 较少,主要使用国外 OpenSSL , 或 基 于 OpenSSL的二次开源 中间件,完全自主开 源的安全中间件较为0 码力 | 43 页 | 4.69 MB | 1 年前3
中国开源软件产业研究报告运动的开发者认为,“集 市”模式通过市场的自然选择,能够发掘出真正具备潜力和价值的项目和创意,从而为软件的持续发展赋能。 “大教堂”和“集市”开发模式的对比和适用性 对于软件产业而言,“大教堂”模 式仍然是众多企业在激烈的市场竞 争环境中进行项目开发的常见模式, 不可否认的是,这种模式能够更快 地满足客户需求,为客户提供高效 便捷的IT服务。 “集市” “大教堂” 依靠精英,自上而下 依靠大众,自下而上 本报告第二章提及的云服务厂商和开源软件的矛盾在我 国市场上普遍存在,实质上破坏了国内发展开源软件产 业的市场环境,降低了开源贡献者的积极性 文化 因素 开源项目运行通常采用一种平等、开放、透明的管理模 式,看重创新氛围而非短期收益,在我国现阶段的产业 发展环境下这种模式不易得到企业乃至行业的支持 44 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况0 码力 | 68 页 | 3.63 MB | 1 年前3
2021 中国开源年度报告托管意味着提供一个完全托管的项目版本,当用户想要在生产中部署时,可以使用该软件启动远程服务器, 而不必担心它不用担心备份、停机、升级等问题。Databricks、Acquia 等公司已经成功证明了托管模 式商业化路径的可行性。但是这也引起了公有云提供商(例如 AWS)与开源社区的矛盾。 Restrictive Licensing 限制性许可——通过提供一个带有稍带限制的开源许可证来激励使用者进行付 市场匹配能力——商业化探索阶段 首先,开源项目应该具有产品 - 市场契合。产品与市场的契合体现在用户对软件的初始采用率,可以用 下载量这一指标进行衡量。产品市场契合度主要是用来衡量免费产品的用户基数,因为在开源的商业模 式下社区用户(含开发者)有一定几率在未来转化为付费客户,所以在初期可以吸引到多少用户进行产 品的使用时后期付费转化的先决条件。 图表 29 :Apollo 客户下载情况0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告Ventures,云启资本 Source: Battery Ventures, Yunqi Partners 开源软件企业着重加强云战略布局,以加速和推动持续性增长。开源软件企业的 SaaS 服务模 块的营收正在成指数倍增长。例如,GitLab 在其最近提交的 S-1 文件中指出,类似于 SaaS 的 全托管云产品在 2020 财年至 2021 财年间的 ARR 占比从 9% 增长至 16%,SaaS Partners 未来开源 4.0 时代 Future Open Source 4.0 Serverless 将成为开源与云计算结合的新模式。无服务器(Serverless)是一种云原生开发模 型,可使开发者在无需管理服务器的情况下专注构建和运行应用。无服务器方案将服务器从应 用开发中抽离,由云供应商负责置备、维护和扩展服务器基本架构,而开发者则可仅将代码打 包到容器中进行部署。Serverless0 码力 | 199 页 | 9.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021对接集团所有系统数据库,对增量、 历史同步方案进行规划与落地 对手工填报流程进行管控,再造审批 流程 多维度汇总和实时推送相关数据 客户收益: 搭建完成元数据 + 主数据管理流程 搭建完成含60+ 数据源、120+ 数据模 型的数据资产体系 搭建完成涵盖财务、营销、运营、研发 四大业务模块的经营分析体系 客户需求: 统一数据系统架构,提升业务系统开发 效率 提升数仓计算效率及数据模型复用度, 避免资源浪费 解决方案:0 码力 | 43 页 | 884.64 KB | 1 年前3
2020 中国开源年度报告
GPU(Nvidia)进⾏索引加速与查询加速,能⼤幅提⾼单机性能。 odpi/egeria nnstreamer/nnstreamer,NNStreamer 是⼀组 Gstreamer 插件,为采⽤神经⽹络模 型的 Gstreamer 开发⼈员和管理神经⽹络管道及其过滤器的神经⽹络开发⼈员提供了⽅ 便和⾼效的⽀持。 可以发现,三个项⽬的开发者⼯作时间分布情况是存在差异的。milvus-io/milvus0 码力 | 46 页 | 4.09 MB | 1 年前3
共 10 条
- 1













