网易数帆 领先的数字化转型技术与服务提供商 2021台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在 升级轻舟云原生软件生产力平台及有数全链路数据生产力平台;发布金融分布式、金融大数据、零售大数据、制造业智慧供应链等行业解决方案。 发布轻舟低代码平台 2.0 。 大数据开源项目 Kyuubi 全票进入 Apache 软件基金会孵化器。 有数 BI 个人版永久免费;发布机器学习平台、消费者运营平台、标签画像、流量分析等产品。 2020 2021 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 版本开发;开源企业级数据湖探索平台 Kyuubi ;发布首个开源项目分布式存储系统 Curve。 2019 发布全链路数据中台解决方案。 2018 发布轻舟微服务、“瀚海”私有云及国内首款云计算全栈一体机。 2017 加入云原生计算基金会(CNCF)。 2016 网易云战略发布,推出面向互联网的场景化云服务。 2012 网易杭州研究院启动私有云研发,支撑网易集团互联网产品全面上云。 20060 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 注释:由于暂无国内厂商主导的开源编程语言,因而不列入本报告研究范围。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 对于这四类基础软件(操作系统、数据库、AI框架、中间件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 开源内容传播应用与 迭代升级,达到社会 集体效应最大化 5 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
2023 中国开源开发者报告的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。 二、 New Bing(Bing AI)代表了微软在 LLM 领域的野心和 决心,它首次把当时世人能想到最有价值又可行的 LLM 应用场景——“智能对话+联网搜索”——无缝整合了起来, 应用场景——“智能对话+联网搜索”——无缝整合了起来, 大有干掉搜索行业和问答社区的趋势,而后事实证明,全 球 最 强 IT 问 答 社 区 Stack OverFlow 深 受 其 害 。 Google 紧随其后推出 Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告Part 2: TOP101-2024 大 模 型 观 点 编委会 21 | 2024 年中国开源模型:崛起与变革 26 | 开源模型未必更先进,但会更长久 30 | 大模型撞上“算力墙”,超级应用的探寻之路 36 | AI 的三岔路口:专业模型和个人模型 40 | 2024 年 AI 编程技术与工具发展综述 45 | RAG 的 2024:随需而变,从狂热到理性 51 | 大模型训练中的开源数据和算法:机遇及挑战 大模型训练中的开源数据和算法:机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编 李泽辰,Gitee 主编 高瞻,Gitee AI 运营 设计:张琪0 码力 | 111 页 | 11.44 MB | 8 月前3
2021 中国开源年度报告来探讨开源(这个原本是纯技术的范畴)。直到最近几起开源软件安 全事件,更是令大家议论纷纷。这样一个令人喜忧参半的现象,也 许还会继续持续下去。 生态责任 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是 自由的。但是,在软件吞噬世界、开源吞噬软件的今天,开源技术, 2021 中国开源年度报告 3 已经成为整个世界的基础设施之一。能力越大,责任越大。应用越广, 风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何 段夕华:我觉得以 actor 和 comment 来衡量项目的活跃度也似乎也有失偏颇,小体量的工具类开源项目如 node.js 的 co、java 的 fastjson 一般这两个数字也不会很大,但被四处应用,star 数也不少。为保证公平起 见,我觉得可以考虑以上数字除以代码行数,另外,挤掉水分后的 star 和 fork 还是蛮有说服力的。 54 3 中国企业开源数据分析(按活跃度排序) company Android 开发语言 1.89% ↓ 4 注:Android 开发语言为 Java 和 Kotlin,这里为了跟后端的 Java 做区分所以用 Android 概括。 Java 作为国内目前应用最广泛的语言,在 2021 年仍保持着强大的竞争力,仓库数量在极高存量的情况下 仍有不错的增长态势,使用 Java 的仓库数量占比超越了 2020 年的 37%,回到了 2019 年的 50% 左右。0 码力 | 132 页 | 14.24 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)OSM(Open Service Mesh)是一个轻量级、 可扩展的云原生服务网格项目,旨在为运行在 Kubernetes上的应用程序提供简单、完整且独 立的服务网格解决方案,包括处理在Kuberne- tes集群上运行的微服务的流量管理、策略执行 和可观测性等任务,以简化应用程序的部署和 管理。OSM于2020年8月推出,同年加入云原 生计算基金会(CNCF)。不久后,该项目成为 云原生计算基金会(CNCF)沙箱级别的项目。 进Istio的发展。此外,OSM向云原生计算基 金会(CNCF)申请进行项目归档,目前还未 真正执行。 KSOC推出业内首个实时 Kubernetes安全态势管理平台 近日,KSOC推出业内首个实时Kubernetes安 全态势管理平台。Kubernetes安全态势管理平 台可以通过实时上下文以及当前和历史信息准 确定位攻击活动,同时还可以根据集群的当前 状态提供可操作的补救措施。具体功能包括: • 实时态势管理,发现基于事件的错误配置; Nutanix Data Services for Kubernetes。具体 功能如下: • NDK为Kubernetes应用提供数据保护、 恢复、迁移、克隆和复制等管理功能; • 支持将恢复时间目标(RTO)和恢复点目 标(RPO)从几天缩短到几分钟; • 提供策略驱动的有状态应用管理; • Kubernetes和IT管理员可以通过制定规则 和限制来管理基础设施,并启用自助式工 作流程。 Mirantis发布轻量级0 码力 | 22 页 | 1.99 MB | 1 年前3
2021 中国开源年度报告responsibility 在开源还只是一个小众群体的业余爱好时,几乎做任何事情,都是自由的。但是,在软件吞噬 世界、开源吞噬软件的今天,开源技术,已经成为整个世界的基础设施之一。能力越大,责任 越大。应用越广,风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何建设更加 健康的开源生态呢?在这样一种生态中,各方的责任又该如何界定呢? When the open source was just 段夕华:我觉得以 actor 和 comment 来衡量项目的活跃度也似乎也有失偏颇,小体量 的工具类开源项目如 node.js 的 co、java 的 fastjson 一般这两个数字也不会很大,但 被四处应用,star 数也不少。为保证公平起见,我觉得可以考虑以上数字除以代码行数, 另外,挤掉水分后的 star 和 fork 还是蛮有说服力的。 In my opinion, it seems biased languages 1.89% ↓4 注:Android 开发语言为 Java 和 Kotlin,这里为了跟后端的 Java 做区分所以用 Android 概 括。 Java 作为国内目前应用最广泛的语言,在 2021 年仍保持着强大的竞争力,仓库数量在极高 存量的情况下仍有不错的增长态势,使用 Java 的仓库数量占比超越了 2020 年的 37%,回 到了 2019 年的 50%左右。0 码力 | 199 页 | 9.63 MB | 1 年前3
中国开源软件产业研究报告红帽(RedHat)公司的收入结构 谷歌公司收入结构 17 20 21 4.4 6.2 8.2 2.8 3.5 4.2 FY2017 FY2018 FY2019 基础设施订阅(亿美元) 应用开发新兴技术订阅(亿美元) 培训服务(亿美元) 853 981 1041 112 170 198 200 215 231 141 170 217 58 89 131 www.iresearch.com.cn 云计算、容 器和虚拟化 22.7% 网络和边缘计算 15.0% web和应用程序开发 13.6% 人工智能、机器学习、数 据和分析 10.8% 隐私与安全 5.1% cross-technology 4.8% 物联网与嵌入式 4.6% 区块链 4.3% DevOps 计算、容器和虚拟化开源项目的占 比最大,达到22.7%。整体来看,全球开源项目类型集中在开发框架、文档类开源项目、云计算等相关领域。此外,开源 项目的类型往往能反映当前市场关注的热点,如容器与云原生应用技术、人工智能开发框架等技术的流行。 来源:Apache软件基金会,艾瑞咨询研究院根据公开资料研究及绘制。 来源:Linux基金会,艾瑞咨询研究院根据公开资料研究及绘制。 2020年Apache基金会开源项目分类0 码力 | 68 页 | 3.63 MB | 1 年前3
2020 中国开源年度报告
但是,接下来应该怎么发展呢?为了抗击疫情⽽凝聚起来的⼈,创造的项⽬,积累的经验,总 结的教训,应该如何“整理、封装、模块化”,并为了今后的各种意外,做好准备呢?这些都是 值得⻓期思考并改进的领域。 作为⼀份⼒图完整、客观、全⾯、丰富的报告,值得探讨的问题当然不⽌上述这些,也欢迎朋 友们阅读下⾯的报告,并随时与我们交流。 庄表伟,开源社理事⻓ 2021 年 1 ⽉ 16 ⽇ 特邀点评专家: 吴晟,Apache 来开源⾃⼰的项⽬,其次则是 Gitee 和 Gitlab。 【专家点评】 蒋涛:随着开源规模和商业化的快速发展,开源平台作为开源项目和开发者生态的重要基础及 支撑体系,未来将承载更多的服务和应用场景,也将发展出各自特色。2020 年新发布的 CODE China,作为独立第三方开源平台,将重点围绕 AIOT,为更多开源项目和开发者提供 运营支持和生态服务。 6.9 技术论坛 知乎和 深度学习框架是⼈⼯智能开源⽣态的核⼼,技术复杂度⾮常⾼,同时需要结合应⽤⽤慢⼯持续 打磨。⻜桨作为我国最早开源、功能最为完备的深度学习平台,⼀直秉持开放透明的理念进⾏ 开源开发。⻜桨结合 AI 产业发展需要,在框架整体设计以及全流程开发⼯具⽅⾯保持了前瞻 性整体设计,保持对⼯程质量的极致追求,并通过社区机制进⾏质量的有效保障,凭借项⽬质 量在⼴⼤ AI 开发者中形成了良好的⼝碑。 ⻜桨⼀直⾮常关注开发者对社区的贡献和认同感。⻜桨⽬前除了已经有0 码力 | 46 页 | 4.09 MB | 1 年前3
Moonshot AI 介绍Diffusion等AI模型成功 的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 与DeepMind和CMU合作研究,⾸次实现⼩样本性能逼近全监督学习的⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2 你需要⼀个同时满⾜scalability和generality这两点的架构,但今天其实很多架构已经不满⾜这两条 了。transformer在已知的tokenspace符合这两条,但放⼤到⼀个更通⽤的场景,也不太符合。数据 也是⼀个⽣产要素,包括整个世界的数字化,和来⾃⽤⼾的数据。 所以在很多核⼼⽣产要素中,通过改变其他的⽣产要素,可以让算⼒利⽤率变⾼。 同时,针对“登⽉”,算⼒肯定要持续增⻓0 码力 | 74 页 | 1.64 MB | 1 年前3
共 12 条
- 1
- 2













