2023 中国开源开发者报告Midjourney 这两大图像生成系统 的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应 用,它们突破了传统图像生成方式的局限,仅需要用户提供 文字描述,就可以生成高质量的数字艺术作品。它们的图像 生成质量、样式多样性和用户便捷性都是极大的突破。这为 广大的个人用户和创意行业提供了强有力的工具,彻底改变 了数字艺术内容的创作方式。同时,它们也引发了人工智能 在创作领域的伦理和法律讨论。LLM 2023 年 10 月,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高 达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。 在上下文窗口长度、长窗口文本生成质量、长上下文理解以及长文本问答、 摘要等方面的表现均全面领先 Claude2。 2023 年 9 月,蚂蚁集团正式开 源代码大模型 CodeFuse——基 于蚂蚁基础大模型研发。 这是蚂蚁自研的代码生成专属 年 12 月,有 “欧洲版 OpenAI” 之称的大模型创业公司——Mistral AI 用「磁链链接」开源了 87 GB 的 8x7B MoE 模型:Mixtral 8x7B。 这是一个开放权重的高质量稀疏混合专家模型(SMoE),采用 Apache 2.0 License 开源。在大多数基准测试中,Mixtral 的成绩都优于 Llama 2-70B, 且推理速度提升了 6 倍。而且在大多数标准基准测试中超过0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 设,建立了更完善的协作机制,从而在开源模型 (如 InternLM) 和数据集 (如 Infinity-MM) 领 域贡献了大量有影响力的基础工作和资源。 2024 年,中国开源社区涌现出众多高质量的自发研究成果。其中,MAP 团队推出的全开 源模型 Map Neo 引人瞩目。该模型在训练数据、脚本以及模型对齐工作上实现了全面公开, 成为国内少有的真正意义上完全开源的项目。 22 / 111 化需求,帮助人工智能在实际应用场景中落地。 开源多元化与应用细分 中国开源模型的发展不仅体现在技术突破上,还在生态建设中展现出巨大的活力。中国开源 模型从竞争激烈的“百模大战”逐步迈向多元化和深度细分,国内社区在今年发布了大量高质量 开源模型,尤其是多模态理解与生成模型: 多模态理解:Qwen2-VL、Ovis、InternVL2、DeepSeek JanusFlow、GOT-OCR2_0; 图片生成:PixArt、Lu0 码力 | 111 页 | 11.44 MB | 8 月前3
网易数帆 领先的数字化转型技术与服务提供商 2021CNCF 官方认可的 Kubernetes 服务提供商 CNCF KCSP认证 管理体系相关资质 ISO 27001 信息安全管理体系认证 ISO 2000 信息技术服务管理体系认证 ISO 9001 质量管理体系认证 CSA STAR Certification 2013 服务管理认证 CMMI (三级) 认证 大数据技术认证资质 信通院第十二批“大数据产品能力评测”(有数BI) 工信部一所信创适配测试认证 网易有数以“数据价值”为导向,聚焦于企业 “看数”、“管数”、“用数”等业务场景,提供全链路大数据技术及产品服 务,致力于盘活企业数据生产力,加速实现数字化转型。 数仓设计中心 指标设计 模型设计 数据治理中心 数据质量 数据地图 数据资产 数据标准 UDF管理 任务开发 版本管理 任务运维 资源管理 任务上线 数据服务中心 智能BI 数据准备 大屏 自助取数 移动应用 数据填报 全渠道 生产测试集群隔离 基于数据沙箱实现测试、开 发、生产环境多集群物理或逻 辑隔离、代码与数据解耦,打 造标准化上线发布管控流程。 PRODUCT 一站式数据开发及管理平台,覆盖大数据开发、任务调度、数据质量、数据治理及数据服务等全链路开发及管理流程。 有数数据开发及管理平台 18 数据+AI 依托于数据中台体系,深度融合数据安 全、管控、治理、分析能力,增强 AI 智能 决策分析。 开放、标准化0 码力 | 43 页 | 884.64 KB | 1 年前3
Moonshot AI 介绍永远都不可能超越OpenAI。OpenAI的很多红利也在于提前预判,它在2018年就⼤概相信⾃⼰在探 索正确的⽅向,花了很⻓时间积累。 海外独⻆兽:让你来做图⽚⽣成这种产品的话,你会怎么做?怎么兼顾语⾔理解和图⽚质量? 杨植麟:现在Midjourney在图⽚⽣成这个单⼀任务已经做得特别好了,我来做的话会希望它能做很多 任务,同时在其中的⼀些任务也能做得很好。这其实也是OpenAI的思路,只是它其实没做成功。 这也是我们以始为终地去思考这个事情,我们认为,与C端⽤⼾共创也是在做AGI,这可能本⾝也是 ⼀个必要的前提。AGI不能闭⻔造⻋,这⾥⾯核⼼的⼀个点是数据,如果不跟⽤⼾共创,很难有⾜够⾼ 质量的数据,就没办法知道模型真正被⽤起来之后会产⽣什么问题,很难跟⽤⼾⼀起去在很多场景⾥ 做更深⼊的挖掘和优化。我甚⾄觉得,这在很⼤程度上也是⼀个必要的前提条件。 张鹏:所以这件事⼜回到了对于⽬标的 ⽽“更好的办法”也是第⼆阶段与第三阶段的分野。在这个⽅向上,我们看到⼤约5年的窗⼝期之中, 我们需要去解决⽬前看到的问题,不断技术创新,让技术变得更加通⽤和低⻔槛,最终推动⼤规模的 产品化。 在这个阶段,更好的模型质量通常会直接带来更好的⽤⼾体验,通过技术驱动的公司会拥有更⼤的产 品优势。如果我们去看美国市场,⽬前领先的公司例如OpenAI,Anthropic,Inflection,CharacterAI0 码力 | 74 页 | 1.64 MB | 1 年前3
中国开源软件产业研究报告老话说“需要是发明之母”),但太多的软件开发人员并不需要也不热爱他们 正在开发的软件,他们把编程当差事,为的只是拿薪酬。Linux世界里可不是 这样——也许这可以解释为什么Linux社区里原创软件的平均质量是如此之高。 5 ©2022.2 iResearch Inc WEB应用开发以及手机/移动开发占据了开 源项目的一半以上,其中开发工具于2020 得到巨大发展 开源项目增长迅速,在各行业中的渗透率加深 全球开源项目的数量增长迅速,中国开发者与开源项目均实现迅速增长,高质量项目数量同步增多。2021年GitHub上的中 国开发者人数达到755万,Gitee上开源项目数量增长率达到192%,其中Star数破千的项目数量增长率达到132%,2020年 Gitee上的代码仓 decisions about the future of the project. 当项目通过孵化器进入Apache软件基金会的时候,我们最关注的是项目的社区 是否具备多样性和可持续性,而不是它的代码是否具备高质量的生产力。项目向 理事会进行月度汇报的时候,理事会不会去评估这些项目的技术进展,而是会考 量它们是否具备可持续性、对社区中的新人是否友好、是否拥有一个足够健壮的 社区来为其未来的发展持续做出决策。0 码力 | 68 页 | 3.63 MB | 1 年前3
2020 中国开源年度报告
但是,另⼀个值得注意的现象,也可以从下⾯的数据⾥看出来。在 GitHub 上最活跃的中国开 源项⽬,与 Gitee 上最活跃的开源项⽬之间,完全没有重叠。 随着 Gitee 的继续⾼速发展,可以⼤胆预测,今后会有越来越多的,⾼质量的中国开源项 ⽬,选择在 Gitee 上开源。曾经有⼀位朋友提到的 “One World, Two Systems”,将会逐 渐变成现实。 如果中国的开源,以⼀种与世界隔离的⽅式 “崛起”,这并不是我们希望看到的未来。 【专家点评】 吴晟:能够获得开源收⼊⽐例和开源参与时间超过 20 ⼩时的⽐例⾼度⼀致,很好的显示出商 业价值在开源贡献强度上的显著变化。虽然,贡献时间和收⼊并不代表开源贡献和开源项⽬的 质量,但⾼质量的项⽬需要⼀定的商业⽀持才能得到良性循环。 陈阳:有12%的参与者从开源中获得兼职或全职收⼊, 开源布道师, 开源运营经理, 开源 开发者等都是2020年的热⻔职业,这说明开源的⽣态正在进⼀步完善, 打磨。⻜桨作为我国最早开源、功能最为完备的深度学习平台,⼀直秉持开放透明的理念进⾏ 开源开发。⻜桨结合 AI 产业发展需要,在框架整体设计以及全流程开发⼯具⽅⾯保持了前瞻 性整体设计,保持对⼯程质量的极致追求,并通过社区机制进⾏质量的有效保障,凭借项⽬质 量在⼴⼤ AI 开发者中形成了良好的⼝碑。 ⻜桨⼀直⾮常关注开发者对社区的贡献和认同感。⻜桨⽬前除了已经有 5,000 多位开源开发 者通过 PR 或者提0 码力 | 46 页 | 4.09 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)可中,商标 所有人应当对商标被许可人提供的相关商标商品或服务进行质量控制,故而因商标所有人缺失对 该等商品或服务质量控制而导致消费者遭受欺诈的情形即为“裸许可”,这将导致推定商标所有 人放弃商标,继而造成商标所有人失去商标权ii。 在通常情况下,许可过程中的“质量控制”可以通过制定技术标准或技术手段等来实施,但在开 源项目中,“质量控制”的实施是复杂的,如果没有商标许可使用的专门规范,商标所有权人很 很 少有机会严格控制根据开源许可协议所修改和分发的软件的质量。鉴于OSI批准的许可证中有部 分许可证并未对明确排除任何商标使用(如只禁止背书、广告或其他特定行为),因此可以考虑 采取一些措施来规避这类风险,例如在开源许可证中添加条款,以标明商标并声明未授予任何许 可;如果不适合在开源许可证中添加条款,可另行添加商标声明,例如OpenJDK商标声明;也可 在社区网站上发布商标使用指南,规范商标授权使用的场景和方式等等 - 通过公共管理实体在公共管理环境中开发独特的软件解决方案,确保为公共管理表现提供最佳和 高效支持。 - 建立一个统一的、明确的平台,用于开发和推广在公共行政领域的开源软件项目,以支持公共行 政的最高质量的绩效,并持续优化在公共行政领域进一步发展开源软件解决方案所需的资源。 - 向公共行政机构提供确切的、经过验证并已实施的软件解决方案,包括支持、咨询和转让等经验。 - 在公共行政机构互相分享各自的专业知识时,需尽可能降低成本。0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 开源内容传播应用与 迭代升级,达到社会 www.iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区 赋能开源全产业生态的循环流转与运行规范 发起者 代码/文档贡献 参与社区互动 开发者 运营: 开 源 基 金 会 为 运营者 使用者 开源代码托管平台 代码维护:对代码进行日常维护,如 审核开发者贡献的代码质量 开源社区 治理与运营者建立开源社区,提供开 发者交流平台,包括建立sig中心、设 立公开课等 开源项目运营 开源基金会 提供基础软件 发起者选择 性捐赠项目 10 ©2023.11 iResearch0 码力 | 43 页 | 4.69 MB | 1 年前3
2021 中国开源年度报告段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人单位越来越认可学生 在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应该也不乏各种刷榜行为,需要开源项目所 有者更多关注学生贡献者增多所带来的质量、合规等问题。 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养 , 越来越多的学生参与到开 源开发中,开源人才培养周期前置,越来越多的学校开设开源课程,希望后续可以实现在学习计算机、编译原 通常需要管理开源产品路线图和专有产品路线图这两个路线图,如何确定哪些功能开源,哪些功能专有 是产品管理中非常重要的部分。 当一个开源项目刚刚开始的时候,需要重点吸引新开发者用户,建立项目“品牌”。企业应该持续投入反 馈社区,打造高质量产品及内容的产出,以此维护社区信任,吸引更多的开发者加入社区来加速社区扩张。 86 在社区运营方面,项目创始人往往是社区的灵魂人物。创始人可通过参加面向开发者的会议与在线讨论会, 并撰写有关该 参与到开源项目中,以此增加项目的影响 力。线上运营方面,官网要有清晰的目标、蓝图和路线,让开发者理解项目本质,从而吸引开发者参与。 并且要积极进行社交网络的运营,例如维护公众号等社交媒体,发表高质量的技术文章,以解决问题的 心态帮助开发者等等。对 GitHub 社区应该进行及时的响应与维护,对开发者需求及时响应,定期维护 2021 中国开源年度报告 95 代码,及时更新说明文档。除此之外还应拓宽渠道推广,不断加强0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人 单位越来越认可学生在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应 该也不乏各种刷榜行为,需要开源项目所有者更多关注学生贡献者增多所带来的质量、合 规等问题。 Duan Xihua: In recent years, the proportion of students in the open source population is an integral part of product management. 当一个开源项目刚刚开始的时候,需要重点吸引新开发者用户,建立项目“品牌”。企业应该 持续投入反馈社区,打造高质量产品及内容的产出,以此维护社区信任,吸引更多的开发者加 入社区来加速社区扩张。在社区运营方面,项目创始人往往是社区的灵魂人物。创始人可通过 参加面向开发者的会议与在线讨论会,并撰写有关该项目的技术文章、参与论坛等等方式进行 PQLs、TTV(新用户到达他们的“aha moment”或激活事件并实现价值所需 的时间)等。在转化阶段,企业应该根据免费版软件的使用行为反馈,进行有针对性的转换跟 进和追加销售。最后在留存阶段,产品质量是能否留住客户的最根本因素。只有持续地为客户 提供价值,才能提高客户留存率。开源软件的销售也可以兼容传统 SLG 模式和 PLG 模式。一 方面,PLG 模式免费版产品面向个人,或中小企业,或者大企业员工用户,扩大用户基数;另0 码力 | 199 页 | 9.63 MB | 1 年前3
共 10 条
- 1













