2021 中国开源年度报告一个开源项目进行判断时往往会综合考虑以下几点 :在产品开发阶段 重点要看企业是否拥有代码所有权和控制权以及是否具备国际竞争力; 社区运营阶段主要看企业是否具备足够强的运营能力 ;而在商业化探 索阶段,市场匹配能力与商业模式的成熟度将成为主要关注点。 作为领域内最早关注并持续耕耘开源的机构,云启资本曾在早期成 功发掘并投资了 PingCAP、Zilliz、Jina AI 等开源企业。 本章内容由云启资本投资团队撰写,主要内容包括 球的公司和学校参与进来,增加项目知名度 ;与学术界合作,发表顶级论文,增加业界影响力等。 图表 28 :TiDB 社区运营模式 资料来源:PingCAP 官网 4.1.4 市场匹配能力——商业化探索阶段 首先,开源项目应该具有产品 - 市场契合。产品与市场的契合体现在用户对软件的初始采用率,可以用 下载量这一指标进行衡量。产品市场契合度主要是用来衡量免费产品的用户基数,因为在开源的商业模 stars 达到 9.4k+,fork 数达到 1k+,总下载量超过 100 万次。Jina 用户场景多样,可以满足 不同行业对神经搜索的需求,比如游戏制作公司的 3D 模型,电商网站上的图像和能够理解混合语义的 2021 中国开源年度报告 103 问答聊天机器人。Jina 在资本市场上也受到多个知名投资机构认可,目前公司总融资金额已达到 3,900 万美元,最新 A 轮融资 3,000 万美元0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告项目进行判断时 往往会综合考虑以下几点:在产品开发阶段重点要看企业是否拥有代码所有权和控制权以及是 否具备国际竞争力;社区运营阶段主要看企业是否具备足够强的运营能力;而在商业化探索阶 段,市场匹配能力与商业模式的成熟度将成为主要关注点。 Capital is an essential participant in the development of the open source TiDB community operation model 资料来源:PingCAP 官网 Source: PingCAP official website 4.1.4 市场匹配能力——商业化探索阶段 Market matching capability - Commercial exploration stage 首先,开源项目应该具有产品-市场契合。产品与市场的契合体现在用户对软件的初始采用率, 达到 9.4k+,fork 数达到 1k+,总下载量超过 100 万次。 Jina 用户场景多样,可以满足不同行业对神经搜索的需求,比如游戏制作公司的 3D 模型,电 商网站上的图像和能够理解混合语义的问答聊天机器人。Jina 在资本市场上也受到多个知名投 资机构认可,目前公司总融资金额已达到 3,900 万美元,最新 A 轮融资 3,000 万美元,该轮 融资由新投资方美国投资机构 Canaan0 码力 | 199 页 | 9.63 MB | 1 年前3
2023 中国开源开发者报告工分得利润超过 1500 万。 联通公司不仅对老用户进行这种强制更换光猫的行为,还会在给新用户装机 的时候,故意使用破旧光猫,也就是之前强迫用户换新留下的,而再过一段 时间之后,又会告诉用户使用的是旧光猫无法匹配,必须换新。联通公司还 会故意关掉用户的短信服务,在后台增加增值业务,之后再把短信功能打开, 以此牟利。 这种强制更换光猫的行为并非新 鲜事。早在 2022 年上半年,就有 不少用户投诉联通公司,以宽带 / 87 LLM 的工具和平台:开发工具 比较有代表性的 LLM 开发工具有: :帮助用户极致优化 给大模型的提示词(prompt),使得对大语 言模型提问时,可以获得更理想的输出。 :用于语义搜索、LLM 编排和语言模 型工作流的一体化嵌入数据库,可以使用 SQL、对象存储、主题建模、图形分析和多模 态索引进行矢量搜索。 :专注以 Sketch、PSD、静态 图片等形式的视觉稿作为输入,通过智能化技0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告JetBrains、GitHub(网站)等,都 在逐渐加入 AI 功能,使得 AI 功能逐渐融入到我们的日常工作中。 在 IntelliJ IDEA 中,我们可以看到 AI 功能的加入,如:原生的向量化模型、基于语义化搜 索(SearchEverywhere)、结合补全统计的机器学习补全插件 Machine Learning Code Completion、适用于单个代码行的 Full Line Code Completion 据转化为有价值的资产,助力企业大规模部署 AI。 对于结构化数据,如对话历史记录和其他数据源的存储管理同样重要。向量数据库如 Chrom、Weaviate、Pinecone、Milvus 等,提供了语义检索和向量存储功能,使得 AI 应用 能够利用超出模型上下文限制的数据源。传统数据库 PostgreSQL 现在也支持通过 pgvector 扩展进行向量搜索,基于 PostgreSQL 的公司如 络搜索的工具。随着更多代理应用的构建,工具生态系统将持续扩展,提供更多新功能,如认证 和访问控制。 在代理应用中,记忆管理同样关键。开源项目 Mem0 将记忆分为短期记忆和长期记忆,后 者进一步细分为事件记忆、语义记忆和程序记忆,并基于此抽象出一套记忆管理 SDK。Zep 通 过时态知识图谱管理和更新用户信息,跟踪事实变化并提供最新数据线索。MemGPT 借鉴了计 64 / 111 算机操作系统内存管理0 码力 | 111 页 | 11.44 MB | 8 月前3
网易数帆 领先的数字化转型技术与服务提供商 2021等技术,针对视频、图像、音频、文本等 多媒体内容进行基础识别与解析,获得离散的内容表示信息。 综合内容理解 基于离散的内容解析结果,结合领域知识和多模态融合技术, 综合分析与推理获取内容的层次化语义描述及统计分析信息, 提高运营管理效率与内容搜索推荐效果。 字幕制作工具 支持识别中文、英文、中英混合的视音频内容,并自动生成字幕 文字和时间轴信息。自带翻译功能,可一键生成中英双语字幕。 广泛0 码力 | 43 页 | 884.64 KB | 1 年前3
Moonshot AI 介绍海外独⻆兽:Chatbot⼀直是AI科学家的⽩⽉光,如果每个⽤⼾每天和Chatbot对话⼏百条, Chatbot系统能采集和理解更多的⽤⼾context,最终会⼤幅超越搜索和推荐系统的匹配准确率吗? 就像我们和同事家⼈之间的互动,只需要⼀句话甚⾄⼀个眼神对⽅就懂你的意思。 杨植麟:核⼼是跨越信任这⼀步。 我觉得最终衡量⼀个AI产品的⻓期价值,就是看⽤⼾愿意在它上⾯输⼊多少个⼈化的信息,然后 划性的创新,⽽是后置性 的,我可能要去试⼀下才知道。AGI得有⼀个底层的机器,它在⼀个更系统的⽅式下做很多东西。 这两者是⼀个fundamental的区别。因为你的组织要跟你做事的⽅式相匹配,当你做事情的底层逻辑 发⽣了变化的时候,就需要新的组织形式。在互联⽹时代产⽣了很多⾮常好的组织,他们可能在某些 领域⽐如跟推荐系统相关的产品都⾮常擅⻓,但是有可能在新的时代,会有⼀些⾮常擅⻓AGI的组织 同的模型其实是⼀定程度的互补,⽽不是冲突 的关系,如何取舍其实是看每个公司不同的策略。 我们的策略是希望去打造超级应⽤,这是我们⽬前专注的地⽅,所以会把时间都花在上⾯。 以终为始,ToC⽅向匹配AGI的终极⽬标 张鹏:听起来你们接下来不是要做api或者帮助企业训练⾃⼰的⼤模型落地到他们的业务⾥,⽽是要做 toC的业务。其实在上⼀波AI浪潮⾥我们可以看到,没有在toC领域⾥有太多的突破,基本上做的还0 码力 | 74 页 | 1.64 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)0发布,版本特性更新 如下: • 各语言源码构建包版本升级; • 支持一键删除应用及应用下相关资源; • 使用集群命令行创建的pod有合理的回收机 制; • 域名配置https证书时,增加搜索功能或优 先匹配与域名相同的证书; • 支持配置日志存储路径。 近日,Prometheus v2.44.0发布,版本特性更 新如下: • 将每次发送的默认样本数提高到2000; • 支持处理原生直方图数据; • 以便进行更全面的分析和监控; • 支持对所有主机进行外部授权; • HttpProxy的条件块还增加了对精确路径匹 配条件的支持; • 支持内部重定向; • 对基于HTTPProxy资源的路由实现了HTTP 查询参数匹配功能。 Flagger v1.31.0发布 Flagger是基于Kubernetes的开源工具,用 于实现持续交付和自动化部署。它提供流量分 配管理、故障检测和回滚机制等功能,帮助开 发人员和运维团队实现高效可靠的应用程序部0 码力 | 22 页 | 1.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书软硬件生态适配、兼容,才能更好的发挥其资源管理者的作用。这种适配是双向 的,不同应用场景操作系统适配的生态也有所差异,随着场景的不断创新增加,生态适配性问题日渐复杂,仅靠单个操作系统发行 商进行生态匹配难以解决问题,需要开源集合更多的开发者力量进行帮助。 开源帮助操作系统优化性能、提升使用体验:在常见的操作系统开源sig分布中,大量的开发者有序的渗入到不同功能板块的代码仓 中,帮助客户端进一步用好0 码力 | 43 页 | 4.69 MB | 1 年前3
2020 中国开源年度报告
的可扩展、冗余和分布式对象存储。 在上述三个项⽬中,carbondata 明显不在 UTC+8 时区,⽽在 UTC+4、5 时区,这是因为 其主要维护者 Ravindra Pesala 是印度⼈,与时区匹配;teaclave 的时间分布则完全是美国时 间,中国⽩天⼏乎都是静默期,虽然是百度捐献的项⽬,但其维护者 Mingshen Sun 其实位于 美国⻄海岸,⽽⾮国内;相⽐⽽⾔,hadoop-ozone0 码力 | 46 页 | 4.09 MB | 1 年前3
共 9 条
- 1













