Moonshot AI 介绍Losslesslongcontextiseverything。这是我们跟杨植麟聊完两个⼩时后记忆最深刻的⼀个观点。 这个技术判断在23年10⽉已经被传递出来,当时杨植麟创⽴的⽉之暗⾯发布了⾸个模型moonshot 和智能助⼿Kimi,⽀持20万字的输⼊。做“⻓”是因为杨植麟判断AI-Native产品的终极价值是提 供个性化的交互,⽽losslesslong-context是实现 本⽂还试图回答另⼀个外界普遍关⼼的问题:⼀家新创⽴的AGI公司如何超越OpenAI?杨植麟的答案 是techvision,⼀号位要能做出技术判断,同时还能拍板执⾏。⼀个具体的例⼦是,⽉之暗⾯希望⽐ OpenAI更关⼼⽤⼾,原因是杨植麟判断⽤⼾数据的scaleup的效果最终会超越basemodel⾃⾝。 杨植麟对于⽤transformer这个概率模型的思想基础⾛向 follow,成本可以降到⾮常低。最终,你对模型个性化的过程实际上就是你所有的交互历史,也是⼀ 个包含了你的偏好和反馈的集合,这些反馈会⽐上个时代的产品更直接,因为它是完全通过对话界⾯ 产⽣的。 基于这个判断,进⼀步就会想:如何在技术层⾯实现基于long-context的定制化去完全取代微调? 我认为现在正在往这个⽅向⾛,未来模型不需要微调,⽽是通过强⼤的上下⽂⼀致性和指令跟随能⼒ 来解决问题0 码力 | 74 页 | 1.64 MB | 1 年前3
清华大学 普通人如何抓住DeepSeek红利在AI时代,知识的获取成本趋近于零,拥有知识不再是核心竞争力。利用提示词创造知识,引领创新、明确 方向,成为社会与个人竞争力的关键。 p 选择中的再创造 面对AI提供的多种解法,人类需具备批判性思维与逻辑判断能力,通过选择最优答案,实现解决方案的创新 性再生。 p 智慧赋能的决策力 提出问题与甄别答案的能力,使人类在信息爆炸与AI辅助的时代,通过决策行为实现价值创造,成为社会发 展的持续动力。 4,参考Kleinberg (1999) 的社交 网络分析研究,强调相关性优先于冗余性。这一配比平衡了生成内容的创新性与冗余性,为AI生成 文本质量的评估提供了量化依据。 AI的内容生成的边界如何判断 50 智能体认知循环边界并非终点,而是人类探索未知领域和创造 新价值的起点。研究提出基于“自指性”和“循环性”的测量 机制,识别智能体生成内容触及边界的临界点,为优化生成内 容提供量化依 一次性提问复杂逻辑 任务需求与提示语策略 "以下是某论文结论:'神经网络模型A优于传统方法B'。 请 验 证 : ① 实验数据是否支持该结论; ② 检查对照组设置是否存在偏差; ③ 重新计算p 值并判断显著性。" "为降低物流成本,现有两种方案: ①自建区域仓库(初期投入高,长期成本低) ②与第三方合作(按需付费,灵活性高) 请根据ROl 计算模型,对比5年内的总成本并推荐最优 解。"0 码力 | 65 页 | 4.47 MB | 8 月前3
DeepSeek从入门到精通(20250204)数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: ① 实验数据是否支持该结论; ② 检查对照组设置是否存在偏差; ③ 重新计算p值并判断显著性。" �实战技巧: 分析需求 "分析近三年新能源汽车销量数据(附CSV),说明: ① 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" 控制每个步骤的输出深度,避免冗余 创意激发 多角度提示激发AI的创造性思维 在创意和连贯之间找到平衡 质量控制 多次迭代提高内容质量 需要更多的实践和计算资源 灵活调整 可根据中奖结果随时调整后续提示 实时调整需要较高的判断和决策能力 提示语链的优势与挑战 提示语链的设计原则 01 目标明确性 02 逻辑连贯性 03 渐进复杂性 04 灵活适应性 05 多样性思考 06 反馈整合机制 提示语链的设计需要遵循0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 解。" �实战技巧: "以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: ① 实验数据是否支持该结论; ② 检查对照组设置是否存在偏差; ③ 重新计算p值并判断显著性。" �实战技巧: 分析需求 "分析近三年新能源汽车销量数据(附CSV),说明: ① 增长趋势与政策关联性; ② 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。" 控制每个步骤的输出深度,避免冗余 创意激发 多角度提示激发AI的创造性思维 在创意和连贯之间找到平衡 质量控制 多次迭代提高内容质量 需要更多的实践和计算资源 灵活调整 可根据中奖结果随时调整后续提示 实时调整需要较高的判断和决策能力 提示语链的优势与挑战 提示语链的设计原则 01 目标明确性 02 逻辑连贯性 03 渐进复杂性 04 灵活适应性 05 多样性思考 06 反馈整合机制 提示语链的设计需要遵循0 码力 | 103 页 | 5.40 MB | 8 月前3
人工智能安全治理框架 1.0机制不完善的情况下,有可能输出违法有害内容。 (b)混淆事实、误导用户、绕过鉴权的风险。人工智能系统及输出内容 等未经标识,导致用户难以识别交互对象及生成内容来源是否为人工智能系统, 难以鉴别生成内容的真实性,影响用户判断,导致误解。同时,人工智能生成 图片、音频、视频等高仿真内容,可能绕过现有人脸识别、语音识别等身份认 证机制,导致认证鉴权失效。 (c)不当使用引发信息泄露风险。政府、企业等机构工作人员在业务工 模杀伤性武器制造等高危场景。 4.2.3 认知域风险应对 (a)通过技术手段判别不符合预期、不真实、不准确的输出结果,并依 法依规监管。 (b)对收集用户提问信息进行关联分析、汇聚挖掘,进而判断用户身份、 喜好以及个人思想倾向的人工智能系统,应严格防范其滥用。 (c)加强对人工智能生成合成内容的检测技术研发,提升对认知战手段- 10 - 人工智能安全治理框架 的防范、检测、处置能力。 建立人工智能服务可追溯管理制度。对面向公众服务的人工智能 系统,通过数字证书技术对其进行标识管理。制定出台人工智能生成合成内容 标识标准规范,明确显式、隐式等标识要求,全面覆盖制作源头、传播路径、 分发渠道等关键环节,便于用户识别判断信息来源及真实性。- 11 - 人工智能安全治理框架 5.3 完善人工智能数据安全和个人信息保护规范。针对人工智能技术 及应用特点,明确人工智能训练、标注、使用、输出等各环节的数据安全和个 人信息保护要求。0 码力 | 20 页 | 3.79 MB | 1 月前3
2021 中国开源年度报告商业化过程中的风险点 …………………………………………………………………………… 87 4 投资——如何找到下一个开源独角兽 …………………………………………………… 93 4.1 成功商业开源项目判断标准 ……………………………………………………………………… 93 4.2 中国开源市场 ……………………………………………………………………………………… 96 4.3 资本市场上投资人对开源领域布局力度加大 上有超过2万个优秀开源项目获得了官方推荐,我们对这2万多个项目进行了Gitee指数的分析。 注 :Gitee 指数的评估结果为全站范围的相对值。 2.7.1 Gitee 指数评估维度 1. 影响力 用来判断开发者是否真正关注过该项目,低 Star 数可能是由种种原 因被埋没,而长时间无 Star,可能这个项目并没有辐射到其他开发者。 2. 代码活跃度 项目代码“年久失修”,维护人员可能已经抛弃了该项目,只是忘了 前开源市场下托管、开放核心、混合许可是最为主流科技公司所采 用的,但是企业应根据自身社区以及产品情况进行商业道路的选择。 资本方是促进开源市场发展的重要参与方。对于投资机构来讲,在对 一个开源项目进行判断时往往会综合考虑以下几点 :在产品开发阶段 重点要看企业是否拥有代码所有权和控制权以及是否具备国际竞争力; 社区运营阶段主要看企业是否具备足够强的运营能力 ;而在商业化探 索阶段,市场匹配能力与商业模式的成熟度将成为主要关注点。0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告site-wide relative basis. 2.7.1 Gitee 指数评估维度 Gitee Index Evaluation Dimensions 1.影响力 Impact 用来判断开发者是否真正关注过该项目,低 Star 数可能是由种种原因被埋没,而长时间无 Star,可能这个项目并没有辐射到其他开发者。 It is used to determine if developers business path based on their community and product situation. 资本方是促进开源市场发展的重要参与方。对于投资机构来讲,在对一个开源项目进行判断时 往往会综合考虑以下几点:在产品开发阶段重点要看企业是否拥有代码所有权和控制权以及是 否具备国际竞争力;社区运营阶段主要看企业是否具备足够强的运营能力;而在商业化探索阶 段,市场匹配能力与商业模式的成熟度将成为主要关注点。 primary concerns. 本章内容由云启资本投资团队撰写,主要内容包括: 开源软件商业化成功的底层驱动因素 开源软件公司的可能商业化路径 开源项目投资人判断标准以及案例分享 This chapter is written by the investment team of Yunqi Partners Investment team and covers0 码力 | 199 页 | 9.63 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)实践行为做出了对GPL协议要约的承诺,其负有 GPL协议中的所约定的相关义务。 2、“传染性”的认定。判断GPL协议所能传染的衍生软件或修订版本,区分开源代码与自有代 码,即确定自有代码是如何与开源代码结合或交互是前提。其次应结合代码的使用场景,即结合 代码的功能及其在软件中所起的作用进行判断。最终确定被传染的部分应当是与原开源软件形成 密切通信使得二者高度牵连融合成一体的程序,而非只要有数据交换就会构成传染。未来公司软0 码力 | 22 页 | 1.99 MB | 1 年前3
2024 中国开源开发者报告们的分析与推 演提供了可贵的素材。对软件商业化问题感兴趣的朋友一定要长期关注这个赛道。只有这样的对 象才能更有力地说明开源策略的重要性。 其次,我们得明确一点——大模型竞争的赛点是什么?常用的判断依据包括:技术的先进性, C 端用户基数,依赖这个软件的生态系统大小等等。其中哪个更关键一点? 技术先进是好事,但大模型领域的先进技术远没有达到能为大模型企业带来可观收入的程度。 整个大模型赛 内国际科技交流是同步强化的,北约和华约, 马歇尔计划和莫洛托夫计划:它们一开始纯是出于增强己方实力维持对抗强度的要求,后来也伴 随国家差别观念的消退和市民社会财产观念的滋长。 于是我们似乎可以判断,如果在这一波即将到来的对抗的高潮之后大模型还存在的话,康德 和黑格尔关于国际关系的构想似乎就要在 30 年的实践里逐渐成型。“世界公民观点下的普遍历 史观念”让开源大模型重新具有过去被认为的“0 码力 | 111 页 | 11.44 MB | 8 月前3
Pro Git 中文版 第2版 2.1.66Git 自带的名为 git-http-backend 的 CGI 脚 本。 该 CGI 脚本将会读取由 git fetch 或 git push 命令向 HTTP URL 发送的请求路径和头部信息, 来判断 该客户端是否支持 HTTP 通信(不低于 1.6.6 版本的客户端支持此特性)。 如果 CGI 发现该客户端支持智能 (Smart)模式,它将会以智能模式与它进行通信, 否则它将会回落到哑(Dumb)模式下(因此它可以对某些 新操作(一个非零的退出码将终止推送过程)。 Git 的一些日常操作在运行时,偶尔会调用 git gc --auto 进行垃圾回收。 pre-auto-gc 钩子会在垃圾回收 开始之前被调用,可以用它来提醒你现在要回收垃圾了,或者依情形判断是否要中断回收。 服务器端钩子 除了客户端钩子,作为系统管理员,你还可以使用若干服务器端的钩子对项目强制执行各种类型的策略。 这些 钩子脚本在推送到服务器之前和之后运行。 推送到服务器前运行的钩子可以在任何时候以非零值退出,拒绝推 用户准备推送的修订版本(revision) 如果推送是通过 SSH 进行的,还可以获知进行此次推送的用户的信息。 如果你允许所有操作都通过公匙授权的 单一帐号(比如“git”)进行,就有必要通过一个 shell 包装脚本依据公匙来判断用户的身份,并且相应地设定 环境变量来表示该用户的身份。 下面就假设 $USER 环境变量里存储了当前连接的用户的身份,你的 update 脚 本首先搜集一切需要的信息: #!/usr/bin/env0 码力 | 501 页 | 19.30 MB | 1 年前3
共 33 条
- 1
- 2
- 3
- 4













