Trends Artificial Intelligence
Compounding = Numbers Behind The Momentum13 AI Technology Compounding = Numbers Behind The Momentum14 260% Annual Growth Over Fifteen Years of… Data to Train AI Models Led To… Note: Only “notable” language Searches in 2 Years (2024) vs. Google’s 11 Years (2009) 0 2,500 5,000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Google Search ChatGPT Years Since Public Launch (Google = Apple acquires Siri voice assistant & integrates it into iPhone 4S model one year later 6/14: Eugene Goostman, a chatbot, passes the Turing Test, with 1/3 of judges believing that0 码力 | 340 页 | 12.14 MB | 5 月前3
DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Model. . . 13 3.2.2 Evaluation Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.2.3 Training and Inference Efficiency . . . . . . . . . . . . . . . . . . . . . . . . 16 4 Alignment MLA performs the following computation: [q? ?,1; q? ?,2; ...; q? ?,?ℎ] = q? ? = RoPE(???c? ? ), (14) k? ? = RoPE(? ??h?), (15) q?,? = [q? ?,?; q? ?,?], (16) k?,? = [k? ?,?; k? ? ], (17) o?,? = English, code, and math benchmarks. As for Chinese benchmarks, Qwen1.5 72B shows better performance on 14 Benchmark (Metric) # Shots DeepSeek Qwen1.5 Mixtral LLaMA 3 DeepSeek-V2 67B 72B 8x22B 70B Architecture0 码力 | 52 页 | 1.23 MB | 1 年前3
OpenAI 《A practical guide to building agents》include tool calls, a certain structured output, errors, or reaching a maximum number of turns. 14 A practical guide to building agents For example, in the Agents SDK, agents are started using the you could implement this pattern in the Agents SDK: Python 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 from import "manager_agent" "You are a translation agent. You use service workflow that handles both sales and support: Python 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 from agents import Agent, Runner technical_support_agent0 码力 | 34 页 | 7.00 MB | 6 月前3
普通人学AI指南. . . . . . . . . . . . . . . . 13 3.1.2 步骤 2:安装 Llama . . . . . . . . . . . . . . . . . . . . . 14 3.1.3 使用 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2 大模型 phi-3 . . . . . . . Llama3,打开新的终端/命令行窗口,执行以下命令: ollama run llama3 程序会自动下载 Llama3 的模型文件,默认是 8B,也就 80 亿参数版本,个 人电脑完全可以运行。等待安装完成,如图 12 所示。 14 Figure 12: Ollama 里下载 Llama3 界面 以上就已经安装完毕,到现在大模型已经在本地部署完成。 3.1.3 使用 Llama3 打开一个终端窗口,再次输入 ollama Figure 13: Ollama 里下载 Llama3 界面 发第一条消息,” 你是谁,用中文回答”,与 Llama2 相比,Llama3 确实在 回答速度上大幅提升,小于秒级,如图 14 所示: 15 Figure 14: 第一次提问:你是谁,用中文回答 发第二条消息,”Python 代码,冒泡排序,代码 + 解释”,回答响应非常快, 如图 15所示: Figure 15: 第二次提问:Python0 码力 | 42 页 | 8.39 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人次”的网址进行去重、筛选,合并成网址列表 2.撰写python脚本,基于步骤1输出的网址列表提取所有网 址内容“截至目前 2025 年春运(2025年1月14日到2月8日) 相关数据(如日期、全社会跨区域人员流动量、铁路客运 量、公路人员流动量、水路客运量、民航客运量等)”完 成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 输出结果格式工整、简洁。 DeepSeek R1 能够详细全面地提取文件中的 数据,并整理成可视化数据表 格,逻辑性强、指标清晰。 所上传的“2025春运数据(1月14-2月8日).txt”包含了从2025年1月14日至2025年2月8日每天各种交通方式的春运客运 量信息,请从中读取每一天的信息,并整理成一张表格,要求包括以下几项信息:1.当天日期;2.当天的铁路客运量、 比2024年同期多或者少的百分比、环比的百分比。3 硬件配置和优化策略,DeepSeek可以在本地环境中高效运行,为用户提供强大的AI支持。 DeepSeek 在端侧部署中展现出较强的适应性和灵活性。 模型轻量化 DeepSeek通过蒸馏技术优化小模 型(1.5B/7B/8B/14B/32B/70B 参数规模),使其在本地部署中表 现出色,适合存储和计算资源有限 的端侧设备。 实时性 在端侧设备上,DeepSeek 能够满足实时性要求,例如 在智能家居、自动驾驶等场0 码力 | 85 页 | 8.31 MB | 8 月前3
Deepseek R1 本地部署完全手册RAM: 8-10GB - GPU: GTX 1680(4-bit量 化) - 存储: 8GB - 内存: 16GB(M2 Pro/M3) - 存储: 8GB 中等复杂度问答、代码 调试 14B - RAM: 24GB - GPU: RTX 3090(24GB VRAM) - 存储: 20GB - 内存: 32GB(M3 Max) - 存储: 20GB 复杂推理、技术⽂档⽣ DCU 适配V3/R1模型,性能对标NVIDIA A100 等效A100(BF16) 2. 国产硬件推荐配置 模型参数 推荐⽅案 适⽤场景 1.5B 太初T100加速卡 个⼈开发者原型验证 14B 昆仑芯K200集群 企业级复杂任务推理 32B 壁彻算⼒平台+昇腾910B集群 科研计算与多模态处理 四、云端部署替代⽅案 1. 国内云服务商推荐 平台 核⼼优势 适⽤场景 硅基流动 官⽅推荐API,低延迟,⽀持多模态模型 com/DeepSeek-R1 12. Cursor:https://cursor.sh/ 13. Monica:https://monica.im/invitation?c=ACZ7WJJ9 14. Lambda:https://lambdalabs.com/ 15. Cerebras:https://cerebras.ai 16. Perplexity:https://www0 码力 | 7 页 | 932.77 KB | 8 月前3
Google 《Prompt Engineering v7》story, or instructions. The name zero-shot stands for ’no examples’. Prompt Engineering February 2025 14 Let’s use Vertex AI Studio (for Language) in Vertex AI,6 which provides a playground to test prompts The recipient should take immediate action to fix the bug and investigate the sender’s claims. Table 14. An example of prompting for self consistency You can use the above prompt and try to see if it returns content) as well as set up the model with appropriate examples/instructions. Please refer to the notebook14 hosted in the GoogleCloudPlatform Github repository, which goes into a bit more detail showing the0 码力 | 68 页 | 6.50 MB | 6 月前3
XDNN TVM - Nov 2019Copyright 2018 Xilinx Xilinx Edge DPU IP (DPUv2) Source: Published results from Huawei 18% 13% 14% 40% 24% 23% 85% 51% 52% 0% 20% 40% 60% 80% 100% VGG16 ResNet-50 GoogleNet-V3 Aristotle Xilinx FPGA Pipeline report in MLSuite 1.5 (animated gif of ResNet-50, view in slideshow mode) >> 14© Copyright 2018 Xilinx Quantization Tool – vai_q ˃ 4 commands in vai_q quantize ‒ Quantize network0 码力 | 16 页 | 3.35 MB | 5 月前3
TVM@AliOS14 TVMQ@Alios AIOS ! 驱动万物智能 PRESENTATION AGENDA 人 人 e 人 e@ TVM Q@ AliOs Overview TVM @ AliOs ARM CPU TVM @ AliOos Hexagon DSP TVM @ Alios Intel GPU Misc /NiiOS ! 驱动万物智能 PART ONE TVM Q@ AliOs Hexagon DSP For128 x 32 x4 GEMM: Vv9.w = vmpyio(v5.w,Vv@.h) } v10.w = vmpyio(v7.w,v1.h) Vv8.w = vasL(v14.w,rl1) } v6.w += vmpyie(v12.w,v3.uh) nop } :endLoop0 v8.w += vmpyie(v4.w,Vv2.uh) vasL(v10.w, rl) }0 码力 | 27 页 | 4.86 MB | 5 月前3
人工智能安全治理框架 1.0……………………………… 12 6.1 模型算法研发者安全开发指引 ……………………… 12 6.2 人工智能服务提供者安全指引 ……………………… 13 6.3 重点领域使用者安全应用指引 ……………………… 14 6.4 社会公众安全应用指引 ……………………………… 15 目 录- 1 - 人工智能安全治理框架 人工智能是人类发展新领域,给世界带来巨大机遇,也带来各类风险挑战。 落实《全球人工 使用者。 (j) 研发者应生成详细的测试报告,分析安全问题并提出改进方案。 6.2 人工智能服务提供者安全指引 (a)服务提供者应公开人工智能产品和服务的能力、局限性、适用人群、 场景。- 14 - 人工智能安全治理框架 (b)服务提供者应在合同或服务协议中,以使用者易于理解的方式,告 知人工智能产品和服务的适用范围、注意事项、使用禁忌,支持使用者知情选 择、审慎使用。 (c)服0 码力 | 20 页 | 3.79 MB | 1 月前3
共 15 条
- 1
- 2













