云原生虚拟数仓 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如等传统数据库均已支持向量检索。 6 基础设施：大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库，使开发者能够更容易地处理大量的数据、管理巨大的网络参数量，并有效地利用硬件资源。微调（Fine Tuning）是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后，微调是用较小、特定领域的数据集对模型进行后续训练，以使抽象掉了许多底层细节，使开发者能够专注于模型的设计和训练策略。：这些框架经过优化，以充分利用 GPU、TPU 等高性能计算硬件，以加速模型的训练和推理过程。：为了处理大型数据集和大规模参数网络，这些框架通常设计得易于水平扩展，支持在多个处理器或多个服务器上并行处理。：它们提供工具来有效地加载、处理和迭代大型数据集，这对于训练大型模型尤为重要。国产深度学习框架 OneFlow

0 码力 | 32 页 | 13.09 MB | 1 年前
3
普通人学AI指南

1.2 Claude Claude 是 Anthropic 公司开发的一系列大型语言模型，它设计用于执行多种涉及语言、推理、分析和编码的任务。 2.1.3 通义千问通义千问（Qwen）是阿里云开发的一系列预训练的大型语言模型，用于聊天、生成内容、提取信息、总结、翻译、编码、解决数学问题等多种任务。这些模型在多种语言数据上进行预训练，包括中文和英文，覆盖广泛的领域。 2.2 图像 Figure docker 4.2.1 了解 docker 基本用法 Docker 是一个开源的容器化平台，旨在开发、部署和运行应用。它利用容器来隔离软件，使其在不同环境中都能一致运行。Docker 提供轻量级虚拟化，能快速部署并且易于管理应用。 Docker 的优势： 1. 快速部署：Docker 容器可以在几秒钟内启动，提高了开发和部署的效率。 2. 一致性：确保应用在开发、测试和生产环境中具有一致的运行环境。 -e ACCESS_CODE=lobe66 ：设置环境变量 ACCESS_CODE 的值为 lobe66 ，这通常是用于在容器内配置应用程序的参数。 lobehub/lobe-chat:latest ：使用 lobehub/lobe-chat 镜像的最新版本来启动容器。 lobe66，记好，后面启动网页界面时，很快就会用到。

0 码力 | 42 页 | 8.39 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

应对 • 应对模型安全新挑战，打赢未雨绸缪之战 • 大模型是能力而非产品，结合场景才能发挥价值 • 中国拥有最完整的产业链、最全的工业门类、最丰富的场景 • 发挥场景优势，加速传统产业数转智改，打赢弯道超车之战 AGI是全球少数玩家的游戏，政府、企业、创业者更多创新的机会在应用之路 11政企、创业者必读把大模型拉下神坛！走入千家万户、百行千业，才能掀起新工业革命 • 当年IBM做出超级电脑，并没有带来工业万亿参数规模之后，继续增大参数规模难以带来质的提升 • 训练算力成本和工程化难度大幅上升强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 • 通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26政企、创业者必读  预训练模型如GPT——疯狂读书，积认知决定行动，这场全民AI科普对推动中国AI发展功不可没政企、创业者必读开源改变行业格局，建立强大生态  开源战胜闭源，促使全球公司、开发者等转到开源  建立强大生态，成为全球人工智能根技术，无推广情况下各国政府、企业、云厂商纷纷接入，获得全球最大影响力  改变中美竞争格局：美国是闭源封闭垄断思路，中国领导开源文化，加速中国领先地位  中国人民使用的AI工具先进性已超过美国，普及率超过美国，使用AI人口

0 码力 | 76 页 | 5.02 MB | 5 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

对数据进行诊断、预测、关联、聚类分析，常用于问题定位、需求预测、推荐系统、异常检测等。对数据进行分类、社交网络分析或时序模式挖掘，常用于客户细分、信用评分、社交媒体营销、股价预测等。将数据转化为统计图、热力图、网络关系图、词云、树形图等，用于揭示数据中蕴含的模式、趋势、异常和洞见。本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合 AI o3mini 响应速度快，能够高效提取所有需求链接，输出完整可运行python脚本，代码运行后生成文件，但数据采集结果为空。 DeepSeek R1 能够提取所有网址并进行筛选、去重，所撰写代码运行后完成数据爬虫任务，所获取数据准确，少量数据有所遗漏。提示词测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响，仅供参考，无法作为决策制定、质量评估或产品验证的最终依据。代码支持，Claude 3.5 Sonnet 负责图表逻辑优化数据采集数据预处理数据分析可视化呈现新思路：DeepSeek R1的数据应用中文数据处理优势创意写作生成能力数据读取分析能力低成本高性能优势编程代码生成能力 • 智能中文古籍修复与注释：利用 DeepSeek

0 码力 | 85 页 | 8.31 MB | 8 月前
3
Deepseek R1 本地部署完全手册

个⼈⽤户：不建议部署32B及以上模型，硬件成本极⾼且运维复杂。企业⽤户：需专业团队⽀持，部署前需评估ROI（投资回报率）。⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表模型参数 Windows 配置要求 Mac 配置要求适⽤场景 1.5B - RAM: 4GB - GPU: 集成显卡/现代CPU - 存储: 5GB - 内存: 8GB （M1/M2/M3） - 存储: 32B 壁彻算⼒平台+昇腾910B集群科研计算与多模态处理四、云端部署替代⽅案 1. 国内云服务商推荐平台核⼼优势适⽤场景硅基流动官⽅推荐API，低延迟，⽀持多模态模型企业级⾼并发推理腾讯云⼀键部署+限时免费体验，⽀持VPC私有化中⼩规模模型快速上线 PPIO派欧云价格仅为OpenAI 1/20，注册赠5000万tokens 低成本尝鲜与测试 2. 国际接⼊渠道（需魔法或外企上⽹环境 DeepSeek-R1-UD- IQ1_M 158 GB ≥200 GB 消费级硬件（如Mac Studio） DeepSeek-R1-Q4_K_M 404 GB ≥500 GB ⾼性能服务器/云GPU 下载地址： HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议硬件类型推荐配置性能表现（短⽂本⽣成）消费级设备 Mac Studio（192GB统⼀内存）

0 码力 | 7 页 | 932.77 KB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

合问题，以达到10万个的问题数量。这些数据集包含大量的问答对，例如使用 d a t a s e t s 库（Hugging Face的datasets库）来加载SQuAD数据集（Stanford Question Answering Dataset），这个数据集是一个著名的问答数据集，基于维基百科数据生成，并且数据是2020年之前的。 AI幻觉问题抽取：多数据集 AI幻觉问题抽取：多数据集问题加载探讨大语言模型（LLMs）在模拟人类意见动态和社会现象（如极化和错误信息传播）中的表现，特别是引入偏误信息后的意见动态变化。使用大模型模拟多个虚拟代理，讨论“气候变暖”、“转基因食品的安全性”和“疫苗的有效性和安全性”三个具有科学共识的话题。实验一在无偏误信息条件下，代理通过社交网络进行每日对话，记录最终信念状态和信息传播路径。实验二改变初始信念分布，探讨初始条件对结果的 50个智能体的在线社区模拟仿真场景3：多智能体在线社区模拟场景4：无人区研究+快速出成果素数位数关系理论及其思考—— 邵宇捷各思路具体化及 Python验算人类提供已有参考案例（拉马努金数、阿姆斯特朗数等） AI提出可能思路要求AI迭代调整或人类介入提供具体设想 AI发现魔法数字的一般过程思路可用，并非刻意构造有刻意构造嫌疑方案可行输出结果及理论体系化

0 码力 | 65 页 | 4.47 MB | 8 月前
3
DeepSeek图解10页PDF

据特定业务需求对模型进行微调，以适应特定任务，如行业术语、企业内部知识库等。 3. 离线运行，适用于无网络环境。可在离线环境下运行：适用于无互联网连接或网络受限的场景。提高系统稳定性：即使云服务宕机，本地大模型依然可以正常工作，不受外部因素影响。本教程搭建 DeepSeek 好处本地搭建 DeepSeek 三个比较实际的好处： • 本教程接入的是 DeepSeek 推理模型训练目标是最小化预测误差，使其能更好地完成语言任务。 2.3.2 监督微调（Supervised Fine-Tuning, SFT）在预训练之后，通常需要对模型进行监督微调（SFT）：使用人工标注的数据集，让模型在特定任务上优化表现。调整参数，使其更符合人类需求，如问答、对话生成等任务。 2.3.3 强化学习（Reinforcement Learning, RL）采用强化学习（RL）

0 码力 | 11 页 | 2.64 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

方法、功能集成方法、性能指标和评价方法等标准。 4. 计算设备标准。规范人工智能加速卡、人工智能加速模组、人工智能服务器等计算设备，及使能软件的技术要求和测试方法，包括人工智能计算设备虚拟化方法，人工智能加速模组接口协议和测试方法，及使能软件的访问协议、功能、性能、能效的测试方法和运行维护要求等标准。 5. 算力中心标准。规范面向人工智能的大规模计算集群、新型数据中心、造、营销服务、运营管理等制造业全流程智能化标准，以及重点行业智能升级标准。 1. 研发设计标准。研制跨领域知识整合、新型设计模式生成、人机协同研发设计等标准。 2. 中试验证标准。围绕高精度、全流程仿真模型，研制智能虚拟中试标准，以及复杂工业场景新技术应用验证标准。 3. 生产制造标准。研制生产过程智能化、产线监测及维护等标准。 4. 营销服务标准。围绕营销服务效率提升，研制智能客服、数字人、商品三维模型标准，以及用户体验等标准。

0 码力 | 13 页 | 701.84 KB | 1 年前
3
DeepSeek从入门到精通(20250204)

从“下达指令”到“表达需求” 策略类型定义与目标适用场景示例（推理模型适用）优势与风险指令驱动直接给出明确步骤或格式要求简单任务、需快速执行 “用Python编写快速排序函数，输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空间需求导向描述问题背景与目标，由模型规划解决路径复杂问题、需模型自主推理 “我需要优化用户登录流程，请分析当前瓶颈并提出3种方 3. 创造性需求需生成新颖内容（文本/ 设计/方案）主题 + 风格/约束 + 创新方向结合逻辑框架生成结构化创意自由发散，依赖示例引导 4. 验证需求需检查逻辑自洽性、数据可靠性或方案可行性结论/方案 + 验证方法 + 风险点自主设计验证路径并排查矛盾简单确认，缺乏深度推演 5. 执行需求需完成具体操作（代码/ 计算/流程）任务 + 影响，以及如何共同推进总体目标的实现。” 5. 时序提示：“为每个子任务制定一个粗略的时间表，考虑它们的依赖关系和完成所需的相对时间。” 6. 资源分配提示：“评估每个子任务的复杂度，分配1—10的'注意力分数'，指导在执行过程中如何分配计算资源。” 7. 适应提示：“在执行每个子任务后，评估其输出质量和对总体目标的贡献，必要时调整后续任务的优先级或内容。” 思维拓展的认知理论基础生成阶段（Ge

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

从“下达指令”到“表达需求” 策略类型定义与目标适用场景示例（推理模型适用）优势与风险指令驱动直接给出明确步骤或格式要求简单任务、需快速执行 “用Python编写快速排序函数，输出需包含注释。” ✅ 结果精准高效 ❌ 限制模型自主优化空间需求导向描述问题背景与目标，由模型规划解决路径复杂问题、需模型自主推理 “我需要优化用户登录流程，请分析当前瓶颈并提出3种方 3. 创造性需求需生成新颖内容（文本/ 设计/方案）主题 + 风格/约束 + 创新方向结合逻辑框架生成结构化创意自由发散，依赖示例引导 4. 验证需求需检查逻辑自洽性、数据可靠性或方案可行性结论/方案 + 验证方法 + 风险点自主设计验证路径并排查矛盾简单确认，缺乏深度推演 5. 执行需求需完成具体操作（代码/ 计算/流程）任务 + 影响，以及如何共同推进总体目标的实现。” 5. 时序提示：“为每个子任务制定一个粗略的时间表，考虑它们的依赖关系和完成所需的相对时间。” 6. 资源分配提示：“评估每个子任务的复杂度，分配1—10的'注意力分数'，指导在执行过程中如何分配计算资源。” 7. 适应提示：“在执行每个子任务后，评估其输出质量和对总体目标的贡献，必要时调整后续任务的优先级或内容。” 思维拓展的认知理论基础生成阶段（Ge

0 码力 | 103 页 | 5.40 MB | 8 月前
3

共 12 条前往

页

分类

语言

格式