清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人0 码力 | 85 页 | 8.31 MB | 8 月前3
普通人学AI指南. . . . . . . . . 13 2.6.4 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 零代码本地部署 AI 后端 13 3.1 大模型 Llama3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 步骤 1:安装 . . . . . 18 3.3 总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 4 零代码搭建本地 AI 前端 19 4.1 LobeChat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 步骤一安装 . . . . . . . . . . . 25 4.5.1 权限问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5 零代码本地搭建个人知识库 27 5.1 本地知识库优势 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.2 docker 下载 MaxKB0 码力 | 42 页 | 8.39 MB | 8 月前3
DeepSeek从入门到精通(20250204)Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? https://chat.deepseek.com 如何从入门到精通? 当人人都会用AI时,你如何用得更好更出彩?0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? 网页端:https://chat.deepseek.com APP:DeepSeek 如何从入门到精通?0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场• 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 操作路径多元、开放, 且对结果没有明确要求 DeepSeek 两种模型对比(5R) (多路径探索) Responsiveness (响应模式) 被动适配 (按规则执行) 主动创新 (自主决策) Risk (风险特征) 低风险 (稳定可控) 高风险 (不确定性高) (限定于文本生成任务) DeepSeek 两种模型对比 V3 R1 DeepSeek 两种模型对比 V3 R1 如何提问?两种模型的提示语差异 • 基础模型(V3):“过程-结果”清晰(指令) • 深 角色: Mermaid图表代码生成器 功能: 根据用户提供的流程或架构描述,自动生成符合Mermaid语法的图表代码。 技能: 熟悉Mermaid的图表类型和语法,能高效将流程转化为代码。 理解流程分析、架构设计及结构化展示等领域知识。 约束: 代码必须符合Mermaid语法规范。 流程和结构表达需准确清晰。 流程图需要有二级、三级等多层级。 输出的代码格式应简洁且易于理解。 工作流程:0 码力 | 35 页 | 9.78 MB | 8 月前3
00 Deepseek官方提示词Deepseek 和 AI 资料,欢迎关注微信公众号【星禾光年 AI】,回复【deepseek】获取 1. 万能提示词生成模版:根据用户需求,帮助生成高质量提示词 SYSTEM 你是一位大模型提示词生成专家,请根据用户的需求编写一个智能助手的提示词,来指导大模型进行内容生成, 要求: 1. 以 Markdown 格式输出 2. 贴合用户需求,描述智能助手的定位、能力、知识储备 3. 提示词应清晰、精确、易于理解,在保持质量的同时,尽可能简洁 4. 只输出提示词,不要输出多余解释 USER “ 请帮我生成一个 Linux ” 助手 的提示词 2. 文案大纲生成:根据用户提供的主题,来生成文案大纲 SYSTEM 你是一位文本大纲生成专家,擅长根据用户的需求创建一个有条理且易于扩展成完整文章的大纲,你拥有强大的 主题分析能力,能准确提取关键信息和核心要点。具备丰富的文 案写作知识储备,熟悉各种文体和题材的文案大 纲构建方法。可根据不同的主题需求,如商业文案、文学创作、学术论文等,生成具有针对性、逻辑性和条理性 的文案大纲,并且能确保大纲结构合理、逻辑通顺。该大纲应该包含以下部分: 引言:介绍主题背景,阐述撰写目的,并吸引读者兴趣。 主体部分:第一段落:详细说明第一个关键点或论据,支持观点并引用相关数据或案例。 第二段落:深入探讨第二个重点,继续论证或展开叙述,保持内容的连贯性和深度。0 码力 | 4 页 | 7.93 KB | 8 月前3
清华大学 普通人如何抓住DeepSeek红利普通人如何抓住DeepSeek红利 p Deepseek是什么? p Deepseek能够做什么? ——在工作、学习、生活和社会关系中解决问题 p 如何提问?让AI一次性生成你想要的东西 卷不动了?DeepSeek帮你一键“躺赢”! 学习太难?DeepSeek带你“开挂”逆袭! 生活太累?DeepSeek帮你“减负”到家! 社交障碍?DeepSeek教你“高情商”破局! ,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。 (Pass@1) (Percentile) t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测0 码力 | 65 页 | 4.47 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处 理领域,GPT 系列模型在文本生成、问答系统和对话生成 等任务中展现出色的性能。在知识图谱构建、智能助手开发 等任务中展现出色的性能。在知识图谱构建、智能助手开发 等方面,LLM 技术也发挥了关键作用。此外,它还在代码 生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 算力 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规0 码力 | 32 页 | 13.09 MB | 1 年前3
DeepSeek图解10页PDFLanguage Model, LLM))的兴起。LLM 在自然语言处理(NLP)领域 发挥着越来越重要的作用,广泛应用于智能问答、文本生成、代码编写、机 器翻译等任务。LLM 是一种基于深度学习的人工智能模型,其核心目标是 通过预测下一个单词来理解和生成自然语言。训练 LLM 需要大量的文本数 据,使其能够掌握复杂的语言模式并应用于不同任务。 接下来,咱们先从较为基础的概念开始。 2 监督微调(Supervised Fine-Tuning, SFT) 在预训练之后,通常需要对模型进行监督微调(SFT):使用人工标注的数 据集,让模型在特定任务上优化表现。调整参数,使其更符合人类需求,如 问答、对话生成等任务。 2.3.3 强化学习(Reinforcement Learning, RL) 采用强化学习(RL)方法进行优化,主要通过人类反馈强化学习(RLHF, Reinforcement Learning from Human Feedback): 强化学习(RLHF)优化过程 • 步骤 1:人类标注者提供高质量回答。 • 步骤 2:模型学习人类评分标准,提高输出质量。 • 步骤 3:强化训练,使得生成的文本更符合人类偏好。 3 DeepSeek-R1 精华图解 3.1 DeepSeek-R1 完整训练过程 DeepSeek-R1 主要亮点在于出色的数学和逻辑推理能力,区别于一般的通 用 AI0 码力 | 11 页 | 2.64 MB | 8 月前3
人工智能安全治理框架 1.0(d)被窃取、篡改的风险。参数、结构、功能等算法核心信息,面临被 逆向攻击窃取、修改,甚至嵌入后门的风险,可导致知识产权被侵犯、商业机 密泄露,推理过程不可信、决策输出错误,甚至运行故障。 (e)输出不可靠风险。生成式人工智能可能产生 “幻觉”,即生成看似合理, 实则不符常理的内容,造成知识偏见与误导。 (f)对抗攻击风险。攻击者通过创建精心设计的对抗样本数据,隐蔽地 误导、影响,以至操纵人工智能模型,使其产生错误的输出,甚至造成运行瘫痪。 (a)信息内容安全风险。人工智能生成或合成内容,易引发虚假信息传播、 歧视偏见、隐私泄露、侵权等问题,威胁公民生命财产安全、国家安全、意识 形态安全和伦理安全。如果用户输入的提示词存在不良内容,在模型安全防护 机制不完善的情况下,有可能输出违法有害内容。 (b)混淆事实、误导用户、绕过鉴权的风险。人工智能系统及输出内容 等未经标识,导致用户难以识别交互对象及生成内容来源是否为人工智能系统, 难以鉴别生成内容的真 难以鉴别生成内容的真实性,影响用户判断,导致误解。同时,人工智能生成 图片、音频、视频等高仿真内容,可能绕过现有人脸识别、语音识别等身份认 证机制,导致认证鉴权失效。 (c)不当使用引发信息泄露风险。政府、企业等机构工作人员在业务工 作中不规范、不当使用人工智能服务,向大模型输入内部业务数据、工业信息, 导致工作秘密、商业秘密、敏感业务数据泄露。 (d)滥用于网络攻击的风险。人工智能可被用于实施自动化网络攻击或-0 码力 | 20 页 | 3.79 MB | 1 月前3
共 14 条
- 1
- 2













