文本样式 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

效果如何？一能做什么？数据挖掘数据分析数据采集数据处理数据可视化 AIGC 数据应用通过编写爬虫代码、访问数据库、读取文件、调用API等方式，采集社交媒体数据、数据库内容、文本数据、接口数据等。通过数据清洗、数据集成、数据变换、特征工程等方式，实现数据纠错、数据整合、格式转换、特征提取等。对数据进行诊断、预测、关联、聚类分析，常用于问题定位、需求预测、推荐系统、异常检测等。性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和高吞吐量，适合实时应用。  轻量化设计：模型结构优化，资源占用少，适合边缘设备和移动端。  多任务支持：支持多种任务，如文本生成、分类和问答。 Kimi k1.5  垂直领域优化：针对特定领域（如医疗、法律）进行优化，提供高精度结果。  长文本处理：擅长处理长文本和复杂文档，适合专业场景。  定制化能力：支持用户自定义训练和微调，适应特定需求。 Open AI o3 mini  小型化设计：轻量级模型，适合资源有限的环境。  快速响应：优化推理速度，适合实时交互场景。  通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容；

0 码力 | 85 页 | 8.31 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）剧本或对话设计文本创作长文本摘要（论文、报告）文本简化（降低复杂度）文本简化（降低复杂度）多语言翻译与本地化摘要与改写 02 01 03 文本生成自然语言理解与分析知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）剧本或对话设计文本创作长文本摘要（论文、报告）文本简化（降低复杂度）文本简化（降低复杂度）多语言翻译与本地化摘要与改写 02 01 03 文本生成自然语言理解与分析知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

d O w t v B 4 G 0 G p y 8 U I q e T 9 M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换个性化推荐翻译与转换问答系统逻辑推理自然语言处理文本生成与创作建议生成风险评估辅助决策概念关联知识整合交互能力情感分析文本分类图像理解跨模态转换专业建议任务分解情感回应上下文理解对话能力多轮对话数学运算逻辑分析能力图谱诗歌创作语音识别指令理解方案规划实体识别 l 文本创作文章/故事/诗歌写作营销文案、广告语生成、广告语生成社交媒体内容（如推文、帖子）剧本或对话设计 l 摘要与改写长文本摘要（论文、报告）文本简化（降低复杂度）多语言翻译与本地化 l 结构化生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写文本生成文本生成 03 02 01 语义分析 • 语义解析 • 情感分析(评论、反馈) • 意图识别(客服对话、用户查询)

0 码力 | 65 页 | 4.47 MB | 8 月前
3
普通人学AI指南

是指使用人工智能模型生成内容的技术。这些内容可以包括图像、音频、文本、视频、3D 模型等。具体来说，AIGC 技术可以生成如下类型的内容： • 图像：如照片、原创艺术作品 • 音频：如视频游戏中的配音、音乐 • 文本：如代码、广告文案、小说 • 3D 模型：如角色、场景目前，AIGC 技术处于早期阶段，最常见的产品形态是基于文本的，通过用户输入来控制内容的生成。用户输入文本描述所需的内容，然后模型输出与描述相符的内容。下图上下文窗口上下文窗口指的是模型一次可以处理的最大文本长度。这个长度通常用“to- kens”（标记）来表示，每个标记可以是一个单词、子词或单个字符，具体取决于编码方式。上下文窗口大小决定了模型在回答问题或生成文本时可以利用的上下文范围。窗口越大，模型就能处理越长的上下文，对理解长文本内容非常重要。较大的窗口允许模型处理更长的文本片段，从而提高在长文本任务中的表现，如长篇对话、文档生成和分析等。 ChatGPT 是一个由 OpenAI 开发的大型语言模型，它基于 GPT（Generative Pre-trained Transformer）架构。这种模型通过分析大量的文本数据来学习语言结构和信息，使其能够生成连贯的文本、回答问题、撰写文章、进行对话等。 6 Figure 3: AI 问答工具 ChatGPT 经过特别训练，可以理解和生成人类语言，从而在多种应用场景中提供辅助，包括聊天机器人、写作辅助、信息查询等。

0 码力 | 42 页 | 8.39 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。以 GPT 系列为代表，LLM 以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM 国内外各大厂商均投身于大模型的浪潮当中，涌现了诸多知名的大模型及应用，它们结合了文本、图片、视频、音频多种介质，在文本生成、图片生成、AI 编程等方向均有出色的表现。 GitHub Copilot 16 / 32 大模型应用现状：知名大模型在全球范围内，已经发布了多款知名大模型，这些大模型在各个领域都取得了突破性的进展。处理文本数据的 GPT-4，能同时处理和理解多种类型数据的多模态模型 DALL-E

0 码力 | 32 页 | 13.09 MB | 1 年前
3
00 Deepseek官方提示词

简洁 4. 只输出提示词，不要输出多余解释 USER “ 请帮我生成一个 Linux ” 助手的提示词 2. 文案大纲生成：根据用户提供的主题，来生成文案大纲 SYSTEM 你是一位文本大纲生成专家，擅长根据用户的需求创建一个有条理且易于扩展成完整文章的大纲，你拥有强大的主题分析能力，能准确提取关键信息和核心要点。具备丰富的文案写作知识储备，熟悉各种文体和题材的文案大纲构建方法美国的饮食还习惯么。 10. 内容分类：对文本内容进行分析，并对齐进行自动归类 SYSTEM #### 定位 - 智能助手名称：新闻分类专家 - 主要任务：对输入的新闻文本进行自动分类，识别其所属的新闻种类。 #### 能力 - 文本分析：能够准确分析新闻文本的内容和结构。 - 分类识别：根据分析结果，将新闻文本分类到预定义的种类中。 #### 知识储备政治 - 经济 - 科技 - 娱乐 - 体育 - 教育 - 健康 - 国际 - 国内 - 社会 #### 使用说明 - 输入：一段新闻文本。 - 输出：只输出新闻文本所属的种类，不需要额外解释。 USER 美国太空探索技术公司（SpaceX）的猎鹰 9 号运载火箭（Falcon 9）在经历美国联邦航空管理局（Federal Aviation

0 码力 | 4 页 | 7.93 KB | 8 月前
3
DeepSeek图解10页PDF

Model, LLM））的兴起。LLM 在自然语言处理（NLP）领域发挥着越来越重要的作用，广泛应用于智能问答、文本生成、代码编写、机器翻译等任务。LLM 是一种基于深度学习的人工智能模型，其核心目标是通过预测下一个单词来理解和生成自然语言。训练 LLM 需要大量的文本数据，使其能够掌握复杂的语言模式并应用于不同任务。接下来，咱们先从较为基础的概念开始。 2.1 LLM 基础概念 RNN（递归神经网络）和 LSTM（长短时记忆网络）具有更高的训练效率和更强的长距离依赖建模能力。Transformer 由多个关键组件组成：1. 自注意力机制（Self-Attention）：模型在处理文本时，会自动关注句子中的重要单词，理解不同词语间的联系。2. 多头注意力（Multi-Head Attention）：使用多个注意力头同时分析不同的语义信息，使得模型的理解能力更强。3. 前 Encoding）：在没有循环结构的情况下，帮助模型理解单词的顺序信息。 Transformer 结构的优势 1. 高效的并行计算：摒弃循环结构，使计算速度大幅提升。 2. 更好的上下文理解：注意力机制可捕捉长文本中的远程依赖关系。 3. 良好的可扩展性：可适配更大规模模型训练，增强 AI 泛化能力。教程作者：郭震，工作 8 年目前美国 AI 博士在读，公众号：郭震 AI，欢迎关注获取更多原创教程。资

0 码力 | 11 页 | 2.64 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

金山办公2024中文文本智能校对大赛第二名 2024 法研杯法律要素争议焦点识别第二名 AFAC2024金融智能创新大赛金融工具学习三等奖 Googl e kaggl e全球专利文件短语相似性匹配金牌 Googl e kaggl e全球自动问答比赛金牌 Googl e kaggl e全球医疗对话理解金牌 2021全球人工智能技术创新大赛-小布助手对话短文本语义匹配一等奖 2022全球人工智能技术创新大赛-商品标题实体识别一等奖第十八届中国计算语言学大会-小牛杯中文幽默计算一等奖第十届全国社会媒体处理大会-中文隐式情感分析一等奖 2021全球开放数据应用创新大赛-基于文本挖掘的企业隐患排查质量分析模型第一名 2021中国计算机学会大数据与计算智能大赛-“千言〞问题匹配鲁棒性评测第一名 2021年全国知识图谱与语义计算大会-医疗科普知识答非所问识别第一名网状路径（多路径探索） Responsiveness （响应模式）被动适配（按规则执行）主动创新（自主决策） Risk （风险特征）低风险（稳定可控）高风险（不确定性高）（限定于文本生成任务） DeepSeek 两种模型对比 V3 R1 DeepSeek 两种模型对比 V3 R1 如何提问？两种模型的提示语差异 • 基础模型（V3）：“过程-结果”清晰（指令） •

0 码力 | 35 页 | 9.78 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

个部分，如图 1 所示。其中，基础共性标准是人工智能的基础性、框架性、总体性标准。基础支撑标准主要规范数据、算力、算法等技术要求，为人工智能产业发展夯实技术底座。关键技术标准主要规范人工智能文本、语音、图像，以及人机混合增强智能、智能体、跨媒体智能、具身智能等的技术要求，推动人工智能技术创新和应用。智能产品与服务标准主要规范由人工智能技术形成的智能产品和服务模式。赋能新型工业化标准主要规范人工智能技术赋能大模型标准。规范大模型训练、推理、部署等环节的技术要求，包括大模型通用技术要求、评测指标与方法、服务能力成熟度评估、生成内容评价等标准。 4. 自然语言处理标准。规范自然语言处理中语言信息提取、文本处理、语义处理等方面的技术要求和评测方法，包括语法分析、语义理解、语义表达、机器翻译、自动摘要、自动问答、语言大模型等标准。 5. 智能语音标准。规范前端处理、语音处理、语音接口、数据群体智能标准。规范群体智能算法的控制、编队、感知、规划、决策、通信等技术要求和评测方法，包括自主控制、协同控制、任务规划、路径规划、协同决策、组网通信等标准。 11. 跨媒体智能标准。规范文本、图像、视频、音频等多模态数据处理基础、转换分析、融合应用等方面的技术要求，包括数据获取与处理、模态转换、模态对齐、融合与协同、应用扩展等标准。 12. 具身智能标准。规范多模态主动与交互、自主行为学习、

0 码力 | 13 页 | 701.84 KB | 1 年前
3

共 12 条前往

页

分类

语言

格式