单文件数据库 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

能做什么？要怎么做？效果如何？一能做什么？数据挖掘数据分析数据采集数据处理数据可视化 AIGC 数据应用通过编写爬虫代码、访问数据库、读取文件、调用API等方式，采集社交媒体数据、数据库内容、文本数据、接口数据等。通过数据清洗、数据集成、数据变换、特征工程等方式，实现数据纠错、数据整合、格式转换、特征提取等。对数据进行诊断、预测、关联、聚类分析，常用于问题通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容； 2、撰写python脚本； 3、提取并合并网址； 4、提取网址内容； 5、写入文件。任务你需要完成以下两个任务： 1.阅读网页【网址】源代码【对应网页源代码】。提取所有包含“春运2025丨X月X日，全社会跨区域人员流动量完成X万人次”的网址进行去重、筛选，合并成网址列表相关数据（如日期、全社会跨区域人员流动量、铁路客运量、公路人员流动量、水路客运量、民航客运量等）”完成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快，能够高效提取所有需求链接，输出完整可运行python脚本，代码运行后生成文件，但数据采集结果为空。 DeepSeek R1 能够提取所有网址并进行筛选、去重，所撰写代码运行后完成数据爬虫任务，

0 码力 | 85 页 | 8.31 MB | 8 月前
3
普通人学AI指南

AI 编程开发助手，集成在 JetBrains 系列开发工具中，提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具，旨在简化数据库操作。 2.4.4 ChatDev 面壁智能开发的 AI 智能体开发平台，支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目，提供零代码网站开发功能，易于使用。 2 ollama，就能下载到软件。下载之后打开，直接点击 Next 以及 Install 安装 ollama，安装步骤非常简单。 3.1.2 步骤 2：安装 Llama 下载 Llama3，打开新的终端/命令行窗口，执行以下命令： ollama run llama3 程序会自动下载 Llama3 的模型文件，默认是 8B，也就 80 亿参数版本，个人电脑完全可以运行。等待安装完成，如图 12 所示。 14 包含了运行所需的代码、运行时、系统工具、系统库和设置。 2. 镜像（Image）：用于创建容器的只读模板。一个镜像可以包含完整的操作系统环境。 3. Dockerfile：定义镜像内容的文本文件，包含了构建镜像的所有指令。 4. Docker Hub：公共的 Docker 镜像仓库，用于存储和分发 Docker 镜像。 5. 拉取镜像：docker pull

0 码力 | 42 页 | 8.39 MB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型 04 向量数据库/数据库向量支持为大模型提供高效的存储和检索能力大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节大模型训练平台&工具提供了在不同硬件和环境中训练大语言模型所需的基础设施和支持编程语言以 Python 为代表 5 / 32 LLM 基础设施：向量数据库/数据库向量支持向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加

0 码力 | 32 页 | 13.09 MB | 1 年前
3
DeepSeek从入门到精通(20250204)

且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）应对威胁。 c.解释签名式防御如何类似于抗体，能够快速识别和中和已知威胁。 d.比较系统隔离和清理过程与人体发烧的相似性，都是为了控制“感染”扩散。 e.讨论威胁情报数据库如何类似于免疫记忆，使系统能够更快地应对重复出现的威胁。（3）深入探讨启示： a.分析免疫系统的适应性如何启发自适应安全系统的设计。 b.探讨免疫系统的分层防御策略如何应用于网络安全的纵深防御概念。

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）应对威胁。 c.解释签名式防御如何类似于抗体，能够快速识别和中和已知威胁。 d.比较系统隔离和清理过程与人体发烧的相似性，都是为了控制“感染”扩散。 e.讨论威胁情报数据库如何类似于免疫记忆，使系统能够更快地应对重复出现的威胁。（3）深入探讨启示： a.分析免疫系统的适应性如何启发自适应安全系统的设计。 b.探讨免疫系统的分层防御策略如何应用于网络安全的纵深防御概念。

0 码力 | 103 页 | 5.40 MB | 8 月前
3
DeepSeek图解10页PDF

LSTM（长短时记忆网络）具有更高的训练效率和更强的长距离依赖建模能力。Transformer 由多个关键组件组成：1. 自注意力机制（Self-Attention）：模型在处理文本时，会自动关注句子中的重要单词，理解不同词语间的联系。2. 多头注意力（Multi-Head Attention）：使用多个注意力头同时分析不同的语义信息，使得模型的理解能力更强。3. 前馈神经网络（FFN）：非线性变换模块，提升模型的表达能力。4 下图9所示，基于 V3，直接使用强化学习开训：图 9: R1-Zero 完全跳过监督微调这样做竟然达到了惊人的、意想不到的效果，推理超越 OpenAI O1，如下图10所示，蓝线表示单次推理（pass@1）的准确率，红线表示 16 次推理取一致性结果（cons@16）的准确率，可以看出一致性推理提高了最终性能。虚线代表 OpenAI O1 的基准表现，图中可以看到 DeepSeek-R1-Zero

0 码力 | 11 页 | 2.64 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换个性化推荐翻译与转换多语言翻译异常检测多源信息融合知识与推理知识图谱构建流程优化数据可视化数据分析趋势分析，这个数据集包含了大量基于2020年之前数据生成的问答对。提取问题：从数据集中提取问题，并使用set去重。检查问题数量：确保提取的问题数量至少为10万个。保存问题：将问题保存到CSV文件生成的真实答案问题.csv中。要生成10万个存在真实答案的问题，并且基于2020年之前的数据，可以使用现有的公开问答数据集（如SQuAD 、 Natural Questions等）来生成问题。可以从多个数据集中组

0 码力 | 65 页 | 4.47 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

智能体应用案例：定义角色、分解流程社区医生手工填写患者病历并传真到斯坦福预约中心传统人工预约流程 AI辅助预约流程传真识别智能体接到传真，人工查看病历利用多模态大模型，识别传真病历，并自动录入数据库数字人打电话给患者，预约就诊时间大模型查询保险知识库，自动生成理赔申请，提交保险公司就诊预约智能体保险报告生成智能体人工打电话给患者，预约就诊时间病人到医院就诊人工填写理赔申请，提交保险公司

0 码力 | 76 页 | 5.02 MB | 5 月前
3
人工智能安全治理框架 1.0

知人工智能产品和服务的适用范围、注意事项、使用禁忌，支持使用者知情选择、审慎使用。（c）服务提供者应在告知同意、服务协议等文件中，支持使用者行使人类监督和控制责任。（d）服务提供者应让使用者了解人工智能产品的精确度，在人工智能决策有重大影响时，做好解释说明预案。（e）服务提供者应检查研发者提供的责任说明文件，确保责任链条可以追溯到递归采用的人工智能模型。（f）服务提供者应提高人工智能风险防范意识，建立健全实时风险监控

0 码力 | 20 页 | 3.79 MB | 1 月前
3
TVM工具组

存量的开源 caffe 网络模型众多，TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中当前进度无 caffe 依赖 from_caffe 直接导入 caffe 模型文件，不需要预先安装 caffe 。 net 已测试网络：alexnet / densenet121 / inception v1 / inception v3 / inception v4 / mobilenet

0 码力 | 6 页 | 326.80 KB | 5 月前
3

共 11 条前往

页

分类

语言

格式