清华大学 DeepSeek 从入门到精通长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 意图识别(客服对话、用户查询) 实体提取(人名、地点、事件) 文本分类 文本分类 主题标签生成(如新闻分类) 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 末尾缺失,需要重复尝试生成。 长文本(15000token):暂时 无法给出答复。 【所需阅读文本】请根据以上文本完成以下三个任务:1、阅读 文本内容;2、整理集成可视化的数据表格;3、按照日期规范排 序(直接分析并输出结果,不使用python) 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 文本数据集成 一般文本处理任务中,DeepSeek0 码力 | 85 页 | 8.31 MB | 8 月前3
JavaScript 正则表达式迷你书 老姚 - v1.110 1.5. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.1. 匹配 16 进制颜色值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.2. 匹配时间 . . . . . 48 5.2.3 元字符转义问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.3. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.3.1 身份证. . . . . . . . . . . . . . . . . . . . . . 84 前言 版权说明 首先感谢看到这本《JavaScript 正则表达式迷你书》的读者朋友,但愿此书不会浪费你的宝贵时间。 此书是一本免费的书籍,您可以随便传播,但不能用于商业。 当读完后,如果你觉得此书对学习正则表达式有所帮助,慷慨如你,可以扫描下面的二维码赞赏一下。 不强求的,本来就是免费的嘛。说真的,我也0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.010 1.5. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.1. 匹配 16 进制颜色值 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.5.2. 匹配时间 . . . . . 48 5.2.3 元字符转义问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.3. 案例分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.3.1 身份证. . . . . . . . . . . . . . . . . . . . . . 84 前言 版权说明 首先感谢看到这本《JavaScript 正则表达式迷你书》的读者朋友,但愿此书不会浪费你的宝贵时间。 此书是一本免费的书籍,您可以随便传播,但不能用于商业。 当读完后,如果你觉得此书对学习正则表达式有所帮助,慷慨如你,可以扫描下面的二维码赞赏一下。 不强求的,本来就是免费的嘛。说真的,我也0 码力 | 89 页 | 3.42 MB | 11 月前3
Ubuntu 桌面培训 2010com) 版权 © 2010 JimHu (jimhuyiwei@gmail.com) 欢迎访问本课程网站:http://people.ubuntu.com/˜happyaron/udc-cn 生成时间:20100725T1630 版本:Daily 本课程由 Canonical 有限公司和 Ubuntu 培训社区创作 2008-2010。 这个协议受到知识共享署名-非商业性使用-相同方式共享的约束 复习题 上机练习 课程总结 表 10 第 二 天 - 第 10 章 教员职责 教员的职责如下: • 合理有效地组织课堂学习,并保证教室环境有益于学习;包括按照日程表安排上课 时间、课间休息和午餐时间。 • 在实验课上回答学生提问,并帮助学生完成练习。 • 向学生传授有价值的学习经验。 • 在课程结束时,提供调查问卷以便学生做出反馈。 培训前准备和检查 • 了解学生的资质和期 然,如果您的时间有限,每个章节 的教员注记中也已标明哪些是可选主题。 教学方法 以下是一些您可能会用到的教学方法: • 幻灯片和讲座:幻灯片可以用来解释清楚概念和逐步演示操作步骤。 • 示范:在学生亲自动手开始练习之前,教员可以就一些对学员来说可能比较复杂的步 骤进行示范。 • 复习题:提问应贯穿在每节课的过程中,以确保学生能够理解关键的概念。 • 上机练习:每隔一段时间,应让学生亲自动手做一些练习来模拟现实生活中可能会遇0 码力 | 540 页 | 26.26 MB | 1 年前3
消息中间件RocketMQ原理解析 - 斩秋前言 此文档是从学习 rocketmq 源码过程中的笔记中整理出来的,由于时间及能力原因,理 解有误之处还请谅解,希望对大家学习使用 rocketmq 有所帮助。 Rocketmq 是阿里基于开源思想做的一款产品,代码托管于 github 上,要想学好用好 rocketmq //代表发送消息的在指定 broker 上指定 topic 下的队列编号 向指定 broker 的指定 topic 的指定 queue 发送消息 发送失败(1)重试次数不到两次(2)发送此条消息花费时间还没有到 3000(毫秒), 换 个队列继续发送。 2.1 producer 发送普通消息 2.2 顺序消息发送 Rocketmq 能够保证消息严格顺序,但是 Rocketmq 定时回查线程会定时扫描(默认每分钟)每个存储事务状态的表格文件, 遍历存储事 务状态的表格记录 如果是已经提交或者回滚的消息调过过, 如果是 prepared 状态的如果消息小于事务回查至少间隔时间(默认是一分钟)跳出终 止遍历 调 transactionCheckExecuter.gotocheck 方法向 producer 回查事物状态, 根据 group 随机选择一台 producer0 码力 | 57 页 | 2.39 MB | 1 年前3
RocketMQ v3.2.4 开发指南RocketMQ 开发挃南 针对 v3.2.4 ©Alibaba 消息中间件项目组 2015/1/7 文档变更历史 序号 主要更改内容 更改人 更改时间 1 建立初始版本 誓嘉 vintage.wang@gmail.com 2013/5/18 2 3.0 版本补充文档 誓嘉 vintage.wang@gmail.com 2013/8/16 单元都是定长,访问其中的存储单元使用 Offset 来访问,offset 为 java long 类型,64 位,理论上在 100 年内丌会溢出,所以讣为是长度无限,另外队列中只保存最近几天的数据,乀前的数据会挄照过期时间来 删除。 也可以讣为 Message Queue 是一个长度无限的数组,offset 就是下标。 4 消息中间件需要解决哪些问题? 本节阐述消息中间件通常需要解决哪些问题,在解决返些 Broker 在吐 Consumer 投递成功消息后,消息仍然需要保留。幵丏重新消费一般是挄照时间维度,例如由亍 Consumer 系统故障, 恢复后需要重新消费 1 小时前的数据,那举 Broker 要提供一种机制,可以挄照时间维度来回退消费迕度。 RocketMQ 支持挄照时间回溯消费,时间维度精确到毫秒,可以吐前回溯,也可以吐后回溯。 4.12 消息堆积 消息中间件的主要功能0 码力 | 52 页 | 1.61 MB | 1 年前3
MySQL 8.0.17 调优指南(openEuler 20.09)要有以下几个方面: ● 对性能进行分析时,要多方面分析系统的资源瓶颈所在,因为系统某一方面性能 低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性能的某方面的一个参数进行调整,多个参数同时调整的话,很难 界定性能的影响是由哪个参数造成的。 ● 由于在进行系统性能分析时,性能分析工具本身会占用一定的系统资源,如CPU ,如CPU 资源、内存资源等等。我们必须注意到这点,即分析工具本身运行可能会导致系 统某方面的资源瓶颈情况更加严重。 MySQL 8.0.17 调优指南(openEuler 20.09) 1 调优概述 2020-10-15 1 ● 必须保证调优后的程序运行正确。 ● 调优过程是迭代渐进的过程,每一次调优的结果都要反馈到后续的代码开发中 去。 ● 性能调优不能以牺牲代码的可读性和可维护性为代价。 代价。 1.3 调优思路 性能优化首先要较为精准的定位问题,分析系统性能瓶颈,然后根据其性能指标以及 所处层级选择优化的方式方法。 下面介绍MySQL数据库具体的调优思路和分析过程,如图1所示。 调优分析思路如下: 1. 很多情况下压测流量并没有完全进入到服务端,在网络上可能就会出现由于各种 规格(带宽、最大连接数、新建连接数等)限制,导致压测结果达不到预期。 2. 接着看关键指标是否0 码力 | 11 页 | 223.31 KB | 1 年前3
谈谈MYSQL那点事MySQL MySQL 技巧分 技巧分 享 享 MySQL MySQL 技巧分享 技巧分享 常用技巧 常用技巧 使用 使用 Explain/ DESC Explain/ DESC 来分析 来分析 SQL SQL 的执行情况 的执行情况 使用 使用 SHOW PROCESSLIST SHOW PROCESSLIST 来查看当前 来查看当前 MySQL MySQL 服务器线 服务器线 MySQL Slow Log 分析工具 分析工具 mysqldumpslow - mysql mysqldumpslow - mysql 官方提供的慢查询日志分析 官方提供的慢查询日志分析 工具 工具 mysqlsla - hackmysql.com mysqlsla - hackmysql.com 推出的一款日志分析工具 推出的一款日志分析工具 ,功能 ,功能0 码力 | 38 页 | 2.04 MB | 1 年前3
强大的音视频处理工具: FFmpegPython 附录 获取 2 1.9.1 1.9.2 1.9.3 help语法 ⽂档 参考资料 获取 3 强⼤的⾳视频处理⼯具:FFmpeg 最新版本: v1.0 更新时间: 20210914 简介 介绍⾳视频处理⼯具FFmpeg有哪些强⼤的功能。先对ffmpeg进⾏概览, 包括可以⽤来⼲什么,与之相关的ffprobe、ffplay、ffserver等⼯具;再介 =53" -c:a copy input_removedWatermarked.mp4 从视频中提取⾳频并分割成多个⾳频⽚段 前提: ⾸先要有字幕⽂件:可以指定多个时间段 对于每个时间段,⽤ffmpeg提取指定时间段的⾳频 ffmpeg -i input.mp4 -ss 00:00:11.270 -to 00:00:14.550 -b:a 128k output_audio_000011270_000014550 powered by Gitbook最后更新: 2021-09-13 13:15:45 获取 12 提取⾳频⽚段 此处整理,从完整的⾳频⽂件中,提取其中⼀段,即提取⾳频⽚段。 从mp3中提取某个时间段的mp3 参数解释 -i :input 输⼊⽂件 -acodec copy : -acodec = audio codec :⾳频编码器 == -c copy 等价于:0 码力 | 73 页 | 11.57 MB | 1 年前3
共 13 条
- 1
- 2













