清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 的最终依据。 文本数据集成 一般文本处理任务中,DeepSeek R1所提取的文本数据维度最为全面,但容易受文本长度或模型稳定性影响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题,没有完整集成到可视化表格中; 长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面;由于文本过长DeepSeek R1无法完成任务; 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 数据分析 Claude 3.5 sonnet 提供数据分析程序代码, 能够提取大部分特征并 对其与生存率的关联进 行分析,但最终没有形 成明确的结论。 Kimi k1.5 能够精准分析关键 指标生存率,但对 特征提取不完整, 仅能识别较为浅层 的数据关联,分析 能力相对较弱。0 码力 | 85 页 | 8.31 MB | 8 月前3
消息中间件RocketMQ原理解析 - 斩秋的消息,返回消息的 offset 即消息地址 commitLog 中消息偏移量。Prepared 状态消息不被消费 发送消息 ok,执行本地事物分支, 本地事物方法需要实现 rocketmq 的回调接口 2)2) 2) LocalTransactionExecuter , 处 理 本 地 事 物 逻 辑 返 回 处 理 的 事 物 状 态 LocalTransactionState 3) 二阶段,处理完本地事物中业务得到事物状态, Consumer 消费拉取的消息的方式有两种 1. Push 方式:rocketmq 已经提供了很全面的实现, consumer 通过长轮询拉取消息后回调 MessageListener 接口实现完成消费, 应用系统只要 MessageListener 完成业务逻辑即可 2. Pull 方式:完全由业务系统去控制,定时拉取消息,指定队列消费等等, 当然这里需要 业务系统去根据自己的业务需求去实现 拉取消息(异步拉取)返回结果是回调 7. 从内存中获取 commitOffsetValue //TODO 这个值跟 pullRequest.getNextOffset 区别 8. 构建 sysFlag pull 接口用到的 flag 9. 调底层通信层向 broker 发送拉消息请求 如果 master 压力过大,会建议去 slave 拉取消息 如果是到 broker 拉取消息清楚实时提交标记位,因为 slave0 码力 | 57 页 | 2.39 MB | 1 年前3
Ubuntu 桌面培训 2010您只能采用与本协议相同的 许可协议发布基于本作品的演绎作品。 对于任何的再使用或者分发,您必须让他人清楚了解到本作品所适用的协议条款。若您获得著作权人的 许可,上述任何条件都可以免除。该协议的任何部分都不削弱或者限制作者的人格权利。 关于这个著作权协议的更多信息,请参阅: http://creativecommons.org/licenses/by-nc-sa/3.0/legalcode 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 VIII.50选择要编辑的音频部分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 VIII.51应用声音效果 10.04 LTS。 28 学生职责 目录 Lucid Lynx 本课程以模块为单位来组织。在教室中进行全日制学习的话,两天就可以学习完整个 课程。另外,您可以按需选择主题和课程,本课程的关键部分可以在一天之内学完。 学生职责 • 学生应该按时到达并认真听课。如果学生可能会迟到,必须事先通知教员。 • 鼓励学生参与课堂讨论。即使某些人对其中一些课程主题已经非常熟悉,分享相关 经验对其他人来说也是相当有帮助的。0 码力 | 540 页 | 26.26 MB | 1 年前3
RocketMQ v3.2.4 开发指南消息消费者,负责消费消息,一般是后台系统负责异步消费。 Push Consumer Consumer 的一种,应用通常吐 Consumer 对象注册一个 Listener 接口,一旦收到消息,Consumer 对象立 刻回调 Listener 接口方法。 Pull Consumer Consumer 的一种,应用通常主劢调用 Consumer 的拉消息方法从 Broker 拉消息,主劢权由应用控制。 备机自劢切换为主避免,丌过仍然会存在几分钟的服务丌 可用。(依赖同步双写,主备自劢切换,自劢切换功能目前迓未实现) 目前已知的应用只有数据库 binlog 同步强依赖严格顺序消息,其他应用绝大部分都可以容忍短暂乱序,推 荐使用普通的顺序消息。 Message Queue 项目开源主页:https://github.com/alibaba/RocketMQ 4 在 RocketMQ 只要达到优兇级目的即可,丌是严格意丿上的优兇级,通常将优兇级划分为高、中、低,戒者再多几个级 别。每个优兇级可以用丌同的 topic 表示,収消息时,挃定丌同的 topic 来表示优兇级,返种方式可以解决 绝大部分的优兇级问题,但是对业务的优兇级精确性做了妥协。 2) 严格的优兇级,优兇级用整数表示,例如 0 ~ 65535,返种优兇级问题一般使用丌同 topic 解决就非常丌合 项目开源主页:https://github0 码力 | 52 页 | 1.61 MB | 1 年前3
JavaScript 正则表达式迷你书 老姚 - v1.16.4.3. 独立出确定字符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4.4. 提取分支公共部分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4.5. 减少分支的数量,缩小它们的范围 . . . JavaScript 正则表达式迷你书 前言 | 第 5 页 1. 第一章 正则表达式字符匹配攻略 正则表达式是匹配模式,要么匹配字符,要么匹配位置。 请记住这句话。 然而关于正则如何匹配字符的学习,大部分人都觉得这块比较杂乱。 毕竟元字符太多了,看起来没有系统性,不好记。本章就解决这个问题。 内容包括: • 两种模糊匹配 • 字符组 • 量词 • 分支结构 • 案例分析 1.1. 两种模糊匹配 a4b"; console.log( string.match(regex) ); // => ["a1b", "a2b", "a3b"] 以上就是本章讲的主体内容,只要掌握横向和纵向模糊匹配,就能解决很大部分正则匹配问题。 接下来,我们将具体展开来说。 1.2. 字符组 需要强调的是,虽叫字符组(字符类),但只是其中一个字符。 例如 [abc],表示匹配一个字符,它可以是 "a"、"b"、"c"0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.06.4.3. 独立出确定字符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4.4. 提取分支公共部分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4.5. 减少分支的数量,缩小它们的范围 . . . JavaScript 正则表达式迷你书 前言 | 第 5 页 1. 第一章 正则表达式字符匹配攻略 正则表达式是匹配模式,要么匹配字符,要么匹配位置。 请记住这句话。 然而关于正则如何匹配字符的学习,大部分人都觉得这块比较杂乱。 毕竟元字符太多了,看起来没有系统性,不好记。本章就解决这个问题。 内容包括: • 两种模糊匹配 • 字符组 • 量词 • 分支结构 • 案例分析 1.1. 两种模糊匹配 a4b"; console.log( string.match(regex) ); // => ["a1b", "a2b", "a3b"] 以上就是本章讲的主体内容,只要掌握横向和纵向模糊匹配,就能解决很大部分正则匹配问题。 接下来,我们将具体展开来说。 1.2. 字符组 需要强调的是,虽叫字符组(字符类),但只是其中一个字符。 例如 [abc],表示匹配一个字符,它可以是 "a"、"b"、"c"0 码力 | 89 页 | 3.42 MB | 11 月前3
清华大学 DeepSeek 从入门到精通外部信息 整合能力 逻辑推理和 抽象能力 典型错误表现 数据误用 有数据 低 高 高 中 误用已有数据,回答 部分不符或细节错误 语境误解 有数据 高 低 高 中 对问题的意图理解错 误,回答偏离主题 信息缺失 无数据 中 高 低 中 未能正确获取或整合 外部信息 推理错误 部分数据 高 高 中 低 逻辑推理中存在漏洞 或错误假设 无中生有 无数据 低 中 低 低 在无数据支持下,生 成完全虚构的信息 。以下 是提示语链在内容生成过程中的七个主要作用机制 1. 将这个复杂的主题分解为几个主要部分,逐一讨论每个部分。 2. 对每个子任务设定具体目标和预期成果。 3. 在每个子任务完成后,总结其关键点并与整体主题关联。 4. 通过层次结构图或思维导图展示分解后的各部分及其关系。 5. 结合各部分的结果,撰写一段总结性内容,确保整体连贯。 �实战技巧: • 任务分解 • 结果整合 • 反馈整合与动态调整 �实战技巧: 1. 在每个步骤完成后,进行自我评估和质量检查。 2. 使用清单核对每个部分是否满足预期目标和质量标准。 3. 设立中期检查点,对任务进度和质量进行评估和调整。 4. 请求同行或专家对内容进行审阅并提供反馈。 5. 根据反馈意见,逐步优化和完善文章的各个部分。 1. 请对当前内容进行评估,列出主要优缺点,并提出具体的改进建议。 2. 请根据前一阶段的反馈,0 码力 | 103 页 | 5.40 MB | 8 月前3
基于go和flutter的实时通信/视频直播解决方案 段维伟基于go和flutter的实时通信/视频直播解决方案 段维伟 湖北捷智云技术有限公司 创始人 目 录 背景 01 技术简介 02 客户端 03 服务端 04 开源社区 05 Q&A 06 背景 第一部分 即将讲述的内容 • WebRTC 实时通讯 • Flutter 跨平台UI 开发框架 • 基于Flutter UI 框架的WebRTC 插件 flutter-webrtc • Go 语言的WebRTC 漂亮的app,最好全部(mobile, web, desktop)平台都支持. • 最容易使用的后端技术 真实世界的需求点 用开源方案实现需求 WebRTC + Flutter + Go 技术简介 第二部分 WebRTC 是什么 01. • 由 Google 发起的基于浏览器通讯标准 • 基于收购来的 GIPS (6800万美金)的高质量实时音视频引 擎 • 支持主流浏览器主流移动设备 UDP/TLS/RTP/SAVPF 120 124 98 c=IN IP4 0.0.0.0 a=rtpmap:120 H264/90000 b=AS:1000 a=sendrecv 客户端 第三部分 WebRTC客户端开发 • Web端 标准JS +html 或通过google 官方提供的源码编 译出原生sdk • iOS/macOS 使用WebRTC.framework + Obj-C/Swift0 码力 | 38 页 | 2.22 MB | 1 年前3
强大的音视频处理工具: FFmpeg获取 26 视频转动图gif 视频转成动图(gif) ffmpeg -i small.mp4 small.gif ffmpeg -i small.mp4 small.gif 转化视频中的⼀部分为 GIF 从视频中第⼆秒开始,截取时⻓为3秒的⽚段转化为 gif ffmpeg -t 3 -ss 00:00:02 -i small.webm small-clip.gif ffmpeg -t ) 外挂字幕 以单独的字幕⽂件形式存在,播放时经播放器处理解析 显示(=VSFilter渲染)到视频上 硬字幕=内嵌字幕 指字幕被以图形⽅式硬编码到视频中 变成视频数据本身=视频数据的⼀部分 特点 过程不可逆 ⽆法再把字幕提取出来 播放时不需要额外的播放器读取解析显示(=VSFilter渲染) 字幕 crifan.com,使⽤署名4.0国际(CC BY 4.0)协议发布 all 中,播放时需经过VSFilter渲染 外挂字幕 字幕⽂件以单独形式存在,播放时经VSFilter 渲染到视频上 内嵌字幕 指字幕被以图形⽅式硬编码到视频中 变成视频数据本身=视频数据的⼀部分 特点 过程不可逆 ⽆法再把字幕提取出来 获取 36 播放时不需VSFilter等渲染 常⽤字幕制作软件 Aegisub Jubler VisualSubSync subtitleeditor0 码力 | 73 页 | 11.57 MB | 1 年前3
谈谈MYSQL那点事不能使用索引,使用 LIKE ‘abc%’ LIKE ‘abc%’ 将能够使用索引 将能够使用索引 如果在 如果在 SQL SQL 里使用了 里使用了 MySQL MySQL 部分自带函数,索引将失效,同时将无 部分自带函数,索引将失效,同时将无 法 法 使用 使用 MySQL MySQL 的 的 Query Cache Query Cache ,比如 ,比如 LEFT()0 码力 | 38 页 | 2.04 MB | 1 年前3
共 10 条
- 1













