清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单北京航空航天大学 高研院 助理教 授 清华大学新闻学院与人工智能学 院双聘教授 沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 数据挖掘深度较浅 Kimi k1.5 数据挖掘能力出色 快速读取文件数据,提取网址链接 长文本数据处理能力突出 爬虫数据采集存在代码错误问题 数据分析能力相对较弱 数据应用情况总结 新思路:优势互补,协同应用 Claude+DeepSeek 数据处理的“洗髓易筋” Claude 3.5 Sonnet 在文本提取 上较稳定,可用于数据清洗, DeepSeek R1强大的中文理解能力,自动识 别并修复古籍中的破损文字,同时生成准确的 注释和解释,帮助修复难以辨认的古籍内容。 • 中 文 法 律 文 本 分 析 与 生 成 : 基于 DeepSeek R1的中文数据处理能力,快速分 析法律文本,提取关键信息,自动生成合同草 案、法律意见书等,提高律师工作效率。 • 智能医疗数据分析与诊断:构建智能医疗 平台,分析病历、检查报告和基因数据,帮助 医生提供更准确的诊断与治疗方案。0 码力 | 85 页 | 8.31 MB | 8 月前3
基于go和flutter的实时通信/视频直播解决方案 段维伟的一致性,更新迭代(类似SDK需按平台维护) • 性能问题(全部使用html5) 客户端是否有 更好的选择? 为何选择 Flutter • 同样是 Google 发起的跨全平台高性能UI框架 • 基于 Skia 2D 渲染引擎 • 使用类似JS/TS的Dart 语言开发 • 支持代码编辑后热重载, Flutter 支持那些平台 iOS/Android/Web/Windows/Linux/macOS/Embedded 服务发现,负载均衡,媒体信息全局存储 • Biz 业务接入模块 • SFU 节点 (用于转发webrtc 流,与biz模块配合创建视频会议系 统) • AVP 节点 (用于从SFU节点拉取数据进行数据处理,视频流存 储,音视频混合,CV ,语音识别,图形识别等) • 网关节点与go-sip stack 或rtmp/hls/srt等协议组合成协议网关 • 转换RTC流成直播流推送到CDN ION客户端支持0 码力 | 38 页 | 2.22 MB | 1 年前3
Kubernetes Operator 实践 - MySQL容器化operator 执行 sts 扩缩容 判断 调用 mha 切主 否 是 pod 都正常运行? 重新调度 mha MGR 高可用简介 • 多主和单主两种工作模式 • MGR 只支持 InnoDB 引擎 • 开启 GTID,ROW 模式 binlog • 每张表必须有检测冲突的主键 • 目前最多只支持 9 个节点 • loose-group_replication_ • group_name controller,使用 CRD ü MHA、MGR 高可用的实现 ü 扩缩容、故障处理流程 ü 分布式存储 ceph 展望 • 优化存储 • 增强 MySQL 的安全性 • 完善数据处理工具0 码力 | 42 页 | 4.77 MB | 1 年前3
Apache Pulsar,云原生时代的消息平台 - 翟佳
(C1) Producer (P3) Producer (P2) Consumer (C2) Beijing Shanghai Guangzhou streamnative.io ⼤数据处理中统⼀的存储的抽象 — Segmented Stream Segment0 Segment1 Segment2 Segment3 Producer Consumer Time Segment 5 Segment40 码力 | 39 页 | 12.71 MB | 6 月前0.03
JavaScript 正则表达式迷你书 老姚 - v1.1这三者中任意一个字符,该怎么做呢? 不能写成 [a-z],因为其表示小写字符中的任何一个字符。 可以写成如下的方式:[-az] 或 [az-] 或 [a\-z]。 即要么放在开头,要么放在结尾,要么转义。总之不会让引擎认为是范围表示法就行了。 1.2.2. 排除字符组 纵向模糊匹配,还有一种情形就是,某位字符可以是任何东西,但就不能是 "a"、"b"、"c"。 此时就是排除字符组(反义字符组)的概念。例如 [^abc],表示是一个除 其可视化形式是: JavaScript 正则表达式迷你书 3. 第三章 正则表达式括号的作用 | 第 27 页 对比这两个可视化图片,我们发现,与前者相比,后者多了分组编号,如 Group #1。 其实正则引擎也是这么做的,在匹配过程中,给每一个分组都开辟一个空间,用来存储每一个分组匹配到的 数据。 既然分组可以捕获数据,那么我们就可以使用它们。 3.2.1. 提取数据 比如提取出年、月、日,可以这么做: 点。 • 分支结构“试”的策略是:货比三家。这家不行,换一家吧,还不行,再换。 既然有回溯的过程,那么匹配效率肯定低一些。相对谁呢?相对那些 DFA 引擎, DFA 是“确定型有限自动 机”的简写。 而 JavaScript 的正则引擎是 NFA,NFA 是“非确定型有限自动机”的简写。 大部分语言中的正则都是 NFA,为啥它这么流行呢? 答:你别看我匹配慢,但是我编译快啊,而且我还有趣哦。0 码力 | 89 页 | 3.42 MB | 11 月前3
JavaScript 正则表达式迷你书 老姚 - v1.0这三者中任意一个字符,该怎么做呢? 不能写成 [a-z],因为其表示小写字符中的任何一个字符。 可以写成如下的方式:[-az] 或 [az-] 或 [a\-z]。 即要么放在开头,要么放在结尾,要么转义。总之不会让引擎认为是范围表示法就行了。 1.2.2. 排除字符组 纵向模糊匹配,还有一种情形就是,某位字符可以是任何东西,但就不能是 "a"、"b"、"c"。 此时就是排除字符组(反义字符组)的概念。例如 [^abc],表示是一个除 其可视化形式是: JavaScript 正则表达式迷你书 3. 第三章 正则表达式括号的作用 | 第 27 页 对比这两个可视化图片,我们发现,与前者相比,后者多了分组编号,如 Group #1。 其实正则引擎也是这么做的,在匹配过程中,给每一个分组都开辟一个空间,用来存储每一个分组匹配到的 数据。 既然分组可以捕获数据,那么我们就可以使用它们。 3.2.1. 提取数据 比如提取出年、月、日,可以这么做: 点。 • 分支结构“试”的策略是:货比三家。这家不行,换一家吧,还不行,再换。 既然有回溯的过程,那么匹配效率肯定低一些。相对谁呢?相对那些 DFA 引擎, DFA 是“确定型有限自动 机”的简写。 而 JavaScript 的正则引擎是 NFA,NFA 是“非确定型有限自动机”的简写。 大部分语言中的正则都是 NFA,为啥它这么流行呢? 答:你别看我匹配慢,但是我编译快啊,而且我还有趣哦。0 码力 | 89 页 | 3.42 MB | 11 月前3
谈谈MYSQL那点事二进制层次的文件可以移植 二进制层次的文件可以移植 (Linux (Linux Windows) Windows) • 访问速度飞快,是所有 访问速度飞快,是所有 MySQL MySQL 文件引擎中速度最快的 文件引擎中速度最快的 • 不支持一些数据库特性,比如 事务、外键约束等 不支持一些数据库特性,比如 事务、外键约束等 • Table level lock Table level lock 服务器,尽量在应用本身达到一 个 个 MySQL MySQL 最合理的使用 最合理的使用 针对 针对 MyISAM MyISAM 或 或 InnoDB InnoDB 不同引擎进行不同定制 不同引擎进行不同定制 性配置 性配置 针对不同的应用情况进行合理配置 针对不同的应用情况进行合理配置 针对 针对 my.cnf my.cnf 进行配置,后面设置是针对内存为 进行配置,后面设置是针对内存为0 码力 | 38 页 | 2.04 MB | 1 年前3
Ubuntu 桌面培训 2010. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 III.12 可用的搜索引擎 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 、Amazon、eBay、Answers.com 和 Creative Commons 等搜 索引擎。您可以在搜索框中输入一个关键字,瞬间就能得到所选择的搜索引擎提供的 结果。您可以在任何时候从搜索框菜单里选择一个新的搜索引擎,或添加自己喜欢的 其他搜索引擎。 70 浏览网络 目录 Lucid Lynx 图 III.12 可用的搜索引擎 搜 索 建 议 为 了 方 便 您 进 行 搜 索 , 一 些 搜 索 引 默认带有多个 Feed 订阅。 2. 如果您不想让某篇在一段时间之后被删除,可以将它标记为一个重要项。 3. 您可以使用搜索功能在下载的项目中搜索,快速访问需要的信息。 4. 您还可以使用在线搜索引擎搜索附加新闻。 78 收发邮件 目录 Lucid Lynx 教员注记: 如果需要经过 HTTP 认证或设置其他选项,则需要更改 Feed 属性。 III.IV 收发邮件 Evolution0 码力 | 540 页 | 26.26 MB | 1 年前3
基于 KUBERNETES 的 容器器 + AI 平台构建集群与管理理资源 - 73s 视频演示 多集群和镜像仓库 多租户和旧系统的集成 运⾏行行和构建应⽤用 Rudder - 应⽤用编排技术框架 Cyclone - 持续集成与交付引擎 运⾏行行 AI 应⽤用(机器器学习) - 58s 视频演示 Kubeflow 的应⽤用 Kubeflow 之上 构建集群与管理理资源 多集群和镜像仓库 • 企业想要的 • 隔离性和安全性 CI/CD 流程 CAICLOUD/CYCLONE • 开源 • https://github.com/caicloud/cyclone Cyclone 技术架构 云原⽣生 CI/CD 引擎 设计 - 云原⽣生,k8s 亲和性 性能 - 为企业场景优化 扩展性 - ⽀支持 AI ⼯工作流 运⾏行行 AI 应⽤用 KUBEFLOW 的应⽤用 • Kubeflow 社区的联合创始⼈人0 码力 | 19 页 | 3.55 MB | 1 年前3
MySQL 8.0.17 调优指南(openEuler 20.09)/sys/ block/${device}/queue/ scheduler /sys/block/$ {device}/queue/ nr_requests 提升磁盘吞吐量,尤其对myisam 存储引擎,可以调整到更大。命令 中的${device}为数据盘名称,根据 实际磁盘名称进行修改。 echo 2048 > /sys/ block/${device}/queue/ nr_requests0 码力 | 11 页 | 223.31 KB | 1 年前3
共 10 条
- 1













