数据重分布 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

RocketMQ v3.2.4 开发指南

........................................................................................ 8 4.13 分布式事务 ............................................................................................... ........................................................................................ 14 6.3 数据存储结构 .............................................................................................. ........................................................................................ 15 6.5 数据可靠性 ...............................................................................................

0 码力 | 52 页 | 1.61 MB | 1 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

要怎么做？效果如何？一能做什么？数据挖掘数据分析数据采集数据处理数据可视化 AIGC 数据应用通过编写爬虫代码、访问数据库、读取文件、调用API等方式，采集社交媒体数据、数据库内容、文本数据、接口数据等。通过数据清洗、数据集成、数据变换、特征工程等方式，实现数据纠错、数据整合、格式转换、特征提取等。对数据进行诊断、预测、关联、聚类分析，常用于问题定位、需求预测、推荐系统、异常检测等。定位、需求预测、推荐系统、异常检测等。对数据进行分类、社交网络分析或时序模式挖掘，常用于客户细分、信用评分、社交媒体营销、股价预测等。将数据转化为统计图、热力图、网络关系图、词云、树形图等，用于揭示数据中蕴含的模式、趋势、异常和洞见。本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容； 2、撰写python脚本； 3、提取并合并网址； 4、提取网址内容； 5、写入文件。任务你需要完成以下两个任务： 1.阅读网页【网址】源代码【对应网页源代码】。提取所有包含“春运2025丨X月X日，全社会跨区域人员流动量完成X万人次”的网址进行去重、筛选，合并成网址列表 2.撰写pytho

0 码力 | 85 页 | 8.31 MB | 8 月前
3
消息中间件RocketMQ原理解析 - 斩秋

........................................................................................... 7 2.3 分布式事物消息 ............................................................................................. .......................................................................................... 11 2.2 分布式事物消息落地 ........................................................................................... messageQueueList [userId%messageQueueList.size()] 2.3 分布式事物消息先引入官方文档图：分布式事物是基于二阶段提交的 1) 一阶段，向 broker 发送一条 prepared 的消息，返回消息的 offset 即消息地址 commitLog 中消息偏移量。Prepared

0 码力 | 57 页 | 2.39 MB | 1 年前
3
清华大学 DeepSeek 从入门到精通

们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。非推理大模型：适用于大多数任务，非推理大模型一般侧重于语言生成、上下文理解和自然语言处理，而不强调深度推理能力。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答全局视野概率预测（快速反应模型，如ChatGPT 4o）链式推理(慢速思考模型，如OpenAI o1) 性能表现响应速度快，算力成本低慢速思考，算力成本高运算原理基于概率预测，通过大量数据训练来快速预测可能的答案基于链式思维（Chain-of-Thought），逐步推理问题的每个步骤来得到答案决策能力依赖预设算法和规则进行决策能够自主分析情况，实时做出决策创造力通用模型适配策略 1. 决策需求需权衡选项、评估风险、选择最优解目标 + 选项 + 评估标准要求逻辑推演和量化分析直接建议，依赖模型经验归纳 2. 分析需求需深度理解数据/信息、发现模式或因果关系问题 + 数据/信息 + 分析方法触发因果链推导与假设验证表层总结或分类 3. 创造性需求需生成新颖内容（文本/ 设计/方案）主题 + 风格/约束 + 创新方向

0 码力 | 103 页 | 5.40 MB | 8 月前
3
Ubuntu 桌面培训 2010

OpenOffice.org 演示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 IV.I.IV OpenOffice.org 数据库 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 目录 5 Ubuntu 桌面培训目录 IV.I.V OpenOffice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 VIII.56编辑新音乐文件的元数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 VIII.57导出进度指示器的熟练程度，适当地使用各种教学手段(幻灯片、范例和引导进行实验练习)。课程概况 35 Ubuntu 桌面培训目录 • 使用幻灯片帮助您专注于当前主题而避免离题，确保不遗漏任何有关信息的同时着重对主要的知识点进行讲解。偶尔看一眼特定的知识点，并尽快将您的注意力重新放回学生身上。避免单调地逐字复述幻灯片上的内容。 • 为了激发学生的积极性，在课堂上贯穿进行实验练习。课程结构每个课程包括以下几个部分。

0 码力 | 540 页 | 26.26 MB | 1 年前
3
基于 KUBERNETES 的容器器 + AI 平台

LBaaS(Neutron) • openstack/kuryr- kubernetes 运⾏行行和构建应⽤用跑在 KUBERNETES 上的应⽤用 • k8s 基础资源之外 • 资源分组和整体状态 • 重⽤用 YAML 配置 • 版本化 • 启动依赖 • Helm 很棒，但是 …… 典型企业应⽤用的架构 CAICLOUD/RUDDER • 2 CRDs - Release, Release kubeflow/tf-operator • 定义 TFJob Spec (CRD) • 跟踪 TensorFlow 任务运⾏行行状态 • ⽀支持分布式 TensorFlow 任务 KUBEFLOW 之上 • 借⼒力力容器器平台提供⽣生产级的集群资源管理理 • ⼯工作区隔离与共享 • 数据、模型、环境、应⽤用等 • 全⾯面⽀支持 AI ⼯工作流 • 探索开发 • 线上运⾏行行关注并回复 kubecon18

0 码力 | 19 页 | 3.55 MB | 1 年前
3
Kubernetes Operator 实践 - MySQL容器化

小结搜狗商业平台技术体系广服务多迭代快搜狗产品矩阵商业平台信息流广告搜索广告品牌广告代理商广告主技术体系 CRM 广告平台物料展现审核平台大数据平台基础架构 Golang C++ JavaScript Java Python 质量要求高业务响应快故障恢复快 Cluster1 搜狗商业平台业务系统搜索推广信息流 of complex stateful applications on behalf of a Kubernetes user. operator 是特殊的 controller，用来管理复杂的分布式应用 ü custom resource definition(CRD) ü custom controller Operator 是什么 • Kubernetes 中一切都可视为资源 • MySQL-Operator 集群管理 Master High Availability Ø 目前最常用的高可用实现 Ø 支持大多数 MySQL 版本 Ø 使用 mysql 半同步复制 Ø 有数据丢失风险 Mysql Group Replication Ø MySQL 官方提供 Ø 5.7 新特性 Ø 基于 Paxos 协议 Ø 写入延迟相对高 MySQL 高可用的实现方式 MHA

0 码力 | 42 页 | 4.77 MB | 1 年前
3
谈谈MYSQL那点事

互联网常用数据库市场占有率互联网通用架构体制谈谈 MySQL 数据库那些事  MySQL MySQL 基本介绍基本介绍  MySQL MySQL 优化方式优化方式  MySQL MySQL 技巧分享技巧分享  Q Q & & AA MyISAM MyISAM 特点特点 MyISAM vs MyISAM vs InnoDB InnoDB • 数据存储方式简单，使用数据存储方式简单，使用数据存储方式简单，使用 B+ Tree B+ Tree 进行索引进行索引 • 使用三个文件定义一个表：使用三个文件定义一个表： .MYI .MYD .frm .MYI .MYD .frm • 少碎片、支持大文件、能够进行索引压缩少碎片、支持大文件、能够进行索引压缩 • 二进制层次的文件可以移植二进制层次的文件可以移植 (Linux (Linux 不支持一些数据库特性，比如事务、外键约束等不支持一些数据库特性，比如事务、外键约束等 • Table level lock Table level lock ，性能稍差，更适合读取多的操作，性能稍差，更适合读取多的操作 InnoDB InnoDB 特点特点 •使用使用 Table Space Table Space 的方式来进行数据存储的方式来进行数据存储 (ibdata1

0 码力 | 38 页 | 2.04 MB | 1 年前
3
Apache Pulsar，云原生时代的消息平台 - 翟佳

Apache Pulsar 是什么 streamnative.io Apache Pulsar 要解决的问题 • 企业需求和数据规模 • 多租户 - 百万Topics - 低延时 - 持久化 - 跨地域复制 • 解除存储计算耦合 • 运维痛点：替换机器、服务扩容、数据 rebalance • 减少⽂件系统依赖 • 性能难保障：持久化（fsync）、⼀致性（ack: all）、多Topic • 独⽴扩展 • 灵活扩容 • 快速容错 streamnative.io Broker 容错⽆感知容错零数据catchup streamnative.io Bookie容错应⽤⽆感知并发可控数据恢复 streamnative.io 瞬时存储扩容应⽤⽆感知数据均匀分布⽆re-balance Pulsar：云原⽣的架构优势 https://jack-vanlightly BookKeeper：企业级流存储层分布式⽇志/流存储 • 低延时、⾼吞吐、持久化 • 强⼀致 (repeatable read consistency) • ⾼可⽤ • 单节点可以存储很多⽇志 • I/O隔离 Apache BookKeeper：诞⽣场景 streamnative.io 企业级流存储层：节点对等的架构 • openLedger(组内节点数⽬, 数据备份数⽬, 等待刷盘节点数⽬）

0 码力 | 39 页 | 12.71 MB | 6 月前
0.03
基于go和flutter的实时通信/视频直播解决方案段维伟

com/pion Pion 介子纯Go语言的WebRTC 全家桶作者: Sean DuBois ION 离子之光分布式实时通讯系统 https://github.com/pion/ion • 基于pion/webrtc 开发 pion/ion-sfu • 分布式架构 • 基于grpc over NATS mq • 使用redis 存储媒体流全局位置 • 支持业务自定义开发 • 服务发现，负载均衡，媒体信息全局存储 • Biz 业务接入模块 • SFU 节点 (用于转发webrtc 流，与biz模块配合创建视频会议系统) • AVP 节点 (用于从SFU节点拉取数据进行数据处理，视频流存储，音视频混合，CV ，语音识别，图形识别等) • 网关节点与go-sip stack 或rtmp/hls/srt等协议组合成协议网关 • 转换RTC流成直播流推送到CDN

0 码力 | 38 页 | 2.22 MB | 1 年前
3

共 18 条前往

页

分类

语言

格式