Golang在接入层长连接服务中的实践-黄欣Golang 在接入层长连接服务中的实践 黄欣 基础平台-架构部 目录 • 背景 • 架构 • 心得 目录 • 架构 • 心得 背景—why 长连接? • 业务场景 – 大量实时计算 • 司机乘客撮合 • 实时计价 – 高频度的数据交互 • 坐标数据 • 计价数据 – App和服务端双向可达 • 上行(抢单) • 下行(派单) 背景—why golang? • 开发效率0 码力 | 31 页 | 1.67 MB | 1 年前3
华为云深度学习在文本分类中的实践-李明磊华为云深度学习在文本分类中的实践 华为 Cloud&AI 李明磊 3 2 3 1 4 分类 算法 简史 深度 学习 架构 难点 应用 案例 目录 4 文本分类介绍 内容: 买没几天就降价一点都不开心,闪存跑分就五百多点点 --- 外观漂亮音质不错,现在电子产品基本上都是华为的了 --- 汽车不错,省油,性价比高 --- 这个政策好啊,利国利民 --- f(text)=label 词 句子 篇章 对话 5 文本分类方法简史-机器学习 特征提取 特征选择 输入 文本 模型训练 模型部署 评测 label 预测标签 词袋 TFIDF Ngram 词典 … 卡方 PCA 互信息 RFE … 分类器 SVM LR XGBoost 随机森林 … 6 文本分类方法简史-深度学习 输入 文本 模型训练 模型部署 评测 label label 预测标签 RNN CNN LSTM DCNN Attention HAN Transformer Elmo BERT MT-DNN 7 文本分类方法简史-深度学习 神经网络 语言模型 2003 神经网络NLP里程碑: Word2vec 2013 CNN RNN 2014左右 Attention 2014 Elmo, Bert 2018 解决维度灾难0 码力 | 23 页 | 1.80 MB | 1 年前3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文达观数据 陈运文 文本智能处理的深度学习技术 达观数据CEO 陈运文 博士 • 中 国 计 算 机 学 会 高 级 会 员 , A C M 和 I E E E 学 会 会 员 , 复 旦 大 学 计 算 机 博 士 和 杰 出 毕 业 生 • 原 腾 讯 文 学 高 级 总 监 、 盛 大 文 学 首 席 数 据 官 、 百 度 核 心 技 术 工 程 师 • 三 十 项 国 家 技 术 挖 掘 技 术 和 相 关 应 用 系 统 的 服 务 个人简介——达观数据CEO 陈运文 达观数据:全球领先的文本智能处理专家 l 为企业提供文本挖掘、知识图谱、搜索引擎和个性化推荐等文本智能处理技术服 务,是国内首家将自动语义分析技术应用于企业数据化运营的人工智能公司 专注于文本挖掘的国际领军人工智能企业 l 获得全球三十大最佳AI企业等荣誉,拥有国家级高新技术企业、CMMI3资质认 证 全 l 覆盖金融、制造、法律、电商、传媒等行业,提升企业文档自动化处理能力 为数百家中国知名客户提供完善的文本智能处理服务 01 文本智能处理背景简介 7 文本 语音 图像 人工智能 Voice Image Text 达观专注于人工智能中的文本处理细分领域 文本处理任务 什么是NLP 概念:Natural Language Processing 自然语言处理 目的0 码力 | 46 页 | 25.61 MB | 1 年前3
go-zero开源项目的成长史0 码力 | 31 页 | 4.83 MB | 9 月前3
Object Pascal 参考手册(Ver 0.1) 工程选项文件,扩展名为 .dof(Delphi)或 .kof(Kylix) 窗体文件或者是一个文本文件,或者是一个编译的资源文件,资源文件能包含位图、字符串等等。 每个窗体文件表示一个窗体,通常对应于程序中的一个窗口或对话框。IDE 允许以文本方式察看和编辑 窗体文件,并且能以文本或二进制格式保存它。虽然默认是以文本方式保存窗体,但通常不要手动编辑 它,更常用的方式是使用 Borland 提供的可视化设 + 运算符的运算数可以是字符串、packed string(packed arrays of type Char)或字符。但是,若 其中一个运算数是宽字符(WideChar)类型,其它运算数必须是长字符串。 • + 运算符的返回结果和任何字符串类型是兼容的。但是,若运算数都是短字符串或字符,并且 它们的组合长度大于 255,则返回结果取前面的 255 个字符。 Pointer operators(指针运算符) TByteRec(TWordRec(L).Low).Hi; B := PByte(L)^; end; 在这个例子中,TbyteRec 被用来访问一个字(word)的低字节和高字节,TwordRec 被用来访问一个长 整数的低字和高字。你也可以使用内置函数 Lo 和 Hi 达到同样的目的,但变量转换的优点就是它可以用 在赋值语句的左边。 Syntactic elements - 30 - 要了解指针转换,请参考0 码力 | 168 页 | 868.25 KB | 1 年前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容;0 码力 | 85 页 | 8.31 MB | 8 月前3
PlantUML 1.2021.3 语言参考指引self.\nIt also demonstrates\nmultiline \ntext @enduml PlantUML 语言参考指引 (1.2021.2) 3 / 397 1.5 文本对齐 1 时序图 1.5 文本对齐 1.5.1 让响应信息显示在箭头下面 你可以使用 skinparam responseMessageBelowArrow true 命令,让响应信息显示在箭头下面。 @startuml 10 分割示意图 1 时序图 1.10 分割示意图 关键字 newpage 用于把一张图分割成多张。 在 newpage 之后添加文字,作为新的示意图的标题。 这样就能很方便地在 Word 中将长图分几页打印。 @startuml Alice -> Bob : message 1 Alice -> Bob : message 2 newpage Alice -> Bob : message 结束记录攻击日志 end else 另一种失败 Bob -> Alice: 请重复 end @enduml 1.12 次级分组标签 对于 group 而言,在标头处的 [和] 之间可以显示次级文本或标签。 @startuml Alice -> Bob: 认证请求 PlantUML 语言参考指引 (1.2021.2) 9 / 397 1.13 给消息添加注释 1 时序图 Bob -> Alice:0 码力 | 398 页 | 4.22 MB | 1 年前3
2023 中国开源开发者报告倍以上,能够提供全球气象秒级预 报。盘古大模型的研究成果在国际顶级学术期刊《自然》正 刊发表,获得国际学术界的认可。 年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处 理约 40 万字的文本,成为当时全球大模型中最长的上下文 窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 Gitee 与 OSS Compass 作为数据来源,试图通过数据来反映 2023 年开源开发者圈子的相关情况。 这里提取几个亮点数据: TypeScript 是 增 长 最 快 的 编 程 语 言 , 增 长 率 达 到 49.04% MulanPSL-2.0 在“2023 年使用增长率最快的开源许 可证”中排行第二,增长率为 18.34% 较为活跃的社区代表: OpenHarmony、openEuler 王茜,OSCHINA 主编 叶子,OSCHINA 新媒体运营 鱼仔,OSCHINA 新媒体运营 诺墨,Gitee 开源社区产品负责人 张力文,Gitee 公有云研发负责人 李泽辰,Gitee 主编 李涛,APUS 董事长兼 CEO 特邀评论员: 陈天舟,Bytebase 联合创始人/CEO 王春生,禅道软件公司创始人 冯若航,Pigsty 作者、磐吉云数创始人 叶金荣,GreatSQL 开源生态负责人 杜天微,狮偶编程语言作者0 码力 | 87 页 | 31.99 MB | 1 年前3
使用 PlantUML 绘制 UML - PlantUML 语言参考指引(Version 1.2023.11)表创建新手也能轻松快速地掌握基础知识。 • 文本与图形的关联: 另一个显著特点是文本表示与图形输出之间非常相似。这种和谐的相关性可确保文本草稿准确地转化为 图形图表,从而提供连贯、可预测的设计体验,在最终输出中不会出现令人不快的意外。 • 高效的制作过程: 文本和图形结果之间的紧密联系不仅简化了制作过程,还大大加快了制作速度。用户可从更简化的流程 中获益,减少耗时的修改和调整要求。 • 起草时的可视化: 在起草文本的同时就 可能性。 • 易于编辑和修改: 重要的是,编辑现有图表的过程非常简便。由于图表是由文本生成的,用户会发现进行调整比使用图形 工具修改图像要容易得多,也精确得多。 PlantUML 为创建和编辑序列图提供了一种简单明了、用户友好的方法,既能满足新手的需求,也能满 足经验丰富的设计人员的需求。它巧妙地利用文本输入的简便性来制作具有视觉描述性和准确性的图表, 从而使自己成为图表创建工具包中的必备工具。 1.6 文本对齐 1 序列图 *[Ref. [QA-1361](https://forum.plantuml.net/1361)]* 1.6 文本对齐 箭头上的文本对齐可以用 skinparam sequenceMessageAlign,后接参数 left,right 或 center。 你也可以使用 direction 或 reverseDirection 来根据箭头的方向对齐文本。更多细节可参考0 码力 | 539 页 | 7.74 MB | 1 年前3
2022年美团技术年货 合辑中,用图表示用户与商品之间的点击购买行为;在知识图谱构建中,还可以用图表示 实体与实体间多样的关系。另一方面,深度学习技术在计算机视觉、自然语言处理、 语音处理等领域均已取得了巨大的成功。深度学习技术将图像、文本、语音等多种多 样的数据转化为稠密的向量表示,提供了表示数据的另一种方式。借助于硬件日益强 大的计算能力,深度学习可以从海量数据中学习到数据之间复杂多样的相关性。 这会让人不禁思考,深度学习能 一 流的自然语言处理核心技术和服务能力,依托 NLP(自然语言处理)、Deep Learning(深度学 习)、Knowledge Graph(知识图谱)等技术,处理美团海量文本数据,为美团各项业务提供智 能的文本语义理解服务。NLP 中心长期招聘自然语言处理算法专家 / 机器学习算法专家,感兴 趣的同学可以将简历发送至:tech@meituan.com(邮件主题:美团搜索与 NLP 部)。 Embedding,灌库 训练完成后,将原有子图查询模块拆分,再对长期行为中全量 POI 做一次子图 POI-Embedding 聚合操作,得到行为 POI 的子图 Embedding。灌库阶段,将长 期行为子图 POI 的 Embedding 和其他特征的 Embedding 写入 Redis 存储中。 ● Step3. 对联合训练的模型进行重构导出生成新的线上 Serving 模型0 码力 | 1356 页 | 45.90 MB | 1 年前3
共 822 条
- 1
- 2
- 3
- 4
- 5
- 6
- 83













