 动手学深度学习 v2.056 2.3.7 点积(Dot Product) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 i 2.3.8 矩阵‐向量积 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.3 . . . . . . . . . . . . . . . . 506 12.2 异步计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508 12.2.1 通过后端异步处理 . . . . . . . . . . . . . . . . . . . . . 记事本”选项下载后解压代码, 或者可以按照如下方式进行下载: mkdir d2l-zh && cd d2l-zh curl https://zh-v2.d2l.ai/d2l-zh-2.0.0.zip -o d2l-zh.zip unzip d2l-zh.zip && rm d2l-zh.zip cd pytorch 注意:如果没有安装unzip,则可以通过运行sudo apt install unzip进行安装。0 码力 | 797 页 | 29.45 MB | 1 年前3 动手学深度学习 v2.056 2.3.7 点积(Dot Product) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 i 2.3.8 矩阵‐向量积 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.3 . . . . . . . . . . . . . . . . 506 12.2 异步计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508 12.2.1 通过后端异步处理 . . . . . . . . . . . . . . . . . . . . . 记事本”选项下载后解压代码, 或者可以按照如下方式进行下载: mkdir d2l-zh && cd d2l-zh curl https://zh-v2.d2l.ai/d2l-zh-2.0.0.zip -o d2l-zh.zip unzip d2l-zh.zip && rm d2l-zh.zip cd pytorch 注意:如果没有安装unzip,则可以通过运行sudo apt install unzip进行安装。0 码力 | 797 页 | 29.45 MB | 1 年前3
 从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱腾讯系内容推荐:阅⽂集团,QQ⾳乐 � Facebook推荐场景推理成本占AI推理成本的 >72% [ISCA2020 RecNMP] � 千亿级推荐模型应⽤ O1. 千亿级特征(TB级)的模型的在线/离 线训练,在线推理服务和持续上线 O2. 针对推荐特点的深度优化,达到业界先 进⽔平 推荐系统的核⼼特点 � Feature 1(基本特点) 1.1 User与推荐系统交互,7*24⼩时 百TB数据 分⽚训练 Feature 1: 动态空间 Feature 2.1:短时间内只有部分item和user 被命中,只有部分参数被⽤到 参数按需 获取/更新 Storage 异步训练流⽔线和多级存储:提升性能,降低内存成本 � 问题: � Learner线程中参数拉取和参数更新对性能影响⼤ � 内存成为主要资源瓶颈。由于需要等待全部参数 就绪,Parameter Server难以利⽤速度慢的存储 Worker 返回参数 Request Handler Parameter Server 更新参数 � 异步参数处理流⽔线 参数 预准备 Batch⼊队列 Batch⼊队列 � 效果: � 在不影响训练效果的情况下,降低参数准备与更新耗时,提 ⾼训练速度。训练耗时下降超50% � 异步storage线程,⽀持基于冷热数据的多级存储。内存消 耗下降30%-70% 磁盘 训练 Lookup+0 码力 | 22 页 | 6.76 MB | 1 年前3 从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱腾讯系内容推荐:阅⽂集团,QQ⾳乐 � Facebook推荐场景推理成本占AI推理成本的 >72% [ISCA2020 RecNMP] � 千亿级推荐模型应⽤ O1. 千亿级特征(TB级)的模型的在线/离 线训练,在线推理服务和持续上线 O2. 针对推荐特点的深度优化,达到业界先 进⽔平 推荐系统的核⼼特点 � Feature 1(基本特点) 1.1 User与推荐系统交互,7*24⼩时 百TB数据 分⽚训练 Feature 1: 动态空间 Feature 2.1:短时间内只有部分item和user 被命中,只有部分参数被⽤到 参数按需 获取/更新 Storage 异步训练流⽔线和多级存储:提升性能,降低内存成本 � 问题: � Learner线程中参数拉取和参数更新对性能影响⼤ � 内存成为主要资源瓶颈。由于需要等待全部参数 就绪,Parameter Server难以利⽤速度慢的存储 Worker 返回参数 Request Handler Parameter Server 更新参数 � 异步参数处理流⽔线 参数 预准备 Batch⼊队列 Batch⼊队列 � 效果: � 在不影响训练效果的情况下,降低参数准备与更新耗时,提 ⾼训练速度。训练耗时下降超50% � 异步storage线程,⽀持基于冷热数据的多级存储。内存消 耗下降30%-70% 磁盘 训练 Lookup+0 码力 | 22 页 | 6.76 MB | 1 年前3
 【PyTorch深度学习-龙龙老师】-测试版202112ipython numpy matplotlib pillow pandas - i https://pypi.tuna.tsinghua.edu.cn/simple 国内使用 pip 命令安装时,可能会出现下载速度缓慢甚至连接断开的情况,需要配置 国内的 pip 源,只需要在 pip install 命令后面带上“-i 源地址”参数即可。上述命令即使用 了清华大学的 pip 源。 1.6 Bellemare, A. Graves, M. Riedmiller, A. K. Fidjeland, G. Ostrovski, S. Petersen, C. Beattie, A. Sadik, I. Antonoglou, H. King, D. Kumaran, D. Wierstra, S. Legg 和 D. Hassabis, “Human-level control through + . + ?, ? ∼ ?( , . 12) 通过随机采样? = 1 次,可以获得?个样本的训练数据集?train,代码如下: data = []# 保存样本集的列表 for i in range(100): # 循环采样 100 个点 x = np.random.uniform(-10., 10.) # 随机采样输入 x # 采样高斯噪声0 码力 | 439 页 | 29.91 MB | 1 年前3 【PyTorch深度学习-龙龙老师】-测试版202112ipython numpy matplotlib pillow pandas - i https://pypi.tuna.tsinghua.edu.cn/simple 国内使用 pip 命令安装时,可能会出现下载速度缓慢甚至连接断开的情况,需要配置 国内的 pip 源,只需要在 pip install 命令后面带上“-i 源地址”参数即可。上述命令即使用 了清华大学的 pip 源。 1.6 Bellemare, A. Graves, M. Riedmiller, A. K. Fidjeland, G. Ostrovski, S. Petersen, C. Beattie, A. Sadik, I. Antonoglou, H. King, D. Kumaran, D. Wierstra, S. Legg 和 D. Hassabis, “Human-level control through + . + ?, ? ∼ ?( , . 12) 通过随机采样? = 1 次,可以获得?个样本的训练数据集?train,代码如下: data = []# 保存样本集的列表 for i in range(100): # 循环采样 100 个点 x = np.random.uniform(-10., 10.) # 随机采样输入 x # 采样高斯噪声0 码力 | 439 页 | 29.91 MB | 1 年前3
 全连接神经网络实战. pytorch 版功能,也就是说它可以依次将 batch_size 数量的样本导出。 注意,前面已经导入过的 python 包我们就不再重复导入了。 from torch . u t i l s . data import Dataset from torch . u t i l s . data import DataLoader 前面说过,Dataset 可以存储自定义数据,我们可以继承 Dataset 类,在子类中实现一些固定 , } import matplotlib . pyplot as plt f i g u r e = plt . f i g u r e () # 抽 取 索 引 为 100 的 数 据 来 显 示 img , l a b e l = training_data [ 1 0 0 ] plt . t i t l e ( labels_map [ l a b e l ] ) #squeeze train_labels = next ( i t e r ( train_dataloader ) ) print ( f ” Feature ␣batch␣shape : ␣{ train_features . s i z e () }” ) print ( f ” Labels ␣batch␣shape : ␣{ train_labels . s i z e () }” ) # 取 出 索0 码力 | 29 页 | 1.40 MB | 1 年前3 全连接神经网络实战. pytorch 版功能,也就是说它可以依次将 batch_size 数量的样本导出。 注意,前面已经导入过的 python 包我们就不再重复导入了。 from torch . u t i l s . data import Dataset from torch . u t i l s . data import DataLoader 前面说过,Dataset 可以存储自定义数据,我们可以继承 Dataset 类,在子类中实现一些固定 , } import matplotlib . pyplot as plt f i g u r e = plt . f i g u r e () # 抽 取 索 引 为 100 的 数 据 来 显 示 img , l a b e l = training_data [ 1 0 0 ] plt . t i t l e ( labels_map [ l a b e l ] ) #squeeze train_labels = next ( i t e r ( train_dataloader ) ) print ( f ” Feature ␣batch␣shape : ␣{ train_features . s i z e () }” ) print ( f ” Labels ␣batch␣shape : ␣{ train_labels . s i z e () }” ) # 取 出 索0 码力 | 29 页 | 1.40 MB | 1 年前3
 《TensorFlow 快速入门与实战》7-实战TensorFlow人脸识别�������� ��� �����������---����������������-� LFW.Labeled Face in the Wild/ LFW �t������i 6000 �����h�����vh�i 300 �u��300 ���� ���ha��c��d����t���LFW���s�d�����p� 2013�:�����������f�������l��+�c��� DB ������� ����� T���e�l���������l����Y�����a�h�o b��i���������l�����������o ���lfT��37�7,.�c�o � ������������lo������l�����������������l����� ������o 06645���888��5�6�7����12�:832/�96/��.5� CASIA-WebFace �������S���i������W� cn���mke��l�h�����������K��mkeC������w ����cntp_�������f�d�as�������I_cn����� ����� �����������-�:���+�+-�-��/�15�:���������/��+-/��������/��+-/��1�//�/��:��.0 ��o���u ��Y �r0 码力 | 81 页 | 12.64 MB | 1 年前3 《TensorFlow 快速入门与实战》7-实战TensorFlow人脸识别�������� ��� �����������---����������������-� LFW.Labeled Face in the Wild/ LFW �t������i 6000 �����h�����vh�i 300 �u��300 ���� ���ha��c��d����t���LFW���s�d�����p� 2013�:�����������f�������l��+�c��� DB ������� ����� T���e�l���������l����Y�����a�h�o b��i���������l�����������o ���lfT��37�7,.�c�o � ������������lo������l�����������������l����� ������o 06645���888��5�6�7����12�:832/�96/��.5� CASIA-WebFace �������S���i������W� cn���mke��l�h�����������K��mkeC������w ����cntp_�������f�d�as�������I_cn����� ����� �����������-�:���+�+-�-��/�15�:���������/��+-/��������/��+-/��1�//�/��:��.0 ��o���u ��Y �r0 码力 | 81 页 | 12.64 MB | 1 年前3
 Qcon北京2018-《文本智能处理的深度学习技术》-陈运文达观数据 陈运文 文本智能处理的深度学习技术 达观数据CEO 陈运文 博士 • 中 国 计 算 机 学 会 高 级 会 员 , A C M 和 I E E E 学 会 会 员 , 复 旦 大 学 计 算 机 博 士 和 杰 出 毕 业 生 • 原 腾 讯 文 学 高 级 总 监 、 盛 大 文 学 首 席 数 据 官 、 百 度 核 心 技 术 工 程 师 • 三 十 项 国 家 技 术 LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM O O O B-PER E-PER B-ORG I-ORG I-ORG E-ORG CRF 04 达观数据文本挖掘的实践经验 文 档 智 能 抽 取 功 能 l 财务报表账目信息抽取 l 商业票据关键信息识别 l 应标书信息自动导出 单词在实体中的位置{B(begin),I(inside),E(end),S(single)} • 关系类型{CF,CP,...} • 关系角色{1(entity1),2(entity2)} 根据标签序列,将同样关系类型的实体合并成一个三元组作为最后的结果,如果一个句子包含一个以上同一类 型的关系,那么就采用就近原则来进行配对。 目前这套标签并不支持实体关系重叠的情况。 B-CP-1 O B-CP-2 E-CP-20 码力 | 46 页 | 25.61 MB | 1 年前3 Qcon北京2018-《文本智能处理的深度学习技术》-陈运文达观数据 陈运文 文本智能处理的深度学习技术 达观数据CEO 陈运文 博士 • 中 国 计 算 机 学 会 高 级 会 员 , A C M 和 I E E E 学 会 会 员 , 复 旦 大 学 计 算 机 博 士 和 杰 出 毕 业 生 • 原 腾 讯 文 学 高 级 总 监 、 盛 大 文 学 首 席 数 据 官 、 百 度 核 心 技 术 工 程 师 • 三 十 项 国 家 技 术 LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM O O O B-PER E-PER B-ORG I-ORG I-ORG E-ORG CRF 04 达观数据文本挖掘的实践经验 文 档 智 能 抽 取 功 能 l 财务报表账目信息抽取 l 商业票据关键信息识别 l 应标书信息自动导出 单词在实体中的位置{B(begin),I(inside),E(end),S(single)} • 关系类型{CF,CP,...} • 关系角色{1(entity1),2(entity2)} 根据标签序列,将同样关系类型的实体合并成一个三元组作为最后的结果,如果一个句子包含一个以上同一类 型的关系,那么就采用就近原则来进行配对。 目前这套标签并不支持实体关系重叠的情况。 B-CP-1 O B-CP-2 E-CP-20 码力 | 46 页 | 25.61 MB | 1 年前3
 Experiment 1: Linear Regressiontraining set {x(i)}i=1,··· ,m, our goal is to find the optimal value of θ such that the objective function J(θ), as shown in Equation (2), can be minimized. J(θ) = 1 2m m � i=1 (hθ(x(i)) − y(i))2 (2) One m m � i=1 (hθ(x(i)) − y(i))x(i) j (3) where α is so-called “learning rate” based on which we can tune the convergence of the gradient descent. 1A training data is actually n-dimensional, i.e., x = boys corresponding to the heights. Each height and age tuple constitutes one training example (x(i), y(i) in our dataset. There are m = 50 training examples, and you will use them to develop a linear regression0 码力 | 7 页 | 428.11 KB | 1 年前3 Experiment 1: Linear Regressiontraining set {x(i)}i=1,··· ,m, our goal is to find the optimal value of θ such that the objective function J(θ), as shown in Equation (2), can be minimized. J(θ) = 1 2m m � i=1 (hθ(x(i)) − y(i))2 (2) One m m � i=1 (hθ(x(i)) − y(i))x(i) j (3) where α is so-called “learning rate” based on which we can tune the convergence of the gradient descent. 1A training data is actually n-dimensional, i.e., x = boys corresponding to the heights. Each height and age tuple constitutes one training example (x(i), y(i) in our dataset. There are m = 50 training examples, and you will use them to develop a linear regression0 码力 | 7 页 | 428.11 KB | 1 年前3
 Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf8(% ������ pu/行i检测技术 • 目的a给定e定长视频,定x感兴趣行i发生的时间段并给出 对应行i类标 • 方法a采取1QPvQNuVLQP 32+5DVHG >HFuTTHPV APLVU 5>A) 算法,结合SLPgNH ShQV 2HVHFVQT SS2)框架实现行i检测功 能 • 效果a • THA9OS 14数据集,O/P-%4.1% 7QA-0.() () 内容理解——pu/行i检测 ����/���� ���������� • 目的a定x和识别视频h的特定目标,并在目标生命周期内 进行跟踪 • 方法a检测采用>HgLQP IuNNy FQPvQNuVLQP PHVwQTM >-41:) 的GHHR NHDTPLPg框架,对q小物体在IHDVuTH ODR进行ow 化b跟踪采用214框架,结合颜色模型,并使用0/14进行 候选区域扩充 候选区域扩充 • 效果a • 检测算法在HQNNywQQG HHDG数据集,O/P-80.41%, 高过VhH UVDVH-QI-DTV ).)%b • 0TDLPwDUh数据集,O/P-88.4)%,高过VhH UVDVH-QI- DTV 10.(%。 • 跟踪算法在T0-100评测集,在实时速度d,RTHFLULQP 和UuFFHUU TDVH效果最好 内容理解——多目标检测f跟踪0 码力 | 24 页 | 9.60 MB | 1 年前3 Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf8(% ������ pu/行i检测技术 • 目的a给定e定长视频,定x感兴趣行i发生的时间段并给出 对应行i类标 • 方法a采取1QPvQNuVLQP 32+5DVHG >HFuTTHPV APLVU 5>A) 算法,结合SLPgNH ShQV 2HVHFVQT SS2)框架实现行i检测功 能 • 效果a • THA9OS 14数据集,O/P-%4.1% 7QA-0.() () 内容理解——pu/行i检测 ����/���� ���������� • 目的a定x和识别视频h的特定目标,并在目标生命周期内 进行跟踪 • 方法a检测采用>HgLQP IuNNy FQPvQNuVLQP PHVwQTM >-41:) 的GHHR NHDTPLPg框架,对q小物体在IHDVuTH ODR进行ow 化b跟踪采用214框架,结合颜色模型,并使用0/14进行 候选区域扩充 候选区域扩充 • 效果a • 检测算法在HQNNywQQG HHDG数据集,O/P-80.41%, 高过VhH UVDVH-QI-DTV ).)%b • 0TDLPwDUh数据集,O/P-88.4)%,高过VhH UVDVH-QI- DTV 10.(%。 • 跟踪算法在T0-100评测集,在实时速度d,RTHFLULQP 和UuFFHUU TDVH效果最好 内容理解——多目标检测f跟踪0 码力 | 24 页 | 9.60 MB | 1 年前3
 AI大模型千问 qwen 中文文档Qwen Qwen Team 2024 年 05 月 11 日 快速开始 1 文档 3 i ii Qwen Qwen is the large language model and large multimodal model series of the Qwen Team, Alibaba Group. Now the large language models have been --local-dir-use-symlinks False 然后你可以用如下命令运行模型: ./main -m qwen1_5-7b-chat-q5_k_m.gguf -n 512 --color -i -cml -f prompts/chat-with- �→qwen.txt -n 指的是要生成的最大 token 数量。这里还有其他超参数供你选择,并且你可以运行 ./main -h 以了解它们。 https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-2-raw-v1.zip? �→ref=salesforce-research -O wikitext-2-raw-v1.zip unzip wikitext-2-raw-v1.zip 然后你可以用如下命令运行测试: ./perplexity -m models/7B/ggml-model-q4_00 码力 | 56 页 | 835.78 KB | 1 年前3 AI大模型千问 qwen 中文文档Qwen Qwen Team 2024 年 05 月 11 日 快速开始 1 文档 3 i ii Qwen Qwen is the large language model and large multimodal model series of the Qwen Team, Alibaba Group. Now the large language models have been --local-dir-use-symlinks False 然后你可以用如下命令运行模型: ./main -m qwen1_5-7b-chat-q5_k_m.gguf -n 512 --color -i -cml -f prompts/chat-with- �→qwen.txt -n 指的是要生成的最大 token 数量。这里还有其他超参数供你选择,并且你可以运行 ./main -h 以了解它们。 https://s3.amazonaws.com/research.metamind.io/wikitext/wikitext-2-raw-v1.zip? �→ref=salesforce-research -O wikitext-2-raw-v1.zip unzip wikitext-2-raw-v1.zip 然后你可以用如下命令运行测试: ./perplexity -m models/7B/ggml-model-q4_00 码力 | 56 页 | 835.78 KB | 1 年前3
 如何利用深度学习提高高精地图生产的自动化率-邹亮���� ������������������ DEEPMAP���� �������M�SL���P�G�M���� ��M�SL��������������P���� ����I��� �P��������I�M����U�� ��M�C�������� ��(������� ���)����� ����������� ������� DeepMapTM 3D Map for Localization ���A����� �������� (Sign Detection, Traffic Light Detection) ���������������)��������(������ ��O���D�)3�2����� �������������������D��1R)�� ���� �������� (Sign Detection, Traffic Light Detection) ��� 3D������ �����������������������(��������������������) � � ���D����������A� D�� ��������O� ���������� 3D������ ���(��������D���� ��� ��� ���(��������������)2��1��������� 3D������ ���0 码力 | 34 页 | 56.04 MB | 1 年前3 如何利用深度学习提高高精地图生产的自动化率-邹亮���� ������������������ DEEPMAP���� �������M�SL���P�G�M���� ��M�SL��������������P���� ����I��� �P��������I�M����U�� ��M�C�������� ��(������� ���)����� ����������� ������� DeepMapTM 3D Map for Localization ���A����� �������� (Sign Detection, Traffic Light Detection) ���������������)��������(������ ��O���D�)3�2����� �������������������D��1R)�� ���� �������� (Sign Detection, Traffic Light Detection) ��� 3D������ �����������������������(��������������������) � � ���D����������A� D�� ��������O� ���������� 3D������ ���(��������D���� ��� ��� ���(��������������)2��1��������� 3D������ ���0 码力 | 34 页 | 56.04 MB | 1 年前3
共 67 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7













