机器学习课程-温州大学-02深度学习-神经网络的编程基础1 2023年03月 深度学习-神经网络的编程基础 黄海广 副教授 2 本章目录 01 二分类与逻辑回归 02 梯度下降 03 计算图 04 向量化 3 1.二分类与逻辑回归 02 梯度下降 01 二分类与逻辑回归 03 计算图 04 向量化 4 符号定义 ?:表示一个??维数据,为输入数 据,维度为(??, 1);0 码力 | 27 页 | 1.54 MB | 1 年前3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入1 2023年05月 深度学习-自然语言处理和词嵌入 黄海广 副教授 2 03 Word2Vec 04 GloVe 本章目录 01 词汇表征和文本数据处理 02 词嵌入 05 GPT 3 1.词汇表征 01 词汇表征和文本数据处理 03 Word2Vec 04 GloVe 02 词嵌入 05 GPT Word2Vec 03 Word2Vec 04 GloVe 02 词嵌入 05 GPT 01 词汇表征和文本数据处理 15 3.Word2Vec 语言模型的训练机制就是这样 1.我们获得了大量文本数据(例如,所 有维基百科文章)。然后 2.我们有一个窗口(比如说三个单词) ,我们会对所有文本进行滑动。 3.滑动窗口为我们的模型生成训练样本 数据集中为每个训练样本做一次(很可能数千万次)。我们 需要做一些事情来提高效率。 一种方法是将目标分成两个步骤: 1.生成高质量的单词嵌入(不要担心下一个单词预测)。 2.使用这些高质量的嵌入来训练语言模型(进行下一个单词 预测)。 19 3.Word2Vec 负采样 并不是每次迭代都训练全部10,000个,我们只训练其中 的5个,我们要训练对应真正目标词那一个分类器,再训练 4个随机选取的负样本,这就是0 码力 | 44 页 | 2.36 MB | 1 年前3
第29 期| 2023 年9 月- 技术雷达Inc. All Rights Reserved. 2 关于技术雷达 3 雷达一览 4 贡献者 5 本期主题 6 本期雷达 8 技术 11 平台 19 工具 25 语言和框架 36 Thoughtworks 技术雷达 © Thoughtworks, Inc. All Rights Reserved. Thoughtworks 技术雷达 关于技术雷达 Thoughtworker 论结果,从首席技术官到开发人员,雷达将会为各 路利益相关方提供价值。这些内容只是简要的总结。 我们建议您探索雷达中提到的内容以了解更多细 节。技术雷达的本质是图形性质,把各种技术项目 归类为技术、工具、平台和语言和框架。如果技术 可以被归类到多个象限,我们选择看起来最合适的 一个。我们还进一步将这些技术分为四个环以反映 我们目前对其的态度。 想要了解更多技术雷达相关信息,请点击: thoughtworks open-source LLMs for coding 在工具领域可能带来的变革,并且我们看到了在编码之外的辅助领域中工具和能力的爆炸式增 长,如用户故事编写辅助、用户研究、电梯演讲和其他基于语言的任务。同时,我们希望开发人员能够负责任 地使用所有这些工具,并且始终掌控主导权,比如 hallucinated dependencies 就是其中一个需要注意的安全 和质量风险。 衡量生产力有多有效0 码力 | 43 页 | 2.76 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇����������������� 11 概述 大家好,本章是主要介绍一下深度学习框架 Pytorch 的的历史与发展,主要模 块构成与基础操作代码演示。重点介绍 Pytorch 的各个组件、编程方式、环境 搭建、基础操作代码演示。本章对有 Pytorch 开发经验的读者来说可以直接跳 过;对初次接触 Pytorch 的读者来说,通过本章学习认识 Pytorch 框架,搭建 好 Pytorch 介绍与基础知识 1.1 Pytorch 介绍 Pytorch 是开放源代码的机器学习框架,目的是加速从研究 原型到产品开发的过程。其 SDK 主要基于 Python 语言,而 Python 语言作为流行的人工智能开发语言一直很受研究者与 开发者的欢迎。其模型训练支持CPU与GPU、支持分布式训练、 云部署、针对深度学习特定领域有不同的丰富的扩展库。 1.1.1 Pytorch 历史 最初的来源历史可以追溯到另外两个 机器学习框架,第一个是 torch 框架,第二个是 Chainer,实 现了 Eager 模式与自动微分,Pytoch 集成了这两个框架的优 点, 把 Python 语言作为框架的首选编程语言,所以它的名字 是在 torch 的前面加上 Py 之后的 Pytorch。由于 Pytorch 吸 取了之前一些深度学习框架优点,开发难度大大降低、很容易 构建各种深度学习模型并实现分布式的训练,因此一发布就引0 码力 | 13 页 | 5.99 MB | 1 年前3
动手学深度学习 v2.0. . . . . . . . . . . . . . . . . . . 302 8.3 语言模型和数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 8.3.1 学习语言模型 . . . . . . . . . . . . . . . . . . . . . . . 303 8.3.2 马尔可夫模型与n元语法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 8.3.3 自然语言统计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 8.3.4 读取长序列数据 . 有隐状态的循环神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 8.4.3 基于循环神经网络的字符级语言模型 . . . . . . . . . . . . . . . . . . . . . . . . . . 315 8.4.4 困惑度(Perplexity) . . . . . . . . .0 码力 | 797 页 | 29.45 MB | 1 年前3
OpenShift Container Platform 3.11 开始使用与版本 2 (v2) 有很大不同。 OpenShift Container Platform 3 提供了一组 编程语言 和 数据库,以及相关的信息和教程,供开发人员 参考来快速开始进行应用程序开发。Quickstart 模板提供了编程语言支持,它利用 构建器(builder)镜 像。 语 语言 言 实 实施及指南 施及指南 Ruby Rails Python Django Node.js Node 登录到 GitHub,访问 Ruby 示例 页面。 注意 注意 本节介绍 Ruby 示例,但您可以使用 OpenShift Container Platform GitHub 项目 中提供的任何语言示例进行操作。 2. Fork 仓库。 您会被重新指向您的新 fork。 3. 复制 fork 的克隆 URL。 4. 将存储库克隆到您的本地机器。 4.4. 创建一个项目 要创建应用程序,您必须首先创建一个新项目,然后选择 与版本 2 (v2) 有很大不同。 OpenShift Container Platform 3 提供了一组 编程语言 和 数据库,以及相关的信息和教程,供开发人员 参考来快速开始进行应用程序开发。Quickstart 模板提供了编程语言支持,它利用 构建器(builder)镜 像。 语 语言 言 实 实施及指南 施及指南 Ruby Rails Python Django Node.js Node0 码力 | 24 页 | 290.05 KB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112可避免地需要使用正式化的 数学符号推导,其中涉及到少量的概率与统计、线性代数、微积分等数学知识,一般要求读 者对这些数学知识有初步印象或了解即可。比起理论基础,读者需要有少量的编程经验,特 别是 Python 语言编程经验,显得更加重要,因为本书更侧重于实用性,而不是堆砌公式。 总的来说,本书适合于大学三年级左右的理工科本科生和研究生,以及其他对人工智能算法 感兴趣的朋友。 本书共 15 章,大体上可分为 信息技术是人类历史上的第三次工业革命,计算机、互联网、智能家居等技术的普及 极大地方便了人们的日常生活。通过编程的方式,人类可以将提前设计好的交互逻辑交给 机器重复且快速地执行,从而将人类从简单枯燥的重复劳动工作中解脱出来。但是对于需 要较高智能水平的任务,如人脸识别、聊天机器人、自动驾驶等任务,很难设计明确的逻 辑规则,传统的编程方式显得力不从心,而人工智能(Artificial Intelligence,简称 AI)是有 年代,科学家们尝试通过知识库加推理的方式解决人工智能,通过构建庞大复杂 的专家系统来模拟人类专家的智能水平。这些明确指定规则的方式存在一个最大的难题, 就是很多复杂、抽象的概念无法用具体的代码实现。比如人类对图片的识别、对语言的理 解过程,根本无法通过既定规则模拟实现。为了解决这类问题,一门通过让机器自动从数 据中学习规则的研究学科诞生了,称为机器学习,并在 1980 年代成为人工智能中的热门学 预览版202112 第0 码力 | 439 页 | 29.91 MB | 1 年前3
Hadoop 概述。而众 所周知的文件系统,Hadoop 分布式文件系统,或者说 HDFS,则是 Hadoop 的核心,然而它并不会威胁到你的预算。如果要分析一组数 据,你可以使用 MapReduce 中包含的编程逻辑,它提供了在 Hadoop 群集上横跨多台服务器的可扩展性。为实现资源管理,可考虑将 Hadoop YARN 加入到软件栈中,它是面向大数据应用程序的分布式 操作系统。 ZooKeeper 运行在群集中大量低成本的机 器上。既然已经介绍了用于读取数据的工具,下一步便是用 MapReduce 来处理它。 1.1.3 MapReduce 是什么 MapReduce 是 Hadoop 的一个编程组件,用于处理和读取大型 数据集。MapReduce 算法赋予了 Hadoop 并行化处理数据的能力。 简而言之,MapReduce 用于将大量数据浓缩为有意义的统计分析结 果。MapReduce 统的数据库或数据结构进行对比。它也不能取代现有的 RDBMS 环 Hadoop 大数据解决方案 8 境。Hive 提供了一种为数据赋予结构的渠道,并且通过一种名为 HiveQL 的类 SQL 语言进行数据查询。 Hive Thrift 服务器 驱动程序 解析器 执行 Hive Web 接口 计划器 优化器 MS 客户端 元存储 图 1-3 1.40 码力 | 17 页 | 583.90 KB | 1 年前3
云计算白皮书排、部署等管理方式的不断升级,在算力资源的接入、调度和分发 等方面产生新的促进作用,具体表现为: 接入方面,云计算纳管能力持续加强,使多样性算力资源提供 成为可能。传统数据中心以提供通用算力为主,随着科学计算、自 然语言处理、视频渲染、知识图谱等计算需求的增长,通用算力资 源已不能满足这些超强计算型应用的需要,而云计算逐渐发展出多 样性算力资源池的能力,高性能计算云平台(HPC)、FPGA 云主机、 GPU 用 的底层语言,充分剥离复杂底层环境对上层应用的影响,将视角真 正地聚焦到应用侧。以 ChatGPT 为例,得益于云原生技术对多元异 构数据的统一接入,对单一维度应用的统一部署,模型的信息集成、 处理效率、计算精度和能力输出实现显著提高,使得其智能化水平 走在同类产品的前列。 工程模式方面,云计算助推应用从单点创新到体系化创新的突 破。云计算提供了数字时代的标准化沟通语言,软件、硬件等各领 数据为中心过渡。当前,产业各界逐渐开始探索以数据为中心的落 地方案,如阿里云发布云基础设施处理器 CIPU,并将其定位为代替 CPU 承担云计算服务管理和加速的关键处理器;云豹智能发布云霄 DPU,提出可编程通用 DPU 框架理念,并落地多个应用场景;中科 驭数发布 DPU 芯片 K2,能够实现 1.2 微秒低时延和最高 200G 网络 带宽。 以计算为中心向以数据为中心这一过渡变化,促使算力服务形0 码力 | 47 页 | 1.22 MB | 1 年前3
Extending service mesh capabilities using a streamlined way based on WASM and ORAS敏捷性:过滤器可以动态加载到正在运行的Envoy进程中,而无需停止或重新编译。 ○ 可维护性:不必更改Envoy自身基础代码库即可扩展其功能。 ○ 多样性:可以将流行的编程语言(例如C/C++和Rust)编译为WASM,因此开发人员可 以选择实现过滤器的编程语言。 ○ 可靠性和隔离性:过滤器会被部署到VM沙箱中,因此与Envoy进程本身是隔离的;即使 当WASM Filter出现问题导致崩溃时,它也不会影响Envoy进程。0 码力 | 23 页 | 2.67 MB | 1 年前3
共 144 条
- 1
- 2
- 3
- 4
- 5
- 6
- 15













