第29 期| 2023 年9 月- 技术雷达ChatGPT,Google Bard,Meta 的 LLaMA 以及亚马逊的 Bedrock 等)在我们的讨论中占据重要地位。更广泛来说,大语言模型可以应用于从 内容生成(文本、图片和视频)、代码生成到总结概述和翻译等各种问题。通过自然语言的抽象层,这些大模型 成为了强大的工具库,被诸多信息工作者广泛使用。我们讨论了大语言模型的各个方面,包括自托管式大语言 模型,相较云托管的大语言模型,它支持更多的定制和管 是一个全自动的本地化平台,它支持特定上下文的翻译。我们的团队在 ETL 流程或开发工作流中使用 Lokalise API 来翻译可本地化的内容。 Lokalise 支持多种文件格式的可本地化字符串。一个值得强调的方面是它 支持上传整个文件,其中每个键 - 值对都被视为单独的记录并被翻译。在底层,我们利用了 Lokalise 与 Google MT 的集成来处理翻译。 Lokalise 的 Web 界 界面提供了便捷的访问方式,供人工审阅员验证翻译结果,或者根据 需要简化、重新表达翻译内容。在过去,我们曾介绍过类似的工具,例如 Phrase。我们的团队在使用 Lokalise 方面有很好的体验,建议您评估该平台是否适用于协作翻译工作流程。 30. Orca 试验 Orca 是一个专有的云安全平台,用于识别、优先级排序和修复安全风险和合规问题。它支持主流的云提供商和 混合设置。Orca0 码力 | 43 页 | 2.76 MB | 1 年前3
Docker 从入门到实践 0.9.0(2017-12-31)v17.x 安装说明 更新 Docker 网络 一节 更新 Docker Machine 基于 0.13.0 版本 修订记录 10 更新 Docker Compose 基于 3 文件格式 删除 Docker Swarm 相关内容,替换为 Swarm mode Docker 1.12.0 新增特性 删除 docker run --link 参数 精简 Docker 的内容,它没有上下文,因此不可以像其他方法那样可以将本 地文件 COPY 进镜像之类的事情。 从标准输入中读取上下文压缩包进行构建 $ docker build - < context.tar.gz 如果发现标准输入的文件格式是 gzip 、 bzip2 以及 xz 的话,将会使其为上下文压缩包, 直接将其展开,将里面视为上下文,并开始构建。 使用 Dockerfile 定制镜像 78 Dockerfile --no-cache 构建镜像过程中不使用 cache(这将加长构建过程)。 --pull 始终尝试通过 pull 来获取更新版本的镜像。 config 验证 Compose 文件格式是否正确,若正确则显示配置,若格式错误显示错误原因。 down 此命令将会停止 up 命令所启动的容器,并移除网络 exec 进入指定的容器。 help 获得一个命令的帮助。0 码力 | 370 页 | 6.73 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112部分,主要介绍神经网络的核心理论和共性知识,让读者理解深 度学习的本质;第 10~15 章为模型算法应用部分,主要介绍常见的算法与模型,让读者能够 学有所用。 在本书中编写时,很多英文词汇尚无法在业界找到一个共识翻译名,因此作者备注翻译 的英文原文,供读者参考,同时也方便读者日后阅读相关英文文献时,不至于感到陌生。 尽管每天都有深度学习相关算法论文的发布,但是作者相信,深度学习的核心思想和基 础理论是共通的。本书 超人的智力水平, 如在围棋上 AlphaGo 智能程序已经击败人类最强围棋专家之一柯洁,在 Dota2 游戏上 OpenAI Five 智能程序击败世界冠军队伍 OG,同时人脸识别、智能语音、机器翻译等一项 项实用的技术已经进入到人们的日常生活中。现在我们的生活处处被人工智能所环绕,尽 管目前能达到的智能水平离通用人工智能(Artificial General Intelligence,简称 AGI)还有一 2019 OpenAI Five ResNet 2015 2014 VGG GooLeNet 2015 Batch Normalization 德州扑克 Pluribus 2019 机器翻译 BERT 2018 TensorFlow 发布 2015 PyTorch 0.1 发布 2017 2018 PyTorch 1.0 发布 图 1.9 深度学习发展时间线 10 码力 | 439 页 | 29.91 MB | 1 年前3
OpenShift Container Platform 4.14 存储。不同的类可能会映射到服务质量级别、备份 策略,以及由集群管理员决定的任意策略。 VMware vSphere 的虚 的虚拟机磁 机磁盘 (VMDK) 卷 卷 虚拟机磁盘 (VMDK) 是一种文件格式,用于描述虚拟机中使用的虚拟硬盘的容器。 第 第 1 章 章 OPENSHIFT CONTAINER PLATFORM 存 存储 储概述 概述 5 1.2. 存储类型 OpenShift Container Container Storage Interface (CSI) 驱动程序 中。 此过程不执行任何数据迁移,OpenShift Container Platform 只在内存中转换持久性卷对象。因此,翻译 的持久性卷对象不会存储在磁盘上,也不会更改它的内容。CSI 自动迁移应该可以无缝进行。这个功能不 会改变如何使用所有现有 API 对象: 例如 PersistentVolume、 、PersistentVolume、0 码力 | 215 页 | 2.56 MB | 1 年前3
consul 命令行”,仅允许环回连接。在Consul 1.0及更高版本中,可以将其设置为以空格分隔的要绑定的地址列表 或者设置为 可以解析为多个地址的 go-sockaddr模板。 ● -config-file:要加载的配置文件。有关此文件格式的更多信息,请阅读“ 配置文件”部分。可以 次指定此选项以加载多个配置文件。如果多次指定,则稍后加载的配置文件将与先前加载的配置文件 并。在配置合并期间,单值键(string,int,bool)将 json”或“.hcl”加载此目录中的所 文件。加载顺序是按字母顺序排列的,并且使用与上述config-file选项相同的合并例程 。可以多次指 此选项以加载多个目录。未加载config目录的子目录。有关配置文件格式的详细信息,请参阅“ 配置 件”部分。 ● config-format:要加载的配置文件的格式。通常,Consul会从“.json”或“.hcl”扩展名中检测 置文件的格式。将此选项设置为“js0 码力 | 5 页 | 346.62 KB | 1 年前3
OpenShift Container Platform 4.14 Operator源文件 Operator 会使用 Kubernetes 的扩展机制,即自定义资源定义 (CRD),这样您的自定义资源 (CR) 的外观 和行为均类似于内置的原生 Kubernetes 对象。 CR 文件格式是一个 Kubernetes 资源文件。该对象具有必填和选填字段: 表 表 5.1. 自定 自定义资源字段 源字段 字段 字段 描述 描述 apiVersion 要创建 CR 的版本。 kind 源文件 Operator 会使用 Kubernetes 的扩展机制,即自定义资源定义 (CRD),这样您的自定义资源 (CR) 的外观 和行为均类似于内置的原生 Kubernetes 对象。 CR 文件格式是一个 Kubernetes 资源文件。该对象具有必填和选填字段: 表 表 5.5. 自定 自定义资源字段 源字段 NAME DATA AGE example-config 标签应用到命名空间。 控制器检查 ServiceAccount 对象权限,以便在每个命名空间中使用安全性上下文约束。安全性上下文约 束 (SCC) 根据其字段值映射到 Pod 安全配置集,控制器使用这些翻译配置集。Pod 安全准入 warn 和 audit 标签被设置为命名空间中的最特权 pod 安全配置集,以防止在创建 pod 时显示警告和日志记录审计 事件。 命名空间标签基于对命名空间本地服务帐户权限的考虑。0 码力 | 423 页 | 4.26 MB | 1 年前3
服务增强器社区介绍中兴通讯ServiceMesher 社区成立以来组织了一系列翻译活动,如: • Envoy 官方文档 • Knative 入门 • Istio 官方文档 1.1 版本和 1.4 版本 社区官网投稿情况: • 翻译文章:147 篇 • 原创文章:122 篇 /03 社区活动2019年 10 月31 日 正式开始 istio 1.5 官网文档的翻译。 2 个月 累计合并 PR 数超过 300 个。 个。 300+ 超过 60 人参与了官网的翻译。 60+ 持续时间 合并 PR 数 参与人数 20 万+ 翻译字数 累计翻译的文档中汉字数超过 20 万。 /04 Istio.io 社区化翻译活动Istio 官网本地化活动卓越贡献者 官余棚 @gorda 罗小东 @ilylia 于晓博 @yuxiaobo96 高国良 @gauliang /05 Istio 官网0 码力 | 7 页 | 20.77 MB | 6 月前3
机器学习课程-温州大学-13深度学习-Transformer1.Transformer介绍 Seq2Seq任务 Seq2Seq 任务指的是输入和输出都是 序列的任务,输出的长度不确定时采 用的模型,这种情况一般是在机器翻 译的任务中出现,将一句中文翻译成 英文,那么这句英文的长度有可能会 比中文短,也有可能会比中文长,所 以输出的长度就不确定了。 上图,输入的中文长度为4,输出的英文长度为2 6 1.Transformer介绍 Encoder-Decoder模型 息会被弱化,就好像记忆能力弱的人,记不住过去的事情是一样的。 10 2017年google的机器翻译团队在 NIPS上发表了Attention is all you need的文章,开创性地提出了 在序列转录领域,完全抛弃 CNN和RNN,只依赖Attention-注 意力结构的简单的网络架构, 名为Transformer;论文实现的 任务是机器翻译。 Transformer结构 Multi-Head Attention Transformer的训练 02 Transformer的工作流程 04 BERT 14 2.Transformer的工作流程 从宏观的视角开始 首先将这个模型看成是一个黑箱操作。在机器翻译中,就 是输入一种语言,输出另一种语言。 15 2.Transformer的工作流程 那么拆开这个黑箱,我们可以看到它是由编码组件、解码组件和它们之间的 连接组成。 16 2.Transformer的工作流程0 码力 | 60 页 | 3.51 MB | 1 年前3
动手学深度学习 v2.0. 354 9.4.3 双向循环神经网络的错误应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 9.5 机器翻译与数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357 9.5.1 下载和预处理数据集 上,许多重要的任务可以清晰地描述为,在给定一组特定的可用数据的情况下,估计未知事物的概率。比如: • 根据计算机断层扫描(Computed Tomography,CT)肿瘤图像,预测是否为癌症; • 给出一个英语句子,预测正确的法语翻译; • 根据本月的财务报告数据,预测下个月股票的价格; 监督学习的学习过程一般可以分为三大步骤: 1. 从已知大量数据样本中随机选取一个子集,为每个样本获取真实标签。有时,这些样本已有标签(例如, ,模型可能就需要拥有 “记忆”功能。比如,我们该如何处理视频片段呢?在这种情况下,每个视频片段可能由不同数量的帧组成。 通过前一帧的图像,我们可能对后一帧中发生的事情更有把握。语言也是如此,机器翻译的输入和输出都为 文字序列。 再比如,在医学上序列输入和输出就更为重要。设想一下,假设一个模型被用来监控重症监护病人,如果他 1.3. 各种机器学习问题 27 们在未来24小时内死亡的风险超0 码力 | 797 页 | 29.45 MB | 1 年前3
机器学习课程-温州大学-01深度学习-引言•图像滤波与降噪 •图像增强 •风格迁移 •三维重建 •图像检索 •GAN 12 深度学习-CV典型应用案例 翻译 传统翻译采用人工查词的方式,不但耗时长 ,而且错误率高。图像识别技术(OCR)的出 现大大提升了翻译的效率和准确度,用户通 过简单的拍照、截图或划线就能得到准确的 翻译结果。 体育赛事 计算机视觉还有助于比赛和策略分 析、球员表现和评级,以及跟踪体育 节目中品牌赞助的可见性。 机科学、数学等领域的交叉学科。自然语 言处理,是指用计算机对自然语言 的形、音、义等信息进行处理 ,即对字、词、句、篇章的输入、输出、识别、 分析、理解、生 成等的操作和加工。自然语言处理的具体表现形式包括机器 翻译 、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识 别等。 可以说,自然语言处理就是要计算机理解自然语言,自然 语言处理机制涉及 两个流程,包括自然语言理解和自然语言生成 ,自然语言理解是让计算机把 基于规则的方法 2008 • 深度学习 未来 深度学习入门-NLP(自然语言处理) 19 深度学习入门-NLP(自然语言处理) 1.短文本相似 2.文本分类 3.QA机器人 4.语义标注 5.机器翻译 6.…… 20 2020 2013 2017 2019 2018 • ELECTRA • ALBERT • GPT-3 • BERT • GPT • ELMo 2014 • word2vec0 码力 | 80 页 | 5.38 MB | 1 年前3
共 43 条
- 1
- 2
- 3
- 4
- 5













