谭国富:深度学习在图像审核的应用深度学习在图像审核的应用 腾讯优图实验室 谭国富 http://open.youtu.qq.com SACC2017 优图团队立足于社交网络大平台,借助社交业务积累 的海量人脸、图片、音乐等数据,专注在人脸、图像、 音乐、语音、机器学习等领域开展技术研究,并积极 推动研究成果在业务中落地产生价值。 关于优图实验室 人脸识别 图像识别 音频识别 SACC2017 目录 01 腾讯优图内容审核能力介绍 腾讯优图内容审核能力介绍 02 深度学习技术介绍 03 内容审核的扩展和延伸 00 图像审核的行业背景 SACC2017 内容审核 - 行业现状 不良信息泛滥,监管猝不及防 Ø 随着互联网的飞速发展和信息量的猛增, 大量的色情图片、暴力等不良信息夹杂其 中,严重影响着互联网的健康发展。 Ø 直播行业的快速兴起,使得视频中不良信 息含量更加迅猛增长,色情暴力等不雅视 频频繁流出,导致各网络直播平台面临危 秽、血腥、暴力、极端主义、恐怖主义图像 等,方便平台进行违规处理和风险管控。 业务痛点:面对越来越爆发的安全风险,解决办法门 槛高, 成本高;迫切需要技术解决方案 SACC2017 图像内容审核技术 OCR技术 图像分割以及超分辨率技术 优图图像技术还包括:图像分类、图像增强、艺术滤镜、图片去水印、图像融合、图像修补等。 图像识别技术 01 腾讯优图图像技术能力 SACC20170 码力 | 32 页 | 5.17 MB | 1 年前3
深度学习下的图像视频处理技术-沈小勇深度学习下的图像视频处理技术 沈小勇 优图X-Lab视觉AI负责人 专家研究员 自我介绍 自我介绍 2006.9 – 2012.7 浙江大学数学系本科硕士 2012.8 – 2016.6 香港中文大学博士 2016.6 – 2017.5 香港中文大学 Research Fellow 2017.5 – 现在 腾讯优图X-Lab 视觉AI负责人,专家研究员 个人主页:http://xiaoyongshen https://scholar.google.com/citations?user=P eMuphgAAAAJ&hl=en 看得更清,看得更懂 目录 1. 夜景增强 2. 图像视频去模糊 3. 视频超分辨率 1. 夜景图像增强 Taking photos is easy Amateur photographers typically create underexposed photos ?????????? = ???????????? − 1 ???????????? = ???????????? + 1 skip connections Decoder 3. 图像视频去模糊 图像去模糊问题 75 Data from previous work Different Blur Assumptions Uniform: [Fergus et al, 2006], [Shan0 码力 | 121 页 | 37.75 MB | 1 年前3
李东亮:云端图像技术的深度学习模型与应用云端图像技术的深度学习模型与应用 李东亮 360 人工智能研究院 lidongliang@360.cn 2017.10.20 SACC2017 360电脑安全产品 月活跃数达到4.42亿 360手机安全产品 移动端用户总数已达约1.49亿 360浏览器 月活跃用户数量为3.03亿 360导航 日均独立访问用户为8900万人 日均点击量约为4.51亿次 360搜索 稳定拥有35%以上的市场份额 智能家居 机器人 AR/VR/MR 智能手机 穿戴设备 SACC2017 万物互联的核心技术 视觉感知 语音感知 语义理解 人工智能 大数据分析 物 环境 SACC2017 图像 视频 检测 识别 分割 跟踪 物 环境 数 据 核 心 云端 移动端 业 务 视觉感知模型 SACC2017 视觉感知核心问题 Object Segmentation Object Classification Person, Horse, Barrier, Table, etc Object Detection 检测 识别 分割 跟踪 核 心 SACC2017 图像技术的三个核心难点>>小、快、准 小模型 线上速度快 预测准 Frequent remote upgrade CPU-constrained, real-time Cloud processing0 码力 | 26 页 | 3.69 MB | 1 年前3
动手学深度学习 v2.0109 3.4.8 模型预测和评估 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 3.5 图像分类数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.5.1 . 220 6.1.4 “沃尔多在哪里”回顾 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 6.2 图像卷积 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 6 卷积层 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 6.2.3 图像中目标的边缘检测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 6.2.4 学习卷积核 . . . .0 码力 | 797 页 | 29.45 MB | 1 年前3
《TensorFlow 快速入门与实战》6-实战TensorFlow验证码识别Python 解释器添加了图像处理功能。但是,在 2009 年发布 1.1.7 版本后,社区便停止更新和维护。 Pillow 是由 Alex Clark 及社区贡献者 一起开发和维护的一款分叉自 PIL 的图像工具库。 至今,社区依然非常活跃,Pillow 仍在快速迭代。 Pillow提供广泛的文件格式支持,高效的内部表示和相当强大的图像处理功能。 核心图像库旨在快速访问以几种基本像素格式存储的数据, 核心图像库旨在快速访问以几种基本像素格式存储的数据, 它应该为一般的图像处理工 具提供坚实的基础。 https://github.com/python-pillow/Pillow captcha Catpcha 是一个生成图像和音频验证码的开源工具库。 https://github.com/lepture/captcha from captcha.image import ImageCaptcha from captcha 早期的Captcha验证码 "smwm" ,由EZ-Gimpy 程序产生,使用扭曲的字母和背景颜色梯度 一种更现代的CAPTCHA,其不使用扭曲的背景及 字母,而是增加一条曲线来使得图像分割 (segmentation)更困难。 另一种增加图像分割难度的方法为将符号彼此拥挤 在一起,但其也使得真人用户比较难以识别 要求用户识别图片的验证方式,本图为模拟12306 网站的验证界面 验证码(CAPTCHA)生成0 码力 | 51 页 | 2.73 MB | 1 年前3
全连接神经网络实战. pytorch 版首先我们需要明白一个术语:tensor。这个词被翻译为中文叫张量。1 维标量是一种 tensor; 向量也是一种 tensor;而一些微分量,例如梯度、导数等也都是 tensor;矩阵也是张量;多张矩 阵或者多张图像也是张量(3 维张量)。我们在做实验时,可以将 tensor 理解为是“data”。 我们需要先导入 pytorch,顺便导入 numpy: import torch import numpy (0 , torch . tensor (y) , value=1)) ) transf orm 是对数据的转换,ToTensor() 函数将 PIL 图像或者 NumPy 的 ndarray 转换为 FloatTensor 类型的,并且把图像的每个像素值压缩到 [0.0,1.0] 之间。 target_transf orm 10 1.2. 导入样本数据 是标签的转换,分类中我们需要将标签 23 4.4 自定义 Dataset 数据集 25 4.5 总结 27 本章我们的目标是把构建自己的数据集,并来测试和可视化。 4.1 自定义 Variable 数据与网络训练 假如我们并没有图像数据,我们自己创造一些数据,并用它们来分类。 由于本节内容相对比较多,大家可以直接参考本节代码。本节代码见 chapter4.py。 我们假设一共有四类数据,分布如下: 设横纵坐标为 (x,y),最左下角的一类中,x0 码力 | 29 页 | 1.40 MB | 1 年前3
第29 期| 2023 年9 月- 技术雷达来越多地尝试 GenAI 工具,该实践正在获得新的关注。 17. 设计系统决策记录 评估 在迭代速度快、用户需求不断演进的产品开发环境中,设计是一个不断变化的领域。这意味着对设计决策输入 的需求会一直持续下去。我们借鉴了用 ADR(架构决策记录)记录软件架构决策的思路,采用类似的格式,以 设计系统决策记录来记录设计系统决策以及相应的依据、研究洞见和实验结果,这有效地传达了设计系统决策 似乎已成 。 技术 © Thoughtworks, Inc. All Rights Reserved. 18 22. 忽略 OWASP 十大安全风险榜单 暂缓 OWASP 十大安全风险榜单长期以来一直是 Web 应用程序最关键的安全风险参考。尽管众所周知,我们曾写过 它在软件开发过程中未得到充分利用,并警告不要忽略 OWASP 十大安全风险榜单。 但鲜为人知的是 OWASP 也在其他领域发布了 团队发现 Chromatic 与该领域其他工具的视觉差异要大得多;可视化高亮显示变更的功能让它非常实用。 51. Cilium 试验 eBPF 以其应用透明、高性能和低开销而闻名,因此云原生社区一直在探索其在无边车网格服务(service mesh without sidecar) 中的应用场景。Cilium 是一个为云原生环境如(Kubernetes 集群和其他容器编排平台)提 供网络、0 码力 | 43 页 | 2.76 MB | 1 年前3
Kubernetes开源书 - 周立使⽤Kubespray部署⽣产可⽤的Kubernetes集群 (1.11.2) 前提:科学上⽹,或⾃⾏将gcr.io的镜像转成其他镜像仓库的镜像。 Kubernetes的安装部署是难中之难,每个版本安装⽅式都略有区别。笔者⼀直想找⼀种 ⽀持多平台 、 相对简单 、 适⽤于 ⽣产环境 的部署⽅案。经过⼀段时间的调研,有如下⼏种解决⽅案进⼊笔者视野: 部署⽅案 优点 缺点 Kubeadm 官⽅出品 部署较麻烦、不够透明 控制器和服务的解耦——端点控制器秩序观察Pod 清晰地将Kubelet级的功能与集群级的功能组合——Kubelet实际上是“Pod控制器” ⾼可⽤性应⽤,Pod可在其终⽌或删除之前被替换,例如在计划的驱逐,图像预取或Pod实时移植的情况下#3949 14-Pod 43 StatefulSet 控制器(⽬前处于Beta测试阶段),⽀持有状态Pod。该功能在1.4中是alpha测试阶段,被称为PetSet。对 有⾃⼰的IP,但这些IP可能是会变化的。这 导致⼀个问题:如果⼀些 Pod (称为backend)为Kubernetes群集中的其他 Pod (称为frontend)提供功能,那么 frontend如何找到,并⼀直能找到backend呢? 译者注:下⾯将backend译为后端,frontend译为前端。 可⽤ Services 来解决该问题。 Kubernetes Service 是⼀个抽象,它定义了⼀组逻辑0 码力 | 135 页 | 21.02 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112之间的误差用于调整神经 元的权重参数{? , ? , … , ? }。Frank Rosenblatt 随后基于“Mark 1 感知机”硬件实现感知 机模型,如图 1.6、图 1.7 所示,输入为 400 个单元的图像传感器,输出为 8 个节点端 子,它可以成功识别一些英文字母。一般认为 1943 年~1969 年为人工智能发展的第一次兴 盛期。 ? ? ? ? ? ? 此需要重新设计算法模型,模型的通用性不强。 设计一种像人脑一样可以自动学习、自我调整的通用智能机制一直是人类的共同愿 景。从目前来看,深度学习是最接近通用智能的算法之一。在计算机视觉领域,过去需要 针对具体的任务设计特征、添加先验假设的做法,已经被深度学习算法彻底抛弃了,目前 在图片识别、目标检测、语义分割、图像变换等方向,几乎都是基于深度学习端到端地训 练,获得的模型性能好,适应性强;在 Atria 游戏平台上,DeepMind 是一个非常优秀的科学计算库,基于较冷门的编程语言 Lua 开发。Torch 灵活性 较高,容易实现自定义网络层,这也是 PyTorch 继承获得的优良基因。但是由于 Lua 语言使用人群较少,Torch 一直未能获得主流应用。 ❑ MXNet 由华人陈天奇和李沐等人开发,是亚马逊公司的官方深度学习框架。采用了 命令式编程和符号式编程混合方式,灵活性高,运行速度快,文档和案例也较为丰 富。 ❑ Keras0 码力 | 439 页 | 29.91 MB | 1 年前3
Keras: 基于 Python 的深度学习库123 6.2.4 text_to_word_sequence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 6.3 图像预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 6.3.1 ImageDataGenerator . . . . . . 152 12 常用数据集 Datasets 154 12.1 CIFAR10 小图像分类数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 12.2 CIFAR100 小图像分类数据集 . . . . . . . . . . . . . . . . . . . . . . . . 1 可用的模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 13.2 图像分类模型的示例代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 13.2.1 使用 ResNet500 码力 | 257 页 | 1.19 MB | 1 年前3
共 97 条
- 1
- 2
- 3
- 4
- 5
- 6
- 10













