视频直播 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

深度学习下的图像视频处理技术-沈小勇

深度学习下的图像视频处理技术沈小勇优图X-Lab视觉AI负责人专家研究员自我介绍自我介绍 2006.9 – 2012.7 浙江大学数学系本科硕士 2012.8 – 2016.6 香港中文大学博士 2016.6 – 2017.5 香港中文大学 Research Fellow 2017.5 – 现在腾讯优图X-Lab 视觉AI负责人，专家研究员个人主页：http://xiaoyongshen Scholar： https://scholar.google.com/citations?user=P eMuphgAAAAJ&hl=en 看得更清，看得更懂目录 1. 夜景增强 2. 图像视频去模糊 3. 视频超分辨率 1. 夜景图像增强 Taking photos is easy Amateur photographers typically create underexposed photos More Results Input iPhone Lightroom Our result More Results Input iPhone Lightroom Our result 2. 视频超分辨率 Old and Fundamental Several decades ago [Huang et al, 1984] → near recent Many Applications HD

0 码力 | 121 页 | 37.75 MB | 1 年前
3
Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf

�� 目录 1、视频搜索的挑战 %、深度学m在视频内容理解h的应用——召回 3、深度学m在语k搜索h的应用——语k表征 4、深度学m在排序h的应用——g性化表征视频搜索的挑战 1��/��——�� 2��/��——�� 3��——�� 1�� 1�� 2��/�� 3�� 内容理解——基q视频内容的召回 �� 1�� 2��/�� 3��/�� 4��/OCR/ASR��NLP�� 内容理解——自动分类技术 • 目的a输入v意视频，通过内容理解的方法对视频进行类目和标签预测 • 方法a采用1::+8ST9的UHSuHPFH-VQ- 方法a采用1::+8ST9的UHSuHPFH-VQ- UHSuHPFH RTHGLFVLQP的方法 • 效果a • 基类目平均准确率.8(% �� pu/行i检测技术 • 目的a给定e定长视频，定x感兴趣行i发生的时间段并给出对应行i类标 • 方法a采取1QPvQNuVLQP 32+5DVHG >HFuTTHPV APLVU 5>A) 算法，结合SLPgNH ShQV 2HVHFVQT SS2)框架实现行i检测功

0 码力 | 24 页 | 9.60 MB | 1 年前
3
QCon2018北京-基于深度学习的视频结构化实践-姚唐仁

《基于深度学习的视频结构化实践》七牛云 AI实验室首席架构师／姚唐仁� • 围绕海量数据提供创新的云服务，帮助客户缩短想法到产品的距离 • 创立6年，每年超过300%的业绩增长 • 已完成5轮融资，累计超过20亿 • 长期服务70多万企业用户和开发者 • 文件数超过2000亿，每日新增文件20亿 • 覆盖全球300个节点 • 覆盖金融、公安、广电媒体、互联网等行业 ��2007�� 视觉-最重要的信息感知 2017中国网络视频用户情况 ��2017�� 传统视频摘要 vs AI视频结构化内容不完整依赖经验实时性差时效性差识别范围广效率高可迭代创新基础传统手工摘要 AI视频结构化视频结构化场景视频分解基础模型要素 ��1�01:02:03-01:10:05� ��1�01:02:03-01:10:05� ��1�� XX�� (��)� 视频描述-标签视频处理 Frames Flows Audio …….� Others 节省了80%的人力成本，缩短了50%的实现周期七牛云深度学习平台 1 ��P �� 2 �� 3 �� 4 �� 5 1 ��P

0 码力 | 39 页 | 38.01 MB | 1 年前
3
谭国富：深度学习在图像审核的应用

大量的色情图片、暴力等不良信息夹杂其中，严重影响着互联网的健康发展。 Ø 直播行业的快速兴起，使得视频中不良信息含量更加迅猛增长，色情暴力等不雅视频频繁流出，导致各网络直播平台面临危机。 Ø 内容监管日趋严格， 2017年上半年，各大直播行业协会相应成立，行业平台自我规范的同时，网信办、文化部等国家部门对于直播行业监管也越发严格，几乎所有知名的直播平台均被有关部门点名查处过，特别2017 年月中旬，黄鳝事件引爆网络，年月中旬，黄鳝事件引爆网络，让色情直播再度被推上舆论浪尖。微信朋友圈日上传图片10亿张，视频播放20亿次 4000亿QQ空间存量图片，每天空间相册新增6亿张上传图片 SACC2017 内容审核 - 痛点和诉求默默承受自建识别模型加大审核人力一旦出现严重违规平台面临停业整顿风险昂贵的专业机器、AI专家, 样本不足导致识别模型漏过模型调优难度大人力审核疲劳容易发人力审核疲劳容易发生漏过，人力招聘、管理需要耗费不小成本识别种类完备节约成本节省审核人力减少人工漏审技术诉求：自动识别图片或视频中出现的文字、二维码、logo等内容以及违规人像、淫秽、血腥、暴力、极端主义、恐怖主义图像等，方便平台进行违规处理和风险管控。业务痛点：面对越来越爆发的安全风险，解决办法门槛高，成本高；迫切需要技术解决方案 SACC2017

0 码力 | 32 页 | 5.17 MB | 1 年前
3
云计算白皮书

，如北京市、重庆市均明确加快云计算在制造行业的应用创新，加快实体企业数字化转型进程；江苏省和上海市鼓励利用云计算推动跨境电子商务等数字贸易，促进国际贸易的增长；浙江省提出利用云计算为直播平台等企业赋能，发展数字文娱产业；广东省鼓励推动云计算与各行业融合，催生产业新形态，创新经营新模式。此外，为落地实施国家云计算发展战略，进一步推进云计算在企业的渗透率，各省市还出台了相应上云企业的减半奖励。 2022.6 《加强科技创新助力经济稳进提质的若干政策措施》支持平台企业技术创新。支持平台企业组织开展科研攻关，力争在云计算等领域取得一批重大标志性成果，推动科技对直播平台等平台经济业态的赋能。四川 2022.10 《关于加快推进新时代体育强省建设的实施意见》运用互联网、大数据、云计算、物联网等信息技术，推进体育资源整合、数据共享、互联互通。络、存储资源的操作系统方向演进。向上来看，数字应用呈现出分布式、多模态、超大量级的特点。以 ChatGPT 为例，ChatGPT 的模型参数已达千亿，且模型训练数据涉及文本、图片、音视频等多个模态，基于分布式训练框架实现了超大规模量级的并行计算，这对部署模型的云计算平台提出新的需求。云计算的焦点不仅仅在提升单点应用的研运效能，更要发挥出面向大规模分布式应用协调、分发、部署的中枢管控能力。模型构

0 码力 | 47 页 | 1.22 MB | 1 年前
3
构建基于富媒体大数据的弹性深度学习计算平台

构建基于富媒体大数据的弹性深度学习计算平台 SPEAKER / 土土@七牛 AtLab Mobile —> 富媒体时代数据存储数据加速数据处理直播点播 Connect 每天超过10亿图像上传超过万亿小时的音视频存储 What are they？内容审核团队运营分析团队 AI？ Content 分类检测分割跟踪描述搜索分析 … 连接

0 码力 | 21 页 | 1.71 MB | 1 年前
3
阿里云容器服务大促备战

opportunities-to-2025-industry-analysis-key-players-regional- outlook-and-forecast-study/492024云边端一体化协同双十一直播的背后 50% 5倍在线与离线异构计算能力 ECS, EBM, GPU, FPGA, ECI 高性能网络 VPC, ENI, RDMA, SLB, DNS Public Cloud Edge

0 码力 | 17 页 | 17.74 MB | 6 月前
3
Apache RocketMQ 从入门到实战

开源社区的授予我优秀布道师荣誉称号。说到参与开源项目，很多人都理解为成为一名 Committer 才能算式参与到开源社区的建设？但其实这个就是参与开源项目有代码层面的贡献，也有非代码贡献层面的如技术布道、社区运营（线上直播、线下活动、文档编辑）等。如何参与一个开源项目，容我慢慢道来。一、与 RocketMQ 相识、相知到“在一起” 在 2017 年听到阿里巴巴将 RocketMQ 捐赠给 Apache 基金会成为随着《RocketMQ 技术内幕》一书的正式出版上市，并得到广大读者朋友的认可，与官方的联系也越来越多，后面在 RocketMQ 中国社区负责人青峰大佬的筹备下，我还参与了 RocketMQ 官方社区的源码解析直播活动、官方文档审稿等工作，并在社区得到了不错的反响。说到这里大家是不是觉得非常奇怪，是不是都认为你只是在写文章，写书，没有真正参与开源社区呀，没有贡献代码，这个算哪门子参与开源社区？

0 码力 | 165 页 | 12.53 MB | 1 年前
3
VMware Data Recovery 管理员指南

com/support/services。 VMware 专业服务 VMware 教育服务课程提供了大量实践操作环境、案例研究示例，以及用作作业参考工具的课程材料。这些课程可以通过现场指导、教室授课的方式学习，也可以通过在线直播的方式学习。关于现场试点项目及实施的最佳实践， VMware 咨询服务可提供多种服务，协助您评估、计划、构建和管理虚拟环境。要了解有关教育课程、认证计划和咨询服务的信息，请访问 http://www

0 码力 | 22 页 | 663.62 KB | 1 年前
3
复杂环境下的视觉同时定位与地图构建

Tango Google的Tango项目演示视频 Tango为终端开发者提供了从硬件到软件的整套AR开发套件 SLAM应用介绍 • 混合现实：微软HoloLens HoloLens融合了场景位置感知和头盔显示技术，并提供了完整的软硬件解决方案。 Hololens部分传感器左右双目+前视RGB摄像头+深度传感器 Hololens宣传视频视觉SLAM • 主要传感器 • 单目摄像头相机姿态恢复与场景三维结构恢复 • 求解相机参数和三维点云 • 如何处理循环回路序列和多视频序列？ • 如何高效高精度地处理大尺度场景？ • 如何处理动态场景？ • 如何处理快速运动和强旋转？复杂环境下的主要挑战我们课题组的工作 • 面向大尺度场景的运动恢复结构 • ENFT-SFM：能够高效地处理大尺度场景下拍摄的循环回路和多视频序列。 • 单目视觉的同时定位与地图构建 • ENFT-SLA 并能处理快速运动和强旋转。 ENFT-SFM: Efficient Non- Consecutive Feature Tracking for Robust SFM 循环回路序列和多视频序列 • 如何将不同子序列上的相同特征点高效地匹配上？ • 如何高效地进行全局优化，消除重建漂移问题？ VisualSFM 结果 ENFT：高效的非连续帧特征跟踪基于两道匹配的连续帧跟踪

0 码力 | 60 页 | 4.61 MB | 1 年前
3

共 61 条前往

页

分类

语言

格式

深度学习下的图像视频处理技术-沈小勇

Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf

QCon2018北京-基于深度学习的视频结构化实践-姚唐仁

谭国富：深度学习在图像审核的应用

云计算白皮书

构建基于富媒体大数据的弹性深度学习计算平台

阿里云容器服务大促备战

Apache RocketMQ 从入门到实战

VMware Data Recovery 管理员指南

复杂环境下的视觉同时定位与地图构建