 FFmpeg滤镜开发人脸识别FFmpeg滤镜开发 - ⼈人脸识别 刘歧 OnVideo 联合创始⼈人 个⼈人介绍 • 现任职于OnVideo • 业余参与维护与开发 FFmpeg • ⾳音视频流媒体爱好者 内容⼤大纲 技术选择 集成操作 后续考虑 操作总结 技术选择 技术选择 集成操作 后续考虑 操作总结 契机 ➤ 项⽬目需要 ➤ 视频图像识别技术⽕火热 ➤ 好奇视频图像识别实现 ➤ 社区中很多⼈人对相关技术有兴趣 FFmpeg 的 Frei0r (GPL v2) ➤ ⾃自⼰己封装⼀一个so Switch接⼝口 - 可适配 ➤ init 初始化各种参数 ➤ object_detect 识别的对象 ➤ get_rect 获得识别到的对象的画⾯面范围 ➤ finit 结束使⽤用 集成操作 技术选择 集成操作 后续考虑 操作总结 集成操作 - AVFilter ➤ 参考 frei0r 滤镜 集成操作0 码力 | 20 页 | 547.54 KB | 1 年前3 FFmpeg滤镜开发人脸识别FFmpeg滤镜开发 - ⼈人脸识别 刘歧 OnVideo 联合创始⼈人 个⼈人介绍 • 现任职于OnVideo • 业余参与维护与开发 FFmpeg • ⾳音视频流媒体爱好者 内容⼤大纲 技术选择 集成操作 后续考虑 操作总结 技术选择 技术选择 集成操作 后续考虑 操作总结 契机 ➤ 项⽬目需要 ➤ 视频图像识别技术⽕火热 ➤ 好奇视频图像识别实现 ➤ 社区中很多⼈人对相关技术有兴趣 FFmpeg 的 Frei0r (GPL v2) ➤ ⾃自⼰己封装⼀一个so Switch接⼝口 - 可适配 ➤ init 初始化各种参数 ➤ object_detect 识别的对象 ➤ get_rect 获得识别到的对象的画⾯面范围 ➤ finit 结束使⽤用 集成操作 技术选择 集成操作 后续考虑 操作总结 集成操作 - AVFilter ➤ 参考 frei0r 滤镜 集成操作0 码力 | 20 页 | 547.54 KB | 1 年前3
 2020美团技术年货 算法篇KDD Cup 2020 多模态召回比赛季军方案与搜索业务应用 252 对话任务中的“语言 - 视觉”信息融合研究 267 ICDM 论文:探索跨会话信息感知的推荐模型 278 自然场景人脸检测技术实践 289 技术解析 | 横纵一体的无人车控制方案 304 目录 智能搜索模型预估框架 Augur 的建设与实践 作者:朱敏 紫顺 乐钦 洪晨 乔宇 武进 孝峰 俊浩等 1. NLP 任务(文本分类、序列标注、句间关系判断和机器阅读理解等)。美团 AI 平台搜 索与 NLP 部算法团队基于美团海量业务语料训练了 MT-BERT 模型,已经将 MT- BERT 应用到搜索意图识别、细粒度情感分析、点评推荐理由、场景化分类等业务场 景中 [2]。 作为 BERT 的核心组成结构,Transformer 具有强大的文本特征提取能力,早在多 项 NLP 任务中得到了验证,美团搜索也基于 和商户文本信息后,判断用户是否点击来取代 NSP 任务。 添加品类信息后,BERT 相关性模型在 Benchmark 上的 Accuracy 提升 56BP,相 应地 L2 排序模型离线 AUC 提升 6.5BP。 引入实体成分识别的多任务 Fine-tuning 在美团搜索场景中,Query 和 Doc 通常由不同实体成分组成,如美食、酒店、商 圈、品牌、地标和团购等。除了文本语义信息,这些实体成分信息对于 Query-Doc0 码力 | 317 页 | 16.57 MB | 1 年前3 2020美团技术年货 算法篇KDD Cup 2020 多模态召回比赛季军方案与搜索业务应用 252 对话任务中的“语言 - 视觉”信息融合研究 267 ICDM 论文:探索跨会话信息感知的推荐模型 278 自然场景人脸检测技术实践 289 技术解析 | 横纵一体的无人车控制方案 304 目录 智能搜索模型预估框架 Augur 的建设与实践 作者:朱敏 紫顺 乐钦 洪晨 乔宇 武进 孝峰 俊浩等 1. NLP 任务(文本分类、序列标注、句间关系判断和机器阅读理解等)。美团 AI 平台搜 索与 NLP 部算法团队基于美团海量业务语料训练了 MT-BERT 模型,已经将 MT- BERT 应用到搜索意图识别、细粒度情感分析、点评推荐理由、场景化分类等业务场 景中 [2]。 作为 BERT 的核心组成结构,Transformer 具有强大的文本特征提取能力,早在多 项 NLP 任务中得到了验证,美团搜索也基于 和商户文本信息后,判断用户是否点击来取代 NSP 任务。 添加品类信息后,BERT 相关性模型在 Benchmark 上的 Accuracy 提升 56BP,相 应地 L2 排序模型离线 AUC 提升 6.5BP。 引入实体成分识别的多任务 Fine-tuning 在美团搜索场景中,Query 和 Doc 通常由不同实体成分组成,如美食、酒店、商 圈、品牌、地标和团购等。除了文本语义信息,这些实体成分信息对于 Query-Doc0 码力 | 317 页 | 16.57 MB | 1 年前3
 刘道平-从0到1,移动政务应用小程序系统架构演化三、政务服务小程序平台研发过程 四、政务服务小程序平台架构演化 五、政务服务系统架构小结与思考 5、技术路线选型,APP 还是 小程序? 对比项 微信小程序 政务APP 统一身份认证 无需注册直接登录,提供活体检测、人脸核身 需要注册,使用密码和手机盾认证 推广传播 下载成本低、通过微信裂变传播 下载成本高、推广难、占流量、占内存 开发成本 只需开发一套,组件丰富 每个端都得开发,标准化组件少 版本更新 无感知,轻量级更新 服务触达 利用微信载体,消息通知更简单 APP消息,打扰多,用户遗漏概率大 拓展性 程序包小,可以关联调转 无大小限制,调转较难 智能化服务能力 微信自带组件,对接更容易 需根据场景单独对接,如人脸识别、支付等 产品自主性 需依托微信平台 完全自主可控 数据安全性 微信前端数据通过HTTPS传输 全业务流程数据传输监控 使用路径 微信端二级应用 一级入口 从技术的角度来比对,小程序和AP woshipm.com/pd/1547313.html 8、统一认证机制 – 登录一次、全网通办 • 无需注册(无需用户再记住一个新账号、密码) • 依托微信的账号体系,便捷登录,以授权登录、 人脸识别登录为主 • 依托公安部门互联网可信身份认证体系 • 用户登录后,业务系统不再要求用户登录 9、前端开发 -- 封装公共组件 ,磨刀不误砍柴工 1、封装DGD-SDK公共组件 2、合包工具0 码力 | 35 页 | 15.60 MB | 1 年前3 刘道平-从0到1,移动政务应用小程序系统架构演化三、政务服务小程序平台研发过程 四、政务服务小程序平台架构演化 五、政务服务系统架构小结与思考 5、技术路线选型,APP 还是 小程序? 对比项 微信小程序 政务APP 统一身份认证 无需注册直接登录,提供活体检测、人脸核身 需要注册,使用密码和手机盾认证 推广传播 下载成本低、通过微信裂变传播 下载成本高、推广难、占流量、占内存 开发成本 只需开发一套,组件丰富 每个端都得开发,标准化组件少 版本更新 无感知,轻量级更新 服务触达 利用微信载体,消息通知更简单 APP消息,打扰多,用户遗漏概率大 拓展性 程序包小,可以关联调转 无大小限制,调转较难 智能化服务能力 微信自带组件,对接更容易 需根据场景单独对接,如人脸识别、支付等 产品自主性 需依托微信平台 完全自主可控 数据安全性 微信前端数据通过HTTPS传输 全业务流程数据传输监控 使用路径 微信端二级应用 一级入口 从技术的角度来比对,小程序和AP woshipm.com/pd/1547313.html 8、统一认证机制 – 登录一次、全网通办 • 无需注册(无需用户再记住一个新账号、密码) • 依托微信的账号体系,便捷登录,以授权登录、 人脸识别登录为主 • 依托公安部门互联网可信身份认证体系 • 用户登录后,业务系统不再要求用户登录 9、前端开发 -- 封装公共组件 ,磨刀不误砍柴工 1、封装DGD-SDK公共组件 2、合包工具0 码力 | 35 页 | 15.60 MB | 1 年前3
 Django、Vue 和Element UI 前后端原理论述S2_A 43 《51 测试天地》七十四 www.51testing.com 随着科技日新月异的发展,人工智能正逐渐渗透到我们生活的各方各面,从智能语 音助手到自动驾驶汽车,从智能家居到人脸识别技术,AI 正以其卓越的智能和学习能力 引领着新时代的发展方向。在这个快速演进的时代中,软件测试领域也受到了不小的冲 击。虽然在当下,传统的软测技术仍然是绝对的主力,但是身为 IT 行业中的一员,近几 定义核心测试测试场景是确保软件系统的关键功能得到充分测试的关键步骤。这些 场景通常涉及到系统的核心功能、最重要的用户操作流程以及最关键的使用情景。 请注意:“核心”、“重要”、“关键”。 以下是定义核心测试场景的一些步骤: ·识别关键功能 确定系统中的关键功能,这些功能对于系统的整体运作和用户体验至关重要。这可 能涉及到核心业务逻辑、主要用户流程和最常用的功能。 ·确定用户故事 将关键功能转化为用户故事或使用情景。每个用户故事描述一个用户的目标、操作 事描述一个用户的目标、操作 和预期结果。这有助于将功能放置在真实使用环境中,以便更好地理解其重要性。 ·优先级排序 54 《51 测试天地》七十四 www.51testing.com 对识别的关键功能和用户故事进行优先级排序。确定哪些功能是绝对必须测试的, 以确保系统的核心方面能够正常工作。 有了以上几点,我们可以定义测试场景。然后,根据优先级,为每个关键功能或用 户故事定义一个0 码力 | 61 页 | 6.84 MB | 1 年前3 Django、Vue 和Element UI 前后端原理论述S2_A 43 《51 测试天地》七十四 www.51testing.com 随着科技日新月异的发展,人工智能正逐渐渗透到我们生活的各方各面,从智能语 音助手到自动驾驶汽车,从智能家居到人脸识别技术,AI 正以其卓越的智能和学习能力 引领着新时代的发展方向。在这个快速演进的时代中,软件测试领域也受到了不小的冲 击。虽然在当下,传统的软测技术仍然是绝对的主力,但是身为 IT 行业中的一员,近几 定义核心测试测试场景是确保软件系统的关键功能得到充分测试的关键步骤。这些 场景通常涉及到系统的核心功能、最重要的用户操作流程以及最关键的使用情景。 请注意:“核心”、“重要”、“关键”。 以下是定义核心测试场景的一些步骤: ·识别关键功能 确定系统中的关键功能,这些功能对于系统的整体运作和用户体验至关重要。这可 能涉及到核心业务逻辑、主要用户流程和最常用的功能。 ·确定用户故事 将关键功能转化为用户故事或使用情景。每个用户故事描述一个用户的目标、操作 事描述一个用户的目标、操作 和预期结果。这有助于将功能放置在真实使用环境中,以便更好地理解其重要性。 ·优先级排序 54 《51 测试天地》七十四 www.51testing.com 对识别的关键功能和用户故事进行优先级排序。确定哪些功能是绝对必须测试的, 以确保系统的核心方面能够正常工作。 有了以上几点,我们可以定义测试场景。然后,根据优先级,为每个关键功能或用 户故事定义一个0 码力 | 61 页 | 6.84 MB | 1 年前3
 NTTDATA 汽车行业数字营销平台微服务化实践大数据分析 及应用 线上数字化布局 线下数字化布局 车联网及线下店端消费者旅程与线上消费 者旅程相结合,设计多种跨渠道跨屏互动, 引导进店消费者通过扫码,配车,留资等 行为整合线上数据 利用人脸识别等多种技术及平台,通过可 配置用户聚类评级模型和数据处理算法, 实现消费者深度洞察,提高销售线索质量 及转化率,助力经销商销售 新媒体营销数字化布局 从微信营销及小程序开始布局其他新兴媒体渠道,如抖0 码力 | 11 页 | 2.25 MB | 1 年前3 NTTDATA 汽车行业数字营销平台微服务化实践大数据分析 及应用 线上数字化布局 线下数字化布局 车联网及线下店端消费者旅程与线上消费 者旅程相结合,设计多种跨渠道跨屏互动, 引导进店消费者通过扫码,配车,留资等 行为整合线上数据 利用人脸识别等多种技术及平台,通过可 配置用户聚类评级模型和数据处理算法, 实现消费者深度洞察,提高销售线索质量 及转化率,助力经销商销售 新媒体营销数字化布局 从微信营销及小程序开始布局其他新兴媒体渠道,如抖0 码力 | 11 页 | 2.25 MB | 1 年前3
 华为企业级PaaS 微服务应用servicecomb.apache.org github.com/apache?q=servicecomb 同济大学,教学管理信息微服务化上云 新功能上线 月 -> 天 弹性伸缩 秒级 AI 新生报到人脸识别 教务系 统 科研系 统 人事系 统 … 独立烟囱 (12个) 云容器引擎,微服务引擎,EI服 务 微服务公共组 件 数据平台 教学 科研 人事 … 华为云 servicecomb0 码力 | 17 页 | 3.42 MB | 1 年前3 华为企业级PaaS 微服务应用servicecomb.apache.org github.com/apache?q=servicecomb 同济大学,教学管理信息微服务化上云 新功能上线 月 -> 天 弹性伸缩 秒级 AI 新生报到人脸识别 教务系 统 科研系 统 人事系 统 … 独立烟囱 (12个) 云容器引擎,微服务引擎,EI服 务 微服务公共组 件 数据平台 教学 科研 人事 … 华为云 servicecomb0 码力 | 17 页 | 3.42 MB | 1 年前3
 QCon北京2018-业务高速发展下的互联网金融系统架构演变-张现双+商城MIS WAP … … Android/ios/h5/php/openApi 积分系统 基础服务 优惠券 宜人币 基金服务 保险服务 网贷服务 支付中心 用户中心 电子签章 人脸识别 营销平台 埋点 基础服务 会员系统 资金存管 账户中心 Pc Web 支付/钱包 外 部 系 统 流控 熔断 限流 版本 更多... 标签 用户 管理平台 产品0 码力 | 42 页 | 19.96 MB | 1 年前3 QCon北京2018-业务高速发展下的互联网金融系统架构演变-张现双+商城MIS WAP … … Android/ios/h5/php/openApi 积分系统 基础服务 优惠券 宜人币 基金服务 保险服务 网贷服务 支付中心 用户中心 电子签章 人脸识别 营销平台 埋点 基础服务 会员系统 资金存管 账户中心 Pc Web 支付/钱包 外 部 系 统 流控 熔断 限流 版本 更多... 标签 用户 管理平台 产品0 码力 | 42 页 | 19.96 MB | 1 年前3
 Apache ServiceComb 开源微服务社区月级上线 (>2月) 运维效率提升 人工定位 问题定位时间缩短3倍 微服务化后 案例:助力某无人机企业打造智慧控制大脑 新功能上线 月 -> 天 弹性伸缩 秒级 AI 新生报到人脸识别 教务系统 科研系统 人事系统 … 独立烟囱 (12个) 云容器引擎,微服务引擎,EI服务 微服务公共组件 数据平台 教学 科研 人事 … 案例:助力某大学教学管理信息系统上云 应用市场0 码力 | 15 页 | 2.86 MB | 1 年前3 Apache ServiceComb 开源微服务社区月级上线 (>2月) 运维效率提升 人工定位 问题定位时间缩短3倍 微服务化后 案例:助力某无人机企业打造智慧控制大脑 新功能上线 月 -> 天 弹性伸缩 秒级 AI 新生报到人脸识别 教务系统 科研系统 人事系统 … 独立烟囱 (12个) 云容器引擎,微服务引擎,EI服务 微服务公共组件 数据平台 教学 科研 人事 … 案例:助力某大学教学管理信息系统上云 应用市场0 码力 | 15 页 | 2.86 MB | 1 年前3
 Golang大规模云原生应用管理实践插入:策略(Policy)与机制(Mechanism) 策略是做事的一组概念和计 划,关注要做什么事 “what” 机制是获取结果的过程, 方法和系统,关注如何做事 “how” • 员工进入公司需要验证是一个策略,人脸识别是机制; • 从杭州到上海是策略,坐火车是机制; • 接口是策略,实现是机制; • 声明是策略,过程是机制; • 策略面向外部交互,机制面向内部实现; • 策略追求开放标准,机制追求稳定可复用;0 码力 | 23 页 | 7.70 MB | 1 年前3 Golang大规模云原生应用管理实践插入:策略(Policy)与机制(Mechanism) 策略是做事的一组概念和计 划,关注要做什么事 “what” 机制是获取结果的过程, 方法和系统,关注如何做事 “how” • 员工进入公司需要验证是一个策略,人脸识别是机制; • 从杭州到上海是策略,坐火车是机制; • 接口是策略,实现是机制; • 声明是策略,过程是机制; • 策略面向外部交互,机制面向内部实现; • 策略追求开放标准,机制追求稳定可复用;0 码力 | 23 页 | 7.70 MB | 1 年前3
 2022年美团技术年货 合辑类 两个实体。 ● 快速特征选择:因为自动化特征工程是针对全部实体依次按照不同特征算子进 行的笛卡尔积组合,会产生大量的无效特征,故需要进行快速特征选择。使用 LightGBM 模型快速识别有效特征及无用特征,从指标提升及特征重要性角度 考虑,裁剪掉没用的特征,同时标识重要特征与其他特征再次进行更为高阶的 组合。 ● 高阶特征算子:基于一、二阶特征算子组合构建的新特征,进一步与其他特征 美团到店广告平台算法团队立足广告场景,探索深度学习、强化学习、人工智能、大数据、知 识图谱、NLP 和计算机视觉前沿的技术发展,探索本地生活服务电商的价值。主要工作方向 包括: ● 触发策略:用户意图识别、广告商家数据理解,Query 改写,深度匹配,相关性建模。 ● 质量预估:广告质量度建模。点击率、转化率、客单价、交易额预估。 ● 机制设计:广告排序机制、竞价机制、出价建议、流量预估、预算分配。 低频和高频用户人均曝光品类数量均有提升,并且高频用户的人均品类增加更 多,说明具备更好的兴趣挖掘探索能力,能够帮助高频场景用户跳脱已有的兴 趣圈。 3.4.2 特定时空场景感知 为验证场景图模型对于不同场景的识别和刻画能力,进一步对比引入场景图联合建模 对比无场景图在时间品类和空间需求下的感知变化(以下多组统计结果均为多天 / 同 时段累计结果)。 3.4.2.1 时间品类场景 奶茶品类是下午时段的0 码力 | 1356 页 | 45.90 MB | 1 年前3 2022年美团技术年货 合辑类 两个实体。 ● 快速特征选择:因为自动化特征工程是针对全部实体依次按照不同特征算子进 行的笛卡尔积组合,会产生大量的无效特征,故需要进行快速特征选择。使用 LightGBM 模型快速识别有效特征及无用特征,从指标提升及特征重要性角度 考虑,裁剪掉没用的特征,同时标识重要特征与其他特征再次进行更为高阶的 组合。 ● 高阶特征算子:基于一、二阶特征算子组合构建的新特征,进一步与其他特征 美团到店广告平台算法团队立足广告场景,探索深度学习、强化学习、人工智能、大数据、知 识图谱、NLP 和计算机视觉前沿的技术发展,探索本地生活服务电商的价值。主要工作方向 包括: ● 触发策略:用户意图识别、广告商家数据理解,Query 改写,深度匹配,相关性建模。 ● 质量预估:广告质量度建模。点击率、转化率、客单价、交易额预估。 ● 机制设计:广告排序机制、竞价机制、出价建议、流量预估、预算分配。 低频和高频用户人均曝光品类数量均有提升,并且高频用户的人均品类增加更 多,说明具备更好的兴趣挖掘探索能力,能够帮助高频场景用户跳脱已有的兴 趣圈。 3.4.2 特定时空场景感知 为验证场景图模型对于不同场景的识别和刻画能力,进一步对比引入场景图联合建模 对比无场景图在时间品类和空间需求下的感知变化(以下多组统计结果均为多天 / 同 时段累计结果)。 3.4.2.1 时间品类场景 奶茶品类是下午时段的0 码力 | 1356 页 | 45.90 MB | 1 年前3
共 313 条
- 1
- 2
- 3
- 4
- 5
- 6
- 32














 
  
 