September 13, 2016 | Beijing 边缘计算揽洪荒之力挺直播大潮...

September 13, 2016 | Beijing

边缘计算揽洪荒之力挺直播大潮 GPU携深度学习助智能CDN

全民直播

传统视频直播平台流程

视频采集端数据中心端数据处理

CDN节点

压缩上传

由CDN链路上传数据

处理完成数据回流

传统直播平台系统功能架构

就近访问

数据中心端数据处理

转码

并行文件系统

视频分析

集群

分发

截图

切片

音频

视频编码&封装

视频采集端

原视频压缩数据

CDN节点数据分发

CDN CDN

数据回流

传统直播平台系统功能架构--分析

音频

视频编码&封装

视频采集端

就近访问

CDN节点数据分发

CDN CDN

数据中心端数据处理

转码

并行文件系统

视频分析

集群

分发

截图

切片

数据推送

带宽昂贵

集中处理

计算能力有限

CDN 边缘计算能力弱

GPU加速的智能CDN平台

视频采集端数据中心端数据存储

CDN节点数据处理分发

压缩上传

部分视频切片数据备份

GPU加速的智能CDN平台

音频

视频编码&封装

视频采集端

就近访问

CDN 数据处理数据分发

CDN CDN

转码

视频分析存储系统

数据中心端数据归档

备份

GPU加速的智能CDN平台--分析

音频

视频编码&封装

视频采集端

就近访问数据中心端数据归档

存储系统

CDN 数据处理数据分发

CDN CDN

转码

视频分析

备份

增强CDN

边缘计算能力

节省带宽资源

更好用户体验

降低

NVIDIA GPU 在视频分析中选择

训练端（training）计算性能：7TFlops ~ 12TFlops （SP）,22TFlops（16bit） GPU显存：12GB ~ 24GB 功耗：250W ~ 300W 尺寸：全高全长，占2个PCI-E槽位

线上识别（inference）

• 计算性能：2.2TFlops ~ 5.5TFlops（SP），22TOPS（INT8） • GPU显存： 4GB ~ 8GB • 功耗：50W ~ 75W • 尺寸：半高半长，占1个PCI-E槽位

用于训练端GPU

用于线上端GPU

基于GPU的视频分析平台

Inference NVDEC

NVENC CUDA Filter Filter Filter

通过GPU构建高效的视频转码和分析平台

GPU支撑的深度学习训练平台实现高精确度的识别算法

GIE优化 DIGITS 支持GPU的线上平台

训练数据集

NVDEC NVENC

使用GPU进行视频处理示例

GDDR5 GPU Memory

Frames

MPEG-2

NVDEC NVENC

<<Resize

Kernel>>

GDDR5 GPU Memory

Resized

Frames

NVDEC NVENC

<<GIE Inference

Kernel>>

GDDR5 GPU Memory

Resized

Frames

Bounding

NVDEC NVENC

<<Video

Processing

Kernel>>

GDDR5 GPU Memory

Frames

NVDEC NVENC

GDDR5 GPU Memory

Frames

1 2 3 4 5

GPU硬件加速视频编解码

GPU高效的编码性能可处理1080p30视频流的路数

*Xeon E5 2.4GHz 14core, x264 preset slow

与XEON E5性能相比

Tesla M4 3.5x

Tesla M40 7x

Tesla M60 14x

2 7 5 7 5 7 5

比特率 – 高质量预设参数 (2 B-FRAMES) NVENC h.264/AVC vs x264 同等质量下比特率= ±2%

内容强相关性

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Actual Bitrate Mbps

RD Curve

x264 Av Mbps

NVENC Av Mbps

NVIDIA VIDEO CODEC SDK 7.0

https://developer.nvidia.com/nvidia-video-codec-sdk

Fermi Kepler

Maxwell

(GM10X)

Maxwell

(GM20X) Pascal

H.264 encoding No Yes Yes1 Yes Yes

HEVC encoding No No No Yes Yes

MPEG2, MPEG-4,

H.264 decoding

Yes Yes Yes Yes Yes

HEVC decoding No No No Yes2 Yes

VP9 decoding No No No Yes Yes

Yes1 GM108除外，它不包含任何encoder或decoder硬件芯片

Yes2只有GM206芯片支持硬件的HEVC解码

基于GPU的深度学习加速平台

深度学习一个新的计算模式

基于深度学习的目标识别 DNN + Data + HPC

传统的计算机视觉处理专家 + 大量时间

采用深度学习算法识别的结果已经超越了人类的识别能力

2009 2010 2011 2012 2013 2014 2015 2016

Traditional CV

Deep Learning

ImageNet

NVIDIA 深度学习SDK 支持几乎所有的深度学习框架

developer.nvidia.com/deep-learning-software

深度学习框架

计算视觉语言识别自然语言理解

目标检测语言识别语言翻译推荐系统情感分析

Mocha.jl

图片分类

NVIDIA 深度学习SDK

NCCL cuDNN cuBLAS cuSPARSE GIE

GPU INFERENCE ENGINE (GIE) 高性能深度学习线上应用优化工具

developer.nvidia.com/gie

训练好的深度神经网络

嵌入式设备

自带驾驶平台

CDN/数据中心

网络层复用

定制化kernel

优化的batch size

支持FP16优化

轻松部署管理

针对不同平台自动优化

GIE 性能测试数据比较

100.00

150.00

200.00

250.00

300.00

350.00

400.00

450.00

batch=1 batch=2 batch=4 batch=10 batch=16

GIE 性能数据测试对比

Caffe CPU

Caffe cuDNNv5

GIE Inference

测试平台信息

GPU M4, 2.2Thlops, 4GB Memory

CPU Intel Xeon CPU E5 2.8GHz

CUDA CUDA 8.0

OS Ubuntu 14.04 64bit

多路视频实时分析

22 NVIDIA CONFIDENTIAL. DO NOT DISTRIBUTE.

谢谢！

September 13, 2016 | Beijing 边缘计算揽洪荒之力挺直播大潮...

Documents

智慧树网学习手册 - Lanzhou Universityxgb.lzu.edu.cn/upload/news/N20201012120438.pdf2 重要提醒：1、在登录智慧树之前，请学生务必确保已在本校教务系统（或教务

ASnet連携Title ASnet連携 Created Date 3/12/2021 11:50:10 AM

依能科技-智慧校园|智慧学习|数字校园|教学诊改-官网€¦ · Web view2020-02-13 · 1.电脑配置：安装有window7或Windows10操作系统的台式电脑、笔记本电脑或二合一电脑。

Mozilla 宣言何智昇

学习 Clarendon

1章统计学习及监督学习概论...VCG 统计学习方法概论 2021/3/27 4 机器学习维基百科机器学习是近20多年兴起的一门多领域交叉学科，涉及概率论、统计学、逼近论、

机器学习：现在与未来yww/papers/MachineLearning... · 人工智能和机器学习，谈谈其发展现状与未来趋势。 1 什么是机器学习？机器学习是人工智能的一个分支

“周哥教 IT”一站式 IT 学习解决方案学IT编程，选“周哥教IT” 入门 … · 麦洛科菲专注于计算机安全、数学和人工智能 1 “周哥教it”一站式it学习解决方案

智慧 - Tongji University · 第三，智慧城市的功利性所表现出的非智慧性。首先，一些智慧城市并未根据“智慧” 内涵来界定智慧城市

人工智能技术 - Huodongjia.com · 2017. 12. 27. · 2017.thegiac.com 目录 1 背景介绍智慧题库自动批改自适应学习总结 2 3 4 5

Unit 3 What does he look like?. 学习目标 1. 复习上节课学习的生词 2. 谈论某人的外貌特征…

Chile 智利 02

学习与思考 - news.chd.edu.cn

智媥匬咊局 - TIPO.GOV.TW

依能科技-智慧校园|智慧学习|智慧教室|数字校园|教学诊改|在线教 … · Web view教师根据学校课表利用微讲师板书录课软件提前录制好教学视频，通过微讲师云平台开展在线教学。

谈英语学习方法与策略培养 - heep.unipus.cnheep.unipus.cn/gykejianNews/files/教会学习——_谈英语学习方法与... · 1 教会学习 ——谈英语学习方法与策略培养

E:\学习\Designinnovation\Innovationbydesign 2008

kátn zofhfnhlhlkNNCknearestnghhorlll.lt 2œº器学习/机器学习上课11...kátn 降维与度量学习 C d. 2. zofhfnhlhlkNNCknearestnghhorlll.ltzd KNN o 数据集S = 佖,别绌

深度学习 vs.. 机器学习 —— 方法选择与模型训练download.ilovematlab.cn/meetup/2019HUST/... · 6 深度学习还是机器学习？你有标签数据吗？ – 如果没有，传统的机器学习可能是更合

MZ Platform エクセル連携導入チュートリアルエクセル連携-1- エクセル連携導入（派遣管理アプリケーション）この派遣管理アプリケーションは、MZ