自上次在 MTSC2019 介绍了 “Intel 实时视频评估框架解析” 受到了非常多同学的关注,分享时间有限,为了让更多的同学了解到视频质量评估的知识,我将陆续更新视频相关知识点,本文将是这个系列的第一篇综述。
随着手机硬件的升级和带宽的提高,相比于图片形式的传播,视频媒体在互联网内容上越来越重要,基于实时视频的社交,一对多的长短视频直播和播放以及在线电影电视视频的观看等应用如井喷似的出现,除此之外,社交媒体、远程医疗、远程教育、智能监控等各种产品都涉及到视频的传输,大家在看在线视频直播或者说使用这些产品的时候,都会遇到各种视频质量的问题,如果对视频质量进行评估一直是业界探讨的重要方向。
对于视频产品,比如说在线电影,在线直播,游戏,评估点会从几点出发,一是视频流畅度相关的参数,比如说 fps, 视频帧抖动 jitter,导入延时,端对端延时等,这方面主要影响因子是网络因数,上下行带宽,网络拥塞等,这些可以通过产品开发接口或者日志信息等获取相关的参数信息,除此之外呢,就是对视频画面也就是视频帧观感的评估,通过有损编码或者网络传输损耗之后真实接收到的每一帧的视频质量到底怎么样? 怎么用技术手段可以量化这部分的质量呢? 接下来我们介绍视频评估的方法。
关于视频质量评估本身,业界通常将评估方法分为两种类别,一个叫做主观评估,一种叫做客观评估。
主观评估,顾名思义就是人参与的人工评估,视频主观质量评价就是选择一批非专家类型的受测者,让他们参加一些培训,至少是阅读一些评估规范和标准比如说 ITU-R BT.500 等,然后在一个特定的受控环境中,连续观看一系列的测试序列大约 10 至 30 分钟,然后采用不同方法让他们对视频序列的质量进行评分,最后求得平均意见分 (MeanOpinion Score,MOS),并对所得数据进行分析。测试环境中的受控因素包括:观看距离、观测环境、测试序列的选择、序列的显示时间间隔等
客观评估通过一些评估标准来量化视频质量,其实就是对每一帧视频的量化。为什么说是视频帧评估呢, 因为视频的评估的发展源于图像质量的评估,每一帧视频其实就是一张图片。
主要也分为两类,一类是有参考(全参考/部分参考)评估,另一类就是无参考评估。
有参考评估,就是依赖原始视频和待评测视频进行对比,目前比较熟知的就是 PSNR, SSIM VIF VMAF PEVQ 等。
无参考方法,在判断视频质量时不需要来自原始参考视频的任何信息,通过对失真视频空域和频域的处理分析来提取失真视频的特征,或者基于视频像素的质量模型等来得到视频质量。这种评估标准适合与线上无原始参考视频序列的无线和 IP 视频业务,或者输入和输出差异化的模型,比如说视频增强,视频合并等场景
由于工作比较忙,所以我会以小短文的方式继续往后介绍,能想到的先是下面几个议题,如果有感兴趣的欢迎提出来后面再陆续补充
--有参考评估算法系列
--如何对标发送接收视频帧信息,制作实际应用中的有参考序列对
--无参考评估算法或者模型
我们的框架已经在大会上宣布开源 也欢迎大家到 https://github.com/open-webrtc-toolkit/QoSTestFramework 上使用,提问和打星。