随着近年来在线教育、线上会议的普及,在线交友,实时娱乐等应用的爆发,人们对于实时视频互通的需求正在与日俱增,编码器作为视频传输和存储过程的核心技术之一也成为技术领域的热门话题。

在众多编码器中,x264 和 x265 是目前业界主流的商用编码器。他们都有着很高的压缩比和优秀的画面质量,但在实时编码领域却面临着很大的挑战。大家都知道,编码器的画质和延时总是在天平的两端,往往此消彼长,因此,如何在保障低延时的实时场景保持高清画质是行业内不断钻研和努力的方向。

声网通过多年在实时互动场景中的积累和探索,推出了自研编码器 a264 和 a265,进一步满足实时场景中对于高清画质、低延时传输的需求。

更优的画质和更低的能耗

摄像头采集场景下,声网自研的 a264 编码器相比 x264 在相同画质下能节省 17% 的码率,速度提高了 47%;甚至相比高一代的 x265,a264 在编码速度遥遥领先的同时,编码效率都能略胜一筹。
对于有更进一步画质追求的客户,声网也提供了压缩效率更高的 a265 编器。a265 编码器在速度几乎持平 x264 的基础上,相同画质下能够节省 28% 的码率;相比 x265,a265 同样具备码率节省 16%、速度提升 215% 的优异表现。这意味着声网的 a265 编码器在保证画质的前提下会更加高效,同时拥有更低的能耗。

ROI (Region of Interest) 功能

声网自研编码器提供的 ROI 功能可以对用户指定的视频图像中感兴趣的区域进行高清编码,通过提高非 ROI 区域的压缩率,在有限的带宽下,还原用户更关注的内容。
在操作层面,声网的编码器支持从外部导入多个人眼感兴趣区域的信息,在内部进行更好的码字分配,从而在相对低的码率下保证更好的主观画质。

弱网对抗

为了应对实时场景下网络波动带来的影响,声网对 a264 的码控进行了重新的设计。由于帧大小的波动会直接影响端到端的延时,声网对 a264 的帧大小做了非常精细的控制来适应网络的波动,同时又要确保画质稳定。如下图所示,在 racehorses 序列中声网的码控相比开源编码器更加稳定。

为了做到更好的弱网对抗,声网的自研编码器会综合端到端的带宽估计、丢包率、时延等信息,对码控做更精细的控制。在网络情况较差的时候,我们会在保证不超发的前提下保持画质;而在网络情况好的时候,通过对画面的检测,根据不同场景进行码控策略上的调整,在不影响延时的同时进一步提升主观画质。

在实时场景中,为了提高实时场景中的数据传输效率和可靠性,声网的编码器也引入了 SVC(Scalable Video Coding)功能。SVC 能够将视频数据分层编码,在不同的网络环境下选择不同的数据层级进行传输,以达到更好的效果,保证用户的视听体验。

无论是主观感受还是客观的数据支撑,声网的 a264 和 a265 编码器在实时互动领域的优势相当显著,将会在未来的 4K 和 8K 视频中扮演着重要的角色。声网也一直致力于提供先进的技术和高品质的产品,期待与更多的客户合作,共同实现互利共赢。

注册并试用声网服务

点击【此处】,即可注册并试用每月 10000 分钟免费的声网视频 SDK,体验四行代码、三十分钟快速构建沉浸式实时互动场景


↙↙↙阅读原文可查看相关链接,并与作者交流