雷锋网消息,9月20日,由保利威主办的教育直播高峰论坛在北京举行。保利威董事长兼CEO谢晓昉以《5G时代,重构教育直播体验》为题,就5G对教育直播体验带来的重要影响谈及了他的见解。
谢晓昉在演讲中认为,当下影响教育直播体验的四大痛点有:卡顿多、延迟大、双向体验差、视频质量低,而随着5G的到来,这些问题将逐渐被攻克,在线教育直播行业即将迎来最佳的窗口期。
论坛现场,谢晓昉也介绍了保利威布局未来5G时代的新一代直播平台。该直播平台主要有五大特性:支持4K UHD双向视频流;支持大并发的超低延迟直播;弹性的节点负载均衡策略;终端就近访问机制;跨节点的智能流路由。
保利威董事长兼CEO 谢晓昉
值得注意的是,在本次论坛上,保利威技术副总裁梁瑛玮对外发布了“视频大数据高级分析”功能,并于9月20日进行线上公测。该功能包括观看行为分析、视频分析、观众分析三个维度,目的是为了帮助在线教育平台了解用户的观看行为以及直播的播放热度,从而挖掘数据价值,提升运营效率。
在具体技术应用上,观看行为分析主要借助视频观看热力图来实现,即单次观看行为的图形化表示,不仅展示用户观看完成度的统计结果,还原整个观看过程,可以帮助在线教育企业深度了解单用户对视频内容的不同喜好。比如,视频分析图能帮助在线教育机构准确了解到哪一部分视频内容观众不再感兴趣,而视频分析图一个波峰的出现可能意味着这部分视频内容吸引了观众反复观看,机构便可准确地对直播内容作出调整,更加符合用户现阶段的需求。
除了在线教育机构外,保利威也与不少全日制学校及教育系统存在合作。活动现场,谢晓昉在接受雷锋网采访时表示,教育系统当中有一个很重要的组成部分是电教系统,一些山区的老师通过电教系统的卫星网络电视给学生教授相关教学内容,但这套系统互动性和体验很差,一直用不起来。
“但是随着手机的普及,江西省教育、兰州教育电教系统通过互联网来解决这个问题,来替代基于卫星的这套系统,这是我们中小学方面的进展。在高校领域,我们和山东大学、武汉大学等在慕课以及远程教育系统方面合作比较多。”
以下是谢晓昉在大会上的分享内容,雷锋网(公众号:雷锋网)对其进行了不改变原意的编辑整理:
各位尊敬的来宾,大家下午好,我是保利威的创始人谢晓昉。刚才宓老师讲的比较宏观,我接下来讲的内容会偏技术一点,作为一名在在线视频行业从业18年的老兵来说,今天我的内心比较激动,因为随着5G的到来,我们教学直播行业即将迎来最佳的窗口期。
大家可以看到这张图,这是思科的一个数据。早在2007年的时候,我们在线视频流量已经占据整个互联网流量的半壁江山,到2017年的时候大家可以看到,它的占比是75%。思科预测在2022年,在线视频占比会超过82%,而我的预计会更加乐观一点。
直播行业的最近几年迅速发展,我们教育直播最近几年发展也是非常迅速的。但是在教育行业,我觉得教育直播行业的上空笼罩了几朵乌云。这是一张我们最典型的教育直播架构图从采集,编码、推流,到视频的传输,到解码播放,加入我们的连麦系统,在这样一个经典网络架构之下,一直以来有几个重要问题得不到解决。
影响教育直播体验的四大痛点
第一个痛点是卡顿。我认为每个直播平台,不管是教育直播平台,还是娱乐直播平台,甚至游戏直播平台都面临一个问题,现在来说0.5%的卡顿率已经算是不错的成绩了。刚才宓老师也说我们人口基数非常大,现在很多机构开一个万人的直播课,都是非常常见的,一万人的话如果有50人有卡顿的体验,其实整体感受也会是比较差的,这种服务是比较糟糕的。
第二个问题是延迟。现在我们业界的延迟量级大概是1-3秒,有一些移动平台的延迟甚至达到10多秒,严重影响了我们这种教学活动的开展。
第三个问题是双向体验。说到双向体验,除了延迟会导致体验差之外,我们现在使用的网络是不对等的网络,上下行带宽的差异,尤其上行会比较差,所以无法进行高清双向的互动沟通。可能大家看过一些场景,在我们教学过程当中,一旦涉及到连麦,我们图片画面立即缩小了,体验非常差。
第四个是视频画面质量还是相对较低。目前来看,720P已经成为主流,1080P也慢慢普及,但是这样图像清晰度跟我们线下教学体验还是相距甚远的,这些问题是我觉得困扰着大家。
但更严重的问题是什么?更严重问题是我们甚至习以为常,对于这些卡顿和延迟,我们甚至没有动力去解决它,这是我们最大的问题。但是现在不一样了,5G到来了,我们看到解决这些问题的终极方案,我们看到了解决问题的希望。
5G的三大特性
5G给我们带来了什么?这是一张大家非常熟悉的图,提到5G必须要讲5G的三大特性。
其中一大特性是海量机器通信,这个跟物联网比较相关。
我讲一讲跟直播行业相关的,很重要一个特性就是eMBB,增强了移动带宽。这个特性能够让我们终端接入速度大大加快,现在已经实现了,因为我们在今年6月6日5G正式商用,运营商获得了牌照,现在我们测试的带宽增强效果是1个G,上行是100兆。
随着5G不断成熟,终端的下行速度将会达到10G,甚至20G,也就是今后每个人的手机接入速度达到万兆水平,上行也会有十倍的提升。eMBB在整个5G体系里面,这一套相关的规范和标准是最早提出来的,并且目前来看是最成熟的,eMBB的特性基本上是完全面向超高清视频的传输,也就是说未来两三年5G的价值落地和体现,基本是朝这个方向来进行的。
因此我们保利威在近期也是跟运营商密切的合作,当然运营商态度也非常积极,因为他们要让5G产生价值。我觉得最快速的办法就是看重超高清这一块商业落地,保利威在这一块是有先发优势的,所以eMBB让我们直播体验,高清快速的到来,双向的带宽大幅提升会让我们超高清双向互动没有任何压力。
另外我们谈到uRLLC。这是超高可靠性和低时延通信,这是一个革命性的变革。大家应该都用过电话跟有线电视,有线电视我们90后不一定用过,但是我们在打电话或者看有线电视的时候,有一个非常明显的体验,就是说我们不会中断也不会卡顿。
电话和有线电视是上个世纪的发明,它不算什么高科技,但是在这样一些系统当中,存在着我们称之为QOS的机制,因此就是说能够保障系统的数据流的高可用。可喜的是我们5G时代,5G在物理层和数据链路层开始有了QOS机制,能够保障我们的直播数据通信是达到高可用的水平。
我刚才说了uRlLLC,能够让现在4G的100毫秒延迟降低到1毫秒以下,为我们的低延迟直播创造了非常有力气条件。大家看到基于5G的技术,给我们直播行业提供了非常多的利好。
下一代直播网络的两大技术方向
但仅仅是从硬件底层来做一些变革还是远远不够的,还有两个技术方向,就是我们认为会影响我们的下一代直播网络。一个技术方向就是底层协议更换,另外一个是超高清编码的采用。
我说底层协议的更换,其实是一个比较专业的话题。在这个话题之前,我们看一张图,大家可以看到这张图,很多的汽车在这个十字路口围绕着一个交通灯,完全堵塞的状态。在这个状态里,交通灯其实是形同虚设的,交通灯是一个非常伟大的发明,是英国在1868年首先发明的使用的。
那个时候我们的道路上面的车辆是非常少的,车速是非常慢的,交通灯非常有效的解决了交通规则和道路堵塞的问题。但是随着汽车工业的发展,我们的车辆不断在增加,车速也在不断加快,因此在很多场景之下,交通灯成为了堵塞的一个原因。因此需要新的一些机制来改变这种局面。
大家可以看到,这是现在很常见的一个立体交通网的立交桥,在很多情况之下能够大幅度提升我们的交通效率,同样的情况,也出现在我们的网络世界当中。
我认为我们的网络通信的基础协议TCP就有这种交通灯的属性。TCP大家可能非常清楚,TCP是非常伟大的一个发明,是跟互联网相生相伴的一个重要协议,是我们互联网发展的技术的基石。目前来看我们在网络上面绝大部分应用都是基于TCP,像HTPP协议,像很清楚的FTP,还有在直播行业经常用到的RTMP协议,都是基于TCP,这是一个非常重要的协议。
但是现在来看TCP协议,或者说在TCP构建下的网络,已经显得力不从心了。原因很简单,在互联网的初期,当TCP协议发明的时候,它解决问题是一些相对较低速网络当中数据的安全和完整性的问题。那时候丢包率大概是百万分之一,传递的数据是以K计算的,大家有过经历的,那还是后期的。数据量不大,TCP协议其实解决了很多问题。
但现在来看,我们终端的接入速度,刚才说到5G,甚至5G网络能达到10个G的速率,我们现在网络的丢包率是1%的时候也是非常常见的丢包率,因此我们的TCP协议已经成为了制约我们真实速度提升的很重要的问题。解决这个问题,业界提出了三种解决方案,大家可以看一下。
第一个是基于IP路由解决方案。通过链路的优化,通过购买专有链路解决堵塞和丢包问题,这种方案成本相对比较高,应用场景也是有限的,因此无法大规模普及。
第二种方案是基于UDP的应用层传输协议。UDP大家知道,存在很多缺陷。但是好的消息是UDP很多缺陷是能够通过应用层进行优化和补充,甚至能够在某些场景下达到TCP的可靠性,这是UDP。
第三种方案是进行TCP协议算法优化。首先来说这种优化的空间不会特别大。其次TCP的优化一般要接触到操作系统的内核,开发成本相对比较高,因此这样一个方案在一些操作系统厂家,会比较乐意去推广,例如像微软这样的公司。显而易见,第二个方案可行性是比较高的。
我们也看到,Google推出了QUIC方案,是基于UDP的协议,HTTP/3 QUIC。在去年年底正式通过了IETF的官方认证,更名成为了HTTP/3,成为了未来的传输协议的标准,得到了业界的认可。可以想像,在我们未来的互联网中,大量的视频数据、音频数据都将是采用UDP的方式进行阐述的。
说完我们的协议更换之后来讲一讲大家很关心的编码。这是一张从2K到8K的对比图,实际上我们的编码分辨率从2K到8K的数据量增长了15倍,分辨率大家都很关心,其实图像的质量除了分辨率之外还有很多其他的指标,包括HDR,通过动态的补偿提升场景的还原度,还有色域色深这样一些参数能够让我们的画面更加的鲜活。
提到超高清视频,高帧率也是必备元素,包括现在教育直播使用的帧率,很多电影都是在15-30帧时代。我们5G来来之后,4K、8K标准出来了,60帧是一个基准,120帧甚至180帧也会慢慢的普及。除了视频还有音频,从单声道到双声道到全景声道的演进。保利威最近也跟杜比合作,在音频编码这一块使用双声道能够实现全景深的编码技术,以上这些编码技术能够让我们视频的体验超越身临其境的效果。
我做一个比喻,比如舞蹈的教学,还有一些武术的教学等动作类型的教学,用我们的高帧率能够把很多动作细节真实还原出来。另外我们一些8K视频,结合超视网膜的屏幕,能够在医学教学当中,把一些微组织和微结构体现出来。
这样体验的提升带来的直接效果就是数据量的陡增,这是腾讯视频实验室的数据,在视频没有被压缩之前,大家可以注意一下,现在大家在网上看到的数据都是被压缩过的。在视频没有被压缩之前,8K的视频,它的码率能够达到60GB每秒,非常之大,即使我们5G网络也无法承受这样的高数据量,因此我们视频编码标准就变得非常重要了。
大家可以看到,视频压缩这个技术在不断的提升。现在我们看到的这样一些视频的压缩标准,能够接近一千倍的压缩比,也就是我们刚才看到8K视频,通过这些解码技术上能够达到60兆/秒的速率,我们5G网络能够非常轻松的传输这样的视频流了。
5G时代的直播网络
刚才说了5G的特性和两个技术方向的重构,最终效果是让我们重新打造一个全新的下一代视频直播的通信网络。
大家可以看到,在这个网络里面,大部分的蓝色线代表UDP的数据流,少量TCP仅用于性能控制连接在里面,99%的数据都是通过UDP传输的。在这样的网络当中,其实跟现在的直播网络正好是形成一个鲜明的对比,是反过来的。在这样的网络当中,我们能支持是4K超高清的双向视频流,并且支持大并发的超低延迟的直播,以及拥有现有所有CDN所具备的弹性负载能力。
这个网络我们保利威现已在搭建当中,正式商用应该在明年年初,今年年底应该有部分的用户能够体验到我们这张网络。当然这张网络是不完全依赖5G,5G来了以后仍然会充分利用5G的特性,我们新的网络架构主要目的是能够充分的发挥eMBB和URI的特性。
最终我们四大痛点通过这些技术得以完美的解决,我们会实现超高清的视频体验,双向的沟通会非常好,卡顿也是比较低,我们的延迟会比现在降低十倍甚至一百倍,这是一张对比的表,应该说5G到来之后,我们视频体验应该是这样子。
最后我用一句话来总结一下我今天的分享,我们教育直播行业的四大痛点,通过5G的三大特性,以及两大技术方向的变革,让我们迎接一个全新的教育直播的新时代,感谢大家。