Home 技术文章 从服务器端测量视频QoE:估计重新缓冲
Applications

从服务器端测量视频QoE:估计重新缓冲

About The Author

Outline

视频体验质量和重新缓冲

在视频流的早期 ,观众愿意忍受令人沮丧的播放体验,以获得独家内容的访问。 随着在多个分销商之间共享内容的内容提供商数量不断增加,用户体验质量(QoE)对于保持观看者身份至关重要。

体验质量是指用户观看视频流的整体体验。 与服务质量(QoS)不同,QoE是一个更加主观的问题,因此难以衡量或保证一定的水平。 QoE包含许多关键性能指标(KPI),视频服务可跟踪这些指标以明确其平台的性能。 这些质量指标可以细分为特定的关注领域,例如重新缓冲或大量比特率波动。

在各种指标中,重新缓冲是观众最明显和最讨厌的错误。 这个小小的旋转轮子是一个糟糕的观众体验的象征。 视频行业的研究一致表明,观众在遇到重新缓冲时会放弃流媒体。 重新缓冲和QoE降级的原因可能很难查明。 它可能来自观众的互联网服务提供商(ISP),内容交付网络(CDN),客户端的浏览器/播放器应用程序或原始发行商的视频基础设施。

虽然我们无法控制ISP或发行商的问题,但我们现在可以捕获可操作的数据,使我们能够识别和解决源自CDN的QoE问题。 为此,我们开发了一种称为”估计重新缓冲区”的算法,以使用Web服务器日志识别视频QoE问题。 此实时监控系统使用细化数据来识别QoE问题,并深入了解根本原因和相应的解决措施。 在这篇文章中,我们将了解此算法如何确定QoE问题以及如何使用它来改进QoE。

估计重新缓冲算法概述

跟踪QoE的一种方法是让玩家将QoE数据发送到CDN。 这需要玩家和客户采用一个软件开发工具包(SDK)。 鉴于播放设备的多样性,客户端QoE指标几乎不可能一致地捕获。 估计重新缓冲算法减少了播放器/客户端更改或SDK采用的需要。 这是一个估计值,因为它不需要通过信标从客户端发送信息。 但是,鉴于其在数据中心和交付网络中的广泛性,与单独的客户端相比,它提供了对QoE问题根本原因的更清晰的见解。

估计重新缓冲工具使用来自我们平台上的视频服务的服务器端客户端访问日志来识别QoE问题。 要评估QoE,它使用三个信息:

  • 客户端请求资产/视频流块时的时间戳
  • asset/video-stream-chunk的文件名
  • 会话或客户端标识符

根据此信息,无需第三方工具,估计重新缓冲算法可以确定影响QoE的关键元素,包括以下内容:

  • 重新缓冲—该算法详细说明了客户端已检测到的重新缓冲次数,重新缓冲事件的持续时间以及重新缓冲与观看视频流所用时间的比率。
  • 平均比特率—视频质量是视频比特率的函数。 较高的平均比特率意味着更好的视频质量,更清晰的图片,更丰富的色彩和更好的体验。
  • 波动率—观众倾向于对比特率的波动作出负面反应,而倾向于使用恒定比特率。 此指标确定视频流更改其质量的次数。
  • 质量分布—这使我们能够确定以何种质量向给定客户提供的视频比例。 例如,80%的服务质量高,10%中等,10%低。

工作原理

估计重新缓冲算法如何仅使用两条信息提供对QoE的有用评估? 让我们来看看。

自适应比特率(ABR)视频流包含许多单独的视频块或资产。 每个块的大小是固定的,通常为4秒。 例如,40秒ABR视频流有10个块(40/4=10个块)。

每个块都按顺序命名,例如A1ts,A2ts,A3ts…A10ts, 等等。 第一个字母是质量类型。 在我们的例子中:A是最低的,B是高于A,C是高于B…,依此类推。 借助这些知识,我们可以查看来自每个客户的请求,并按顺序进行检查。 如果质量发生变化,例如A1ts,B2ts,A3ts, 我们将其添加到波动率指标中。

由于我们知道客户端何时向我们请求一个块,以及每个块有多长时间(4秒),我们可以为所有请求的块添加所有时间/持续时间。 如果我们看到中间的间隙,请求的间隙超过播放器过去请求的块数(即缓冲区中的视频),我们将其视为重新缓冲区。 我们还会考虑当缓冲视频客户端从CDN发出新的块请求时,它们会观看多少视频。

此算法不是Verizon Media独有 的,现在是Edgio。 它可以扩展到Edgio交付网络上的其他视频服务,只要它们使用类似的文件命名约定。

应用程序

借助现有的QoE数据,我们可以通过多种方式改进QoE,包括调试特定问题和识别性能不佳的网络。 识别QoE问题后,我们可以轻松地深入了解问题发生的原因。

当我们发现质量较差的QoE时,我们可以查看每个数据中心的QoE指标,以确定哪个数据中心发现了质量较差的QoE。 一旦我们确定了数据中心,我们就可以深入了解导致数据中心的网络,找出原因并提出修复建议。 例如,一个解决方法可能是在下一个实时视频流中不使用特定网络,如果该网络显示容易出现故障。 通常,当出现重新缓冲问题时,我们会在活动开始为新流量腾出空间之前手动移动流量。 根据估计的再缓冲算法数据,我们的流量管理团队可以创建一个游戏前缓冲区,在游戏开始前移动流量,以抢占容量问题。

由于系统可以实时工作,我们可以在直播视频期间主动采取纠正措施 。 例如,这可能需要将流量从体验恶劣QoE的数据中心转移到更健康的数据中心。 实时错误检测和解决是一个非常有效的工具,可减少遇到重新缓冲或其他问题的客户端数量。

虽然消除可怕的旋转轮可能永远不可能,但像估计再缓冲算法这样的服务器端分析工具在很大程度上减少了其出现频率。

Tags

Just For You