影片體驗質量和重新緩衝
在影片流的早期,觀眾願意忍受令人沮喪的播放體驗,以獲得獨家內容。 隨著在多個分銷商之間共享其內容的內容提供商數量的增加,體驗質量(QoE)已成為觀眾保留的關鍵。
體驗質量是指用戶觀看影片流的整體體驗。 與服務質量(QoS)不同,QoE是一個更主觀的問題,因此很難衡量或保證某個級別。 QoE包含許多關鍵性能指標(KPI),視頻服務跟蹤這些指標以清楚地瞭解其平臺的性能。 這些質量指標可細分為特定的關注領域,例如重新緩衝或大範圍比特率波動。
在各種指標中,重新緩衝是觀眾最引人注目和最煩人的錯誤。 這個小旋轉的車輪象徵著糟糕的觀眾體驗。 影片行業研究一致表明,觀眾在經歷重新緩衝時會放棄流媒體。 重新緩衝和QoE降級的原因可能很難確定。 它可能源自觀眾的網際網路服務提供商(ISP),內容交付網路(CDN),客戶端的瀏攬器/播放器應用程式或原始發行商的影片基礎設施。
儘管ISP或發布者的問題在很大程度上超出了我們的控制範圍,但我們現在可以捕獲可操作的數據,使我們能夠識別和解決CDN引起的QoE問題。 爲此,我們開發了一種稱爲“估計重新緩衝”的算法,以使用Web服務器日誌識別視頻QoE問題。 此實時監控系統使用精細數據來識別QoE問題,並深入了解根本原因和相應的解決措施。 在本篇文章中,我們將了解此算法如何確定QoE問題,以及如何使用它來改進QoE。
估計重新緩衝算法概述
追蹤QoE的一種方法是讓播放程式將QoE資料傳送至CDN。 這要求玩家和客戶端採用軟體開發套件(SDK)。 由於回放設備的多樣性,客戶端QoE指標幾乎不可能一致地捕獲。 估計重新緩衝算法可減少播放器/客戶端更改或採用SDK的需要。 這是一個估計值,因為它不需要從客戶端通過信標發送資訊。 但是,鑑於其跨數據中心和交付網路的廣度,與僅客戶端相比,它可以更清楚地了解QoE問題的根本原因。
評估重新緩衝工具使用我們平臺上的影片服務中的伺服器端客戶端訪問日誌來識別QoE問題。 為了評估QoE,它使用三項資訊:
- 客戶端請求asset/video-stream-chunk的時間戳
- asset/video-stream-chunk的文件名
- 會話或客戶端標識符
根據這些資訊,無需第三方工具,估算重新緩衝算法可以確定影響QoE的關鍵元素,包括:
- 重新緩衝—該算法詳細說明客戶端已看到的重新緩衝次數,重新緩衝事件的持續時間以及重新緩衝與觀看視頻流所用時間的比率。
- 平均比特率—影片質量是影片比特率的函數。 平均比特率越高意味著影片質量越好,圖像越清晰,越鮮明,色彩越豐富,體驗越好。
- 波動率—觀眾傾向於對比特率波動作出負面反應,傾向於採用恆定比特率。 此度量決定視訊串流變更其品質的次數。
- 質量分布—這使我們能夠確定向給定客戶提供的影片的質量。 例如,80%的服務是高質量的,10%是中質量的,10%是低質量的。
工作原理
估計重新緩衝演算法如何只用兩項資訊就能提供QoE的有用評估? 讓我們來看看。
自適應比特率(ABR)影片流由多個單獨的影片塊或資產組成。 每個塊的大小固定,通常為4秒。 例如,40秒的ABR影片流有10個塊(40/4 = 10個塊)。
每個塊按順序命名,例如A1,A2,A3…A10,依此類推。 第一個字母是質量類型。 在本例中:A是最低值,B高於A,C高於B…,依此類推。 有了這些知識,我們會查看每位客戶的要求,並依序檢查。 如果其質量發生變化,例如A1,B2,A3,我們將其添加到波動率指標中。
由於我們知道客戶何時向我們請求塊以及每塊塊的時間長度(4秒),因此我們可以添加所有請求塊的所有時間/持續時間。 如果我們發現兩者之間存在間隙,則請求間隙長於播放器過去請求的塊數(即緩衝區中的影片),我們將其計為重新緩衝區。 我們還要考慮當緩衝影片客戶端從CDN發出新塊請求時,他們會觀看多少影片客戶端。
此算法不只適用於Verizon Media,現在是Edgio。 只要Edgio交付網路上的其他影片服務使用類似的文件命名約定,就可以將其擴展至這些影片服務。
應用程式
有了QoE數據,我們可以通過多種方式改進QoE,包括調試特定問題和識別性能不佳的網路。 一旦我們發現QoE問題,我們就可以輕鬆深入地了解問題發生的原因。
當我們看到不良的QoE時,我們可以查看每個數據中心的QoE指標,以確定哪個數據中心觀察到不良的QoE。 一旦確定了數據中心,我們就可以向下鑽取以確定是哪個網絡造成的,找出原因並提出修復建議。 例如,如果某個網絡已證明容易出現故障,則可以在下次實況視頻流期間不使用該網絡。 通常,當我們遇到重新緩衝問題時,我們會在事件開始之前手動移動流量,以便為新流量騰出空間。 根據估計的重新緩衝算法數據,我們的流量管理團隊可以創建遊戲前緩衝區,以便在遊戲開始搶先解決容量問題之前移動流量。
由於該系統可以實時工作,我們可以在實時流影片期間主動採取糾正措施。 例如,這可能需要將流量從QoE質量較差的數據中心轉移到更健康的數據中心。 實時錯誤檢測和解決是一種非常有效的工具,可減少遇到重新緩衝或其他問題的客戶端數量。
儘管消除可怕的旋轉車輪可能永遠不可能,但伺服器端分析工具(如估計重新緩衝算法)大大降低了其外觀的頻率。