Qualité vidéo de l’expérience et des mémoires tampon
Au début du streaming vidéo , les téléspectateurs étaient prêts à endurer une expérience de lecture frustrante pour avoir accès à du contenu exclusif. Alors que le nombre de fournisseurs de contenu partageant leur contenu entre plusieurs distributeurs a augmenté, la qualité de l’expérience (QoE) est devenue essentielle pour fidéliser les téléspectateurs.
La qualité de l’expérience fait référence à l’expérience globale d’un utilisateur regardant un flux vidéo. Contrairement à la qualité de service (QoS), la QoE est une question plus subjective, donc difficile à mesurer ou à garantir un certain niveau. La QoE comprend de nombreux indicateurs de performance clés (KPI) que les services vidéo suivent pour mieux comprendre les performances de leur plate-forme. Ces mesures de qualité peuvent être décomposées en domaines de préoccupation spécifiques, tels que la remise en mémoire tampon ou les fluctuations importantes du débit binaire.
Parmi les différentes métriques, la remise en mémoire tampon est la faute la plus perceptible et la plus gênante des téléspectateurs. Cette petite roue qui tourne est le symbole d’une mauvaise expérience du spectateur. Les études de l’industrie de la vidéo montrent systématiquement que les téléspectateurs abandonnent un flux lorsqu’ils subissent une remise en mémoire tampon. La responsabilité de la remise en mémoire tampon et d’une qualité de service dégradée peut être difficile à identifier. Elle peut provenir de sources provenant du fournisseur d’accès Internet (FAI) du téléspectateur, du réseau de diffusion de contenu (CDN), de l’application de navigateur/lecteur du client ou de l’infrastructure vidéo de l’éditeur d’origine.
Bien que les problèmes avec le FAI ou l’éditeur soient largement hors de notre contrôle, nous pouvons maintenant capturer des données exploitables qui nous permettent d’identifier et de résoudre les problèmes de qualité d’expérience découlant du CDN. Pour ce faire, nous avons développé un algorithme que nous appelons « Estimate Rebuffer » pour identifier les problèmes de QoE vidéo à l’aide des journaux du serveur Web. Ce système de surveillance en temps réel utilise des données granulaires pour identifier les problèmes de QoE et analyser les causes profondes et les actions de résolution correspondantes. Dans cet article, nous verrons comment cet algorithme détermine les problèmes de QoE et comment nous pouvons l’utiliser pour améliorer la QoE.
La vue d’ensemble de l’algorithme Estimate Rebuffer
Une façon de suivre la QoE est que le lecteur envoie des données QoE au CDN. Cela nécessite que les joueurs et les clients adoptent un kit de développement logiciel (SDK). Et compte tenu de la grande diversité des périphériques de lecture, il est presque impossible de capturer de manière cohérente les indicateurs de qualité de service côté client. L’algorithme Estimate Rebuffer atténue le besoin de changements de joueur/client ou d’adoption de SDK. Il s’agit d’une estimation car elle n’a pas besoin d’informations envoyées via des balises du côté client. Cependant, compte tenu de son étendue à travers les centres de données et les réseaux de livraison, il fournit une vision beaucoup plus précise de la cause profonde des problèmes de qualité de l’expérience que du côté client seul.
L’outil Estimate Rebuffer identifie les problèmes de QoE à l’aide des journaux d’accès client côté serveur à partir des services vidéo de notre plateforme. Pour évaluer la qualité de l’expérience, il utilise trois éléments d’information :
- Horodatage du moment où un client a demandé un asset/video-stream-chunk
- Nom de fichier de la ressource/vidéo-stream-chunk
- Identifiant de session ou de client
À partir de ces informations, sans avoir besoin d’outils tiers, l’algorithme Estimate Rebuffer peut déterminer les éléments clés qui influencent la QoE, notamment les éléments suivants :
- Rebuffering — L’algorithme détaille le nombre de rebuffers qu’un client a vus, la durée des événements de rebuffering et le rapport entre la remise en mémoire tampon et le temps passé à regarder le flux vidéo.
- Débit binaire moyen — la qualité vidéo est fonction du débit binaire vidéo. Un débit binaire moyen plus élevé signifie une meilleure qualité vidéo, des images plus claires et plus nettes, des couleurs plus riches et une meilleure expérience.
- Taux de fluctuation — les téléspectateurs ont tendance à réagir négativement aux fluctuations du débit binaire, préférant un débit binaire constant. Cette mesure détermine le nombre de fois que le flux vidéo change de qualité.
- Distribution de qualité — cela nous permet de déterminer quelle fraction de la vidéo a été servie à quelle qualité à un client donné. Par exemple, 80 % ont été servis en haute qualité, 10 % en moyenne et 10 % en basse qualité.
Comment ça marche
Comment l’algorithme Estimate Rebuffer peut-il fournir une évaluation aussi utile de la QoE avec seulement deux informations ? Jetons un coup d’œil.
Un flux vidéo à débit binaire adaptatif (ABR) comprend de nombreux morceaux ou ressources vidéo individuels. Chaque bloc est de taille fixe, généralement de 4 secondes. Par exemple, un flux vidéo ABR de 40 secondes comporte 10 blocs (40/4 = 10 blocs).
Chaque bloc est nommé séquentiellement, par exemple, a1.TS, a2.TS, a3.TS…a10.TS, etc. La première lettre est le type de qualité. Dans notre cas : a est le plus bas, B est supérieur à A, C est supérieur à B…, et ainsi de suite. Avec cette connaissance, nous examinons les demandes de chaque client et les vérifions dans l’ordre. Si leur qualité change, par exemple a1.TS, b2.TS, a3.TS, nous l’ajoutons à la métrique du taux de fluctuation.
Puisque nous savons quand un client nous a demandé un morceau et combien de temps chaque morceau est (4 secondes), nous pouvons ajouter tout le temps / durée pour tous les morceaux demandés. Si nous voyons un intervalle entre les deux, les intervalles de requête sont plus longs que le nombre de morceaux demandés par le lecteur dans le passé — qui est la vidéo dans le tampon — nous le comptons comme un retampon. Nous considérons également combien de clients vidéo mis en mémoire tampon auraient regardé lorsqu’ils ont fait une nouvelle requête de segment à partir du CDN.
Cet algorithme n’est pas exclusif à Verizon Media, maintenant Edgio. Il peut être étendu à d’autres services vidéo sur le réseau de diffusion Edgio tant qu’ils utilisent une convention de dénomination de fichier similaire.
Applications
Avec les données QoE en main, nous pouvons améliorer la QoE de plusieurs façons, y compris le débogage de problèmes spécifiques et l’identification des réseaux sous-performants. Une fois que nous avons identifié les problèmes de QoE, nous pouvons facilement creuser plus profondément pour comprendre pourquoi ils se sont produits.
Lorsque nous constatons une mauvaise qualité d’expérience, nous pouvons examiner les indicateurs de qualité d’expérience par centre de données pour identifier le centre de données qui a observé la mauvaise qualité d’expérience. Une fois que nous avons identifié le centre de données, nous pouvons explorer le réseau qui en est à l’origine, isoler les causes et recommander des correctifs. Par exemple, une solution pourrait consister à ne pas utiliser un réseau spécifique lors du flux vidéo en direct suivant si ce réseau s’est révélé sujet aux pannes. Habituellement, lorsque nous avons des problèmes de remise en mémoire tampon, nous déplaçons manuellement le trafic avant que l’événement ne commence à faire de la place pour le nouveau trafic. Sur la base des données estimées de l’algorithme de rebuffer, notre équipe de gestion du trafic peut créer un tampon avant le jeu pour déplacer le trafic avant que le jeu ne commence à anticiper les problèmes de capacité.
Et puisque le système peut fonctionner en temps réel, nous pouvons prendre des mesures correctives de manière proactive lors d’une vidéo en direct. Cela peut impliquer, par exemple, de déplacer le trafic d’un centre de données connaissant une mauvaise qualité de service vers un centre de données plus sain. La détection et la résolution des erreurs en temps réel sont un outil très efficace pour réduire le nombre de clients confrontés à des problèmes de remise en mémoire tampon ou autres.
Bien que l’élimination de la roue qui tourne redoutée ne soit jamais possible, les outils d’analyse côté serveur comme l’algorithme Estimate Rebuffer contribuent grandement à rendre son apparition beaucoup moins fréquente.