随着广告资金和观众继续远离传统电视,内容所有者和广播公司正在寻求广告支持的直播活动流媒体,以吸引新的观众并通过Over-the-Top (OTT)流媒体增加收入。 OTT提供了新的分发机会,使出版商能够播放以前在广播电视上没有位置的许可内容并从中获利。 但是,在出版商开始流式传输直播活动之前,必须考虑流式传输视频工作流第一步中的技术障碍:
- 会场和摄取点之间的连接质量和带宽可用性可能是工作流程中的一个薄弱环节。 必须内置冗余和可靠性。
- 实时视频源必须编码成各种自适应比特率格式和协议,如Apple HLS和MPEG-DASH ,同时最大限度地减少延迟。
- 上传和编码解决方案必须面向未来,可靠且可扩展,才能应对4K和其他高质量格式的出现。
- 视频工作流应能够支持服务器端广告插入,以获得最佳观众体验和最适宜的盈利策略。
在本技术博客中,我们将介绍我们如何构建平台,使发行商能够优化流媒体视频工作流程的第一步,了解其中涉及的一些挑战,并解释我们如何对直播流进行编码,以实现高性能,低延迟,支持广告的直播流媒体。
Background : The Slicer
在深入探讨编码的技术注意事项之前,我们需要解释称为”切片器”的技术。 强大的软件客户端Slicer可将场地的直播流式传输到我们的云视频平台。 它简化了极其复杂的任务,而不牺牲灵活性和功能性。 切片器是拥有丰富技术资源和没有技术资源的广播公司能够利用我们的平台打造与众不同的OTT体验的关键原因。
切片器准备内容进行编码,计算理想的编码设置并管理广告插入标记。 您可以在安全的硬件上运行切片器,或选择支持各种格式(包括SDI,IP视频,RTP/FEC和RTMP)的与云无关的位置的成本节约和可扩展性。
切片器可将您的内容分成多个小块,并在将其发送到我们经过ISO认证的云编码堆栈之前对其进行加密,确保内容始终安全,让您高枕无忧。 它提供了一系列灵活的工作流,从简单的一键式配置到更高级的编程语言脚本,到编写触发通知,作业处理和机器学习集成工作流的云功能。
我们的”实时切片器”是切片器的一个版本,针对实时事件流媒体进行了优化。 HD-SDI或基于IP的源可以快速摄取并以最高期望比特率分成2秒或4秒的加密片段,从而将带宽要求降低到1080p的3-5 Mbps,4K的带宽要求降低到大约15 Mbps。 我们的流程会自动保留带内和带外元数据和消息,以触发节目和广告中断或替换内容。 我们的插件架构允许您创建自定义脚本,以处理您独特的信令事件要求。 Live Slicer还可以收听SCTE 35 / 104消息或接收API调用以插入广告中断,内容开始或中断触发器。
OTT流是从直播线性源生成的,前期投资最少,带宽要求低。
最小化带宽
既然您已经了解了Slicer,您可能会想知道为什么我们会开发一个前端软件组件来将实时流媒体从事件转移到云端。 例如,为什么发布者无法通过RTMP (实时消息协议)流发送? (如果您愿意,您可以这样做,但我们的大多数客户都充分利用了切片器。)答案与消费者对高质量直播流的期望以及解决直播场地的带宽难题一样重要。 这是一个在许多竞争因素之间找到适当平衡的问题。 一方面,您需要尽可能多地保留原稿,并注意到更高质量的格式和4K。 另一方面,您需要优化流媒体,以便它可以有效地交付,而不会陷入额外的开销困境,如个性化广告。 找到合适的平衡对于视频工作流程的这一步至关重要。
这里是切片器至关重要的地方。 如上所述,它通过在站点上创建最高比特率配置文件并仅将该配置文件发送到云来显著降低给定馈送所需的带宽。 在我们的观察结果中,基于向全球数十亿观众传输数百万小时的直播影像,将大幅增加的RTMP流式传输到云端的替代方法不会显著提高观看体验的质量。 但它确实显著增加了带宽,从而增加了成本。
回程成本可能会迅速增加。 如果您需要卫星上行链路,例如,Ka波段卡车的租金为每天2,000美元,带宽成本为每小时400美元。 考虑到某些场地(如酒店或会议中心,甚至全球体育场馆)的不一致和带宽受限的情况,底线是尽量减少上传带宽要求,同时确保为观众提供广播般的体验始终是一个好主意。
编码障碍
实况视频源离开会场后,工作流程中的下一步就是编码。 在这里,视频编码器可以创建不同比特率,分辨率和质量级别的音频和视频的多个版本或变体。 然后将变体划分为小文件或媒体段。 必须执行多个附加步骤,例如为每个变体创建媒体播放列表,其中包含指向变体媒体段的URL列表。 生成的主播放列表是播放器选择最适合设备的变体以及当前测量或可用带宽。
两种主要的视频流协议增加了复杂性,可能需要支持其他协议才能覆盖无数潜在的播放设备。 HLS是Apple实施的基于HTTP的媒体流通信协议。 它支持所有Apple设备以及大多数Google,Android,Linux和Microsoft浏览器和设备。 大多数但不是全部。 您还需要MPEG-DASH,这是一种竞争对手的基于HTTP的媒体流协议。 您可能还需要为游戏控制台添加对Microsoft Smooth Streaming的支持。
DRM还需要自己的多种格式集来支持大量观众的需求,从而使编码变得复杂。 例如,不支持DRM的旧玩家需要HLS和AES-128。 较旧的iOS设备需要HLS和FairPlay。 较新的iOS设备支持HLS和FairPlay以及CMAF CBC。 较旧的Windows和Android仅支持CMAF CTR。 较新的Android,Windows和iOS应支持所有CMAF格式。 您的内容必须以多种格式打包,才能在所有设备上播放。
如果这听起来像大量的编码工作,你是对的。 随着分辨率的增加和编解码器的复杂性的增加,在单台机器上编码完整的ABR编码梯变得越来越困难,无论是在云端还是内部部署。 如果您的编码硬件不能跟上实时视频源的任务,您可能需要减少编码梯上的梯级数,这最终可能会影响观众的体验。
为了跟上更复杂的编码要求,传统模式意味着生产商必须不断投资于新硬件,以保持速度和质量。 归根结底,对于Edgio (以前称为Verizon Digital Media Services)这样的流媒体服务,1:1流对编码器模型无法提供满足客户期望所需的可靠性,灵活性和可扩展性。
相反,我们开发了一个复杂的中介系统,允许使用我们需要的任意数量的编码器,所有这些编码器都在基于云的基础设施中运行。 中介系统接收来自切片器实例的内容块,并将其移动到最优的编码器。 此操作可防止编码进程使特定计算机负担过重,并使数据块通过系统传输到存储设备,然后再传输到查看器。
代理流程可无缝扩展我们的云编码器基础设施,更重要的是,自动扩展。
在我们的实现中,代理实例充当管理器,在切片器和编码器之间进行对话。 代理确保任何新的切片器将其数据路由到正确的编码器,并验证编码器是否可以处理工作负载。 此外,我们还拥有一个非常强大的扩展基础设施。 如果我们突然转储了需要编码的一百万小时的VOD内容,我们可以快速提升服务器实例并开始处理内容。 我们还可以快速缩小规模以节省资源。 此代理流程无缝管理我们的整个云基础设施,更重要的是,自动管理。
无状态编码器
当然,中介系统的价值将是有限的,如果它所能做的只是指向一个单一的编码器,可能或可能无法跟上直播流的需求,这是一个严重的问题4K . 我们开发的解决方案涉及使用无状态编码器。 每个编码器一次只接收一个2秒或4秒的视频片段,而不是将一台机器用于整个视频流。 每个段都包含足够的信息来启动编码器,以便编码该段并丢弃任何不必要的启动信息,例如引入和引出信息。 此时,整个段已完成并准备就绪,解放编码器,以便它可以开始对来自另一个频道或其他任何内容的另一段内容进行编码。
此型号还在系统中内置了大量冗余。 例如,如果编码器在处理数据段时崩溃,同一数据段将在另一台机器上启动,并在数据流中发现任何问题之前及时完成。
这种方法还允许使用更具成本效益的硬件。 例如,如果我们知道速度较慢的计算机可能需要8秒才能处理来自切片器的4秒文件,则可以将工作负载分散到多个编码器上,如下所示:服务器A获取分片1,服务器B获取分片2,依此类推。 然后,这些块都在可预测的时间内完成,因此没有出现任何问题。 如下图所示,此示例将导致延迟16–20秒的实时延迟。
在云中使用多个编码器可最大限度地减少延迟,并允许使用无法跟上实时源的服务器。
最终,云中的服务器数量(即使单个服务器的速度较慢)意味着编码流程始终可以满足实时需求。 如果您想使用传统模式设置编码基础设施,您需要投资购买昂贵的高性能机器或专用硬件,每种设备都能够处理整个传入视频,而无需实时协助。 通过利用云的可扩展性,我们显著降低了编码成本。
无状态云编码的另一个优点是,我们可以轻松地将工作负载移至备用云提供商,因为我们没有专门的服务器要求。 凭借250+ Tbps容量的网络,多云方法具有固有的优势。
经济实惠的直播流媒体
对于直播内容制作者来说,为云流媒体准备直播视频的技术考虑因素可能会带来巨大的障碍。 您将面临各种问题,从会场带宽限制到围绕编码器和流协议的复杂问题。 虽然它不能消除场地的一些连接需求,但简化的工作流程和减少前端带宽要求可以显著减少前期和持续支出,同时提供观众期望的高质量,低延迟流媒体。