其他分享
首页 > 其他分享> > 自动驾驶网络大学课程W5L1

自动驾驶网络大学课程W5L1

作者:互联网

上周课程学习的是数据网络设备中的两个关键器件PP和TM的设计思路,两篇材料分别介绍了可编程的PP报文处理器的设计和可编程的TM流量管理芯片的设计。

本周第一课的内容回到了网络的控制协议方面。

文章研究了视频网站如何采用可变速率编码,为不同连接带宽的用户根据网络带宽情况发送不同编码速率的视频信号,这个功能在各个视频网站上比较常见的体现是用户可以自己选择观看480P画质的视频、高清视频、还是自动模式。

目前视频网站的自动模式采取的方法是基于客户端对网络带宽的探测,然后通知服务器端无缝改变信号编码速率,通过降低带宽要求来保障视频的连续性。

文章发现复杂的基于机器学习方法产生的控制策略在效果上不如简单的基于缓冲区占用的算法,出现这种情况的原因是网络状态变化的影响因素太多、用户的行为模型太复杂。

文章提出的VBR算法还是用到了监督学习的方法,只是监督学习只是用于预测切分成小块的视频块的传送时间。

作者建立了一个电视转播的网站来获取实际的数据,并基于实际获取的数据对视频块传送时间预测器进行训练。

文章附录中给出了用于训练的数据具体包含的内容。

文章的想法不难,但是作者建立的电视转播网站,开源了获取的数据,并且和现有算法的效果进行了比较,内容非常的扎实。

还是放个文章的结论:

计算机网络中的机器学习系统有时根据问题的包含版本或模型版本的结果,将自己描述为达到接近“最优”的性能[25,37,39]。这种方法并不局限于学术界:2020年初,一家大型视讯流媒体公司宣布为最佳低延迟ABR方案提供5000美元的奖金,在该方案中,候选人将在一个网络模拟器中进行评估,该模拟器跟踪不同吞吐量[2]的轨迹。

在本文中,我们建议这些努力可以受益于考虑性能和最优性的更广泛的概念。在模拟器或仿真器中良好的,甚至接近最佳的性能并不一定能预测在互联网上的良好性能,因为它具有可变性和重尾分布。

收集适当的训练数据(或在RL系统的情况下,训练环境)来正确地学习和验证这样的系统仍然是一个具有挑战性的问题。

在这篇论文中,我们提出了这样一个问题:如何才能创建一个学习后的ABR算法,并在互联网上稳健地运行?作弊实际上,我们最好的答案是:训练算法原位实际部署环境的数据,并使用一个算法的结构足够复杂(神经网络),但也很简单(预测服从监督学习数据,通知一个经典控制器)受益于这样的培训。

在过去的一年里,我们为63,508名用户提供了38.6年的视频。会议在不同算法中以盲法随机进行,并记录客户遥测数据进行分析。Fugu算法在客观度量(SSIM、失速时间、SSIM变变性)上稳健地优于其他方案,包括简单和复杂的方案,并增加了用户选择继续流的持续时间。

我们已经发现Puffer方法是一个强大的网络研究工具——能够“测量,然后构建”[5]来快速迭代新想法并获得反馈是令人满意的。

因此,我们将Puffer开放为一个“开放研究”平台。与这篇论文一起,我们在Puffer网站上发布了我们的数据和结果的完整档案。该系统每周发布新数据,以及正在进行的实验的结果总结,其置信区间与本文中的相似。(格式见附录b)

我们从公共档案中编辑了一些字段,以保护参与者的隐私(例如,IP地址),但我们愿意与研究人员合作,以聚合的方式访问这些字段。Puffer和Fugu也是开源软件,正如本文中用来准备结果的分析工具一样。

我们计划在可行的情况下使用Puffer,并邀请研究人员训练和验证新的ABR算法

控制,网络和吞吐量预测,以及流量的拥塞控制。对于如何设计和部署健壮的Internet学习系统,我们渴望与社区合作并学习他们的想法。

 

标签:W5L1,Puffer,视频,驾驶,学习,算法,课程,数据,我们
来源: https://www.cnblogs.com/qiuzhiqiuzhi/p/16074537.html