一、将视频会议进行到端(论文文献综述)
胡晓宇[1](2021)在《多流互动视频直播的传输控制研究》文中提出多流互动直播是新兴的商业直播模式,在国内外愈加流行,具有重要的前景和价值。但是由于多流互动直播起源于传统单流直播技术,在服务性能、用户体验上存在着较大的提升空间,目前的多流互动直播的传输控制大多是对传统直播场景的复用或者简单的整合,如何进一步优化控制方法与策略对提升用户体验有重要的意义。本文作为对多流互动直播传输控制的早期探索,研究其系统架构、转发服务器中的帧调度策略和用户体验质量预测模型的优化,主要包括以下创新点:(1)为了更好地提高用户的体验质量,本文提出了一种基于视频内容的用户体验质量模型,该模型在原有多流互动直播QoE(Quality of Experience)模型的基础上,参考目前学术界对QoE的最新研究成果,对原模型进行优化,从而提升模型的表征能力,使模型的预测更贴近用户的感知体验。(2)本文提出了一种部署在转发服务器上的面向多流互动视频直播的调度算法Rapunzel,基于排队论模型对不同的调度策略的QoS(Quality of Service)指标进行预测,并与QoE模型相结合求得最优的调度策略。最后,本文分别通过测量的方式验证了提出的QoE预测模型优化方案,通过仿真系统测试了多流互动视频直播调度算法Rapunzel在真实网络数据下的性能和表现。实验表明,优化后的QoE预测模型具备更强的表征用户体验质量的能力,而调度算法Rapunzel可以有效解决多流互动直播中的技术瓶颈,降低卡顿概率,并提升整体用户体验。
王鸿璋[2](2021)在《基于移动边缘计算的视频业务QoS保障研究》文中提出移动边缘计算(Mobile Edge Computing,MEC)通过下沉存储和计算资源,可以在网络边缘侧提供就近的响应和服务能力,为视频业务的QoS保障提供了新的思路。然而,有限的边缘缓存及终端算力资源与视频业务苛刻的QoS需求之间存在着矛盾。因此,如何利用有限的MEC缓存、计算和通信资源,实现视频业务的QoS保障,成为亟需解决的关键问题。本论文围绕配备有MEC的无线通信网络中视频业务的QoS保障优化技术而展开,针对现有的MEC资源分配算法在视频缓存和传输等方面存在的不足,从边缘缓存策略设计和视频传输系统实现两方面进行了研究:(1)基于视频片段的MEC缓存资源和推荐系统联合优化研究针对缓存资源有限的问题,本文设计了一种细粒度的MEC缓存资源分配策略,考虑视频片段流行程度的差异,并引入缓存感知的推荐系统,通过向用户推荐满足其观看兴趣同时缓存在MEC节点中的视频,来提高视频文件的缓存命中率。仿真结果表明,本文提出的算法在降低视频文件平均传输时延和提高缓存命中率等方面具有明显的优势。(2)基于图像超分辨的回程带宽受限视频传输系统设计与实现针对终端算力受限的问题,本文面向融合了 MEC的星地协同网络场景,引入了基于深度神经网络的图像超分辨算法,在不需要终端算力提升的前提下,利用MEC服务器的计算能力提升视频分辨率,同时基于HLS(HTTP Live Streaming)视频传输协议,设计并实现了端到端视频传输系统,有效节省回程链路带宽的占用,利用MEC服务器的计算能力弥补回程链路带宽受限的缺陷。实验结果表明,所设计的系统在提升视频分辨率的同时,可以满足实时传输的目标。
林建平[3](2021)在《基于深度学习的视频帧间预测编码》文中研究指明随着多媒体应用的兴起和人们对更高质量视频服务需求的增加,全世界的视频数据量一直在爆炸式增长。过去一年半以来,由于新冠疫情的爆发,人们被迫将大部分交流转移到网上,视频流量的增长进一步加速。如何高效压缩这些爆炸性增长的视频数据成为了多媒体计算、传输和存储的最严峻挑战。通过将视频压缩到更小尺寸的视频编码技术是关键解决方案之一。现有视频编码标准(包括高效视频编码H.265/HEVC和新一代的多功能视频编码H.266/VVC等)一直沿用基于块的混合编码框架,其中大多数模块都是人工设计、并且单独优化的,作为一个整体的系统很难做到全局最优。该框架经过三十多年的增量式发展,已经逐渐趋于饱和,单个传统技术在复杂度较小的约束下很难再有较大的性能增益。近年来,深度学习在视频帧插值、图像视频超分辨等底层视觉领域取得成功应用,如基于卷积神经网络的图像视频超分辨模型在重建效果上已经远远超过传统的基于插值的方法。本文研究如何将这些先进技术应用于视频编码领域,进一步提升视频帧间预测编码的性能。由于自然视频在时间维度是高度相关的,利用这种相关性的帧间预测编码技术是决定整个视频编码系统压缩性能的关键因素。但是,传统框架中的帧间预测编码具有如下三个缺陷:首先,传统框架使用基于块的平移或仿射运动模型进行运动估计和补偿,虽然具有计算效率高的优势,但无法有效刻画自然视频中的复杂运动。其次,传统框架中的所有帧间编码块都只在原始分辨率进行编码,当实际可用码率偏低,无法有效表达原始信号时,会导致严重的编码失真,而这种失真随着视频分辨率的增加会变得越来越严重。最后,由于传统框架是人工设计的复杂编码系统,为其设计的基于深度学习的帧间预测模块无法直接针对率失真目标函数进行端到端优化,只能使用启发式的方法引入码率和失真的约束,这样训练出来的神经网络模型通常不是编码性能最优的。本文的三个研究内容分别针对传统框架中帧间预测编码的三个缺陷而设计。论文的主要工作和技术创新如下:(1)针对传统框架中运动模型过于简单的问题,本文提出了基于深度学习和多参考帧的时域外插技术,用于补偿视频中的复杂高阶运动。具体地,本文从运动具有不同大小的特点出发,设计了多尺度逐级预测的时域外插网络,并且构建了合适的训练数据集用于网络训练。另外,考虑到运动具有一定随机性,外插帧不可能总是与当前帧保持运动对齐,本文将外插帧放入HEVC参考帧列表作为额外的参考帧使用。实验结果表明,本文提出的时域外插技术可以显着提升视频编码的性能。(2)针对传统框架中所有帧间编码块都只在原始分辨率进行编码的问题,本文提出了基于深度学习和块级下/上采样的帧间预测编码技术,用于实现局部自适应分辨率的帧间预测编码。具体地,本文为HEVC的P或B帧中每个编码块提供了选择低分辨率或高分辨率编码以及选择基于传统插值滤波器上采样或基于卷积神经网络上采样的灵活性。另外,本文还进一步研究了如何利用参考帧来增强卷积网络的上采样能力,并研究了如何使用压缩的视频序列来训练上采样网络。实验结果表明,提出的方法可以为低码率编码下的高清超高清序列提供超过5%的性能增益。(3)针对传统框架中基于深度学习的帧间预测编码模块无法端到端优化的问题,本文提出了基于多参考帧预测的端到端深度学习视频编码技术。具体地,本文分别在运动矢量域和像素域引入了两个新的基于多参考帧预测的模块,用于提升预测精度和增强重建质量:运动矢量域包括运动矢量预测和运动矢量改善模块,像素域包括运动补偿和残差改善模块。另外,为了解决复杂多模块系统难以优化的问题,本文进一步设计了渐进式训练策略直接针对率失真目标函数进行端到端优化。实验结果表明,提出的方法在编码性能上大幅超过之前同类的端到端编码方法。
林煌达[4](2020)在《D2D通信中视频多播传输机制研究》文中指出随着互联网、智能设备及无线网络技术的飞速发展,近年来,无线网络中的视频流媒体服务应用已经成为了移动数据流量激增最主要的推动力。同时,视频服务也正在从以指标为中心转向为以用户体验为导向。然而,由于用户对高质量视频画面的需求以及诸如移动视频直播、远程医疗、增强现实等具有挑战性的实时视频应用服务的出现,对于如何有效保证具有低时延、带宽密集型的视频应用服务的高质量传输,这将给现有的无线通信网络带来了新的难题。基于此,本文主要从D2D通信技术出发,并结合视频流的结构特征以及MEC技术的特性,旨在研究具有更高带宽,更低的端到端延迟以及更高的用户体验质量的视频传输方案。具体研究内容如下:(1)针对当前无线网络中视频流量呈指数上升,频谱资源短缺等现状,总结了D2D通信技术和视频多播技术的特点,以及这两种技术相结合对于缓解视频流量过载并提高无线网络服务质量的重大意义。并针对多播信道之间差异性,为保证多播组用户的观看视频体验,本文充分考虑到视频流的层次结构特性,采用可伸缩视频编码的方式对视频内容进行分层处理,灵活地调整不同视频层的速率以应对多播组之间不同的衰落信道特性。(2)考虑到现有的研究大多都是以吞吐量来衡量视频传输方案对提高视频质量的有效性。而对于时延敏感的视频流服务而言,该指标的增长并不能很好的衡量对用户所观看视频质量的增益。为此,本文通过对有效吞吐量进行公式推导,提出了一种时延约束下基于SVC编码的D2D协作视频多播传输方案。通过系统建模与分析,给出了在D2D网络中不同SVC视频层速率分配的优化问题,并针对该问题提出一种二阶段的启发式算法进行求解,旨在最大化系统的有效吞吐量。(3)指出未来5G乃至B5G网络的发展以及新兴的视频应用领域也将进一步导致用户对超高质量低时延的视频内容交付的高体验质量要求。因此,本文通过更贴近用户侧的MEC技术所具有对无线网络信息及用户位置感知的实时洞察能力,创新性的提出MEC架构下的有效吞吐量感知(MEC-Enabled Goodput-Aware,MEGA)模型。一方面,提出了一种基于path Chirp的流量调整链路状态估计算法,对当前无线网络实时监测并提供链路状态估计结果,以确保无线侧的带宽资源的充分利用。另一方面,提出了一种基于Gra Descent的速率分配算法,并采用D2D协作传输的方式来优化用户的Qo E质量。仿真结果表明,所提出的MEGA方案可有效提高实时视频应用的有效吞吐量、用户满意度,并在端到端时延及有效丢失率等方面都有明显的改善。
周郁淳[5](2020)在《基于KCP协议的实时视频传输方案设计与实现》文中提出随着无线通信技术的不断更迭和Android智能移动终端性能的不断提升,视频传输系统中的终端设备正从个人电脑和固定摄像头向Android智能移动终端为终端迁移。目前市场中的视频传输系统大多需要高带宽支持以保证视频传输的实时性,当遇到在网络拥堵的情况时,这些视频传输系统就无法保证视频直播的实时性甚至会中断视频直播,这对用户而言是非常差的体验。基于上述问题,本文提供了基于KCP协议的实时视频传输方案,针对网络拥堵这种极端情况下直播实时性差的问题,尝试在协议侧使用KCP协议作为视频传输协议进行解决。本方案使用Android智能手机作为实时视频传输系统的推流端和播放端,并使用KCP协议进行端到端的通信。KCP协议作为一个可靠的传输层ARQ协议,它的初衷就是为了处理在网络拥堵的情况下TCP的网络通讯速度很慢的难题。本文使用KCP协议作为Android推流端和Android播放端之间的视频传输协议,能够有效的保证网络拥堵情况下直播系统的实时性。此外,本文还在Android播放端添加了追帧计算以保证网络抖动时直播的实时性。本文的主要工作如下:1.为了实现基于KCP的Android推流端,本文使用KCP Client作为Android推流端,设计并实现了Android推流端从视频数据采集到发送过程中的各个模块,这些模块包含从采集、拷贝、预览、修改、编码和发送实时视频数据模块。2.为了实现基于KCP的Android播放端,本文使用KCP Sever作为Android播放端,设计并实现了Android播放端从视频数据接收到播放过程中的各个模块,接收、解码和播放实时视频数据模块。3.为了减少网络抖动时Android播放端的累计时延,本文设计出了通过遍历KCP收包队列,根据队列尾部的视频数据时间戳判断是否丢弃数据包的追帧计算。为了验证系统的有效性,本文对所实现的实时视频传输系统进行了功能测试和性能测试,验证了各个模块在功能上的正确性以及实时视频播放的实时性,能够满足实际使用的要求。
鲁国[6](2020)在《视频压缩编码及其质量增强的优化技术研究》文中指出近年来,随着多媒体技术的蓬勃发展,视频作为重要的信息传递媒介,其应用需求和数量规模迎来了爆发式的增长。更为重要的是,消费者对高分辨率、高帧率的高品质视频需求也日益强烈,这对视频传输系统的压缩效率和质量增强提出了更高的要求。本文从视频编码系统整体优化的角度出发,围绕提高视频压缩效率和提升压缩视频质量这两个关键问题展开深入研究,创新性地提出了一个基于深度学习的完整视频压缩编码系统,从而显着提升了视频压缩效率。同时本文分别从视频编码预处理和解码后处理入手,结合视频编码特性,提出了内置帧率上变换的高效视频编码系统和压缩视频复原算法,从而提升了压缩视频的质量。本论文的研究工作针对整个编码系统,实现了高效率的视频压缩以及高品质的压缩视频重建,增强了终端的视频质量并减少了视频的传输带宽。本文的主要研究内容及创新归纳如下:围绕高帧率视频的产生与编码问题,本文提出了在编码器中内置视频帧率上变换,并与视频压缩编码联合优化的方案。为了在编码端产生高质量的高帧率重建视频,并且减少高帧率视频传输带来的带宽消耗,本文给出了一个视频压缩编码和帧率上变换的联合优化模型,从而能够根据率失真策略对帧率上变换进行优化。这种新架构的关键是把帧率上变换功能嵌入编码器环路中,并在原有的运动估计和运动补偿模块中增加帧率上变换功能。这种高帧率编码新架构有效地提升了高帧率视频编码的性能,并使得解码器能直接解出高帧率视频。本文给出的系统充分结合已有的编码多层次划分架构,给出一个多信息融合的运动估计策略;同时根据运动可靠度和量化误差,建立一个内插帧的失真模型。所提出的内嵌帧率上变换功能的联合优化编码系统,在保证压缩标准兼容的前提下,比传统预处理加编码的级联系统显着减少了高帧率视频的码率消耗,去除了编码端帧率上变换预处理和解码端帧率上变换后处理的需要,从而显着降低了编码端和解码端处理高帧率视频的计算复杂度。针对压缩视频图像的高质量后处理,本文对于压缩视频的失真复原问题提出了一个基于深度学习的卡尔曼递归模型。视频的有损压缩编码,意味着解码端的视频重建不可避免地存在压缩图像的失真现象。本文结合基于模型和基于学习这两种方法的优势,首次提出了一个应用于视频复原的基于深度学习的卡尔曼递归模型。所提出的算法将视频的压缩失真复原建模为一个卡尔曼滤波递推问题,通过利用卷积神经网络估计卡尔曼滤波器状态和计算卡尔曼增益,获取准确的后验估计。对于视频图像序列,本文提出的方法一方面利用了卡尔曼递归滤波特性,另一方面又发挥了深度学习的数据驱动的特长,从而实现压缩视频图像的高效复原。对于深度学习视频压缩这一关键问题,本文首次给出了一个端到端优化的完整视频压缩编码系统。本文系统充分利用当前视频压缩编码的混合编码框架和深度学习的强大表达能力,通过设计编码系统中的运动估计网络、运动信息压缩网络、运动补偿网络、残差压缩网络以及码率估计网络,实现了一个基于混合编码架构和深度学习的完整压缩编码系统。整个编码系统可以通过率失真损失函数进行端到端的整体优化,从而实现高性能的视频压缩。与此同时,本论文基于深度学习的视频压缩系统具有很强的可扩展性,从而能够根据速度和性能的需求进行对应设计。实验结果表明,相比较当前广泛使用的H.264算法,本文给出的深度视频压缩算法能够实现更高的压缩效率。即便与最新标准H.265相比,本文给出的视频编码系统能够实现相似甚至更好的主观质量。本论文围绕视频压缩编码及其质量增强的优化技术展开研究,所提出的系统和方法提升了视频压缩效率、增强了视频质量,为应对高品质视频需求提供了卓有成效的解决方案。更为重要的是,通过对深度卡尔曼模型、基于深度学习的视频压缩编码等研究方向的探索,为今后的研究提供了有益借鉴。
赵阳超[7](2020)在《面向视频应用的网络智能传输算法研究》文中指出随着移动终端的普及以及无线接入技术如4G/5G的飞速发展,当前,视频服务已是人们生活中必不可少的一部分,且越来越多的商用视频服务涌现了出来。同时,用户对视频传输高吞吐率、低时延的需求也随着各项技术的进步越来越高。不断涌现出的视频服务以及快速增加的用户不仅给互联网带来了巨大的数据流量压力,而且增加了网络拥塞发生的风险。然而,网络的拥塞和不稳定使得用户对视频传输的高吞吐率和低时延需求难以得到保证。波动的网络环境使得高吞吐率的视频传输充满挑战,而用户的低时延需求特别是在交互式视频传输场景下通常因为网络的拥塞而难以得到满足。在进行视频传输优化时,针对用户的高吞吐率需求和低时延需求,往往只能顾此失彼,或者牺牲视频的流畅性而极大影响用户的观看体验。针对上述视频传输所面临的问题,本文从视频的发送到接收整个过程入手,研究了面向视频应用的网络智能传输算法,涵盖了视频发送端的码率控制、传输过程中的网络路由、内容分发过程中的缓存算法以及接收端的自适应码流。本文的主要工作和创新点包括:1.基于深度强化学习的端到端码率控制:在用户对传输时延和吞吐率都有较高要求的视频传输场景中,需要在低时延的前提下传输较高质量的视频,离不了码率的动态调整,视频上传的质量更是直接决定了接收端的播放质量,在上行链路和下载链路波动的网络环境下,发送端的编码器码率控制尤为重要。本文在视频发送端提出了轻量级的、基于深度强化学习的码率控制模型smart RC;另外针对低时延传输场景中视频接收端缓冲区容量小而导致码率选择容错率低的挑战,本文利用基于深度强化学习的自适应码流模型Adaptive Streaming来实现多码率的选择。相比于基于带宽预测的比较方法,smart RC能够在保持较低传输时延的情况下提升20.88%的服务质量(Quality-of-Service,Qo S);Adaptive Streaming相比于常用的基于缓冲区的方法分别能够降低64.72%的百秒卡顿次数和91.04%的百秒卡顿时长。此外针对计算能力和功耗受限的移动端,smart RC和Adaptive Streaming采用了微调的轻量级深度神经网络,其和基于时序神经网络的模型相比较在维持表现相近的情况下能节省62.63%的运行时间。2.基于深度学习的覆盖网络路由选择:路由的准确选择离不开实时且准确的网络流量信息,为此,本文利用一个结合网络流量预测和路由选择的深度学习模型实现覆盖网络路由的快速搜索,并针对整体的用户满意率提出了基于regret的覆盖网络路由算法COR。基于深度学习的覆盖网络路由模型能达到90.58%的路由决策准确率且和不做流量预测的方法相比能多节省14.92%的传输时延。相比于传统的基于底层路由协议的算法,COR能提升5%到43%的用户满意率。3.基于内容流行度的自适应缓存算法:针对网络流量压力和数据成本的挑战,本文对包含超过200亿个独立视频的真实数据进行了特征分析,提出了基于流行度的自适应缓存算法ATW。基于真实数据集的仿真实验,ATW相比于内容提供商现行的缓存算法,能节省1%到3%的数据流量。另一方面,其在保持同等命中率的情况下能节省37.5%的缓存容量。
程石磊[8](2020)在《视频序列中人体行为的特征提取与识别方法研究》文中研究表明基于视频序列的行为识别(以下简称行为识别)是计算机视觉领域研究的热点课题之一,具有十分重要的理论研究价值和广阔的应用前景。由于人体行为的复杂性和多样性,目前仍有两方面的问题亟待解决,一是类内与类间的不确定性导致对相似行为的识别混淆程度较高;二是长视频序列中存在不规律的可预测性,特别是当主体行为由多个子行为共同构成时,子行为的分布状态对识别效果的影响较大。对此,本文主要从特征提取与行为分类两方面进行研究,本文的主要成果包括以下方面:1.提出了基于局部时空协方差矩阵特征的行为识别算法。传统的特征级联可以视作特征向量在单一维度上的简单堆叠,这种特征融合方式通常无法对时空域特征的关联性作出准确描述。为此,论文通过在局部范围内,对空域梯度特征与时域梯度特征作协方差矩阵融合,增强了外观信息与行为信息在同一时刻的联合表达能力,提高了特征的判别性,这对行为识别具有重要意义。但协方差矩阵属于黎曼空间,无法使用传统的欧氏空间的度量方式进行量化,通过研究发现运用对数欧氏运算可以将黎曼空间下的协方差矩阵映射至欧氏向量空间。实验证实了协方差矩阵融合特征明显优于传统的级联特征。2.提出了基于低秩稀疏联合表达的行为识别算法。局部约束线性编码用局部近邻可视词对特征样本作描述,代替了词袋模型中对无序可视词的简单统计,获取了局部特征的空间分布信息,但是这种局部描述具有噪声敏感性,且忽略了可视词的全局信息,会影响行为描述的充分性。为此,论文通过寻求特征样本关于模板的低秩稀疏表达,获取行为描述在全局范围内的显着性信息;同时,通过沿用之前提出的局部时空协方差矩阵特征设计实验,实验证实低秩稀疏表达相比于局部约束线性编码以及同类的线性编码算法,具备良好的显着性特征,实现了对无关特征的抑制,又能从背景噪声中提炼出关联信息,在公开数据集上,该算法取得了较好的效果。3.提出基于低秩约束的判别子空间学习的行为识别算法。低秩稀疏编码算法中的模板缺少更新机制,需要大量样本参与模板构建,以确保模型具有足够的泛化性能,但同时也增大了模板构建时的运算开销。为此,论文通过利用子空间的低维映射性质构建模型,降低特征维度,减小运算开销;同时模型显式地引入判别约束,联合低秩表达,既保留了模型的抗噪能力,又提高了行为表达的判别性,实现了对类内与类间良好的区分度,提高了识别效果。实验结果表明,判别约束对提升行为识别效果起到了积极作用,同时验证了该算法,相比同类型算法具备一定的竞争力。4.提出了基于改进的局部聚合向量网络的行为识别框架。长视频序列普遍存在信息冗余程度大,资源占用率高的特点,同时在这类视频中,主体行为通常由多个子行为共同构成,明确子行为与主体行为的时空结构特点,准确把握特征之间以及特征与背景之间的量化关系,成为处理这类行为识别问题的关键。为此,论文引入局部聚合向量网络,通过量化局部描述与聚合中心之间的残差关系,寻求子行为的特征分布状态,从而聚合出具有强语义信息的行为描述。在此过程中,论文主要从三方面对其作了改进,首先结合了划片采样的方式,使采样图像均匀分布于视频序列,确保了行为表述的完整性,同时相比密集采样又能提高处理效率;其次论文提出了基于时空软赋值的局部聚合向量网络,由于局部聚合向量网络运用二维卷积对软赋值实施计算,缺乏对时空特性的获取能力,为此构建了以3D卷积为主体的时空感知模块用以软赋值计算,增强软赋值的时空特性;最后论文提出基于自注意力加权的局部聚合网络,由于时空感知模块忽略了分布于序列片段间的关联信息,造成了时空感知范围的局限,为此构建了以自注意力模块为主体的软赋值计算方法。通过大量实验,验证了自注意方式计算的软赋值可以有效地扩大感受范围,获取更多上下文时空信息,相比于其他先进算法,该模型在UCF101与HMDB51数据集上取得了具备竞争力的识别效果。
于化龙[9](2020)在《大跨度视频编码与传输体系研究》文中研究指明随着人们对视觉内容的消费需求越来越高,互联网中视频数据的储量呈爆炸式增长。海量视频的存储和传输消耗着大量的存储和带宽资源。为了降低视频数据量,视频编码方案使用了层出不穷的高效技术以提升编码效率。但是为了支持灵活的随机访问,视频码流中存在着很多随机访问点,它们将码流分割为多段相互独立的随机访问片段。由于不能相互参考,随机访问片段之间的冗余信息无法被有效剔除,以至于不能进一步提升编码效率。实际上,在很多视频中,随机访问片段在大跨度的时间间隔内存在着反复出现的背景或对象。为了利用这种大跨度的相关信息,前人提出基于场景知识库的视频编码方法,通过引入包含多样场景内容的外源知识图像库,为主视频中包含相似场景的随机访问片段提供外源参考信息。然而,外源知识图像带来了两方面的问题。一方面,在编码层,生成获取的知识图像的内容和质量会极大地影响视频编码的效率,而获取内容多样又存储精简的最优知识图像集会消耗很多的计算时间,这为其在海量视频的压缩上带来了阻碍,如何快速地获取最优知识图像是在编码层获得编码性能增益的一个关键问题;另一方面,在系统层,外源知识图像在大跨度时间上的交替共享使用为视频码流的随机访问的实现和传输效率的提升带来了严峻的挑战,如何处理知识图像和主视频中随机访问片段之间的紧凑存储和高效传输,是保持编码层获得的编码效率增益的另一个关键问题。本文对这种使用大跨度外源参考信息的视频编码方法(简称大跨度编码)进行了深入全面的分析,并针对外源知识图像在编码层的高效获取和在系统层的高效存储传输等关键问题开展了研究工作,取得了以下创新性的研究成果:·在编码层,本文着眼于最优知识图像的选择问题。一方面在复杂度受限的情况下,减低大跨度编码的计算复杂度,使其适用于长时视频的高效编码;另一方面在码率受限的情况下,提升大跨度编码的最优编码性能,使其更具有竞争力:1.本文提出一种基于众包的最优知识图像集选择方法。该方法根据知识图像和主视频的联合率失真优化,将最优知识图像选择的问题转化为物理意义上相一致的众包理论中的用户选择问题,使用优化算法快速求解得到能够提供最多参考信息且占用最少数据量的最优知识图像集。与已有的基于知识库的视频编码方法相比,该方法在长时的电视剧序列上的编码复杂度降低超过20%,并仍可以比HEVC获得近28%的编码性能增益。2.本文提出了 一种基于局部失真传递的知识图像质量调整方法。该方法根据主视频中随机访问片段和知识图像之间的依赖关系,建立图像块级的局部失真传递链,得到知识图像的失真传递权重,用以调整知识图像的质量。该方法能够在不引入过多知识图像数据量的前提下自适应调整知识图像中不同区域的质量,在上述基于众包的编码方法上进一步获得4%左右的编码性能增益。通过这两方面的编码层优化,大跨度编码方法在HEVC通用测试序列上能够获得19%以上的编码性能增益,在长时电视剧序列上能够获得38%以上的编码性能增益。·在系统层,本文针对使用大跨度编码的视频在本地存储播放和流媒体传输,解决主视频和知识图像联合的存储文件格式和同步传输,在保证系统层操作简便的同时,实现使用大跨度编码的视频在大规模视频服务应用中的紧凑存储和高效传输。1.在存储文件格式方面,本文提出一种基于样本群组的大跨度文件格式,该方法将主视频图像按照其参考的知识图像进行分组归类,实现主视频图像和知识图像之间的外源依赖关系描述。与现有基础文件格式相比,该方法避免了知识图像数据在存储文件中的重复,能够紧凑地实现主视频与知识图像的联合存储。2.在流媒体传输方面,本文提出一种基于片段索引的大跨度传输方案。该方法在片段索引中增加主视频图像与知识图像之间的外源依赖关系,使得接收端能够快速解析外源依赖关系以实现主视频图像和知识图像的同步传输。同时,本文还提出一种知识图像缓存管理方法,根据知识图像的重要性管理其存储和更新,提升知识图像的重用率,从而降低知识图像在随机访问点的重复传输和重复解码的次数。这解决了现有流媒体传输方案只能多次重传和重解码知识图像的问题。相较于引入额外传输数据量和解码时间的现有传输方案,我们提出的传输方案能够减少45%的传输码率,并降低9%的解码时间,充分发挥大跨度编码的效率。基于以上两种系统层的方法,我们能够实现系统层对大跨度编码的视频的便捷高效操作,同时不会为外源知识图像的使用消耗额外的存储、带宽和解码资源。
吴飞[10](2020)在《软件定义网络中网络服务质量感知路由策略研究》文中研究指明近些年来,伴随着互联网的蓬勃发展,越来越多的新型网络应用和服务应运而生。这些不同类型的应用产生的数据流在互联网传输的过程中通常具有不同的网络服务质量(Quality of Service,QoS)需求。而传统的Internet网络提供的尽最大努力交付服务模式难以满足这种差异化服务需求。软件定义网络(Software-Defined Networking,SDN)作为一种新型网络架构,其核心思想是将控制与转发分离,形成一个控制平面和一个数据平面。SDN架构本身以及其控制平面与数据平面之间的交互协议,即OpenFlow协议,都对QoS保障提供了细粒度的技术支持。因此,本文主要研究了SDN环境中面向不同类型网络应用的QoS感知路由策略,并提出了以下方案:(1)面向可伸缩视频流服务的多播路由方案。可伸缩视频流应用是一种具备可分级特性的流媒体服务,本文设计了一个面向该服务的多播路由方案。本方案首先给出基于SDN网络的通信系统架构设计,然后提出一个时间高效的组播树构建算法来进行可伸缩视频流多播路由,并进一步设计了一个基于视频失真模型的动态层转换策略来解决网络动态环境引起的视频失真问题。最后本方案实现了一个原型系统,并进行了大量的实验,实验结果表明该方案能够在满足可伸缩视频流服务的QoS需求的基础上,有效地保障用户的网络服务质量体验并提升多播会话的可扩展性。(2)面向IP电话服务的单播路由方案。IP电话服务是一种主流的、基于IP网络的端到端语音通话技术,本文提出一个面向该服务的单播路由方案。本方案首先利用SDN逻辑集中控制的特性收集数据平面的历史流量信息构成数据集,然后训练本方案设计的一个基于循环神经网络的深度学习模型,即DeepRouting,来学习网络流量调度特征,进而使用训练后的模型来进行针对IP电话服务请求的线上路由规划。实验结果表明DeepRouting模型能够以时间高效的方式进行线上服务路由,并且取得合理的QoS性能,从而验证了方案的有效性和可行性。
二、将视频会议进行到端(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、将视频会议进行到端(论文提纲范文)
(1)多流互动视频直播的传输控制研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题背景 |
1.2 课题研究内容 |
1.2.1 研究内容 |
1.2.2 创新点 |
1.3 论文组织与结构 |
第二章 相关技术介绍 |
2.1 视频传输QoE预测技术 |
2.1.1 基于关键指标的QoE模型 |
2.1.2 数据驱动的QoE优化 |
2.2 多流传输相关技术 |
2.2.1 端到端的解决方案 |
2.2.2 网络中间设备的解决方案 |
2.3 面向网络传输的视频编解码技术 |
第三章 多流互动直播场景研究 |
3.1 多流互动直播传输架构 |
3.1.1 现有多流互动直播传输架构概述 |
3.1.2 多流互动直播架构 |
3.2 多流互动直播中的优化空间 |
3.2.1 用例分析 |
3.2.2 性能瓶颈与挑战 |
第四章 基于用户偏好和视频内容的多流互动直播QoE预测模型研究 |
4.1 QoE用户体验评估方法 |
4.2 QoE的影响因素 |
4.2.1 服务质量 |
4.2.2 用户偏好 |
4.2.3 视频内容 |
4.3 多流互动场景的QoE预测模型 |
4.3.1 现有的多流互动直播QoE预测模型 |
4.3.2 视频内容对QoE的影响 |
4.4 基于内容的多流互动直播QoE预测模型设计 |
4.4.1 量化视频内容对QoE的影响 |
4.4.2 基于内容的QoE预测模型优化 |
第五章 多流互动直播中的调度算法设计 |
5.1 问题定义 |
5.2 多流互动直播调度算法设计 |
5.2.1 调度策略对QoE的影响 |
5.2.2 Rapunzel核心思想 |
5.2.3 排队模型构建 |
5.2.4 算法执行流程 |
第六章 实验与验证 |
6.1 QoE预测模型优化效果分析 |
6.2 仿真平台设置 |
6.3 仿真实验与结果分析 |
6.3.1 缓解卡顿性能评估 |
6.3.2 时延控制性能评估 |
6.3.3 性能综合评估 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 未来展望 |
参考文献 |
缩略词表 |
致谢 |
攻读学位期间发表的学术论文目录 |
(2)基于移动边缘计算的视频业务QoS保障研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文结构安排 |
第二章 基于MEC的视频业务QoS保障关键技术分析 |
2.1 移动边缘计算 |
2.1.1 基本概念 |
2.1.2 体系架构 |
2.1.3 应用场景 |
2.2 推荐系统 |
2.2.1 基于内容的推荐 |
2.2.2 基于协同过滤的推荐 |
2.2.3 混合推荐 |
2.3 图像超分辨 |
2.3.1 深度学习在图像超分辨中的应用 |
2.3.2 超分辨重建的评价指标 |
2.4 本章小结 |
第三章 基于视频片段的MEC缓存资源和推荐系统联合优化研究 |
3.1 问题描述 |
3.2 系统建模 |
3.2.1 系统模型 |
3.2.2 问题建模 |
3.3 算法设计 |
3.4 仿真验证与结果分析 |
3.4.1 仿真参数设置 |
3.4.2 仿真结果分析 |
3.5 本章小结 |
第四章 基于图像超分辨的回程带宽受限视频传输系统设计与实现 |
4.1 问题描述 |
4.2 系统概述 |
4.2.1 系统架构 |
4.2.2 关键技术与创新 |
4.2.3 系统工作原理 |
4.3 系统开发工具 |
4.3.1 HLS视频传输协议 |
4.3.2 Nginx |
4.3.3 Django |
4.4 系统设计与实现 |
4.4.1 视频内容服务器 |
4.4.2 MEC服务器 |
4.5 系统功能测试 |
4.5.1 测试环境 |
4.5.2 测试结果分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 论文工作成果总结 |
5.2 未来工作展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
(3)基于深度学习的视频帧间预测编码(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 研究历史和现状 |
1.2.1 传统框架的帧间预测编码技术 |
1.2.2 基于帧插值的预测编码技术 |
1.2.3 基于下/上采样的预测编码技术 |
1.2.4 端到端深度学习图像/视频编码技术 |
1.3 主要工作和创新之处 |
1.4 章节组织 |
第2章 基础知识 |
2.1 HEVC简介 |
2.1.1 HEVC标准的背景和发展 |
2.1.2 HEVC的编码框架 |
2.1.3 HEVC的块划分结构 |
2.1.4 HEVC的帧内预测 |
2.1.5 HEVC的帧间预测 |
2.1.6 HEVC的变换和量化 |
2.1.7 HEVC的环路滤波 |
2.1.8 HEVC的熵编码 |
2.2 深度学习简介 |
2.2.1 机器学习概述 |
2.2.2 前馈神经网络 |
2.2.3 卷积神经网络 |
2.2.4 生成对抗网络 |
第3章 基于深度学习和多参考帧的时域外插技术 |
3.1 技术背景及研究动机 |
3.2 提出的方法 |
3.2.1 网络结构 |
3.2.2 训练数据的获取 |
3.2.3 训练方法 |
3.2.4 将网络集成进HEVC |
3.3 实验 |
3.3.1 训练设置 |
3.3.2 和HEVC相比 |
3.3.3 和(Mathieu et al.,2015)的帧外插模型相比 |
3.4 本章小结 |
第4章 基于深度学习和块级下/上采样的帧间预测编码技术 |
4.1 现有技术及研究动机 |
4.2 提出的方案 |
4.2.1 方案的整体框架 |
4.2.2 上采样网络 |
4.2.3 训练数据的生成 |
4.2.4 集成进HEVC |
4.3 实验结果 |
4.3.1 网络训练 |
4.3.2 实验配置 |
4.3.3 实验结果和分析 |
4.3.4 验证性结果和消融研究 |
4.4 本章小结 |
第5章 基于多参考帧预测的端到端深度学习视频编码技术 |
5.1 技术背景及研究动机 |
5.2 提出的方案 |
5.2.1 方案的整体框架 |
5.2.2 多尺度对齐的运动矢量预测网络 |
5.2.3 运动矢量改善网络 |
5.2.4 基于多参考帧的运动补偿网络 |
5.2.5 残差改善网络 |
5.2.6 训练策略 |
5.3 实验结果 |
5.3.1 实验配置 |
5.3.2 整体性能 |
5.3.3 消融实验 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(4)D2D通信中视频多播传输机制研究(论文提纲范文)
摘要 |
Abstract |
专用术语注释表 |
第一章 绪论 |
1.1 课题研究背景 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.4 本文结构安排 |
第二章 相关背景知识介绍 |
2.1 D2D通信 |
2.1.1 D2D协作方式 |
2.1.2 D2D协作共享 |
2.2 可伸缩视频编码 |
2.2.1 SVC编码结构 |
2.2.2 SVC的可伸缩性 |
2.3 视频流传输 |
2.3.1 传统视频流传输方式 |
2.3.2 自适应视频流传输 |
2.4 MEC技术 |
2.5 本章小结 |
第三章 基于SVC编码的D2D协作视频多播传输方案 |
3.1 概述 |
3.2 系统模型 |
3.2.1 信道丢失模型 |
3.2.2 有效吞吐量 |
3.3 问题描述 |
3.4 解决方案 |
3.5 仿真结果 |
3.6 本章小结 |
第四章 D2D网络中基于MEC的实时视频传输方案 |
4.1 概述 |
4.2 MEGA系统模型 |
4.2.1 信道模型 |
4.2.2 SVC视频流传输 |
4.2.3 QoE模型 |
4.3 最优化有效吞吐量问题构建 |
4.4 MEGA解决方案 |
4.4.1 基于PathChirp流量调整的链路状态估计算法 |
4.4.2 基于GraDescent的速率分配算法 |
4.5 仿真结果 |
4.5.1 仿真环境搭建 |
4.5.2 仿真结果对比 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 全文总结 |
5.2 未来研究展望 |
参考文献 |
附录1 攻读硕士学位期间撰写的论文 |
附录2 攻读硕士学位期间参加的科研项目 |
致谢 |
(5)基于KCP协议的实时视频传输方案设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及发展趋势 |
1.3 主要研究内容 |
1.4 论文结构安排 |
第2章 相关技术研究与分析 |
2.1 Android操作系统相关理论 |
2.1.1 Android系统简介 |
2.1.2 Android系统框架 |
2.1.3 Android JNI |
2.2 流媒体传输协议 |
2.2.1 RTMP |
2.2.2 HLS |
2.3 快速可靠传输协议 |
2.4 H.264/AVC |
2.4.1 H.264/AVC原始码流结构 |
2.4.2 H.264/AVC码流分层结构 |
2.4.3 H.264/AVC的主要参数 |
2.4.4 H.264/AVC的优点 |
2.5 Android推流端 |
2.6 Android播放端 |
2.7 本章小结 |
第3章 基于KCP的实时视频传输方案的设计 |
3.1 基于KCP的实时视频传输方案 |
3.1.1 KCP的设计思路 |
3.1.2 整体框架 |
3.2 Android推流端 |
3.2.1 KCP Client |
3.2.2 将KCP Client作为Android推流端 |
3.3 Android播放端 |
3.3.1 KCP Server |
3.3.2 将KCP Server作为Android播放端 |
3.4 本章小结 |
第4章 基于KCP的端到端实时视频传输系统的实现 |
4.1 环境搭建 |
4.2 KCP的 JAVA实现 |
4.3 推流端的实现 |
4.3.1 采集实时视频数据模块 |
4.3.2 拷贝实时视频数据模块 |
4.3.3 预览实时视频数据模块 |
4.3.4 修改实时视频数据模块 |
4.3.5 编码实时视频数据模块 |
4.3.6 发送实时视频数据模块 |
4.4 播放端的实现 |
4.4.1 接收实时视频数据模块 |
4.4.2 解码实时视频数据模块 |
4.4.3 播放实时视频数据模块 |
4.5 本章小结 |
第5章 系统测试结果与分析 |
5.1 测试环境 |
5.2 系统功能测试 |
5.2.1 采集实时视频数据模块测试 |
5.2.2 拷贝实时视频数据模块测试 |
5.2.3 预览实时视频数据模块测试 |
5.2.4 修改实时视频数据模块测试 |
5.2.5 编码实时视频数据模块测试 |
5.2.6 发送和接收实时视频数据模块测试 |
5.2.7 解码实时视频数据模块测试 |
5.2.8 播放实时视频数据模块测试 |
5.3 系统性能测试 |
5.3.1 测试工具 |
5.3.2 测试结果 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 未来工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间从事的科研工作及取得的成果 |
(6)视频压缩编码及其质量增强的优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
主要符号对照表 |
第一章 绪论 |
1.1 研究背景及其意义 |
1.2 国内外研究现状 |
1.2.1 传统视频压缩编码 |
1.2.2 视频帧率上变换 |
1.2.3 视频压缩失真复原 |
1.2.4 基于深度学习的视频压缩 |
1.2.5 研究现状总结与分析 |
1.3 论文主要工作及结构安排 |
1.3.1 论文的主要研究工作 |
1.3.2 论文结构安排 |
第二章 理论基础 |
2.1 视频压缩编码 |
2.2 基于运动补偿的帧率上变换 |
2.3 卡尔曼滤波器 |
2.4 图像压缩的基础神经网络架构 |
第三章 视频压缩编码和帧率上变换的联合优化 |
3.1 引言 |
3.2 帧率上变换和视频压缩的联合优化框架 |
3.2.1 帧率上变换和HEVC算法的融合模型 |
3.3 联合运动估计算法 |
3.3.1 数据项 |
3.3.2 特征匹配项 |
3.3.3 平滑项 |
3.4 面向内插帧的率失真优化模型 |
3.4.1 内插帧的失真模型 |
3.4.2 预测误差的方差估计 |
3.5 实验结果与分析 |
3.5.1 实验条件设定 |
3.5.2 客观质量评估 |
3.5.3 主观质量评估 |
3.5.4 RDO准则的有效性验证 |
3.5.5 联合运动估计算法的有效性验证 |
3.5.6 融合模型的计算复杂度分析 |
3.5.7 与基于后处理算法的性能比较 |
3.6 本章小结 |
第四章 基于深度卡尔曼模型的压缩视频复原 |
4.1 引言 |
4.2 相关研究工作 |
4.2.1 单帧图像的压缩失真复原 |
4.2.2 基于深度学习的视频失真复原 |
4.2.3 基于非局部先验信息的图像复原 |
4.3 面向压缩视频失真复原的深度卡尔曼模型 |
4.3.1 卡尔曼滤波器的基础模型 |
4.3.2 基于预测量化误差先验的深度卡尔曼模型 |
4.3.3 基于非局部先验信息的深度卡尔曼模型 |
4.4 实验结果与分析 |
4.4.1 训练数据集 |
4.4.2 与业界领先算法的比较 |
4.4.3 消融实验分析 |
4.5 本章小节 |
第五章 端到端优化的深度视频编码系统 |
5.1 引言 |
5.2 相关工作 |
5.2.1 传统的图像和视频压缩算法 |
5.2.2 基于深度学习的图像和视频压缩算法 |
5.2.3 运动估计算法 |
5.3 端到端优化的深度视频压缩系统 |
5.3.1 深度视频压缩模型框架 |
5.4 深度视频压缩的网络设计 |
5.4.1 运动估计 |
5.4.2 运动编码与解码网络 |
5.4.3 运动补偿网络 |
5.4.4 残差编码和解码网络 |
5.5 网络训练策略 |
5.5.1 损失函数 |
5.5.2 量化 |
5.5.3 码率估计 |
5.5.4 参考帧缓冲设置 |
5.6 深度视频压缩框架的扩展 |
5.6.1 轻量级的深度视频压缩方案 |
5.6.2 增强版的深度视频压缩方案 |
5.7 实验结果和分析 |
5.7.1 实验设置 |
5.7.2 实验结果分析 |
5.7.3 消融实验分析 |
5.7.4 计算复杂度分析 |
5.7.5 深度视频压缩模型的分析与讨论 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读博士学位期间的科研成果及参与项目 |
简历 |
(7)面向视频应用的网络智能传输算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 本文研究背景与意义 |
1.2 视频传输流程介绍 |
1.3 当前视频传输所面临的挑战 |
1.3.1 高质量低时延的挑战 |
1.3.2 交互式视频传输的挑战 |
1.3.3 网络流量压力和成本的挑战 |
1.4 本文的主要工作及创新点 |
1.5 本文的结构安排 |
1.6 本章总结 |
第二章 国内外研究现状 |
2.1 流控和码率自适应 |
2.2 覆盖网络路由 |
2.3 视频内容缓存 |
2.3.1 经典的缓存算法 |
2.3.2 基于学习的缓存算法 |
2.4 本章总结 |
第三章 基于深度强化学习的端到端码率调整 |
3.1 本章引论 |
3.2 视频发送端码率控制 |
3.3 发送端码率控制实验及结果 |
3.4 视频接收端自适应码流 |
3.5 模型的移动端性能测试 |
3.6 本章总结 |
第四章 基于深度学习的覆盖网络路由 |
4.1 本章引论 |
4.2 基于regret的覆盖网络路由算法 |
4.3 基于深度学习的网络流量预测和覆盖网络路由 |
4.4 本章总结 |
第五章 基于流行度的自适应内容缓存 |
5.1 本章引论 |
5.2 基于内容流行度的自适应缓存优化 |
5.3 视频内容缓存优化实验结果 |
5.4 本章总结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 未来工作展望 |
致谢 |
参考文献 |
简历与科研成果 |
(8)视频序列中人体行为的特征提取与识别方法研究(论文提纲范文)
摘要 |
abstract |
缩略词表 |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 人体行为识别的问题描述 |
1.3 国内外研究现状 |
1.3.1 全局行为表达 |
1.3.2 局部行为表达 |
1.3.3 行为表达分类方法 |
1.4 人体行为识别面临的问题 |
1.5 人体行为数据库 |
1.6 本文主要研究内容 |
1.7 论文的章节安排 |
第二章 基于局部时空协方差矩阵特征的行为识别 |
2.1 引言 |
2.2 相关工作 |
2.3 协方差矩阵概述 |
2.4 时空局部协方差矩阵特征 |
2.4.1 局部特征设计 |
2.4.2 视频描述 |
2.4.3 局部约束线性编码 |
2.4.4 行为表达设计 |
2.5 实验验证与分析 |
2.5.1 ADL数据集实验结果与分析 |
2.5.2 KTH数据集实验结果与分析 |
2.6 本章小结 |
第三章 基于低秩稀疏联合表达的行为识别 |
3.1 引言 |
3.2 相关工作 |
3.3 低秩编码与稀疏编码 |
3.3.1 稀疏编码 |
3.3.2 低秩编码 |
3.4 LRS编码模型与优化 |
3.4.1 LRS编码模型 |
3.4.2 LRS模型优化 |
3.4.3 低秩稀疏联合表达分类 |
3.5 实验分析 |
3.5.1 UCF11 数据集实验 |
3.5.2 KTH数据集实验 |
3.5.3 ADL数据集实验 |
3.5.4 与部分深度学习算法的对比试验 |
3.6 本章小结 |
第四章 基于低秩约束的判别子空间学习的行为识别 |
4.1 引言 |
4.2 相关工作 |
4.3 低秩约束的判别子空间学习 |
4.3.1 判别子空间学习 |
4.3.2 模型引入 |
4.3.3 分析讨论 |
4.4 优化求解 |
4.4.1 对子空间Ω更新 |
4.4.2 对辅助变量J的更新 |
4.4.3 对表达系数Z更新 |
4.4.4 对稀疏误差E更新 |
4.5 算法讨论 |
4.6 实验分析 |
4.6.1 实验设计 |
4.6.2 参数评估 |
4.6.3 鲁棒性测试 |
4.6.4 与先进算法对比 |
4.6.5 HMDB51 数据库识别实验 |
4.7 本章小结 |
第五章 基于改进的局部聚合向量网络的行为识别 |
5.1 引言 |
5.2 相关工作 |
5.3 局部聚合描述子向量 |
5.3.1 硬赋值VLAD编码 |
5.3.2 软赋值VLAD编码 |
5.3.3 NetVLAD网络 |
5.4 基于多时段划分的局部聚合向量网络 |
5.4.1 采样模块 |
5.4.2 数学表达 |
5.5 基于时空软赋值的局部聚合向量网络 |
5.5.1 3D卷积简述 |
5.5.2 时空感知模块(STA) |
5.6 基于自注意力加权的局部聚合向量网络 |
5.6.1 时空自注意力加权的VLAD编码 |
5.7 实现细节 |
5.7.1 梯度剪裁 |
5.7.2 数据增强 |
5.8 实验与分析 |
5.8.1 不同聚合方式的特性对比 |
5.8.2 软赋值可视化对比 |
5.8.3 不同的视频帧长度对识别效果的影响 |
5.8.4 不同的聚合中心数量对识别效果的影响 |
5.8.5 网络普适性测试 |
5.8.6 与先进的相关算法实验对比 |
5.9 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 未来工作展望 |
参考文献 |
致谢 |
攻读博士学位期间取得的成果 |
(9)大跨度视频编码与传输体系研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
缩写、符号清单、术语表 |
1 绪论 |
1.1 选题背景 |
1.2 视频编码研究现状 |
1.2.1 高效视频编码理论与技术的发展 |
1.2.2 帧间预测的参考信息研究概述 |
1.3 系统层存储和传输研究现状 |
1.3.1 文件格式 |
1.3.2 自适应流媒体传输 |
1.4 本文研究内容 |
2 大跨度编码与传输体系概述 |
2.1 大跨度参考结构 |
2.1.1 现有编码方案的参考结构 |
2.1.2 跨随机访问点的大跨度参考结构 |
2.2 编码与传输体系 |
2.2.1 大跨度参考结构的挑战和需求 |
2.2.2 大跨度编码与传输体系设计 |
2.3 本章小结 |
3 编码层部分——基于众包理论的最优知识图像选择研究 |
3.1 基于众包的知识图像集构造 |
3.1.1 联合率失真优化问题 |
3.1.2 基于众包的最优知识图像选择问题 |
3.1.3 基于次模优化的最优知识图像选择方法 |
3.2 编码收益和编码成本分析 |
3.2.1 基于颜色直方图的收益和成本度量 |
3.2.2 基于局部图像信息的收益和成本度量 |
3.3 编码性能分析 |
3.3.1 测试配置条件 |
3.3.2 快速众包选择方法的性能和复杂度分析 |
3.3.3 增强众包选择方法的性能分析 |
3.3.4 增强众包选择方法在VVC上的性能分析 |
3.4 本章小结 |
4 编码层部分——基于局部失真传递的知识图像质量调整研究 |
4.1 基于失真传递的联合率失真优化 |
4.1.1 基于知识图像的分层参考结构 |
4.1.2 联合率失真优化 |
4.2 失真传递分析 |
4.2.1 间接失真传递 |
4.2.2 直接失真传递 |
4.3 基于失真传递的量化参数决策 |
4.4 基于局部失真传递的直接失真传递因子 |
4.5 质量调整方法的性能增益 |
4.6 大跨度编码的综合性能分析 |
4.7 本章小结 |
5 系统层部分——面向大跨度编码的高效存储传输设计 |
5.1 面向大跨度编码视频的存储文件格式 |
5.1.1 基础文件格式概述 |
5.1.2 码流级外源依赖关系 |
5.1.3 基于知识图像重用的大跨度编码视频文件存储方法 |
5.1.4 基于样本群组的大跨度编码视频文件格式 |
5.1.5 大跨度编码视频的本地播放示例 |
5.2 面向大跨度编码的视频的流媒体传输 |
5.2.1 自适应流媒体传输概述 |
5.2.2 码流级外源依赖关系描述 |
5.2.3 基于片段索引的图像级外源依赖描述 |
5.2.4 知识图像的下载和管理 |
5.3 系统层性能分析 |
5.3.1 实验设计 |
5.3.2 大跨度存储传输方案的传输效率分析 |
5.3.3 解码端延时分析 |
5.4 本章小节 |
6 总结与展望 |
6.1 工作总结 |
6.2 未来展望 |
参考文献 |
攻读博士学位期间主要的学术成果 |
(10)软件定义网络中网络服务质量感知路由策略研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 SDN研究与应用进展 |
1.2.2 SDN中 QoS路由策略研究概况 |
1.3 本文主要工作 |
1.4 论文组织结构 |
第2章 相关概念与技术 |
2.1 SDN基础架构 |
2.2 OpenFlow协议及其对QoS的支持 |
2.2.1 OpenFlow协议流表处理机制 |
2.2.2 OpenFlow协议消息类型 |
2.2.3 OpenFlow协议对QoS的支持 |
2.3 神经网络模型相关介绍 |
2.3.1 前馈神经网络 |
2.3.2 循环神经网络 |
第3章 面向可伸缩视频流服务的多播路由方案 |
3.1 引言 |
3.2 符号定义及问题模型 |
3.3 方案设计 |
3.3.1 系统架构设计 |
3.3.2 方案具体描述 |
3.3.3 时间复杂度分析 |
3.4 实验设计与性能分析 |
3.4.1 系统原型与实验部署 |
3.4.2 实验结果展示和分析 |
3.5 本章小结 |
第4章 面向IP电话服务的单播路由方案 |
4.1 引言 |
4.2 问题模型 |
4.3 方案设计 |
4.4 实验与结果分析 |
4.4.1 实验环境部署 |
4.4.2 模型训练和评估 |
4.5 本章小结 |
总结与展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
四、将视频会议进行到端(论文参考文献)
- [1]多流互动视频直播的传输控制研究[D]. 胡晓宇. 北京邮电大学, 2021(01)
- [2]基于移动边缘计算的视频业务QoS保障研究[D]. 王鸿璋. 北京邮电大学, 2021(01)
- [3]基于深度学习的视频帧间预测编码[D]. 林建平. 中国科学技术大学, 2021(09)
- [4]D2D通信中视频多播传输机制研究[D]. 林煌达. 南京邮电大学, 2020(02)
- [5]基于KCP协议的实时视频传输方案设计与实现[D]. 周郁淳. 重庆邮电大学, 2020(02)
- [6]视频压缩编码及其质量增强的优化技术研究[D]. 鲁国. 上海交通大学, 2020(01)
- [7]面向视频应用的网络智能传输算法研究[D]. 赵阳超. 南京大学, 2020(04)
- [8]视频序列中人体行为的特征提取与识别方法研究[D]. 程石磊. 电子科技大学, 2020(07)
- [9]大跨度视频编码与传输体系研究[D]. 于化龙. 浙江大学, 2020(01)
- [10]软件定义网络中网络服务质量感知路由策略研究[D]. 吴飞. 安徽大学, 2020(07)