(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211515828.1 (22)申请日 2022.11.30 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 街道八一路2 99号 (72)发明人 王中元 李娜 胡思成 罗来干  何政 梁超 韩镇  (74)专利代理 机构 武汉科皓知识产权代理事务 所(特殊普通 合伙) 42222 专利代理师 肖明洲 (51)Int.Cl. G06T 3/40(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于孪生超分辨率网络的压缩视频超分辨 率方法及系统 (57)摘要 本发明公开了一种基于孪生超分辨率网络 的压缩视频超分辨率方法及系统, 将待处理低分 辨率视频输入本实施例的孪生超分辨率网络, 获 得超分辨率视频; 训练时本发明将原始高质量视 频进行M‑JPEG格式的压缩。 然后将压缩版本和非 压缩版本两类数据输入到孪生超分辨率网络中。 最后从四个方面约束孪生超分辨率网络的训练, 两类视频经编码器提取到的特征应该尽可能靠 近; 两类视频的超分结果和真实值共同构成了一 个三元组, 三元组内元素互为正样本; 负样本则 是压缩数据与传统降质之间的残差超分的结果。 通过这样对比学习的方式, 孪生超分辨率网络能 够最大限度地学习到对压缩视频超分需要的特 征参数, 获得更精细的超分辨 率重建结果。 权利要求书2页 说明书5页 附图3页 CN 115546030 A 2022.12.30 CN 115546030 A 1.一种基于孪生超分辨率网络的压缩视频超分辨率方法, 其特征在于: 将待处理低分 辨率视频输入所述孪生超分辨 率网络, 获得超分辨 率视频; 所述孪生超分辨率网络, 由两支并行设置超分辨率网络组成; 所述超分辨率网络, 包括 编码器网络和上采样模块; 所述编码器网络, 它由两类卷积层和若干PFRB模块组成; 第一类卷积层以输入连续三 帧图像的中心帧为输入, 每帧大小为64 ×64×3, 该卷积层将其大小转换为batchsize ×64 ×64×80的特征图, 第二类卷积层以除中心帧外其他的补充帧作为输入, 输入数据大小为 batchsiz e×64×64×6, 卷积层将这样的数据转换为batchsiz e×64×64×80的特征图, 最 后, 将这两个特征同上一轮上采样前的超分结果一起, 输入连续的PFRB模块中; 两种输入对 应的两个编码器网络共享 一个权重; 其中, batc hsize为梯度优化的批量样本数; 所述PFRB模块, 数据先被输入到三个大小为3 ×3的卷积层中, 这三个卷积层的输入输 出通道数均为8 0, 记输出为x1, 然后对 该卷积层的输出进 行拼接, 再使用一个1 ×1的卷积层 将总通道数240变换为8 0, 并且将得到的结果分别和x1中的三个结果进 行拼接, 得到的结果 记为x2, 最后, 将x2中的三个结果分别输入到三个卷积层中, 将输入数据的通道数压缩为 80, 然后将得到的三个结果与最初输入的三个结果对应加和, 得到最终的结果; 其中, 各卷 积层之间均使用LeakyReLU激活函数来引入非线性关系; 所述上采样模块, 输入数据的大小为batchsize ×3×64×64×80, 首先经过一个3 ×3 的卷积层, 将数据通道数240转换为80, 继续输入卷积层中, 将通道数80转换为48; 使用 pytorch中的pixelshuffle函数对数据进行尺度为2的上采样, 通道数压缩为12; 得到的结 果再经过一个卷积层处理, 最后使用pix elshuffle函数进行一次尺度为2的上采样; 输出的 超分数据的尺寸 为batchsize×3×256×256×3。 2.根据权利要求1所述的基于孪生超分辨率网络的压缩视频超分辨率方法, 其特征在 于: 所述孪生超分辨 率网络, 是训练好的孪生超分辨 率网络; 其训练过程包括以下步骤: 步骤1: 针对包括若干高分辨率连续帧的原始数据集, 将原始数据集中视频进行M ‑JPEG 压缩并且bicubic下采样处理得到低分辨率的压缩图像, 记 为压缩视频; 将原始数据集中视 频进行高斯模糊并且bicubic下采样处 理得到传统低质量图像, 记为BD视频; 步骤2: 利用编码器网络对输入的视频进行初步的特征提取, 对于输入的5维视频数据, 编码网络输出一个4维特征, 通过LeakyReLU激活函数处理4维特征, 引入非线性的函数关 系, 并且约束提取的两个特 征之间的损失; 步骤3: 分别将提取到的特征送入上采样模块中继续进行超分, 输出一个相比于输入长 宽放大四倍的视频; 分别约束两个输出和真值之间的关系, 使其尽可能靠近, 做为压缩视频 样本和正样本的距离; 记超分后的残差、 真值视频与压缩视频的差这两者的距离为压缩视 频样本与负 样本之间的距离, 需要在设定范围内尽可能大; 步骤4: 计算总损失, 使用反向传播梯度的方式对所述孪生超分辨率网络进行训练; 循 环执行步骤1‑4, 将所述孪生超分辨 率网络训练到收敛, 得到训练好的孪生超分辨 率网络。 3.根据权利要求2所述的基于孪生超分辨率网络的压缩视频超分辨率方法, 其特征在 于: 步骤3中, 得到BD视频和压缩视频的超分结果, 并且将两者与真值做约束, 得到损失 dispositive;权 利 要 求 书 1/2 页 2 CN 115546030 A 2; 其中,yBD指BD视频超分后的结果, ycompress指压缩视 频超分后的结果, gt指真实值, ε表示 一个常量; 将 dispositive记为压缩视频样本和正样本的距离; 将压缩视频与BD压缩视频做差, 得到负样本, 记为 xnega; 计算负样本和压缩视频样本的 距离disnegative; ; 其中, M(xnega)、xnega分别表示负 样本输入模型后得到的超分结果和负 样本本身。 4.根据权利要求2所述的基于孪生超分辨率网络的压缩视频超分辨率方法, 其特征在 于: 步骤4中, 根据步骤3中计算得到的压缩视频样本与 正样本之间的距离 dispositive和压缩 视频样本与负 样本之间的距离 disnegative, 计算最终的损失; ; 其中,margin为超参数, 用来设定 两特征距离之间的间隔; 计算出损失后, 使用Adam优化器对所述孪生超分辨 率网络进行反向传播并优化。 5.一种基于 孪生超分辨 率网络的压缩视频超分辨 率系统, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 使得所述一个或多个处理器实现如权利要求 1至4中任一项 所述的基于孪生超分 辨率网络的压缩视频超分辨 率方法。权 利 要 求 书 2/2 页 3 CN 115546030 A 3

PDF文档 专利 基于孪生超分辨率网络的压缩视频超分辨率方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于孪生超分辨率网络的压缩视频超分辨率方法及系统 第 1 页 专利 基于孪生超分辨率网络的压缩视频超分辨率方法及系统 第 2 页 专利 基于孪生超分辨率网络的压缩视频超分辨率方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:23:41上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。