(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211529489.2
(22)申请日 2022.12.01
(71)申请人 珠海亿智电子科技有限公司
地址 519000 广东省珠海市高新区唐家湾
镇港乐路8号大洲科技园B区厂房803
室
(72)发明人 殷绪成 张崇建 陈松路 刘琦
黄智勇 陈峰
(74)专利代理 机构 深圳青年人专利商标代理有
限公司 4 4350
专利代理师 吴桂华
(51)Int.Cl.
G06V 10/25(2022.01)
G06N 3/04(2006.01)
G06V 10/44(2022.01)G06V 10/77(2022.01)
G06V 10/82(2022.01)
(54)发明名称
目标检测方法、 装置、 设备及 介质
(57)摘要
本发明适用图像目标检测技术领域, 提供了
一种目标检测方法、 装置、 设备及介质, 该方法包
括: 通过第一网络对输入的目标图像进行特征提
取, 得到对应的第一特征图, 根据第一特征图, 通
过第二网络对该目标图像中的高层特征和低层
特征进行特征融合, 得到对应的第二特征图, 根
据第二特征图, 通过第三网络对 该目标图像中的
小目标进行检测, 得到对应的小目标检测结果,
从而提高小目标的检测速度和检测准确率, 进而
提高了小目标检测的能力。
权利要求书1页 说明书10页 附图4页
CN 115546473 A
2022.12.30
CN 115546473 A
1.一种目标检测方法, 其特 征在于, 所述方法包括下述 步骤:
通过第一网络对输入的目标图像进行 特征提取, 得到对应的第一特 征图;
根据所述第 一特征图, 通过第 二网络对所述目标图像中的高层特征和低层特征进行特
征融合, 得到对应的第二特 征图;
根据所述第二特征图, 通过第三网络对所述目标图像中的小目标进行检测, 得到对应
的小目标检测结果。
2.如权利要求1所述的方法, 其特征在于, 所述第 二网络包含由上采样核预测分支和多
尺度特征重组分支组成的内容感知上采样模块。
3.如权利要求2所述的方法, 其特征在于, 所述通过第 二网络对所述目标图像中的高层
特征和低层特 征进行特征融合的步骤, 包括:
根据预设的核预测公式, 通过所述上采样核预测分支对所述第 一特征图中不同位置的
上采样核 进行预测, 得到对应的上采样核;
根据所述对应的上采样核和预设的重组公式, 通过所述多尺度 特征重组分支对所述第
一特征图进行 特征重组, 得到所述第二特 征图。
4.如权利要求1所述的方法, 其特征在于, 所述第 三网络包含由特征重构分支和注意力
机制分支组成的通道打乱 注意力模块。
5.一种目标检测装置, 其特 征在于, 所述装置包括:
特征提取单元, 用于通过第一网络对输入的目标图像进行特征提取, 得到对应的第一
特征图;
特征融合单元, 用于根据所述第一特征图, 通过第二网络对所述目标图像中的高层特
征和低层特 征进行特征融合, 得到对应的第二特 征图; 以及
目标检测单元, 用于根据所述第二特征图, 通过第三网络对所述目标图像中的小目标
进行检测, 得到对应的小目标检测结果。
6.如权利要求5所述的装置, 其特征在于, 所述第 二网络包含由上采样核预测分支和多
尺度特征重组分支组成的内容感知上采样模块。
7.如权利要求6所述的装置, 其特 征在于, 所述特 征融合单 元包括:
采样核预测单元, 用于根据预设的核预测公式, 通过所述上采样核预测分支对所述第
一特征图中不同位置的上采样核 进行预测, 得到对应的上采样核; 以及
特征重组单元, 用于根据所述对应的上采样核和预设的重组公式, 通过所述多尺度特
征重组分支对所述第一特 征图进行 特征重组, 得到所述第二特 征图。
8.如权利要求5所述的装置, 其特征在于, 所述第 三网络包含由特征重构分支和注意力
机制分支组成的通道打乱 注意力模块。
9.一种目标检测设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理
器上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1
至4任一项所述方法的步骤。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处 理器执行时实现如权利要求1至4任一项所述方法的步骤。权 利 要 求 书 1/1 页
2
CN 115546473 A
2目标检测方法、 装置、 设备及介质
技术领域
[0001]本发明属于图像目标检测技术领域, 尤其涉及一种目标检测方法、 装置、 设备及介
质。
背景技术
[0002]小目标检测有着广 泛的应用, 如交通标志检测、 人脸识别、 遥感图像分析等, 然而,
一般的目标检测器由于体积小、 噪声干扰等原因, 不能有效地应用于小目标检测。 检测小目
标的一种常见做法是使用上采样放大特征图, 传统的上采样方法包括最近邻上采样、 双线
性上采样和双三次上采样, 它们只根据图像信号来提高图像的分辨率, 而这些方法带来了
许多副作用, 如增 加了噪音和计算复杂度。
[0003]针对上述问题, 提出了基于深度学习的上采样方法, 如: Wenzhe Shi等人提出的采
用高效的亚像素卷积神经网络实现实时单图像和视频的超分辨率 (Real ‑time single
image and video super‑resolution using an efficient sub‑pixel convolutional
neural network. Wenzhe Shi, Jose Caballero, Ferenc Huszar, Johannes Totz,
Andrew P. Aitken, RobBishop, Daniel Rueckert, and Zehan Wang. In CVPR,pages
1874–1883, 2016. ) 中的亚像素层是一个端到端的可学习层, 它生成并重组多个通道来执
行上采样; Zhi Tian等人提出的数据依赖上采样 (Decoders matter for semantic
segmentation: Data‑dependent decoding enables flexible feature
aggregation.Zhi Tian, Tong He, Chunhua Shen, and Youliang Yan.In CVPR, pages
3126–3135, 2019. ) 可以根据像素之间的关系放大特征图, 然而, 这些方法中的上采样操作
会导致目标信息的丢失, 尤其是小目标的丢失, 从而导致小目标的漏检。 还有Jiaqi Wang等
人提出的一种通过内容感知和特征重组的上采样方法(CARAFE: content ‑aware
reassembly of features.Jiaqi Wang, Kai Chen, Rui Xu, Ziwei Liu, Chen Change
Loy, and Dahua Lin.In ICCV, pages 3007–3016, 2019. ) 通过上下文建模减少小目标的
信息损失, 但在特 征重组过程中没有考虑多尺度特 征, 不利于小目标的检测。
[0004]此外, 小目标容易受到背景噪声的影响, 注意力机制 可以通过关注重要区域而忽
略无关信息, 以此来抑制噪声干扰。 如: Hu等人提出的压缩激励网络 (Squeeze ‑and‑
excitation networks.Jie Hu, Li Shen, and Gang Sun. In CVPR, pages 7132–7141,
2018. ) 和Wang等人提出的高效通道注意力网络 (Eca ‑net: Efficient channel attention
for deep convolutional neural networks. Qilong Wang, Banggu Wu, Pengfei Zhu,
Peihua Li, Wangmeng Zuo, and Qinghua Hu. In CVPR, pages 11531–11539, 2020. ) 都
关注了通道之 间的关系, 自动学习不同通道特征的重要性, 然而, 这些网络中的通道注意力
不能捕捉到目标周围的局部信息, 影响小目标的检测。
[0005]因此, 亟需一种新的小目标检测方法以解决上述存在的问题。说 明 书 1/10 页
3
CN 115546473 A
3
专利 目标检测方法、装置、设备及介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:40上传分享