(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211482148.4
(22)申请日 2022.11.24
(71)申请人 阿里巴巴 (中国) 有限公司
地址 311121 浙江省杭州市余杭区五常街
道文一西路969号3幢5层5 54室
(72)发明人 纪德益 陶明渊
(74)专利代理 机构 北京智信禾专利代理有限公
司 11637
专利代理师 赵杰
(51)Int.Cl.
G06T 7/11(2017.01)
G06V 10/26(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于小波变换的图像分割方法及装置
(57)摘要
本说明书实施例提供基于小波变换的图像
分割方法及装置, 其中所述基于小波变换的图像
分割方法包括: 获取待分割图像; 将所述待分割
图像输入至图像降采样处理模型做降采样处理,
获得所述待分割图像对应的图像特征矩阵; 根据
所述图像特征矩 阵将所述待分割图像切分为预
设数量的待分割子图像组; 将每个待分割子图像
组分别输入至对应的图像识别模 型, 获得每个图
像识别模型输出的图像分割子结果; 根据所述图
像特征矩 阵和每个图像分割子结果生成所述待
分割图像对应的图像分割结果。 通过将待分割子
图像组输入至对应的基于小波变换图像识别模
型中并行处理, 降低了网络执行时间, 保证了较
好的图像分割性能。
权利要求书3页 说明书15页 附图10页
CN 115546236 A
2022.12.30
CN 115546236 A
1.一种基于小 波变换的图像分割方法, 包括:
获取待分割图像;
将所述待分割图像输入至图像降采样处理模型做降采样处理, 获得所述待分割图像对
应的图像特 征矩阵;
根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分割子 图像组, 其中,
每个待分割子图像组包括至少两个待分割子图像;
将每个待分割子图像组分别 输入至对应的图像识别模型, 获得每个图像识别模型输出
的图像分割子结果, 其中, 所述图像识别模型为基于小 波变换的神经网络模型;
根据所述图像特征矩阵和每个图像分割子结果生成所述待分割图像对应的图像分割
结果。
2.如权利要求1所述的方法, 根据所述图像特征矩阵将所述待分割图像切分为预设数
量的待分割子图像组, 包括:
获取所述图像特 征矩阵的矩阵尺寸信息和矩阵特 征值;
根据所述矩阵尺寸信息将所述待分割图像切分为多个待分割子图像;
根据矩阵特 征值将多个待分割子图像分为预设数量的待分割子图像组。
3.如权利要求1所述的方法, 将每个待分割子图像组分别 输入至对应的图像识别模型,
包括:
在每个待分割子图像组中确定目标待分割子图像组, 并确定所述目标待分割子图像组
对应的目标图像识别模型;
将所述目标待分割子图像组中的待分割子图像拼接生成待输入子图像;
将所述待输入子图像输入至所述目标图像识别模型。
4.如权利要求3所述的方法, 图像识别模型包括小波变换嵌入层、 编码器、 解码器和输
出层;
获得每个图像识别模型输出的图像分割子结果, 包括:
将所述待输入子图像输入至所述小 波变换嵌入层, 获得子图像待编码矩阵;
将所述子图像待编码矩阵输入至所述编码器, 获得子图像编码矩阵;
将所述子图像编码矩阵输入至所述 解码器, 获得子图像解码矩阵;
将所述子图像解码矩阵输入至所述输出层, 获得所述待输入子图像对应的图像分割子
结果。
5.如权利要求4所述的方法, 所述小波变换嵌入层包括卷积子层、 小波变换子层、 融合
子层;
将所述待输入子图像输入至所述小 波变换嵌入层, 获得子图像待编码矩阵, 包括:
将所述待输入子图像输入至所述卷积子层进行 特征提取, 获得第一特 征矩阵;
将所述第一特征矩阵输入至所述小波变换子层做降采样处理, 获得第二特征矩阵集
合, 其中, 所述第二特 征矩阵集 合中包括每 个待分割子图像对应的第二特 征矩阵;
将所述第二特征矩阵集合输入至所述融合子层进行特征融合, 获得子图像待编码矩
阵。
6.如权利要求4所述的方法, 所述编码器包括n个顺次连接的编码层, 每个编码层包括
基于小波变换自注意力层和前馈神经网络层, 其中, n 为大于等于2的正整数;权 利 要 求 书 1/3 页
2
CN 115546236 A
2对于任一编码层, 包括:
接收待处 理子图像特 征矩阵;
将所述待处 理子图像特 征矩阵输入至基于小 波变换自注意力层, 获得第一子层矩阵;
将所述第一子层矩阵输入至前馈神经网络层, 获得子图像特 征矩阵。
7.如权利要求6所述的方法,
对于第1个编码层, 接收待处 理子图像特 征矩阵, 包括: 接收所述子图像待编码矩阵;
对于除第1个编码层的其他编码层, 接收待处理子图像特征矩阵, 包括: 接收上一个编
码层输出的子图像特 征矩阵。
8.如权利要求6所述的方法, 将所述待处理子图像特征矩阵输入至基于小波变换自注
意力层, 获得第一子层矩阵, 包括:
对所述待处 理子图像特 征矩阵进行线性 转换得到键矩阵、 查询矩阵和值矩阵;
对所述键矩阵和所述值矩阵进行小波变换处理, 获得第 一参考键矩阵和第 一参考值矩
阵, 对所述键矩阵和 值矩阵进行反向小波变换处理, 获得第二参考键矩阵和第二参考值矩
阵;
根据所述第 一参考键矩阵和所述查询矩阵进行多头注意力计算, 获得第 一多头注意力
矩阵;
根据所述第 一多头注意力矩阵和所述第 一参考值矩阵进行多头注意力计算, 获得第 二
多头注意力矩阵;
融合所述第二参考键矩阵、 所述第二参考值矩阵和所述第二多头注意力矩阵, 获得第
一子层矩阵。
9.如权利要求1所述的方法, 根据所述图像特征矩阵和每个图像分割子结果生成所述
待分割图像对应的图像分割结果, 包括:
根据所述图像特 征矩阵确定每 个图像分割子结果对应的位置信息;
根据每个图像分割子结果对应的位置信 息, 拼接每个图像分割子结果, 生成目标图像,
其中, 所述目标图像中包括所述待分割图像对应的图像分割结果。
10.如权利要求9所述的方法, 所述方法还 包括:
将所述目标图像输入至图像降采样处理模型做二 次降采样处理, 获得所述目标图像对
应的第二图像特 征矩阵, 其中, 所述 二次降采样的尺度小于所述降采样的尺度;
根据所述第 二图像特征矩阵将所述目标图像切分为第 二预设数量的目标子图像组, 其
中, 每个目标子图像组包括至少两个目标子图像;
将每个目标子图像组分别输入至对应的图像识别模型, 获得每个图像识别模型输出的
图像分割子结果;
根据所述第二图像特征矩阵和每个图像分割子结果获得所述目标图像对应的图像分
割结果。
11.一种基于小 波变换的图像分割装置, 包括:
获取模块, 被 配置为获得待分割图像;
特征提取模块, 被配置为将所述待分割图像输入至图像降采样处理模型做降采样处
理, 获得所述待分割图像对应的图像特 征矩阵;
分割模块, 被配置为根据所述图像特征矩阵将所述待分割图像切分为预设数量的待分权 利 要 求 书 2/3 页
3
CN 115546236 A
3
专利 基于小波变换的图像分割方法及装置
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:44上传分享