国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211503117.2 (22)申请日 2022.11.29 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 陈培 张杨康 李泽健 孙凌云 (74)专利代理 机构 杭州天勤知识产权代理有限 公司 33224 专利代理师 胡红娟 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 一种基于图神经网络的图像生成方法 (57)摘要 本发明公开了一种基于图神经网络的图像 生成方法, 包括通过图像特征节 点集合和对应的 场景拓扑图构建超图, 在超图上构建一个图神经 网络来同时学习场景拓扑图中的语义特征以及 图像的潜在特征; 通过四种在图神经网络上的消 息传递方式来模拟真实场景中的物体交互, 将基 于全局消息传递方式和局部消息传递方式更新 得到的图像特征集合依次输入全连接层和归一 化指数函数得到生成图像编码; 基于训练样本集 对训练网络模 型进行训练, 通过生成图像编码和 真实图像编码采用损失函数训练训练网络模型 得到图神经网络模型; 该方法能够高效的生成具 有较高视觉质量和较为正确物体之间关系的图 像。 权利要求书4页 说明书9页 附图2页 CN 115546589 A 2022.12.30 CN 115546589 A 1.一种基于图神经网络的图像生成方法, 其特 征在于, 包括: (1) 获得多张真实图像, 基于所述真实图像 中的物体构建场景拓扑图, 将真实图像输入 VQGAN系统得到真实图像编码和图像特征节点集合, 通过图像特征节点集合和对应的场景 拓扑图构建超图, 多个超图构建训练样本集; (2) 构建训练网络模型, 所述训练网络模型包括消息传递函数、 注意力机制单元、 全连 接层和归一 化指数函数, 其中: 场景拓扑图上的语义特征消息传递方式: 在场景拓扑图中, 通过消息传递函数将场景 拓扑图节点的每个邻居节点的语义特征和连边特征进 行融合得到第一邻居节点消息, 将 每 个第一邻居节点消息通过注意力机制单元进 行聚合, 将聚合结果作为更新的场景拓扑图节 点语义特 征; 全局消息传递方式: 当图像特征节点的邻居节点为场景拓扑图节点时, 采用回归网络 方法基于场景拓扑图的每个节点构建矩形框, 矩形框内为物体的图像特征节点, 场景拓扑 图的每个节点指向对应矩形框, 通过消息传递函数将更新的场景拓扑图节点语义特征与对 应的矩形框连接的全局连边特征进行融合, 将融合结果通过注意力机制得到的聚合特征作 为采用全局 消息传递方式更新的图像特 征; 局部消息传递方式: 当图像特征节点的邻居节点在当前矩形框内或其他矩形框内时, 通过消息传递函数将矩形框内图像特征节点的邻居节点的图像特征和相 应连边特征进行 融合得到第二邻居节点信息, 将每个第二邻居节点信息通过注意力机制单元进行聚合, 将 聚合结果作为采用局部消息传递方式更新的图像特 征; 将基于全局消息传递方式和局部消息传递方式更新得到的图像特征集合依次输入全 连接层和归一 化指数函数 得到生成图像编码; (3) 基于训练样本集对训练网络模型进行训练, 通过生成图像编码和真实图像编码采 用损失函数训练训练网络模型 得到图神经网络模型; (4) 应用时, 将场景拓扑图输入至图神经网络模型中得到生成图像编码, 将生成图像编 码输入至VQGAN系统的解码器生成图像。 2.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 将真实图像输 入VQGAN系统得到真实图像编码, 包括: 先将真实图像通过VQGAN系 统的编码器得到初始潜在向量组合, 基于距离最近原理将 初始潜在向量组合中的初始潜在向量与向量字典进行比对得到潜在向量组合, 潜在向量组 合的下标为真实图像编码, 其中: 所述潜在向量 为: 其中, 为初始潜在向量组合, q( ﹒ ) 为距离最近函数, zk为向量字典中的第 k个向量, n为向量的维度, h和w分别为潜在向量的高度和宽度。 3.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 所述基于所述 真实图像中的物体构建的场景拓扑图, 场景拓扑图节点表示真实 图像中的物体, 连边表示 物体之间的关系, 场景拓扑图由元 祖 组成, 其中: 场景拓扑图节点的集 合O为:权 利 要 求 书 1/4 页 2 CN 115546589 A 2其中, oi为第i个场景拓扑图节点, N为场景拓扑图节点的个数, 为一组物体 类别; 场景拓扑图连边的集合 , 为一组关系类别, 每条边表示为 , 为 的第 个邻居节点, , 为由第i个场景拓扑图节点指向第 个场景拓扑图 节点的连边。 4.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 将场景拓扑图 输入嵌入层网络中得到场景拓扑图节点的语义特 征和连边特 征。 5.根据权利要求3所述的基于图神经网络的图像生成方法, 其特征在于, 通过消息传递 函数将场景拓扑图节点的每个邻居节点语义特征和连边特征进行融合得到第一邻居节点 消息 为: 其中, 为第 个邻居节点语义 特征, 为连边特征, 为场景拓扑图内信息传递 参数矩阵, ,D1为邻居节点的语义特 征的维度, D2为连边特 征的维度。 6.根据权利要求3所述的基于图神经网络的图像生成方法, 其特征在于, 通过融合结果 更新图像特 征节点对应的图像特 征 为: 其中, 为节点特征 vi的邻居节点集合, 为归一化后的节点 到节点 的注意力 系数, W1和W2分别为参数矩阵, GeLU为激活函数。 7.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 基于全局消息 传递方式更新得到的图像特 征 为: 其中, 为第i已更新的语义节点特征 传递给第 j个图像节点特征 的消息, rg为第g个全局连边类型, 为全局连边类型的参数矩阵, 为全局连边特征, 为第i个 已更新的语义节点特征 到图像节点特征 的注意力系数, W1和W2分别为参数矩阵, 权 利 要 求 书 2/4 页 3 CN 115546589 A 3
专利 一种基于图神经网络的图像生成方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:23:42
上传分享
举报
下载
原文档
(970.3 KB)
分享
友情链接
GB-T 39477-2020 信息安全技术 政务信息共享 数据安全技术要求.pdf
T-ZZB 1934—2020 超高效节能电机用高绝缘漆包铜圆线.pdf
GB-T 32169.2-2015 政务服务中心运行规范 第2部分:进驻要求.pdf
GB/T 33850-2017 信息技术服务 质量评价指标体系.pdf
GB-T 31988-2015 印制电路用铝基覆铜箔层压板.pdf
GB-T 24196-2009 金属和合金的腐蚀 电化学试验方法 恒电位和动电位极化测量导则.pdf
MT-T 244.2-2020 煤矿窄轨车辆连接件 连接插销.pdf
GB-T 14406-2011 通用门式起重机.pdf
GB-T 37565-2019 给水排水用格栅除污机通用技术条件.pdf
GB-T 13298-2015 金属显微组织检验方法.pdf
GB-T 8259-2008 卡箍式柔性管接头 技术条件.pdf
GB-T 26758-2011 铅、锌冶炼企业节能规范.pdf
GB-T 38772-2020 煤液化沥青.pdf
GB-T 16907-2014 离心泵技术条件(Ⅰ类).pdf
YD-T 0219-2019 电信网和互联网数据安全评估规范.pdf
证券期货业信息系统渗透测试指南 (JRT 0276—2023).pdf
GB-T 15909-2017 电子工业用气体 硅烷.pdf
T-GDWJ 013—2022 广东省健康医疗数据安全分类分级管理技术规范.pdf
YD-T 4024-2022 数据中心液冷服务器系统总体技术要求和测试方法.pdf
GB-T 42467.5-2023 中医临床名词术语 第5部分:骨伤科学.pdf
1
/
16
评价文档
赞助2.5元 点击下载(970.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。