国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211503117.2 (22)申请日 2022.11.29 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 陈培 张杨康 李泽健 孙凌云 (74)专利代理 机构 杭州天勤知识产权代理有限 公司 33224 专利代理师 胡红娟 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 一种基于图神经网络的图像生成方法 (57)摘要 本发明公开了一种基于图神经网络的图像 生成方法, 包括通过图像特征节 点集合和对应的 场景拓扑图构建超图, 在超图上构建一个图神经 网络来同时学习场景拓扑图中的语义特征以及 图像的潜在特征; 通过四种在图神经网络上的消 息传递方式来模拟真实场景中的物体交互, 将基 于全局消息传递方式和局部消息传递方式更新 得到的图像特征集合依次输入全连接层和归一 化指数函数得到生成图像编码; 基于训练样本集 对训练网络模 型进行训练, 通过生成图像编码和 真实图像编码采用损失函数训练训练网络模型 得到图神经网络模型; 该方法能够高效的生成具 有较高视觉质量和较为正确物体之间关系的图 像。 权利要求书4页 说明书9页 附图2页 CN 115546589 A 2022.12.30 CN 115546589 A 1.一种基于图神经网络的图像生成方法, 其特 征在于, 包括: (1) 获得多张真实图像, 基于所述真实图像 中的物体构建场景拓扑图, 将真实图像输入 VQGAN系统得到真实图像编码和图像特征节点集合, 通过图像特征节点集合和对应的场景 拓扑图构建超图, 多个超图构建训练样本集; (2) 构建训练网络模型, 所述训练网络模型包括消息传递函数、 注意力机制单元、 全连 接层和归一 化指数函数, 其中: 场景拓扑图上的语义特征消息传递方式: 在场景拓扑图中, 通过消息传递函数将场景 拓扑图节点的每个邻居节点的语义特征和连边特征进 行融合得到第一邻居节点消息, 将 每 个第一邻居节点消息通过注意力机制单元进 行聚合, 将聚合结果作为更新的场景拓扑图节 点语义特 征; 全局消息传递方式: 当图像特征节点的邻居节点为场景拓扑图节点时, 采用回归网络 方法基于场景拓扑图的每个节点构建矩形框, 矩形框内为物体的图像特征节点, 场景拓扑 图的每个节点指向对应矩形框, 通过消息传递函数将更新的场景拓扑图节点语义特征与对 应的矩形框连接的全局连边特征进行融合, 将融合结果通过注意力机制得到的聚合特征作 为采用全局 消息传递方式更新的图像特 征; 局部消息传递方式: 当图像特征节点的邻居节点在当前矩形框内或其他矩形框内时, 通过消息传递函数将矩形框内图像特征节点的邻居节点的图像特征和相 应连边特征进行 融合得到第二邻居节点信息, 将每个第二邻居节点信息通过注意力机制单元进行聚合, 将 聚合结果作为采用局部消息传递方式更新的图像特 征; 将基于全局消息传递方式和局部消息传递方式更新得到的图像特征集合依次输入全 连接层和归一 化指数函数 得到生成图像编码; (3) 基于训练样本集对训练网络模型进行训练, 通过生成图像编码和真实图像编码采 用损失函数训练训练网络模型 得到图神经网络模型; (4) 应用时, 将场景拓扑图输入至图神经网络模型中得到生成图像编码, 将生成图像编 码输入至VQGAN系统的解码器生成图像。 2.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 将真实图像输 入VQGAN系统得到真实图像编码, 包括: 先将真实图像通过VQGAN系 统的编码器得到初始潜在向量组合, 基于距离最近原理将 初始潜在向量组合中的初始潜在向量与向量字典进行比对得到潜在向量组合, 潜在向量组 合的下标为真实图像编码, 其中: 所述潜在向量 为: 其中, 为初始潜在向量组合, q( ﹒ ) 为距离最近函数, zk为向量字典中的第 k个向量, n为向量的维度, h和w分别为潜在向量的高度和宽度。 3.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 所述基于所述 真实图像中的物体构建的场景拓扑图, 场景拓扑图节点表示真实 图像中的物体, 连边表示 物体之间的关系, 场景拓扑图由元 祖 组成, 其中: 场景拓扑图节点的集 合O为:权 利 要 求 书 1/4 页 2 CN 115546589 A 2其中, oi为第i个场景拓扑图节点, N为场景拓扑图节点的个数, 为一组物体 类别; 场景拓扑图连边的集合 , 为一组关系类别, 每条边表示为 , 为 的第 个邻居节点, , 为由第i个场景拓扑图节点指向第 个场景拓扑图 节点的连边。 4.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 将场景拓扑图 输入嵌入层网络中得到场景拓扑图节点的语义特 征和连边特 征。 5.根据权利要求3所述的基于图神经网络的图像生成方法, 其特征在于, 通过消息传递 函数将场景拓扑图节点的每个邻居节点语义特征和连边特征进行融合得到第一邻居节点 消息 为: 其中, 为第 个邻居节点语义 特征, 为连边特征, 为场景拓扑图内信息传递 参数矩阵, ,D1为邻居节点的语义特 征的维度, D2为连边特 征的维度。 6.根据权利要求3所述的基于图神经网络的图像生成方法, 其特征在于, 通过融合结果 更新图像特 征节点对应的图像特 征 为: 其中, 为节点特征 vi的邻居节点集合, 为归一化后的节点 到节点 的注意力 系数, W1和W2分别为参数矩阵, GeLU为激活函数。 7.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 基于全局消息 传递方式更新得到的图像特 征 为: 其中, 为第i已更新的语义节点特征 传递给第 j个图像节点特征 的消息, rg为第g个全局连边类型, 为全局连边类型的参数矩阵, 为全局连边特征, 为第i个 已更新的语义节点特征 到图像节点特征 的注意力系数, W1和W2分别为参数矩阵, 权 利 要 求 书 2/4 页 3 CN 115546589 A 3
专利 一种基于图神经网络的图像生成方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:23:42
上传分享
举报
下载
原文档
(970.3 KB)
分享
友情链接
GB-T 42191-2023 MEMS压阻式压力敏感器件性能试验方法.pdf
GB-T 15852.1-2020 信息技术 安全技术 消息鉴别码 第1部分:采用分组密码的机制.pdf
T-SHXFXH 002—2023 建筑电气防火检测技术规程.pdf
T-GDAEPI 01—2019 固定污染源自动监控系统运行服务规范.pdf
青藤 - 国央企数字化转型安全建设指南0423.pdf
GB-T 25054-2010 海洋特别保护区选划论证技术导则.pdf
FTTR光纤到房间白皮书 2022 .pdf
上海市公共数据开放暂行办法.pdf
SC-T 4001-2021 渔具基本术语.pdf
DB12-T 669-2016 绿色供应链标准化工作指南 天津市.pdf
GW0205-2014 国家电子政务外网 跨网数据安全交换技术要求与实施指南.pdf
GB-T 39988-2021 全尾砂膏体制备与堆存技术规范.pdf
GB-T 32932-2016 留学中介服务规范.pdf
GB-T 17569-2021 压水堆核电厂物项分级.pdf
GB-T 39600-2021 人造板及其制品甲醛释放量分级.pdf
GB-T 31464-2022 电网运行准则.pdf
DB3301-T 0322.2—2020 数据资源管理 第2部分:政务数据安全责任 杭州市.pdf
T-CAEPI 66—2023 水污染源自动监控监测系统 运行维护技术指南.pdf
GB-T 9361-2011 计算机场地安全要求.pdf
GB-T 14315-2008 电力电缆导体用压接型铜、铝接线端子和连接管.pdf
1
/
16
评价文档
赞助2.5元 点击下载(970.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。