(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211513284.5
(22)申请日 2022.11.30
(71)申请人 联合赤道 环境评价股份有限公司
地址 300000 天津市和平区小白楼街曲阜
道80号503室
(72)发明人 罗文辉 朱赛 张楠 梁重庆
吉秋红 连霞
(74)专利代理 机构 天津知远君 正专利代理事务
所(特殊普通 合伙) 12236
专利代理师 何君
(51)Int.Cl.
G06Q 40/02(2012.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于绿色识别信息的信贷风险预测方法及
装置
(57)摘要
本发明公开了一种基于绿色识别信息的信
贷风险预测方法及装置, 所述方法包括: 接收绿
色信贷申请信息, 根据绿色信贷申请信息确定对
应的绿色信贷类别; 获取绿色信贷类别的完整样
本; 在完整样本数量小于预设的数量时, 获取近
似绿色信贷类别和相关传统类别样 本; 将近似绿
色信贷类别和相关传统类别样 本进行混合融合,
生成虚拟样 本; 将所述虚拟样 本通过预设的分类
决策树, 利用基尼系数对所述虚拟样本进行验
证; 将所述验证合格的虚拟样 本加入到样本中对
随机森林进行训练, 并将接收的绿色信贷申请信
息输入到训练完成的随机森 林中, 输出信贷风险
预测结果, 可 以在缺少足够样本数量的情况下,
提高信贷风险预测的准确性。
权利要求书2页 说明书9页 附图3页
CN 115545912 A
2022.12.30
CN 115545912 A
1.一种基于绿色识别 信息的信贷风险预测方法, 其特 征在于, 包括:
接收信贷申请信 息, 从所述信贷申请信 息中提取字段和贷款投向、 项目名称的关键字,
根据所述关键 字确定行业类别多 级内容;
根据所述多级内容中的最小分类内容判断是否为绿色信贷, 在为绿色信贷时确定对应
的绿色信贷类别;
获取所述绿色信贷类别的完整样本;
在所述绿色信贷类别的完整样本的数量小于预设的样本数量 时, 根据所述绿色信贷类
别确定相关传统类别和近似绿色信贷类别;
获取近似绿色信贷类别样本和相关传统类别样本;
将近似绿色信贷类别样本和相关传统类别样本进行混合融合, 生成虚拟 样本;
将所述虚拟样本通过预设的分类决策树, 利用基尼系数对所述虚拟样本进行验证, 筛
选得到验证合格的虚拟 样本;
将所述验证合格的虚拟样本加入到样本 中对随机森林进行训练, 并将接收的绿色信贷
申请信息 输入到训练完成的随机森林中, 输出基于绿色识别 信息的信贷风险预测结果;
所述将近似绿色信贷类别和相关传统类别样本进行混合融合, 包括:
对相关传统类别样本初始数据进行划分, 分为项目数据和信贷申请人数据, 分别建立
项目数据矩阵和信贷申请人 数据矩阵;
提取近似绿色信贷类别样本中每个考核节点对应的项目数据与政策补贴比例和环境
效益转换参数 的比例系 数, 生成考核节点影响矩阵, 每个考核节点影响矩阵对应一个项目
考察节点;
将所述项目数据矩阵和信贷申请人数据矩阵分别与每个考核节点影响矩阵相乘, 得到
每个考核节点对应的项目数据矩阵和信贷申请人 数据矩阵;
从所述每个考核节点对应的项目数据矩阵和信贷申请人数据矩阵中提取对应的元素,
作为虚拟 样本的数据。
2.根据权利要求1所述的方法, 其特 征在于, 所述随机森林,包括:
五个决策树, 每 个决策树中输入的数据至少包括 其它一个决策树中的部分数据。
3.根据权利要求2所述的方法, 其特征在于, 所述五个决策树包括:
盈利能力决策树, 营运能力决策树, 环境效益决策树、 减排额收益决策树和补 贴收益决
策树。
4.根据权利要求1所述的方法, 其特征在于, 所述根据所述绿色信贷类别确定相关传统
类别, 包括:
确定所述绿色信贷类别对应的最小 级别;
获取与所述 最小级别同级别的名称;
根据所述 最小级别同级别的名称确定相关传统类别。
5.一种基于绿色识别 信息的信贷风险预测装置, 其特 征在于, 包括:
接收模块, 用于接收信贷申请信息, 从所述信贷申请信 息中提取字段和贷款投向、 项目
名称的关键 字, 根据所述关键 字确定行业类别多 级内容;
判断模块, 用于根据所述多级内容中的最小分类内容判断是否为绿色信贷, 在为绿色
信贷时确定对应的绿色信贷类别;权 利 要 求 书 1/2 页
2
CN 115545912 A
2绿色信贷类别完整样本获取模块, 用于获取 所述绿色信贷类别的完整样本;
确定模块, 用于在所述绿色信贷类别的完整样本数量小于预设的样本数量时, 根据所
述绿色信贷类别确定相关传统类别和近似绿色信贷类别;
近似和相关样本获取模块, 用于获取近似绿色信贷类别样本和相关传统类别样本;
生成模块, 用于将近似绿色信贷类别样本和相关传统类别样本进行混合融合, 生成虚
拟样本;
验证模块, 用于将所述虚拟样本通过预设的分类决策树, 利用基尼系数对所述虚拟样
本进行验证, 筛 选得到验证合格的虚拟 样本;
训练模块, 用于将所述验证合格的虚拟样本加入到样本中对随机森林进行训练, 并将
接收的绿色信贷申请信息输入到训练完成的随机森林中, 输出基于绿色识别信息的信贷风
险预测结果;
所述生成模块, 包括:
划分单元, 用于对相关传统类别样本初始数据进行划分, 分为项目数据和信贷申请人
数据, 分别建立项目数据矩阵和信贷申请人 数据矩阵;
提取单元, 用于提取近似绿色信贷类别样本 中每个考核节点对应的项目数据与政策补
贴比例和环境效益转换参数 的比例系 数, 生成考核节点影响矩阵, 每个考核节点影响矩阵
对应一个项目考 察节点;
相乘单元, 用于将所述项目数据矩阵和信贷申请人数据矩阵分别与每个考核节点影响
矩阵相乘, 得到每 个考核节点对应的项目数据矩阵和信贷申请人 数据矩阵;
作为单元, 用于从所述每个考核节点对应的项目数据矩阵和信贷申请人数据矩阵中提
取对应的元 素, 作为虚拟 样本的数据。
6.根据权利要求5所述的装置, 其特 征在于, 所述随机森林,包括:
五个决策树, 每 个决策树中输入的数据至少包括 其它一个决策树中的部分数据。
7.根据权利要求6所述的装置, 其特 征在于, 所述五个决策树包括:
盈利能力决策树, 营运能力决策树, 环境效益决策树、 减排额收益决策树和补 贴收益决
策树。
8.根据权利要求5所述的方法, 其特 征在于, 所述确定模块包括:
最小级别确定单 元, 用于确定所述绿色信贷类别对应的最小 级别;
获取单元, 用于获取与所述 最小级别同级别的名称;
相关传统类别确定单 元, 用于根据所述 最小级别同级别的名称确定相关传统类别。权 利 要 求 书 2/2 页
3
CN 115545912 A
3
专利 基于绿色识别信息的信贷风险预测方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:41上传分享