说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210830092.0 (22)申请日 2022.07.15 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 程鹏 白佳乐 任政 谢伟  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 赖舒娴 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 40/04(2012.01) G06N 20/20(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 业务类别识别方法、 装置、 设备、 存储介质和 程序产品 (57)摘要 本申请涉及大数据技术领域, 特别涉及一种 业务类别识别方法、 装置、 设备、 存储介质和程序 产品。 该方法包括: 获取目标用户在处理金融业 务时产生的多维度业务操作数据; 将多维度业务 操作数据输入至业务类别识别模 型中, 得到金融 业务的业务风险类别识别结果; 业务类别识别模 型包括第一类型学习器和第二类型学习器级联 构成的学习器模块; 其中, 第一类型学习器用于 根据第一分类算法对获取到的输入数据进行识 别; 第二类型学习器用于根据第二分类算法对获 取到的输入 数据进行识别。 本申请能够精准高效 地对金融业 务的类别进行识别。 权利要求书2页 说明书16页 附图4页 CN 114998001 A 2022.09.02 CN 114998001 A 1.一种业 务类别识别方法, 其特 征在于, 所述方法包括: 获取目标用户在处 理金融业 务时产生的多维度业 务操作数据; 将所述多维度业务操作数据输入至预设的业务类别识别模型中, 得到所述金融业务的 业务风险类别识别结果; 所述业务类别识别模 型包括第一类型学习器和第二类型学习器级 联构成的学习器模块; 其中, 所述第一类型学习器用于根据第一分类算法对获取到的输入数据进行识别; 所 述第二类型 学习器用于根据第二分类算法对获取到的输入数据进行识别。 2.根据权利要求1所述的方法, 其特征在于, 所述业务类别识别模型还包括特征提取模 块, 则将所述多维度业务操作数据输入至所述业务类别识别模型中, 得到所述金融业务的 业务风险类别识别结果, 包括: 将所述多维度业务操作数据输入至所述业务类别识别模型中, 通过所述特征提取模块 对所述多维度业务操作数据进 行多粒度扫描, 以从所述多维度业务操作数据中提取操作数 据特征向量; 将所述操作 数据特征向量输入至所述学习器模块中, 得到所述金融业务的业务风险类 别识别结果。 3.根据权利要求2所述的方法, 其特征在于, 所述获取目标用户在处理金融业务时产生 的多维度业 务操作数据之前, 所述方法还 包括: 获取所述目标用户在处 理所述金融业 务时产生的初始业 务操作数据; 对所述初始业 务操作数据进行 预处理, 得到所述多维度业 务操作数据。 4.根据权利要求3所述的方法, 其特征在于, 所述对所述初始业务操作数据进行预处 理, 得到所述多维度业 务操作数据包括: 验证所述初始业 务操作数据的完整性; 若所述初始业务操作 数据的完整性验证通过, 则对所述初始业务操作 数据进行归一化 处理, 得到所述多维度业 务操作数据。 5.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 所述业务类别识别模型的构建过 程包括: 获取构建样本集和测试样本集, 所述构建样本集和所述测试样本集均包含多个样本金 融业务的样本多维度业 务操作数据, 和各 所述样本金融业 务的业务风险类别标签; 根据所述构建样本集和所述测试样本集确定训练样本集; 将所述训练样本集输入至初始业务类别识别模型中, 对所述初始业务类别识别模型进 行训练, 直至所述初始业务类别识别模型满足预设的收敛条件, 得到所述业务类别识别模 型。 6.根据权利要求5所述的方法, 其特征在于, 所述初始业务类别识别模型包括初始特征 提取模块和初始学习器模块; 则将所述训练样本集输入至初始业务类别识别模型中, 对所述初始业务类别识别模型 进行训练, 直至所述初始业务类别识别模型满足预设的收敛条件, 得到所述业务类别识别 模型, 包括: 将所述测试样本集输入至所述初始特征提取模块中, 得到测试操作数据特征向量, 并 将所述测试操作数据特征向量输入至所述初始学习器模块中, 得到测试业务风险识别结权 利 要 求 书 1/2 页 2 CN 114998001 A 2果; 若所述初始学习器模块中的学习器总数量达到预设数量, 且所述测试业务风险识别结 果与标准业务风险识别结果之 间的误差小于预设值, 则确定所述初始业务类别识别模型满 足所述收敛 条件, 得到所述 业务类别识别模型。 7.根据权利要求6所述的方法, 其特征在于, 所述初始学习器模块包括第 一类型初始学 习器和级联在所述第一类型初始学习器之后的至少一个第二类型初始学习器; 将所述测试操作数据 特征向量输入至所述初始学习器模块中, 得到所述测试业务风险 识别结果, 包括: 将所述测试操作数据 特征向量输入至所述第 一类型初始学习器中, 得到第 一测试业务 风险识别结果, 并将所述测试操作数据特征向量和所述第一测试业务风险识别结果输入至 第一个第二类型初始学习器中, 得到第二测试业务风险识别结果, 以此类推, 得到最后一个 第二类型初始学习器输出的测试业 务风险识别结果。 8.根据权利要求5所述的方法, 其特征在于, 所述业务风险类别标签包括正样本标签和 负样本标签; 所述根据所述构建样本集和所述测试样本集确定训练样本集, 包括: 对所述构建样本集进行扩充, 得到更新后的构建样本集; 根据所述更新后的构建样本集和所述测试样本集确定所述训练样本集; 其中, 对所述构建样本集进行扩充, 得到更新后的构建样本集, 包括: 根据所述构建样本集中的各所述样本金融业务的业务风险类别标签, 从各所述样本多 维度业务操作数据中提取具有正样本标签的第一样本多维度业务操作数据和具有负样本 标签的第二样本多维度业 务操作数据; 反复多次执行样本筛选步骤, 得到更新后的构建样本集; 所述扩充后的构建样本集中 第一样本多维度业 务操作数据的数量和第二样本多维度业 务操作数据的数量相同; 其中, 所述样本筛选步骤为根据所述第一样本多维度业务操作数据的数量, 从所述第 二样本多维度业务操作数据中提取与所述第一样本多维度业务操作数据的数量相同的第 二样本多维度业 务操作数据。 9.一种业 务类别识别装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取目标用户在处 理金融业 务时产生的多维度业 务操作数据; 识别模块, 用于将所述多维度业务操作数据输入至预设的业务类别识别模型中, 得到 所述金融业务的业务风险类别识别结果; 所述业务类别识别模型包括第一类型学习器和 第 二类型学习器级联构成的学习器模块; 其中, 所述第一类型学习器用于根据第一分类算法对获取到的输入数据进行识别; 第 二类型学习器用于根据第二分类算法对获取到的输入数据进行识别。 10.一种计算机设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。 12.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1至8中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114998001 A 3

.PDF文档 专利 业务类别识别方法、装置、设备、存储介质和程序产品

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 业务类别识别方法、装置、设备、存储介质和程序产品 第 1 页 专利 业务类别识别方法、装置、设备、存储介质和程序产品 第 2 页 专利 业务类别识别方法、装置、设备、存储介质和程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:21:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。