说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210895584.8 (22)申请日 2022.07.26 (71)申请人 华润数字科技有限公司 地址 518000 广东省深圳市福田区梅林街 道梅都社区中康路136号深圳新一代 产业园2栋801 (72)发明人 王伟 董坤磊 肖海山 钟焰涛 陈焕坤 张黔 (74)专利代理 机构 深圳市精英专利事务所 44242 专利代理师 王暄 (51)Int.Cl. G06F 16/9535(2019.01) G06F 30/20(2020.01) G06F 16/35(2019.01)G06N 3/00(2006.01) G06F 111/06(2020.01) G06F 111/10(2020.01) G06F 111/04(2020.01) (54)发明名称 基于蚁群算法的文本模 型推荐方法、 装置及 相关设备 (57)摘要 本发明公开了基于蚁群算法的文本模型推 荐方法、 装置及相关设备。 该方法包括获取当前 待处理任务的文本数据, 并对文本数据进行指标 评估, 得到多个复杂指标; 通过蚁群算法对多个 复杂指标进行组合, 得到评估文本数据的最佳指 标组合; 根据最佳指标组合对文本数据的复杂 度 进行计算, 得到文本数据的当前复杂度; 获取多 个候选文本模 型, 并查询每一候选文本模型的算 法属性; 计算当前复杂 度与每一测试复杂 度的差 值, 以差值最小且符合当前待处理任务所属细分 领域的候选文本模型作为处理文本数据的目标 文本模型。 该方法有助于用户快速确定合适模型 进行数据处理, 减少不必要的训练开销。 权利要求书3页 说明书8页 附图1页 CN 115130004 A 2022.09.30 CN 115130004 A 1.一种基于蚁群算法的文本模型推荐方法, 其特 征在于, 包括: 获取当前待处理任务的文本数据, 并对所述文本数据进行指标评估, 得到多个复杂指 标; 通过蚁群算法对多个所述复杂指标进行组合, 得到评估所述文本数据的最佳指标组 合; 根据所述最佳指标组合对所述文本数据的复杂度进行计算, 得到所述文本数据的当前 复杂度; 获取多个候选文本模型, 并查询每一候选文本模型的算法属性, 所述算法属性至少包 括候选文本模型 所能处理的文本数据的测试复杂度; 计算当前复杂度与每一所述测试复杂度的差值, 以差值最小且符合当前待处理任务所 属细分领域的候选文本模型作为处 理所述文本数据的目标文本模型。 2.根据权利要求1所述的基于蚁群算法的文本模型推荐方法, 其特征在于, 所述复杂指 标包括类别多样性, 所述对所述文本数据进行指标评估, 得到多个复杂指标, 包括: 按如下公式计算所述文本数据的类别多样性: 其中, C_D表示类别多样性, C表示文本数据的类别总 数量, Pi2表示随机取类别i中的两 个样本的联合 概率。 3.根据权利要求1所述的基于蚁群算法的文本模型推荐方法, 其特征在于, 所述复杂指 标还包括类别均衡指数, 所述对所述文本数据进行指标评估, 得到多个复杂指标, 包括: 按如下公式计算所述文本数据的类别均衡指数: 其中, C_BI表示类别 均衡指数, C表示文本 数据的类别总数量, Ni表示类别i的样本 数量, Ntotal表示样本总数量。 4.根据权利要求1所述的基于蚁群算法的文本模型推荐方法, 其特征在于, 所述复杂指 标还包括类别干扰指数, 所述对所述文本数据进行指标评估, 得到多个复杂指标, 包括: 对所述文本数据进行停用词去除, 并将所述文本数据的文本拆分成若干个n ‑gram短 语; 计算每一所述n ‑gram短语的TF ‑IDF, 选取TF ‑IDF最高的K个短语, 并计算K个短语之间 的互信息和杰卡德距离, 以所述互信息和杰卡德距离作为所述类别干扰指数。 5.根据权利要求4所述的基于蚁群算法的文本模型推荐方法, 其特征在于, 所述复杂指 标还包括文本复杂指数, 所述对所述文本数据进行指标评估, 得到多个复杂指标, 包括: 对所述n‑gram短语进行去重, 统计不同n ‑gram短语的个数; 基于不同n ‑gram短语的个数及所述n ‑gram短语 的总数量对所述n ‑gram短语 的独特性 进行计算, 得到所述 n‑gram短语的独特性; 采用自然语言模型对所述文本数据进行困惑度计算, 得到困惑度; 以所述独特性和困惑度作为所述文本复杂指数。权 利 要 求 书 1/3 页 2 CN 115130004 A 26.根据权利要求1所述的基于蚁群算法的文本模型推荐方法, 其特征在于, 所述通过蚁 群算法对多个所述复杂指标进行组合, 得到 评估所述文本数据的最佳指标组合, 包括: 步骤1、 初始化蚁群算法的算法参数, 启用多个推理模块存放于不同的元素, 所述元素 为复杂指标; 步骤2、 计算每个推理模块的运动概率, 在禁忌表的约束下推理模块按运动概率选择下 个访问元 素, 直到访问形成可 行路径; 步骤3、 计算各推理模块经过的路径长度, 同时对每个推理模块所过的路径上的信 息素 浓度进行更新, 在所有推理模块完成信息素更新后, 记录当前迭代后的所有推理模块走过 路径中的最短路径; 步骤4、 判断当前迭代次数是否达到最大迭代次数, 若否, 返回步骤2; 若是, 结束迭代并 执行步骤5; 步骤5: 计算每次迭代后所有推理模块走过路径中的最短路径, 以最短路径上包含的元 素组合作为所述 最佳指标组合并输出。 7.根据权利要求6所述的基于蚁群算法的文本模型推荐方法, 其特征在于, 按如下公式 计算每一推理模块的运动概 率: 其中, 表示第k个推理模从当前所在元素移动到下一个元素的运动概率, 元素表示复 杂指标; τij(t)表示在第t轮迭代后元素i与 j之间边eij信息素的残留强度; ηij表示元素i与 j 之间的能见度; α表示信息启发因子; β 表示期望值启发式因子; Allowed为不在禁忌表 中的 元素集合, 禁忌表用于存放第k个 推理模块已选择的元 素。 8.一种基于蚁群算法的文本模型推荐装置, 其特 征在于, 包括: 获取模块, 用于获取当前待处理任务的文本数据, 并对所述文本数据进行指标评估, 得 到多个复杂指标; 组合模块, 用于通过蚁群算法对多个所述复杂指标进行组合, 得到评估所述文本数据 的最佳指标组合; 计算模块, 用于根据所述最佳指标组合对所述文本数据的复杂度进行计算, 得到所述 文本数据的当前复杂度; 查询模块, 用于获取多个候选文本模型, 并查询每一候选文本模型的算法属性, 所述算 法属性至少包括 候选文本模型 所能处理的文本数据的测试复杂度; 选择模块, 用于计算当前复杂度与每一所述测试复杂度的差值, 以差值最小且符合当 前待处理任务所属细分领域的候选文本模型作为处 理所述文本数据的目标文本模型。 9.一种计算机设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 中任一项所述的基于蚁群算法的文本模型推荐方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程权 利 要 求 书 2/3 页 3 CN 115130004 A 3
专利 基于蚁群算法的文本模型推荐方法、装置及相关设备
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 08:49:25
上传分享
举报
下载
原文档
(604.4 KB)
分享
友情链接
ISO IEC 27003-2017.pdf
DB11-T 1768-2020 建筑水表配置规范 北京市.pdf
SCIE 004-2021 智慧城市产业生态圈联盟标准.pdf
GB-T 24369.3-2017 金纳米棒表征 第3部分:表面电荷密度测量方法.pdf
GB-T 21254-2017 呼出气体酒精含量检测仪.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
汽车数据安全管理若干规定(试行).pdf
专利 政企数据融通的数联网系统.PDF
T-CAME 24—2020 数字化手术室建设标准.pdf
T-CITS 0020—2023 数字化实验室建设指南.pdf
GB-T 16457.2-2023 金刚石圆锯片基体 第2部分:用于烧结锯片.pdf
T-AHPCA 021—2021 聚乳酸可降解口罩.pdf
DB11-T 715-2018 公共汽电车场站功能设计要求 北京市.pdf
DB37-T 4614.1—2023 “爱山东”政务服务平台移动端 第1部分:总体架构 山东省.pdf
国测 电信和互联网行业数据安全治理白皮书 2020.pdf
GB-T 41885-2022 浮空器分类和分级.pdf
GB-T 26758-2011 铅、锌冶炼企业节能规范.pdf
GB-T 27025-2019 检测和校准实验室能力的通用要求.pdf
GB-T 31072-2014 科技平台 统一身份认证.pdf
T-GDCKCJH 058—2022 汽车域控制器(DCU)自动化测试线通用要求.pdf
交流群
-->
1
/
3
13
评价文档
赞助2元 点击下载(604.4 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。