国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211545575.2 (22)申请日 2022.12.05 (71)申请人 湖南工商大 学 地址 410006 湖南省长 沙市岳麓区岳麓 大 道569号 (72)发明人 熊曙初 吴佳妮 李轩 孟晗 殷琪 段金焱 方诺基 (74)专利代理 机构 北京智宇 正信知识产权代理 事务所(普通 合伙) 11876 专利代理师 黄敏华 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06F 40/242(2020.01) G06F 40/284(2020.01)G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 用于文本情感分析的对比优化编解码模型 及方法 (57)摘要 本发明公开了用于文本情感分析的对比优 化编解码模型及方法, 包括: 将通过预处理分词 模块预处理分词后的文本编码为序列表征向量, 并计算有监督对比学习损失; 对序列表征向量进 行局部语义抽取与强化, 得到相应的特征强化向 量; 对特征强化向量进行解码, 得到解码结果并 最终输出模 型判定的文本情感类别, 并对模型判 定的文本情感类别与数据集标签计算分类损失, 有监督对比学习损失和分类损失的联合损失为 模型联合优化损失, 通过模型联合优化损失与小 批量随机梯度下 降方法更新模型各项参数矩 阵 与自适应系数后, 使用优化模型对输入的文本进 行情感分析; 实现一文多义文本的语义分离、 有 效提升文本分析精确度。 权利要求书4页 说明书11页 附图4页 CN 115544260 A 2022.12.30 CN 115544260 A 1.用于文本情感分析的对比优化编解码模型, 其特 征在于, 包括: 编码对比层: 通过预处理分词模块对文本进行预处理分词, 通过自注意力模块和前馈 编码模块将预处 理分词后的文本编码为序列表征向量, 并计算有监 督对比学习损失; 自适应特征强化层: 对序列表征向量进行局部语义抽取与强化, 得到相应的特征强化 向量; 解码输出层; 将特征强化向量进行解码, 得到解码结果并最终输出模型判定的文本情 感类别, 并对 模型判定的文本情感类别与数据集标签 计算分类损失; 以及 优化分析层: 有监督对比学习损 失和分类损 失的联合损 失为模型联合优化损 失, 通过 模型联合优化损失与小批量随机梯度下降方法更新模型各项参数矩阵与自适应系数后, 使 用优化模型对输入的文本进行情感分析。 2.根据权利要求1所述的用于文本情感分析的对比优化编解码模型, 其特征在于, 所述 编码对比层包括: 对文本进行预处理分词 得到文本序列的预处理分词阶段; 以及将预处理 后的文本编码为序列表征向量, 并计算有监 督对比学习损失的编码对比阶段; 其中, 所述编码对比阶段包括: S2.1: 将待分析文本映射为词向量 、 编码向量 、 句间分隔向量 , 三 种向量相加得到 输入向量 , S2.2: 将输入向量 传输至自注意力模块, 计算文本序列中上下文语义之间关联程 度, 得到注意力序列 , 其中, 为信息文本批量大小, 为序列字符长度, 为词向量维度, 、 与 为注 意力权重矩阵, 与 相乘得到注意力权 重变量 、 , 为向量 的维度; S2.3: 将注意力序列 传输至前馈编码模块, 进行维度转化与随机丢弃; 根据不同的丢 弃率 对同一注意力序列 进行两次编码得到序列表征向量 与 ,权 利 要 求 书 1/4 页 2 CN 115544260 A 2其中, 为具有单隐藏层的全连接层; S2.4: 将序列 表征向量 、 及批量大小 中具有相同标签 的 共同组成正样 本对 , 剩余样本构成负 样本对 计算有监 督对比学习 , 其中, 是数据集样本总数, 为超参数, 计算公式如下: 。 3.根据权利要求2所述的用于文本情感分析的对比优化编解码模型, 其特征在于, 所述 自注意力模块将向量 作为输入, 计算文本序列中上下文语义之间关联程度, 得到注意 力序列 , 其中 , 为信息文本批量大小, 为序列字符长度, 为词向量 维度。 4.根据权利要求3所述的用于文本情感分析的对比优化编解码模型, 其特征在于, 所述 前馈编码模块将注意力序列 作为输入, 进行维度转化与随机丢弃; 根据不同的丢弃率 对同一注意力序列 进行两次编码得到序列表征向量 与 。 5.根据权利要求2所述的用于文本情感分析的对比优化编解码模型, 其特征在于, 所述 自适应特征强化层对 输入的序列表征向量 进行局部语 义抽取与强化, 得到相应的特征强 化向量 , 包括: S3.1: 将隐藏状态 与细胞状态 初始化为0, 当前时刻输入为 , 此时为从左至右 遍历 取得的文本表征向量, 运 算得到 、 、 、 四种候选状态:权 利 要 求 书 2/4 页 3 CN 115544260 A 3
专利 用于文本情感分析的对比优化编解码模型及方法
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:23:39
上传分享
举报
下载
原文档
(931.0 KB)
分享
友情链接
T-CERS 0002—2022 民用改性甲醇燃料.pdf
DB6103-T 23-2020 公共机构节能工作考核规范 宝鸡市.pdf
GB-T 17145-1997 废润滑油回收与再生利用技术导则.pdf
GB-T 16946-2017 短波单边带通信设备通用规范.pdf
GB-T 9473-2017 读写作业台灯性能要求.pdf
GB-T 36620-2018 面向智慧城市的物联网技术应用指南.pdf
GB-T 18103-2022 实木复合地板.pdf
GB-T 16920-2015 玻璃 平均线热膨胀系数的测定.pdf
GB-T 39620-2020 沿海船舶自动识别系统 AIS 基站技术要求.pdf
GB-T 32926-2016 信息安全技术 政府部门信息技术服务外包信息安全管理规范.pdf
DB6101-T 3189-2024 检验检测数据管理规范 数据安全 西安市.pdf
GB-T 16264.8-2005 信息技术 开放系统互连 目录 第8部分 公钥和属性证书框架.pdf
GB-T 39662-2020 基金行业数据集中备份接口规范.pdf
GM-T 0024-2014 SSL VPN技术规范.pdf
汇丰科技周纪海 大型银行DevSecOps体系建设和落地实践 2021 .pdf
T-SESA 0003—2022 电竞场馆建设规范.pdf
GB-T 36627-2018 信息安全技术 网络安全等级保护测试评估技术指南.pdf
GB-T 36625.1-2018 智慧城市 数据融合.pdf
T-CSAE 190.4—2021 汽车用轮毂电动轮总成可靠性试验方法.pdf
GBT 4109-2022 交流电压高于1000V的绝缘套管.pdf
1
/
20
评价文档
赞助2.5元 点击下载(931.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。