国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211506901.9 (22)申请日 2022.11.29 (71)申请人 城云科技 (中国) 有限公司 地址 310052 浙江省杭州市滨江区长河街 道江南大道588号恒 鑫大厦主楼17层、 18层 (72)发明人 毛云青 雷卓 彭大蒙 张香伟 (74)专利代理 机构 杭州汇和信专利代理有限公 司 33475 专利代理师 吴琰 (51)Int.Cl. G06V 30/412(2022.01) G06V 30/14(2022.01) G06V 30/19(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于单元格约束的表格结构识别方法及其 应用 (57)摘要 本申请提出了基于单元格约束的表格结构 识别方法及其应用, 包括以下步骤: 根据表格类 型将不同的表格图像输入到对应的目标检测模 型中, 以输出对应表格的位置信息; 根据表格的 位置信息, 获取表格的整行和整列的信息, 该信 息包括每行和每列的任意两个不相邻的顶点的 坐标; 识别表格中的所有文本及其边框; 通过机 器翻译方法获取表格的表格结构信息; 根据表格 的位置信息、 表 格的整行和整列的信息及表格的 表格结构信息, 修正表格中的单元格; 对修正后 的表格中单元格的坐标进行聚类, 以生成表格的 单元格结构。 本申请具有可结合任意一种光学符 号识别方法, 通过完整的表格识别技术, 端到端 地从电子文档中分析表格结构。 权利要求书2页 说明书8页 附图2页 CN 115546809 A 2022.12.30 CN 115546809 A 1.基于单 元格约束的表格结构识别方法, 其特 征在于, 包括以下步骤: S00、 根据表格类型将不同的表格图像输入到对应的目标检测模型中, 以输出对应表格 的位置信息; 其中, 表格的位置信息包括表格的任意两个不相 邻的顶点的坐标, 表格的类型 分为有框表格和无框表格; S10、 根据所述表格的位置信息, 获取所述表格的整行和整列的信息, 该信息包括每行 和每列的任意两个不相邻的顶点的坐标; S20、 识别所述表格中的所有 文本及其 边框; S30、 通过机器翻译方法获取所述表格的表格结构信息, 该表格结构信息包括行列数量 和布局信息; S40、 根据 所述表格的位置信息、 所述表格的整行和整列的信息及所述表格的表格结构 信息, 修正所述表格中的单元格, 其中该修正的手段包括补全 单元格、 合并单元格及 去除单 元格; S50、 对修正后的所述表格中单 元格的坐标进行聚类, 以生成所述表格的单 元格结构。 2.如权利要求1所述的基于单元格约束的表格结构识别方法, 其特征在于, 步骤S00中, 通过计算所述表格外的单元格数量和所述表格内的单元格数量的差值来得到所述表格的 边界, 以该边界作为所述表格的边框, 从而输出对应表格的位置信息 。 3.如权利要求1所述的基于单元格约束的表格结构识别方法, 其特征在于, 步骤S30中, 根据所述表格图像的单元格位置, 使得所述表格图像与文本位置对齐, 并分别在垂直和水 平方向采样, 以确定所述表格的行 数和列数。 4.如权利要求3所述的基于单元格约束的表格结构识别方法, 其特征在于, 在步骤S30 中, 在垂直方向采样之前, 在不与现有 单元格重叠的情况下展开单元格的左右 边缘, 以确定 缺少单元格的行, 并在确定所述表格的行数和列数后, 通过找出与已知单元格最接近完整 对齐的单 元格边框, 从而推断出表格垂直和水平的对齐方式, 该对齐方式作为布局信息 。 5.如权利要求4所述的基于单元格约束的表格结构识别方法, 其特征在于, 步骤S40中, 对单元格边框进行聚类, 以确定每行和每列的位置, 并根据每个单元格的框位置分配行和 列的位置, 以合并单 元格。 6.如权利要求5所述的基于单元格约束的表格结构识别方法, 其特征在于, 步骤S40中, 根据单元格的文本内容确定单元格的逻辑关系, 以再次合并单元格, 并将单元格位置分配 给与任何检测到的单 元格不重 叠的剩余文本 框, 同时拆分附近有间隙的单 元格。 7.如权利要求6所述的基于单元格约束的表格结构识别方法, 其特征在于, 步骤S40中, 当文本的边框与相邻的空行或列相交时, 增 加单元格的行或列的跨度。 8.一种基于单 元格约束的表格结构识别装置, 其特 征在于, 包括: 输入模块, 根据表格 类型将不同的表格图像输入到对应的目标检测模型中; 目标检测模块, 用于根据输入的表格图像, 通过对应的目标检测模型输出对应表格的 位置信息; 其中, 表格的位置信息包括表格的任意两个不相 邻的顶点的坐标, 表格的类型分 为有框表格和无框表格; 行列信息获取模块, 用于根据表格的位置信 息, 获取表格的整行和整列的信息, 该信 息 包括每行和每列的任意两个不相邻的顶点的坐标; 文本识别模块, 用于识别表格中的所有 文本及其 边框;权 利 要 求 书 1/2 页 2 CN 115546809 A 2机器翻译模块, 用于通过机器翻译方法获取表格的表格结构信息, 该表格结构信息包 括行列数量和布局信息; 修正模块, 用于根据表格的位置信息、 表格的整行和整列的信息及表格的表格结构信 息, 修正表格中的单 元格, 其中该修 正的手段包括补全单 元格、 合并单 元格及去除单 元格; 聚类输出模块, 用于对修正后的表格中单元格的坐标进行聚类, 以生成输出表格的单 元格结构。 9.一种电子装置, 包括存储器和处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处理器被设置为运行所述计算机程序以执行权利要求1至7任一项所述的基于单元 格约束的表格结构识别方法。 10.一种可读存储介质, 其特征在于, 所述可读存储介质中存储有计算机程序, 所述计 算机程序包括用于控制过程以执行过程的程序代码, 所述过程包括根据权利要求1至7任一 项所述的基于单 元格约束的表格结构识别方法。权 利 要 求 书 2/2 页 3 CN 115546809 A 3
专利 基于单元格约束的表格结构识别方法及其应用
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:23:42
上传分享
举报
下载
原文档
(894.4 KB)
分享
友情链接
T-CESA 1041—2019 信息技术 人工智能 服务能力成熟度评价参考模型.pdf
T-CSTM 00837—2022 材料基因工程数据 元数据标准化基本原则与方法.pdf
TB-T 3100.1-2017 铁路数字信号电缆 第1部分:一般规定.pdf
GB-T 33130-2016 高标准农田建设评价规范.pdf
T-CACM 1362—2021 中药饮片临床应用规范.pdf
GB-T 14986.4-2018 软磁合金 第4部分:铁铬合金.pdf
DB14-T 2280-2021 时代云运维规范 山西省.pdf
GB-T 32920-2023 信息安全技术 行业间和组织间通信的信息安全管理 ISO 27010-2015.pdf
DB15-T 1878—2020 沙化草地治理技术规范 内蒙古自治区.pdf
DB11-T 945.1-2023 建设工程施工现场安全防护、场容卫生及消防保卫标准 第1部分:通则 北京市.pdf
GB-T 42467.5-2023 中医临床名词术语 第5部分:骨伤科学.pdf
GB-T 15610-2008 同色异谱的目视评价方法.pdf
DB4113-T 068-2024 饲养禽类前殖吸虫病防治技术规范 南阳市.pdf
T-CSZFC 1—2022 慈善组织食品捐赠规范.pdf
T-ZJCX 0019—2022 鼻腔护理液.pdf
GB-T 30520-2014 会议分类和术语.pdf
GB-T 37027-2018 信息安全技术 网络攻击定义及描述规范.pdf
T-GZAS 018—2022 数据要素安全可信流通技术标准.pdf
安芯网盾 2022年实网攻防演练蓝队防守指南.pdf
GB-T 30582-2014 基于风险的埋地钢质管道外损伤检验与评价.pdf
1
/
13
评价文档
赞助2.5元 点击下载(894.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。