用于语义文本分割的方法和系统与流程

文档序号:34106602发布日期:2023-05-10 20:22阅读:33来源:国知局
用于语义文本分割的方法和系统与流程

本发明构思总体上涉及人工智能系统,并且更具体地,涉及人工智能系统中的语义文本分割的使用。


背景技术:

1、文本分割是将书面文本划分为有意义的单元(诸如,词语、句子或主题)的处理。在长文本文档(诸如,新闻文章和杂志文章)中,通常讨论多个主题,并且即使有标题,也只有很少的标题。基于主题分割文档的能力可使用户不是访问和分析整个文档,而是可使用户能够访问和分析文档中的子主题。这些按主题分割的文档的使用在数据的相关有意义部分的检索和提高数据的检索准确性方面有应用。然而,因为可以以包括使用不同语言、不同字体、不同排列(例如,列、表等)等的许多方式写入文本,所以语义分割可能具有挑战性。此外,一些人工智能系统不同地注解文本——一些人工智能系统通过字符注解文本,另一些人工智能系统通过词语注解文本。现有系统通常使用用于文本检测和/或文本识别的专用网络或系统注解文本。这些网络或系统通常专注于文本组或者词语/字符注解。


技术实现思路

1、根据本发明构思的一些实施例,一种方法包括:接收源文本的二进制注解;使用初始内核尺寸对所述二进制注解执行闭运算以生成闭合注解;分别使用一个或更多个边界框在所述闭合注解中定义一个或更多个轮廓;确定所述一个或更多个轮廓的由相应边界框内的文本占据的面积的比例超过阈值的子集;以及基于所述一个或更多个轮廓的所述子集来生成所述源文本的最终注解。

2、在其他实施例中,接收所述源文本的所述二进制注解的步骤包括:接收源文本的原始注解;以及将源文本的所述原始注解转换为源文本的所述二进制注解。

3、在其他实施例中,所述方法还包括:执行以下操作:执行所述闭运算,定义所述一个或更多个轮廓,以及针对所述一个或更多个轮廓的所述子集中的各个轮廓,以迭代方式确定所述一个或更多个轮廓的所述子集,直到所述一个或更多个轮廓中的所有轮廓均被包括在所述一个或更多个轮廓的所述子集中。

4、在其他实施例中,所述方法还包括:随着每一次连续迭代减小所述初始内核尺寸。

5、在其他实施例中,所述方法还包括:针对所述一个或更多个轮廓的所述子集中的各个轮廓,确定当应用于所述二进制注解时的相应边界框内的文本占据的面积的比例,以生成多个原始文本比例;将所述一个或更多个轮廓的所述子集合并为合并注解;针对所述一个或更多个轮廓的所述子集中的各个轮廓,确定当应用于所述合并注解时的相应边界框内的文本占据的面积的比例,以生成多个合并文本比例;对所述合并注解进行膨胀以生成膨胀的合并注解;以及针对所述一个或更多个轮廓的所述子集中的各个轮廓,确定当应用于所述膨胀的合并注解时的相应边界框内的文本占据的面积的比例,以生成多个膨胀的合并文本比例。

6、在其他实施例中,所述阈值是第一阈值;并且生成所述最终注解的步骤包括:当相应的合并文本比例比相应的原始文本比例大第二阈值并且相应的膨胀的合并文本比例比相应的合并文本比例大第三阈值时,使用当应用于所述膨胀的合并注解时的所述一个或更多个轮廓的所述子集中的各个轮廓来生成所述最终注解;以及当相应的合并文本比例不比相应的原始文本比例大第二阈值或者相应的膨胀的合并文本比例不比相应的合并文本比例大第三阈值时,使用当应用于所述合并注解时的所述一个或更多个轮廓的所述子集中的各个轮廓来生成所述最终注解。

7、在其他实施例中,生成最终注解的步骤还包括:沿着在第一方向上延伸的第一线或沿着在垂直于第一方向的第二方向上延伸的第二线划分所述最终注解,以创建第一部分和第二部分;使用针对第一部分内的文本的第一矩形边界框来定义第一轮廓,并且使用针对第二部分内的文本的第二矩形边界框来定义第二轮廓;针对第一轮廓和第二轮廓中的每一个,确定由相应的第一矩形边界框或第二矩形边界框内的文本占据的面积的比例是否超过第四阈值,其中,所述一个或更多个轮廓的所述子集包括第一轮廓和第二轮廓中的由相应的边界框内的文本占据的面积的比例超过第四阈值的各个轮廓。

8、在其他实施例中,执行所述闭运算的步骤包括:对所述二进制注解执行膨胀以生成膨胀的二进制注解;以及对所述膨胀的二进制注解执行腐蚀以生成所述闭合注解。

9、在其他实施例中,分别使用一个或更多个边界框在所述闭合注解中定义所述一个或更多个轮廓的步骤包括:基于文本分组中的相邻文本分组之间的距离,将所述闭合注解划分为所述文本分组;其中,所述文本分组与所述一个或更多个轮廓相应。

10、在本发明构思的一些实施例中,一种方法包括:接收源文本的二进制注解;沿着在第一方向上延伸的第一线或沿着在垂直于第一方向的第二方向上延伸的第二线划分所述二进制注解,以创建第一部分和第二部分;使用针对第一部分内的文本的第一边界框来定义第一轮廓,并且使用针对第二部分内的文本的第二边界框来定义第二轮廓;确定第一轮廓和第二轮廓的由第一边界框或第二边界框内的文本占据的比例面积超过阈值的子集;以及基于第一轮廓和第二轮廓的所述子集来生成所述源文本的最终注解。

11、在另外的实施例中,划分所述二进制注解的步骤包括:基于第一文本分组与第二文本分组之间的沿第一方向或第二方向的距离,将所述二进制注解划分为第一文本分组和第二文本分组;其中,第一文本分组和第二文本分组分别与第一轮廓和第二轮廓相应。

12、在另外的实施例中,将所述二进制注解划分为第一文本分组和第二文本分组的步骤包括:当第一文本分组与第二文本分组之间的沿第一方向或第二方向的所述距离超过距离阈值时,将所述二进制注解划分为第一文本分组和第二文本分组。

13、在另外的实施例中,所述方法还包括:执行以下操作:划分所述二进制注解,定义第一轮廓和第二轮廓,以及针对第一轮廓和第二轮廓中的由相应的边界框内的文本占据的面积的比例不超过所述阈值的各个轮廓,以迭代方式确定第一轮廓和第二轮廓的所述子集,直到第一轮廓和第二轮廓中的所有轮廓均被确定为在第一轮廓和第二轮廓的所述子集中或者被确定为不具有在其中的超过所述距离阈值的第一文本分组和第二文本分组。

14、在另外的实施例中,生成所述最终注解的步骤包括:使用第一轮廓和第二轮廓的所述子集中的各个轮廓以及第一轮廓和第二轮廓中的在其中的第一文本分组与第二文本分组之间的距离不超过所述距离阈值的各个轮廓,来生成所述最终注解。

15、在本发明构思的一些实施例中,一种系统包括:处理器;以及存储器,连接到所述处理器并且包括实现在所述存储器中的能够由所述处理器运行以执行操作的计算机可读程序代码,其中,所述操作包括:接收源文本的二进制注解;使用初始内核尺寸对所述二进制注解执行闭运算以生成闭合注解;分别使用一个或更多个边界框在所述闭合注解中定义一个或更多个轮廓;确定所述一个或更多个轮廓的由相应边界框内的文本占据的面积的比例超过阈值的子集;以及基于所述一个或更多个轮廓的所述子集来生成所述源文本的最终注解

16、在其他实施例中,所述操作还包括:执行以下操作:执行以下操作:执行所述闭运算,定义所述一个或更多个轮廓,以及针对所述一个或更多个轮廓的所述子集中的各个轮廓以迭代方式确定所述一个或更多个轮廓的所述子集,直到所述一个或更多个轮廓中的所有轮廓被包括在所述一个或更多个轮廓的所述子集中。

17、在其他实施例中,所述操作还包括:随着每一次连续迭代减小所述初始内核尺寸。

18、在其他实施例中,所述操作还包括:针对所述一个或更多个轮廓的所述子集中的各个轮廓,确定当应用于所述二进制注解时的相应边界框内的文本占据的面积的比例,以生成多个原始文本比例;将所述一个或更多个轮廓的所述子集合并为合并注解;针对所述一个或更多个轮廓的所述子集中的各个轮廓,确定当应用于所述合并注解时的相应边界框内的文本占据的面积的比例,以生成多个合并文本比例;对所述合并注解进行膨胀以生成膨胀的合并注解;以及针对所述一个或更多个轮廓的所述子集中的各个轮廓,确定当应用于所述膨胀的合并注解时的相应边界框内的文本占据的面积的比例,以生成多个膨胀的合并文本比例。

19、在其他实施例中,所述阈值是第一阈值;以及生成所述最终注解的步骤包括:当相应的合并文本比例比相应的原始文本比例大第二阈值并且相应的膨胀的合并文本比例比相应的合并文本比例大第三阈值时,使用当应用于所述膨胀的合并注解时的所述一个或更多个轮廓的所述子集中的各个轮廓来生成所述最终注解;以及当相应的合并文本比例不比相应的原始文本比例大第二阈值或者相应的膨胀的合并文本比例不比相应的合并文本比例大第三阈值时,使用当应用于所述合并注解时的所述一个或更多个轮廓的所述子集中的各个轮廓来生成所述最终注解。

20、在其他实施例中,执行所述闭运算的步骤包括:对所述二进制注解执行膨胀以生成膨胀的二进制注解;以及对所述膨胀的二进制注解执行腐蚀以生成所述闭合注解。

21、通过阅读以下附图和详细描述,根据本发明构思的实施例的其他方法、系统、制品和/或计算机程序产品对于本领域技术人员将是或变得显而易见。所有这样的另外的系统、方法、制品和/或计算机程序产品旨在被包括在本说明书内,在本发明主题的范围内,并且由所附权利要求保护。还旨在本文公开的所有实施例可单独实现或以任何方式和/或组合进行组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1