表格属性提取方法、装置、电子设备及存储介质与流程

文档序号:35962599发布日期:2023-11-09 01:26阅读:40来源:国知局
表格属性提取方法、装置、电子设备及存储介质与流程

本发明涉及计算机,具体涉及一种表格属性提取方法、装置、电子设备及存储介质。


背景技术:

1、cad软件在建筑工程、装饰设计、水电工程、模具设计以及电路板设计等多种领域都有非常广泛的应用,对cad图纸内容的提取在工业过程中有至关重要的作用。在实际应用时,cad图纸中可能包含很多表格内容,用户需要提取出表格中的对应内容进行分析以便进行下一步的工作。

2、现有技术中,在对cad图纸进行识别时,对于复杂表格比如交叉表常常无法正确抽取出所有属性标签,丢失部分属性值,使得无法构建复杂表格中多个属性标签与其值的对应关系,影响用户对表格属性提取的准确率以及效率。


技术实现思路

1、有鉴于此,本发明实施例提供了一种表格属性提取方法、装置、电子设备及存储介质,以解决提取表格属性时丢失部分属性的问题。

2、根据第一方面,本发明实施例提供了一种表格属性提取方法,包括:

3、获取目标重建表格以及目标属性标签,所述目标重建表格为对目标图纸中的表格进行重建后得到的;

4、基于所述目标属性标签对所述目标重建表格的各行以及各列的标签进行匹配,确定所述各行以及各列的标签中属于所述目标属性标签的数量,以确定各行以及各列中所述目标属性标签的占比;

5、基于所述占比与各个类型表格的样式特征的关系,确定所述目标重建表格的表格类型;

6、根据所述表格类型以及所述各行以及各列标签的位置关系,确定所述目标重建表格中每个单元格的目标属性标签并提取所述目标属性标签对应的属性值。

7、本发明实施例提供的表格属性提取方法,基于从目标图纸中获得的目标重建表格,通过对目标属性标签对各行和各列的标签进行匹配,并根据目标属性标签的数量得到行和列中各个目标属性标签的占比,根据占比与各个类型表格的样式特征的关系来确定表格类型以及各个目标属性标签的位置关系,从而得到目标重建表格中每个单元格的目标属性标签并得到每个目标属性标签对应的属性值,提高了表格标签与其对应属性提取的效率,减小丢失属性值的概率。

8、结合第一方面,在第一方面第一实施方式中,基于所述目标属性标签对所述目标重建表格的各行以及各列的标签进行匹配,确定所述各行以及各列的标签中属于所述目标属性标签的数量,以确定各行以及各列中所述目标属性标签的占比,包括:

9、将所述目标重建表格的各行以及各列的标签与所述目标属性标签进行匹配,确定所述各行以及各列的标签中属于所述目标属性标签的数量;

10、将所述各行以及各列的标签中属于所述目标属性标签的数量与阈值进行比较,确定所述各行以及各列对应的目标属性标签;

11、基于所述各行以及各列对应的目标属性标签的数量计算各行以及各列中所述目标属性标签的占比。

12、本发明实施例提供的表格属性提取方法,通过确定各行与各列中的目标属性标签的数量并将该数量与预设阈值比较,从而确定各行与各列的对应目标属性标签,进而确定各行以及各列中目标属性标签的占比。其中,阈值可以基于实际需求进行设定,使得本方案提供的表格属性提取方法适应性与灵活性更强。

13、结合第一方面第一实施方式,在第一方面第二实施方式中,将所述目标重建表格的各行以及各列的标签与所述目标属性标签进行匹配,确定所述各行以及各列的标签中属于所述目标属性标签的数量,包括:

14、获取所述目标重建表格的各行以及各列对应的文本向量;

15、将所述文本向量中的各个元素与所述目标属性标签的模式进行匹配,确定所述各行以及各列的标签中属于所述目标属性标签的数量。

16、结合第一方面第一实施方式,在第一方面第三实施方式中,基于所述各行以及各列对应的目标属性标签的数量计算所述目标属性标签的占比,包括:

17、统计所有行对应的各目标属性标签的数量记为第一数量,并统计所有列对应的各目标属性标签的数量记为第二数量;

18、计算所述第一数量与所述目标重建表格中对应的表格非空行数的比值,并计算所述第二数量与所述目标重建表格中对应的表格非空列数的比值,确定行标签中各目标属性标签的占比以及列标签中各目标属性标签的占比。

19、结合第一方面第三实施方式,在第一方面第四实施方式中,基于所述占比与各个类型表格的样式特征的关系,确定所述目标重建表格的表格类型,包括:

20、根据所述行标签占比的分布关系及所述列标签占比的分布关系与各个类型表格的样式特征关系,确定所述目标重建表格的表格类型。

21、本发明实施例提供的表格属性提取方法,通过分析行标签占比和列标签占比以及各种类型的表格的样式特征来确定目标重建表格的类型,为后续的属性值提取提供依据。

22、结合第一方面,在第一方面第五实施方式中,当所述表格类型为交叉表时,所述根据所述表格类型以及所述各行以及各列标签的位置关系,确定所述目标重建表格中每个单元格的目标属性标签,包括:

23、根据所述表格类型以及目标属性标签的占比确定所述目标重建表格中交叉标签的位置;

24、基于所述交集标签的位置以及表格类型,确定所述目标重建表格中其它标签与所述交集标签的位置关系,以得到各行以及各列目标属性标签的位置关系;

25、根据所述各行以及各列标签的位置关系,确定所述目标重建表格中每个单元格的目标属性标签。

26、本发明实施例提供的表格属性提取方法,在表格类型为交叉表时,首先通过目标属性标签的占比来确定交叉标签的位置,基于交叉表的自身属性以及得到的交叉标签位置,来确定目标重建表格中其他标签与交叉标签的位置关系,进而得到各个标签与交叉标签的位置关系,即可得到目标重建表格中每个单元格的目标属性标签。

27、结合第一方面第五实施方式,在第一方面第六实施方式,提取所述目标属性标签对应的属性值,包括:

28、基于所述交叉标签的位置确定基准单元格;

29、以所述基准单元格为起点检索所述目标重建表格,确定所述目标重建表格中每个单元格对应的属性值;

30、根据所述目标重建表格中每个单元格对应的属性值以及每个单元格的目标属性标签,提取所述目标属性标签对应的属性值。

31、本发明实施例提供的表格属性提取方法,当目标重建表格为交叉表,在确定了目标重建表格中每个单元格的目标属性标签后,通过已确定的交叉标签来确定基准单元格,基于基准单元格检索目标重建表格,从而实现对目标属性标签的属性值的提取,提升了表格属性提取的准确率和效率。

32、根据第二方面,本发明实施例提供了一种表格属性提取装置,其特征在于,所述装置包括:

33、获取模块,用于获取目标重建表格以及目标属性标签,所述目标重建表格为对目标图纸中的表格进行重建后得到的;

34、占比确定模块,用于基于所述目标属性标签对所述目标重建表格的各行以及各列的标签进行匹配,确定所述各行以及各列的标签中属于所述目标属性标签的数量,以确定各行以及各列中所述目标属性标签的占比;

35、类型确定模块,用于基于所述占比与各个类型表格的样式特征的关系,确定所述目标重建表格的表格类型;

36、属性提取模块,用于根据所述表格类型以及所述各行以及各列标签的位置关系,确定所述目标重建表格中每个单元格的目标属性标签并提取所述目标属性标签对应的属性值。

37、根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或第一方面的任意一种实施方式中所述的表格属性提取方法。

38、根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的表格属性提取方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1