文本处理方法、装置、设备和存储介质与流程

文档序号:36698496发布日期:2024-01-16 11:34阅读:来源:国知局

技术特征:

1.一种文本处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个预设关系信息提取所述待处理文本数据对应的至少一个目标开放关系信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述从所述第一预设关系信息中提取第一开放关系和所述开放主体,包括:

5.根据权利要求2所述的方法,其特征在于,所述从所述第二预设关系信息中提取第二开放关系和所述开放客体,包括:

6.根据权利要求1所述的方法,其特征在于,所述预设关系信息还包括第三预设关系信息,所述第三预设关系信息包括第五文本短语、第三预设关系,第六文本短语,所述第三预设关系用于描述所述第五文本短语和所述第六文本短语之间的关系;

7.根据权利要求6所述的方法,其特征在于,所述基于所述第三预设关系信息提取校验开放主体和校验开放客体,包括:

8.根据权利要求1-7中任一项所述方法,其特征在于,所述预设关系信息以预设关系三元组的形式表示,所述目标开放关系信息以目标开放关系三元组的形式表示。

9.根据权利要求1所述的方法,其特征在于,所述方法还包括:

10.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第一类认知关系信息,所述第一类认知关系信息包括:第一认知主体、第一认知关系、第一认知客体;

11.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第二类认知关系信息,所述第二类认知关系信息包括:第二认知主体、第二认知关系、第二认知客体;

12.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第三类认知关系信息,所述第三类认知关系信息包括:第三认知主体、第三认知关系、第三认知客体;

13.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第四类认知关系信息,所述第四类认知关系信息包括:第四认知主体、第四认知关系、第四认知客体;

14.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第五类认知关系信息,所述第五类认知关系信息包括:第五认知主体、第五认知关系、第五认知客体;

15.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第六类认知关系信息,所述第六类认知关系信息包括:第六认知主体、第六认知关系、第六认知客体;

16.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息中包括第七类认知关系信息,所述第七类认知关系信息包括:第七认知主体、第七认知关系、第七认知客体;

17.根据权利要求9-16中任一项所述的方法,其特征在于,所述泛化认知关系信息中包括第八类认知关系信息,其中,所述第八类认识关系信息包括:第八认知主体、第八认知关系、第八认知客体;

18.根据权利要求9所述的方法,其特征在于,所述泛化认知关系信息以泛化认知关系三元组的形式表示。

19.一种文本处理装置,其特征在于,包括:

20.根据权利要求19所述的装置,其特征在于,所述开放关系信息提取模块,包括:

21.根据权利要求20所述的装置,其特征在于,所述开放关系信息提取模块,还包括:

22.根据权利要求19所述的装置,其特征在于,所述装置还包括:泛化认知关系信息提取模块,用于基于预设泛化认知关系提取所述待处理文本数据中的泛化认知关系信息,其中,所述泛化认知信息中包括:泛化认知主体、泛化认知关系、泛化认知客体,所述泛化认知关系用于描述所述泛化认知主体与所述泛化认知客体之间的通用语义认知关系。

23.一种电子设备,其特征在于,所述电子设备包括:

24.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-18中任一项所述的文本处理方法。


技术总结
本公开涉及一种文本处理方法、装置、设备和存储介质,该方法包括:获取待处理文本数据中的至少一个预设关系信息,其中,所述预设关系信息包括第一预设关系信息和/或第二预设关系信息;基于所述至少一个预设关系信息提取所述待处理文本数据对应的至少一个目标开放关系信息;基于预设泛化认知关系提取所述待处理文本数据中的泛化认知关系信息。本公开的技术方案,提出一种能够对文本数据做全面结构化的通用性方法,更接近认知层次,解决当前文本信息结构化方法在认知层面全面性、通用性较差的问题。

技术研发人员:陈建忠
受保护的技术使用者:陈建忠
技术研发日:
技术公布日:2024/1/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1