信息处理方法及信息处理装置、电子设备、存储介质与流程

文档序号:34238625发布日期:2023-05-24 23:56阅读:43来源:国知局
信息处理方法及信息处理装置、电子设备、存储介质与流程

本公开涉及信息处理,特别涉及一种信息处理方法及信息处理装置、电子设备、存储介质。


背景技术:

1、在传统型企业中,明确的实体一般采用标准实体名称。但在实际的业务场景下,很多情况会用到它的别名或是其他形式的非标准化表述,比如“学生平安保险”常在售前场景下被称作“学平险”和“学生险”,而这种实体别名的缺失,会限制命名实体识别技术和实体链接技术的应用。其中,实体识别技术和实体链接技术为很多应用场景下的关键技术,比如搜索系统、知识图谱、智能问答系统等。为了实体识别技术和实体链接技术的更便捷应用,需要解决这种别名缺少的问题。


技术实现思路

1、本公开提供一种信息处理方法及信息处理装置、电子设备、存储介质。

2、第一方面,本公开提供了一种信息处理方法,该信息处理方法包括:

3、获取待生成别名信息的实体所对应的标准实体名称;

4、基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;

5、获取所述第一实体别名的特征信息;

6、基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;

7、基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。

8、第二方面,本公开提供了一种信息处理装置,该信息处理装置包括:

9、第一信息获取模块,用于获取待生成别名信息的实体所对应的标准实体名称;

10、信息确定模块,用于基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;

11、第二信息获取模块,用于获取所述第一实体别名的特征信息;

12、第三信息获取模块,用于基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;

13、实体别名输出模块,用于基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。

14、第三方面,本公开提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的信息处理方法。

15、第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述的第一方面所述的信息处理方法。

16、本公开所提供的信息处理方法,标准实体名称可以准确地表征待生成别名信息的实体的实体特征,行业知识图谱包含了本行业的更多信息,因此,基于标准实体名称及实体对应的行业知识图谱确定实体对应的第一实体别名更准确;基于第一实体别名的特征信息对第一实体别名进行实体别名衍生,即在第一实体别名基础上进一步衍生获得第二实体别名,保留了第一实体别名的关键信息,使得衍生出的第二实体别名能够表征实体的基本特征,同时能够获得更多的目标实体别名,以解决实体别名缺少的问题。

17、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种信息处理方法,其特征在于,包括:

2.根据权利要求1所述的信息处理方法,其特征在于,所述获取所述第一实体别名的特征信息,包括:

3.根据权利要求2所述的信息处理方法,其特征在于,所述别名信息生成规则,包括:第一提取规则,或,第二提取规则;

4.根据权利要求3所述的信息处理方法,其特征在于,所述基于所述第一提取规则,在所述多个分词中至少提取至少一个字作为所述第一特征信息,包括:

5.根据权利要求4所述的信息处理方法,其特征在于,所述基于所述第二提取规则,至少提取所述多个分词中的一个分词作为所述第一特征信息,包括:

6.根据权利要求2所述的信息处理方法,其特征在于,所述音形图谱包括多个音形节点,每个所述音形节点对应一个常用字;

7.根据权利要求6所述的信息处理方法,其特征在于,

8.根据权利要求2所述的信息处理方法,其特征在于,所述行业知识图谱包括多个行业知识节点;每个所述行业知识节点与实体相关联,每个所述行业知识节点具有与所述实体相关联的实体名称;

9.根据权利要求8所述的信息处理方法,其特征在于,所述基于所述标准实体名称遍历所述行业知识图谱中的各个行业知识节点,确定出与所述实体具有从属关系的各个行业知识节点对应的实体名称之后,还包括:

10.根据权利要求9所述的信息处理方法,其特征在于,所述获得第二实体别名之后,所述方法还包括:

11.根据权利要求2所述的信息处理方法,其特征在于,所述基于音形图谱,获取所述第一实体别名的第二特征信息之前,还包括:

12.根据权利要求11所述的信息处理方法,其特征在于,所述基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名之后,所述方法包括:

13.根据权利要求12所述的信息处理方法,其特征在于,所述基于所述第二子实体别名集合中的各所述第一实体别名和各所述第一子实体别名,遍历所述音形图谱的各个音形节点,生成所述第二实体别名,包括:

14.一种信息处理装置,其特征在于,包括:

15.一种电子设备,其特征在于,包括:

16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-13中任一项所述的信息处理方法。


技术总结
本公开提供了一种信息处理方法及信息处理装置、电子设备、存储介质,该方法包括:获取待生成别名信息的实体所对应的标准实体名称;基于标准实体名称及实体对应的行业知识图谱,确定出实体对应的第一实体别名;获取第一实体别名的特征信息;基于第一实体别名的特征信息对第一实体别名进行实体别名衍生,获得第二实体别名;其中,第二实体别名不同于第一实体别名;基于第二实体别名,或,第二实体别名与第一实体别名,输出目标实体别名。本公开中基于第一实体别名的特征信息的别名衍生方式能够有效保证实体别名中关键信息的保留,使得衍生出的第二实体别名能够表征实体的基本特征,同时能够获取一定数量的实体别名解决别名缺少的问题。

技术研发人员:汪自立,马超,夏粉,蒋宁,吴海英,肖冰
受保护的技术使用者:马上消费金融股份有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1