基于黎曼空间的词嵌入方法和装置、介质及设备与流程

文档序号:25423716发布日期:2021-06-11 21:36阅读:来源:国知局

技术特征:

1.一种基于黎曼空间的词嵌入方法,其特征在于,所述方法包括:

确定对关于医疗文本所构成的黎曼空间的曲率修正因子;

获取医疗文本实体,并将所述曲率修正因子的属性值作为所述医疗文本实体的标签;

将包含所述标签的医疗文本实体输入至训练后的词嵌入模型,以通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度;

基于所述关注度确定目标医疗实体,并通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入。

2.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述曲率修正因子至少包括以下信息中的一种:医生生物钟、医生对病历的处理速度、疾病流行程度和疾病的类型。

3.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述获取医疗文本实体,包括:

根据电子病历中的结构化文本、半结构化文本和/或自由文本确定医疗文本实体。

4.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度,包括:

所述带有调整参数的神经网络根据所述医疗文本实体的标签确定所述医疗文本实体对应的关注度;

其中,所述调整参数用于表征所述曲率修正因子对于所述黎曼空间曲率的影响程度。

5.根据权利要求4所述的基于黎曼空间的词嵌入方法,其特征在于,所述基于所述关注度确定目标医疗实体,包括:

在所述黎曼空间曲率大于预设阈值时,修改纳排条件,以从所述医疗文本实体中确定所述目标医疗文本实体。

6.根据权利要求4所述的基于黎曼空间的词嵌入方法,其特征在于,所述通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入,包括:

确定目标医疗文本实体的上下文的表示,以及确定所述上下文表示与所述目标医疗文本实体之间的关系映射。

7.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,在所述通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度之前,所述方法还包括:

通过词的独热表示将所述医疗文本实体表示为词向量;

将所述词向量的顺序拼接作为所述词嵌入模型的输入。

8.一种基于黎曼空间的词嵌入装置,其特征在于,所述装置包括:

曲率修正因子确模块,用于:确定对关于医疗文本所构成的黎曼空间的曲率修正因子;

实体获取模块,用于:获取医疗文本实体,并将所述曲率修正因子的属性值作为所述医疗文本实体的标签;

关注度确定模块,用于:将包含所述标签的医疗文本实体输入至训练后的词嵌入模型,以通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度;

词嵌入模块,用于:基于所述关注度确定目标医疗实体,并通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入。

9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的基于黎曼空间的词嵌入方法。

10.一种电子设备,其特征在于,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的基于黎曼空间的词嵌入方法。


技术总结
本公开提供了一种基于黎曼空间的词嵌入方法与装置、计算机可读介质及电子设备,涉及自然语言处理技术领域。该方法包括:确定对关于医疗文本所构成的黎曼空间的曲率修正因子;获取医疗文本实体,并将曲率修正因子的属性值作为医疗文本实体的标签;将包含标签的医疗文本实体输入至训练后的词嵌入模型,以通过词嵌入模型中带有调整参数的神经网络得到医疗文本实体对应的关注度;基于关注度确定目标医疗实体,并通过词嵌入模型实现目标医疗文本实体的词嵌入。本技术方案通过弯曲空间的形式使得词嵌入结果与真实世界数据更加符合,增强了词嵌入结果的表现范围。同时,避免了基于欧氏空间来实现词嵌入带来的误差。

技术研发人员:闫峻;薛恒钢
受保护的技术使用者:医渡云(北京)技术有限公司
技术研发日:2019.12.10
技术公布日:2021.06.11
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1