1.一种基于黎曼空间的词嵌入方法,其特征在于,所述方法包括:
确定对关于医疗文本所构成的黎曼空间的曲率修正因子;
获取医疗文本实体,并将所述曲率修正因子的属性值作为所述医疗文本实体的标签;
将包含所述标签的医疗文本实体输入至训练后的词嵌入模型,以通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度;
基于所述关注度确定目标医疗实体,并通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入。
2.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述曲率修正因子至少包括以下信息中的一种:医生生物钟、医生对病历的处理速度、疾病流行程度和疾病的类型。
3.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述获取医疗文本实体,包括:
根据电子病历中的结构化文本、半结构化文本和/或自由文本确定医疗文本实体。
4.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,所述通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度,包括:
所述带有调整参数的神经网络根据所述医疗文本实体的标签确定所述医疗文本实体对应的关注度;
其中,所述调整参数用于表征所述曲率修正因子对于所述黎曼空间曲率的影响程度。
5.根据权利要求4所述的基于黎曼空间的词嵌入方法,其特征在于,所述基于所述关注度确定目标医疗实体,包括:
在所述黎曼空间曲率大于预设阈值时,修改纳排条件,以从所述医疗文本实体中确定所述目标医疗文本实体。
6.根据权利要求4所述的基于黎曼空间的词嵌入方法,其特征在于,所述通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入,包括:
确定目标医疗文本实体的上下文的表示,以及确定所述上下文表示与所述目标医疗文本实体之间的关系映射。
7.根据权利要求1所述的基于黎曼空间的词嵌入方法,其特征在于,在所述通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度之前,所述方法还包括:
通过词的独热表示将所述医疗文本实体表示为词向量;
将所述词向量的顺序拼接作为所述词嵌入模型的输入。
8.一种基于黎曼空间的词嵌入装置,其特征在于,所述装置包括:
曲率修正因子确模块,用于:确定对关于医疗文本所构成的黎曼空间的曲率修正因子;
实体获取模块,用于:获取医疗文本实体,并将所述曲率修正因子的属性值作为所述医疗文本实体的标签;
关注度确定模块,用于:将包含所述标签的医疗文本实体输入至训练后的词嵌入模型,以通过所述词嵌入模型中带有调整参数的神经网络得到所述医疗文本实体对应的关注度;
词嵌入模块,用于:基于所述关注度确定目标医疗实体,并通过所述词嵌入模型实现所述目标医疗文本实体的词嵌入。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的基于黎曼空间的词嵌入方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的基于黎曼空间的词嵌入方法。