医学术语关联方法、装置、电子设备及存储介质与流程

文档序号:37470429发布日期:2024-03-28 18:53阅读:13来源:国知局
医学术语关联方法、装置、电子设备及存储介质与流程

本技术涉及自然语言处理,尤其涉及一种医学术语关联方法、装置、电子设备及存储介质。


背景技术:

1、医学知识复杂多变,一个医学概念会有多种术语表达方式,同时也存在多个上位概念和下位概念,比如肺炎,临床上也可叫肺部炎症,其上位概念有肺组织炎症、肺实变,下位概念有新生儿肺炎,间质性肺炎,支气管肺炎等,支气管肺炎的下位又有细菌性支气管肺炎、哮喘性支气管肺炎等等,只有将复杂的医学知识通过上下位关系完整的、清晰的表达出来,才能使得计算机在辅助开展医疗活动时,更加智能和全面,准确度更高。

2、医学术语上下位的构建通常是具有医学专业知识或者临床经验的专业人员,对医学术语的上下位关系进行一一判断,从而实现医学术语之间的关联,构建出医学术语的上下位资源。但是,依赖人工操作进行医学术语的关联,人工成本较高,且关联效率较低,导致构建医学术语的上下位资源的构建周期较长,从而影响医学术语的上下位构建效率。


技术实现思路

1、基于上述现有技术的缺陷和不足,本技术提出一种医学术语关联方法、装置、电子设备及存储介质,能够降低医学术语关联的人工成本,提高医学术语的关联效率,从而提高医学术语的上下位构建效率。

2、本技术提出的技术方案具体如下:

3、根据本技术实施例的第一方面,提供了一种医学术语关联方法,包括:

4、对第一医学术语和第二医学术语分别进行分词处理,得到第一拆分词语集和第二拆分词语集,所述第一拆分词语集中包括所述第一医学术语拆分得到的所有拆分词语,所述第二拆分词语集中包括所述第二医学术语拆分得到的所有拆分词语;

5、利用所述第一拆分词语中预设数量的拆分词语生成组合词语集,并判断所述组合词语集中包含的拆分词语是否与所述第二拆分词语集中包含的拆分词语相同;所述预设数量小于所述第一拆分词语集中的拆分词语总数;

6、在所述组合词语集中包含的拆分词语与所述第二拆分词语集中包含的拆分词语相同的情况下,生成第一关联信息,所述第一关联信息用于表示所述第二医学术语为所述第一医学术语的上位医学术语。

7、可选的,医学术语关联方法还包括:

8、在所述组合词语集中包含的拆分词语与所述第二拆分词语集中包含的拆分词语相同的情况下,根据组合词语集包含的拆分词语的数量,以及所述第一拆分词语集中拆分词语的数量,确定所述第二医学术语与所述第一医学术语之间的上位层级关系。

9、可选的,医学术语关联方法还包括:

10、在所述组合词语集中包含的拆分词语与所述第二拆分词语集中包含的拆分词语相同的情况下,按照预设的医学知识库,查询第二拆分词语集中的拆分词语对应的上位词;

11、将所述第二医学术语中的拆分词语替换为所述拆分词语对应的上位词,得到第三医学术语,并生成第二关联信息,所述第二关联信息用于表示所述第三医学术语为所述第一医学术语和所述第二医学术语的上位医学术语。

12、可选的,对第一医学术语进行分词处理,得到第一拆分词语集,包括:

13、对所述第一医学术语中的各个字符进行拆分类型解析,确定各个字符对应的拆分类型;所述拆分类型是对根据预设的术语拆分规则而确定的拆分单元组进行分类而确定的;

14、将所述第一医学术语中相同拆分类型的字符组成的词语作为所述第一医学术语拆分后的拆分词语;

15、对所述第一医学术语拆分后的各个拆分词语进行标准化处理,得到所述第一医学术语拆分后的标准化词语,并将所述第一医学术语拆分后的所有标准化词语组成所述第一医学术语对应的第一拆分词语集。

16、可选的,对所述第一医学术语拆分后的各个拆分词语进行标准化处理,得到所述第一医学术语拆分后的标准化词语,包括:

17、对所述第一医学术语拆分后的拆分词语进行语义编码,得到词语编码特征;

18、根据所述词语编码特征与预先构建的标准术语库中的标准词语的编码特征之间的相似度,从所述标准术语库中选取与所述词语编码特征相似度最高的标准词语作为所述第一医学术语拆分后的标准化词语。

19、可选的,对所述第一医学术语中的各个字符进行拆分类型解析,确定各个字符对应的拆分类型,包括:

20、将所述第一医学术语输入到预先构建的分类模型中,所述分类模型根据所述第一医学术语中各个字符的编码特征,确定所述第一医学术语中各个字符的拆分类型;所述分类模型,是通过对预先采集的样本医学术语进行分类处理,以分类结果与所述样本医学术语预先标注的样本分类结果相同为目标训练得到的。

21、可选的,所述分类模型的训练过程包括:

22、采集预先标注各个字符的拆分类型的医学术语作为样本医学术语,将所述样本医学术语中预先标注的各个字符的拆分类型作为所述样本医学术语的样本分类结果;

23、将所述样本医学术语输入到所述分类模型中,所述分类模型对所述样本医学术语中的各个字符进行编码操作,并对各个字符的编码特征进行分类操作,输出所述样本医学术语中的各个字符的预测拆分类型;

24、以所述样本医学术语中的各个字符的预测拆分类型与所述样本医学术语中预先标注的各个字符的拆分类型相同为目标,对所述分类模型进行优化。

25、根据本技术实施例的第二方面,提供了一种医学术语关联装置,包括:

26、术语拆分模块,用于对第一医学术语和第二医学术语分别进行分词处理,得到第一拆分词语集和第二拆分词语集,所述第一拆分词语集中包括所述第一医学术语拆分得到的所有拆分词语,所述第二拆分词语集中包括所述第二医学术语拆分得到的所有拆分词语;

27、判断模块,用于利用所述第一拆分词语中预设数量的拆分词语生成组合词语集,并判断所述组合词语集中包含的拆分词语是否与所述第二拆分词语集中包含的拆分词语相同;所述预设数量小于所述第一拆分词语集中的拆分词语总数;

28、生成模块,用于在所述组合词语集中包含的拆分词语与所述第二拆分词语集中包含的拆分词语相同的情况下,生成第一关联信息,所述第一关联信息用于表示所述第二医学术语为所述第一医学术语的上位医学术语。

29、根据本技术实施例的第三方面,提供了一种电子设备,包括:存储器和处理器;

30、其中,所述存储器与所述处理器连接,用于存储程序;

31、所述处理器,用于通过运行所述存储器中的程序,实现上述医学术语关联方法。

32、根据本技术实施例的第四方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述医学术语关联方法。

33、本技术提出的医学术语关联方法,对第一医学术语和第二医学术语分别进行分词处理,得到第一拆分词语集和第二拆分词语集,第一拆分词语集中包括第一医学术语拆分得到的所有拆分词语,第二拆分词语集中包括第二医学术语拆分得到的所有拆分词语;利用第一拆分词语中预设数量的拆分词语生成组合词语集,并判断组合词语集中包含的拆分词语是否与第二拆分词语集中包含的拆分词语相同;在组合词语集中包含的拆分词语与第二拆分词语集中包含的拆分词语相同的情况下,生成第一关联信息,第一关联信息用于表示第二医学术语为第一医学术语的上位医学术语。采用本技术的技术方案,能够通过对医学术语分词处理后的拆分词语之间的匹配分析,确定各个医学术语的上位医学术语,从而自动确定医学术语之间的关联关系,减少了人工成本,并且能够提高医学术语的关联效率,进而提高医学术语的上下位构建效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1