一种医疗慢病检查报告数据提取方法及系统与流程

文档序号:33402062发布日期:2023-03-08 18:03阅读:99来源:国知局
一种医疗慢病检查报告数据提取方法及系统与流程

1.本说明书涉及医疗数据提取领域,特别涉及一种医疗慢病检查报告数据提取方法及系统。


背景技术:

2.慢病通常是指高血压、高血脂、糖尿病、精神病等慢性病,在当今生活中,患慢性病的人群比例越来越大,患者治疗慢病的过程往往很漫长。患者每一次对慢病进行检查和治疗时,可能需要同时检查多个项目,每个项目都有对应的检查报告,不同的检查报告可能需要在不同设备上打印或者在不同诊疗部门领取。
3.然而,检查报告中并不是每一项内容都需要关注,例如,此次检查与上一次检查的结果区别较大的检查内容需要重点注意,而此次检查与上一次检查的结果区别不大的检查内容则可以作为次要内容或不展示。若将所有检查内容都进行展示,不仅会耗费患者的时间和精力,也会使得医生在查看检查报告时需要花费时间寻找重点内容,影响诊疗效率。
4.因此,亟需提出一种医疗慢病检查报告数据提取方法,筛选出检查报告中的重要内容并进行展示。


技术实现要素:

5.本说明书一个或多个实施例提供一种医疗慢病检查报告数据提取方法,该方法包括:获取医疗慢病检查报告中的关键信息点;对关键信息点进行分析,形成展示数据;将展示数据进行展示。
6.本说明书实施例之一提供一种医疗慢病检查报告数据提取系统,该系统包括:获取模块,用于获取医疗慢病检查报告中的关键信息点;分析模块,用于对关键信息点进行分析,形成展示数据;展示模块,用于将展示数据进行展示。
7.本说明书一个或多个实施例提供一种医疗慢病检查报告数据提取装置,包括处理器,所述处理器用于执行如上述实施例中任一项所述的医疗慢病检查报告数据提取方法。
8.本说明书一个或多个实施例提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如上述实施例中任一项所述的医疗慢病检查报告数据提取方法。
附图说明
9.本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
10.图1是根据本说明书一些实施例所示的医疗慢病检查报告数据提取系统的示例性模块图;
11.图2是根据本说明书一些实施例所示的医疗慢病检查报告数据提取方法的示例性
流程图;
12.图3是根据本说明书一些实施例所示的第一预测模型的示例性示意图;
13.图4是根据本说明书一些实施例所示的第二预测模型的示例性示意图;
14.图5是根据本说明书一些实施例所示的基于相似病例形成展示数据的示例性流程图;
15.图6是根据本说明书一些实施例所示的知识图谱和推断模型的示例性示意图。
具体实施方式
16.为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
17.应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
18.如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
19.本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
20.图1是根据本说明书一些实施例所示的医疗慢病检查报告数据提取系统的示例性模块图。如图1所示,在一些实施例中,医疗慢病检查报告数据提取系统100可以包括获取模块110、分析模块120和展示模块130。
21.获取模块110用于获取医疗慢病检查报告中的关键信息点。关于关键信息点的更多内容参见图2及其相关描述。
22.分析模块120用于对关键信息点进行分析,形成展示数据。关于展示数据的更多内容参见图2及其相关描述。
23.在一些实施例中,分析模块120进一步用于基于关键信息点,确定关键信息点的重要程度;基于重要程度,形成展示数据。关于关键信息点的重要程度的更多内容参见图3、图4及其相关描述。
24.在一些实施例中,分析模块120还用于基于关键信息点,确定相似病例;基于相似病例,形成展示数据。关于相似病例的更多内容参见图5、图6及其相关描述。
25.在一些实施例中,分析模块120还用于获取患者相关资料;基于患者相关资料,构建知识图谱;基于知识图谱,确定相似病例。关于患者相关资料、知识图谱的更多内容参见图6及其相关描述。
26.展示模块130用于将展示数据进行展示。
27.需要注意的是,以上对于系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。例如,获取模块110和分析模块120可以整合在一个模块中。又例如,各个模块可以共用一个存储设备,各个模块也可以分别具有各自的存储设备。诸如此类的变形,均在本说明书的保护范围之内。
28.图2是根据本说明书一些实施例所示的医疗慢病检查报告数据提取方法的示例性流程图。如图2所示,流程200包括下述步骤:
29.步骤210,获取医疗慢病检查报告中的关键信息点。在一些实施例中,步骤210可以由获取模块110执行。
30.关键信息点是指用于表示医疗慢病检查报告中关键内容的信息,一组关键信息点可以包括关键要素和关键评价。关键要素是指关键信息点所反映的要素,例如,肺部、心脏、血小板等。关键评价是指对关键要素的实际情况进行描述的内容,例如,纹理清晰、具体的数值等。例如,一组关键信息点可以是“双肺纹理清晰”,其中,关键要素是“双肺”,关键评价是“纹理清晰”;又例如,一组关键信息点可以是“肺内未见明显异常密度阴影”,其中,关键要素是“肺内”,关键评价是“未见明显异常密度阴影”;又例如,一组关键信息点可以是“血小板计数为200
×
109/l”,其中,关键要素是“血小板计数”,关键评价是“200
×
109/l”。
31.在一些实施例中,获取模块110可以通过对医疗慢病检查报告的固定位置进行分割,从而获取医疗慢病检查报告中的关键信息点。在一些实施例中,获取模块110也可以使用模型对医疗慢病检查报告进行语义分割,从而获取医疗慢病检查报告中的关键信息点。
32.步骤220,对关键信息点进行分析,形成展示数据。在一些实施例中,步骤220可以由分析模块120执行。
33.展示数据是指满足预设条件的关键信息点所包含的数据。例如,关键信息点“双肺纹理清晰”满足预设条件,则包括“双肺纹理清晰”的信息作为展示数据。预设条件可以是提前设定的用于判断关键信息点能否作为展示数据的条件。例如,预设条件可以是关键信息点所包含的内容量化后的指标(如,对关键信息点进行评级)满足一定阈值。又例如,预设条件可以是关键信息点中的关键评价与上一次关键评价的区别大于一定阈值。关于关键评价的更多内容参见上述步骤210及其相关描述。
34.在一些实施例中,分析模块120可以通过建模或采用各种数据分析算法,例如回归分析法、判别分析法等,对关键信息点进行分析处理,确定并形成展示数据。
35.在一些实施例中,分析模块120可以基于关键信息点,通过第一预测模块和第二预测模型确定关键信息点的重要程度,进而基于重要程度,形成展示数据。关于第一预测模型和重要程度的更多内容参见图3及其相关描述,关于第二预测模型的更多内容参见图4及其相关描述。
36.在一些实施例中,分析模块120还可以基于关键信息点,通过知识图谱和推断模型确定相似病例,进而基于相似病例,形成展示数据。关于相似病例的更多内容参见图5及其相关描述,关于知识图谱和推断模型的更多内容参见图6及其相关描述。
37.步骤230,将展示数据进行展示。在一些实施例中,步骤230可以由展示模块130执
行。
38.展示是指将经过分析后的关键信息点通过各种方式呈现在用户面前。在一些实施例中,展示数据可以是各种表示形式,例如图像、表格、视频、电子展示数据、纸质展示数据等。在一些实施例中,展示数据可以储存在存储设备中并定时(如,每一年)更新。
39.在本说明书的一些实施例中,通过对医疗慢病检查报告的关键信息点进行分析来确定展示数据,可以筛选出医疗慢病检查报告中的重要内容,过滤次要的内容,从而仅需输出和打印展示数据,有效避免了患者在打印医疗慢病检查报告的过程中耗时且繁琐的问题,也使得医生在查看医疗慢病检查报告时更多地关注重要内容,提高了诊疗效率。
40.应当注意的是,上述有关流程200的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程200进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
41.图3是根据本说明书一些实施例所示的第一预测模型的示例性示意图。
42.在一些实施例中,分析模块120可以基于关键信息点,确定关键信息点的重要程度;基于重要程度,形成展示数据。
43.重要程度是指用于表示关键信息点对于用户后续诊疗的重要性高低的指标。重要程度可以使用0-100的分数表示,例如,重要程度可以是80分,分数越高代表重要程度越高,反之则重要程度越低。
44.在一些实施例中,分析模块120可以通过建模或采用各种数据分析算法,例如回归分析法、判别分析法等,对关键信息点进行分析处理,确定关键信息点的重要程度。在一些实施例中,分析模块120还可以基于预设规则确定重要程度。预设规则是指提前设定的用于判断重要程度高低的规则。例如,预设规则可以是关键评价与标准评价的相似度,若关键评价偏离标准评价越远,则该组关键信息点的重要程度越高。关于关键评价的更多内容参见图2及其相关描述。
45.在一些实施例中,分析模块120可以使用第一预测模型对关键信息点进行处理,确定关键信息点的重要程度。
46.第一预测模型是指用于预测关键信息点的重要程度的模型。在一些实施例中,第一预测模型可以分别对每一组关键信息点的重要程度进行单独预测。
47.在一些实施例中,第一预测模型340可以对病人基础信息310、检查报告类型320和一组关键信息点330进行处理,获取一组关键信息点的重要程度350。
48.在一些实施例中,第一预测模型340可以为各种可行的神经网络模型。例如,卷积神经网络(convolutional neural networks,cnn)、深度神经网络(deep neural networks,dnn)等或其组合。
49.如图3所示,第一预测模型340的输入可以包括病人基础信息310、检查报告类型320和一组关键信息点330。病人基础信息310是指病人的个人信息,例如,输入的病人基础信息310可以是病人的年龄、性别、身高、体重等。体检报告类型320是指体检报告所反映的病人检查的具体类别,例如,输入的检查报告类型320可以是血常规、尿常规等。一组关键信息点330是指包含关键要素和关键评价的信息点,例如,输入的一组关键信息点330可以是“双肺纹理清晰”等。
50.第一预测模型340的输出可以包括一组关键信息点的重要程度350。一组关键信息
点的重要程度350是指一组关键信息点重要性的高低,例如,输出的一组关键信息点的重要程度350可以是80分等。
51.在一些实施例中,第一预测模型340可以基于历史数据单独训练。在一些实施例中,可以基于多个第一训练样本及第一标签训练得到第一预测模型340。
52.在一些实施例中,训练第一预测模型的第一训练样本包括样本病人基础信息、样本检查报告类型和一组样本关键信息点,与第一训练样本相对应的第一标签为该组样本关键信息点的重要程度。第一训练样本可以基于历史数据获取,第一标签可以基于医生在检查报告上对该组样本关键信息点的点击时间和对该组样本关键信息点的相应内容的查看停留时间确定,第一标签可以通过人工标注或自动标注的方式确定。以上说明仅为示例,而非限制,第一标签可以通过各种方式获取。
53.训练时,将第一训练样本输入第一预测模型,基于初始第一预测模型的输出与第一标签构建损失函数,通过损失函数更新初始第一预测模型的参数,直到训练的初始第一预测模型满足预设条件,获取训练好的第一预测模型340,其中,预设条件可以是损失函数小于阈值、收敛,或训练周期达到阈值等。
54.在本说明书的一些实施例中,通过使用第一预测模型对每一组关键信息点进行单独预测,使得第一模型针对不同类型的训练样本的训练更独立,可以保证预测结果的准确性,也提高了第一预测模型处理数据的效率。
55.在一些实施例中,分析模块120还可以使用第二预测模型对关键信息点进行处理,确定关键信息点的重要程度。关于第二预测模型的更多内容参见图4及其相关描述。
56.在一些实施例中,分析模块120可以基于关键信息点的重要程度,形成展示数据。在一些实施例中,分析模块可以将重要程度满足预设条件的关键信息点所包含的数据作为展示数据,进而将展示数据进行展示。例如,一组关键信息点“双肺纹理清晰”的重要程度为90分,预设条件为重要程度大于85分,则该组关键信息点所包含的“双肺纹理清晰”的相关数据信息则作为展示数据进行展示。关于预设条件和展示数据的更多内容参见图2及其相关描述。
57.在本说明书的一些实施例中,通过确定关键信息点的重要程度形成展示数据,使得展示数据展示的内容为医疗慢病检查报告中的关键内容,便于患者获取和打印,也使得医生在查看医疗慢病检查报告时更多地关注重要内容,提高了诊疗效率;并且,通过第一预测模型来处理每一组关键信息点来确定重要程度,可以有效提高预测重要程度的结果的准确性,保证展示数据的科学性。
58.图4是根据本说明书一些实施例所示的第二预测模型的示例性示意图。
59.在一些实施例中,分析模块120可以使用第二预测模型对关键信息点进行处理,确定关键信息点的重要程度。在一些实施例中,第二预测模型可以将同一病人的多组关键信息点一起作为输入,从而可以结合该病人全部关键信息点的整体情况来预测每组关键信息点的重要程度。
60.在本说明书的一些实施例中,将多组关键信息点同时输入第二预测模型进行预测,可以在同一时间内对大量数据进行处理,提高了处理数据的速度;并且,第二预测模型所包含的多个层可以基于大量的历史数据单独训练或联合训练来获取,从而保证了第二预测模型的预测结果的准确性。
61.第二预测模型是指用于预测多组关键信息点中的每一组关键信息点的重要程度的模型。
62.在一些实施例中,第二预测模型可以对多组关键信息点410、病人基础信息460和检查报告类型470进行处理,获取每组关键信息点对应的重要程度490。
63.如图4所示,第二预测模型可以包括嵌入层420、异常检测层440和重要程度预测层480。
64.在一些实施例中,嵌入层420可以对多组关键信息点410进行处理,获取多组关键信息特征430。在一些实施例中,嵌入层420可以为各种可行的神经网络模型。例如,卷积神经网络(convolutional neural networks,cnn)、深度神经网络(deep neural networks,dnn)等或其组合。
65.如图4所示,嵌入层420的输入可以包括多组关键信息点410。例如,输入的多组关键信息点410可以是“双肺纹理清晰,肺内未见明显异常密度阴影,血小板计数为200
×
109/l”等。
66.嵌入层420的输出可以包括多组关键信息特征430。关键信息特征是指对关键信息点的特征进行提取和汇总后获得的特征,关键信息特征包括关键要素特征和关键评价特征,关键信息特征可以用向量来表示,多组关键信息特征分别对应多组关键信息点。例如,多组关键信息点为:双肺纹理清晰、心率90次/分钟、血小板计数为200
×
109/l;则对应的多组关键信息特征可以是(3,5,6,7,90,8,200
×
109)。其中,3表示共有三组关键信息点,5表示“双肺”,为关键要素特征;6表示“纹理清晰”,为关键评价特征;7表示“心率”,为关键要素特征;90表示“心率90次/分钟”,为关键评价特征;8表示“血小板”,为关键要素特征;200
×
109/l表示“血小板计数为200
×
109/l”,为关键评价特征。
67.在一些实施例中,异常检测层440可以对多组关键信息特征430进行处理,获取多组关键信息特征对应的重构特征450。在一些实施例中,异常检测层440可以为transformer结构。
68.如图4所示,异常检测层440的输入可以包括多组关键信息特征430。例如,输入的多组关键信息特征430可以是(3,5,6,7,90,8,200
×
109)。其中,3表示共有三组关键信息点,5表示“双肺”,6表示“纹理清晰”,7表示“心率”,90表示“心率90次/分钟”,8表示“血小板”,200
×
109/l表示“血小板计数为200
×
109/l”。
69.异常检测层440的输出可以包括多组关键信息特征对应的重构特征450。多组关键信息特征对应的重构特征450是指对多组关键信息特征430进行重新整理后得到的特征。
70.在一些实施例中,异常检测层440可以将输入的多组关键信息特征430中的每一组使用表示向量x来表示,将多个表示向量x组合起来从而可以得到表示向量矩阵a,将a进行多次编码处理得到编码后的表示向量矩阵b,再将b进行多次解码处理后得到表示向量矩阵c,至此,异常检测层440完成了重构并输出多组关键信息特征对应的重构特征450。
71.例如,多组关键信息特征430为(3,5,6,7,90,8,200
×
109),表示共有三组关键信息点,分别为:双肺纹理清晰、心率90次/分钟,血小板计数为200
×
109/l;经过重新整理(例如,进行多次先编码后解码处理)后得到的多组关键信息特征对应的重构特征450为(3,5.1,6.2,7.3,95,8.1,202
×
109),表示共有三组关键信息点,分别为:双肺纹理比较清晰、心率95次/分钟,血小板计数为202
×
109/l;多组关键信息特征对应的重构特征450与多组
关键信息特征430相似程度较高,仅存在细微区别,且该区别属于人体生理特征数据的正常波动范围,则多组关键信息特征430不存在异常。
72.又例如,若经过重新整理(例如,进行多次先编码后解码处理)后得到的多组关键信息特征对应的重构特征450为(3,5.1,6.2,7.3,165,8.1,400
×
109),表示共有三组关键信息点,分别为:双肺纹理比较清晰、心率165次/分钟,血小板计数为400
×
109/l;多组关键信息特征对应的重构特征450与多组关键信息特征430中的心率和血小板的相关数据存在明显不同,则多组关键信息特征430存在异常。
73.在本说明书的一些实施例中,通过引入异常检测层对嵌入层输出的多组关键信息特征进行重构,可以关注到多组关键信息特征的序列中每一部分与其它部分的关联以及每一部分与已经输出的部分结果的关联,从而实现对嵌入层输出的多组关键信息特征进行优化。
74.在一些实施例中,嵌入层420的输出可以为异常检测层440的输入,嵌入层420和异常检测层440可以通过联合训练得到。
75.在一些实施例中,联合训练的第二样本数据包括多组样本关键信息点,第二样本数据对应的第二标签为多组样本关键信息特征对应的重构特征。第二样本数据可以基于历史数据获取,第二标签可以通过人工标注或自动标注的方式确定。
76.训练时,将多组样本关键信息点输入初始嵌入层,得到初始嵌入层输出的多组关键信息特征;将多组关键信息特征作为训练样本数据输入初始异常检测层,得到初始异常检测层输出的每组关键信息特征对应的重构特征。基于每组样本关键信息特征对应的重构特征和异常检测层输出的每组关键信息特征对应的重构特征构建损失函数,同步更新嵌入层和异常检测层的参数。通过参数更新,得到训练好的嵌入层和异常检测层。
77.在一些实施例中,重要程度预测层480可以对多组关键信息特征430、多组关键信息特征对应的重构特征450、病人基础信息460和检查报告类型470进行处理,获取每组关键信息点对应的重要程度490。在一些实施例中,重要程度预测层480可以为各种可行的神经网络模型。例如,卷积神经网络(convolutional neural networks,cnn)、深度神经网络(deep neural networks,dnn)等或其组合。
78.如图4所示,重要程度预测层480的输入可以包括多组关键信息特征430、多组关键信息特征对应的重构特征450、病人基础信息460和检查报告类型470。例如,输入的多组关键信息特征430可以是(3,5,6,7,90,8,200
×
109),表示共有三组关键信息点,分别为:双肺纹理清晰、心率90次/分钟,血小板计数为200
×
109/l;输入的多组关键信息特征对应的重构特征450可以是(3,5.1,6.2,7.3,95,8.1,202
×
109),表示共有三组关键信息点,分别为:双肺纹理比较清晰、心率95次/分钟,血小板计数为202
×
109/l;输入的病人基础信息460可以是该病人的年龄、性别、身高、体重等;输入的检查报告类型470可以是肺功能检查、心功能检查、血常规等。
79.重要程度预测层480的输出可以包括每组关键信息点对应的重要程度490。例如,输出的每组关键信息点对应的重要程度490可以是(70,80,90),表示共有三组关键信息点,每组关键信息点对应的重要程度分别为70分,80分,90分。
80.在一些实施例中,重要程度预测层480可以基于历史数据单独训练。在一些实施例中,可以基于多个第三训练样本及第三标签训练得到重要程度预测层480。
81.在一些实施例中,训练重要程度预测层的第三训练样本包括多个样本病人中的每一个样本病人的多组样本关键信息特征、多组样本关键信息特征对应的重构特征、样本病人基础信息和样本检查报告类型,与第三训练样本相对应的第三标签为每组样本关键信息点对应的重要程度。第三训练样本可以基于历史数据获取,第三标签可以基于第一预测模型获取,第三标签的获取方式与第一预测模型的第一标签的获取方式相同,第三标签可以通过人工标注或自动标注的方式确定。以上说明仅为示例,而非限制,训练数据的标签可以通过各种方式获取。关于第一预测模型、基于第一预测模型获取第三标签的更多内容参见图3及其相关描述。
82.训练时,将第三训练样本输入重要程度预测层,基于初始重要程度预测层的输出与第三标签构建损失函数,通过损失函数更新初始重要程度预测层的参数,直到训练的初始重要程度预测层满足预设条件,获取训练好的重要程度预测层480,其中,预设条件可以是损失函数小于阈值、收敛,或训练周期达到阈值等。
83.在一些实施例中,嵌入层420的输出可以为异常检测层440的输入,异常检测层440的输出可以为重要程度预测层480的输入,第二预测模型可以基于嵌入层420、异常检测层440和重要程度预测层480的联合训练得到。
84.在一些实施例中,联合训练的第四样本数据包括多个样本病人中的每一个样本病人的多组样本关键信息点、样本病人基础信息和样本检查报告类型,第四样本数据对应的第四标签为每组样本关键信息点对应的重要程度。第四样本数据可以基于历史数据获取,第四标签可以基于医生在检查报告上对该组样本关键信息点的点击时间和对该组样本关键信息点的相应内容的查看停留时间确定,第四标签可以通过人工标注或自动标注的方式确定。
85.训练时,将多组样本关键信息点输入初始嵌入层,得到初始嵌入层输出的多组关键信息特征;将多组关键信息特征作为训练样本数据输入初始异常检测层,得到初始异常检测层输出的多组关键信息特征对应的重构特征;将多组关键信息特征对应的重构特征作为训练样本数据,和初始嵌入层输出的多组关键信息特征、样本病人基础信息、样本检查报告类型一起输入初始重要程度预测层,得到初始重要程度预测层输出的每组关键信息点对应的重要程度。基于每组样本关键信息点对应的重要程度和重要程度预测层输出的每组关键信息点对应的重要程度构建损失函数,同步更新嵌入层、异常检测层和重要程度预测层的参数。通过参数更新,得到训练好的嵌入层、异常检测层和重要程度预测层。
86.在一些实施例中,第二预测模型还可以对患者的历史检查报告中的历史关键信息点和其他类型的检查报告中的其他报告关键信息点进行处理,确定关键信息点的重要程度。
87.在一些实施例中,嵌入层420的输入还可以包括历史关键信息点。历史关键信息点是指输入的多组关键信息点对应的病人的历史医疗慢病检查报告中关键内容的信息,例如,历史关键信息点可以是“肺内未见明显异常密度阴影、心率92次/分钟,血小板计数为210
×
109/l”。嵌入层420的输出可以包括历史关键信息特征。历史关键信息特征是指对历史关键信息点的特征进行提取和汇总后获得的特征,例如,历史关键信息特征可以是(3,9,10,7,92,8,210
×
109)。其中,3表示共有三组历史关键信息点,9表示“双肺”,10表示“未见明显异常密度阴影”,7表示“心率”,92表示“心率92次/分钟”,8表示“血小板”,210
×
109/l
表示“血小板计数为200
×
109/l”。重要程度预测层480的输入还可以包括历史关键信息特征。
88.在一些实施例中,嵌入层420的输入还可以包括其他报告关键信息点。其他报告关键信息点是指输入的多组关键信息点对应的病人的其他医疗慢病检查报告中关键内容的信息,例如,其他报告关键信息点可以是“红细胞计数3.6
×
10
12
/l、血红蛋白120g/l,血细胞比容40%”等。嵌入层420的输出可以包括其他报告关键信息特征。其他报告关键信息特征是指对其他报告关键信息点的特征进行提取和汇总后获得的特征,例如,其他报告关键信息特征可以是(3,11,3.6
×
10
12
,12,120,13,40)。其中,3表示共有三组其他报告关键信息点,11表示“血红细胞计数”,3.6
×
10
12
表示“红细胞计数3.6
×
10
12
/l”,12表示“血红蛋白”,120表示“血红蛋白120g/l”,13表示“血细胞比容”,40表示“血细胞比容40%”。重要程度预测层480的输入还可以包括其他报告关键信息特征。
89.在本说明书的一些实施例中,通过引入患者的历史检查报告和其他类型检查报告中的关键信息点,可以进一步考虑患者的历史病情和相关病情,从而可以进一步加强对关键信息点的重要程度预测结果的准确性。
90.在一些实施例中,分析模块120还可以基于知识图谱,推断关键信息点的重要程度。在一些实施例中,分析模块120可以基于推断模型推断病人个体与关键信息点之间的边的权重,推断模型的输入可以是知识图谱、当前病人个体、当前关键信息点,推断模型的输出可以是病人个体与关键信息点之间的边的权重。
91.关于知识图谱、推断模型的更多内容参见图6及其相关描述。
92.在本说明书的一些实施例中,基于第二预测模型对多组关键信息点进行处理来确定每组关键信息点对应的重要程度,可以加快处理大量关键信息点相关数据的速度,提高预测关键信息点的重要程度的效率,并且,通过第二预测模型的异常检测层对多组关键信息特征进行重构,可以判断多组关键信息特征中是否存在异常,从而进一步保证预测关键信息点的重要程度的准确性。
93.图5是根据本说明书一些实施例所示的基于相似病例形成展示数据的示例性流程图。在一些实施例中,流程500可以由分析模块120执行。如图5所示,流程500包括下述步骤:
94.步骤510,基于关键信息点,确定相似病例。
95.相似病例是指与当前病例的关键信息点所包含的内容特征相似的病例。例如,关键要素(如,肺部)相似的病例,又例如,关键要素和关键评价(如,都是对肺部纹理的评价)都相似的病例。
96.在一些实施例中,分析模块可以基于检查报告中关键信息点的关键信息特征构建特征向量。关键信息特征是指对关键信息点的特征进行提取和汇总后获得的特征。特征向量是指基于关键信息特征所包含的信息构建的向量。基于关键信息特征所包含的信息构建特征向量的方式可以有多种。例如,基于关键信息特征(a,b,c,d,e,f,g)构建的特征向量p,其中,关键信息特征(a,b,c,d,e,f,g)可以表示关键信息点的组数为a,第一组关键信息点的关键要素为b,第一组关键信息点的关键评价为c,第二组关键信息点的关键要素为d,第二组关键信息点的关键评价为e,第三组关键信息点的关键要素为f,第三组关键信息点的关键评价为g。
97.存储设备中包含多个参考向量,以及多个参考向量中的每个参考向量对应的参考
重要程度。
98.参考向量基于同类型检查报告中关键信息点的关键信息特征构建,参考向量对应的参考重要程度为对应同类型检查报告中关键信息点的重要程度。待匹配向量基于当前检查报告中关键信息点的关键信息特征构建。参考向量和待匹配向量的构建方式参见上述特征向量。
99.在一些实施例中,分析模块120可以分别计算参考向量与待匹配向量之间的向量距离(如余弦距离),确定待匹配向量对应的当前病例的相似病例。例如,将与待匹配向量之间的向量距离满足预设条件的参考向量作为目标向量,将目标向量对应的病例作为待匹配向量对应的当前病例的相似病例。预设条件可以根据情况设定。例如,预设条件可以是向量距离最小或向量距离小于距离阈值等。
100.关键信息特征可以通过图4所示的第二预测模型来确定。关于关键信息特征的更多内容参见图4及其相关描述。
101.在一些实施例中,分析模块120还可以通过知识图谱和推断模型来确定相似病例。关于知识图谱和推断模型的更多内容参见图6及其相关描述。
102.步骤520,基于相似病例,形成展示数据。
103.在一些实施例中,分析模块120可以将储存在存储设备中的相似病例对应的关键信息点的重要程度直接作为当前病例对应的关键信息点的重要程度,进而基于重要程度,形成展示数据。关于基于重要程度形成展示数据的更内容参见图2、图3及其相关描述。
104.在一些实施例,分析模块120也可以基于相似病例对应的关键信息点的重要程度、第一预测模型输出的重要程度和第二模型输出的重要程度确定当前病例的关键信息点的重要程度。例如,可以通过求平均值的方法对相似病例对应的关键信息点的重要程度、第一预测模型输出的重要程度和第二模型输出的重要程度进行处理,确定当前病例对应的关键信息点的重要程度。如,相似病例对应的关键信息点的重要程度为70分,第一预测模型输出的重要程度为72分,第二模型输出的重要程度为71分,则当前病例对应的关键信息点的重要程度为71分。
105.在一些实施例中,分析模块120可以通过加权求平均值的方法对相似病例对应的关键信息点的重要程度、第一预测模型输出的重要程度和第二模型输出的重要程度进行处理,确定当前病例对应的关键信息点的重要程度。权重可以根据病人基础信息来确定。例如,当相似病例为当前病例的近亲家属等情况时,相似病例的权重较大。关于病人基础信息的更多内容参见图3及其相关描述。
106.在本说明书的一些实施例中,通过引入相似病例,基于相似病例来确定当前病例的关键信息点的重要程度,可以提高预测重要程度的速度,减轻系统的运行负荷;并且,引入相似病例考虑了近亲家属等情况,可以使对重要程度的预测结果更符合实际情况,保证预测结果的真实性和可靠性。
107.应当注意的是,上述有关流程500的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程500进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
108.图6是根据本说明书一些实施例所示的知识图谱和推断模型的示例性示意图。
109.在一些实施例中,分析模块120可以获取患者相关资料;基于患者相关资料,构建
知识图谱;基于知识图谱,确定相似病例。
110.患者相关资料是指包含患者基本信息和病情信息的资料。例如,患者的性别、年龄、所患疾病、临床症状记录、疾病诊断报告、治疗方案等。在一些实施例中,可以将历史患者相关资料储存在存储设备中,分析模块可以从存储设备中获取患者相关资料。在一些实施例中,患者相关资料涉及患者个人隐私问题,可以在获得患者授权的情况下获取并使用。
111.知识图谱是指基于患者相关资料构建的以符号形式反映患者相关资料中各种因素之间的关系的图谱,知识图谱包括节点和边。如图6所示,知识图谱610包括节点(如,节点a、节点1等)和边(如,边a等)。
112.知识图谱的节点可以包括病人个体节点和关键信息点节点。病人个体节点是指包含病人的基本信息和病情信息的节点。例如,图6所示的节点a和节点b为病人个体节点。病人个体节点的属性可以包括病人基础信息(如,性别、年龄等)、临床症状(如,发烧、呕吐等)、疾病诊断(如,糖尿病、高血压等)与治疗方案(如,服用的药物与疗程等)等。
113.关键信息点节点是指包含报告类型和关键信息内容的节点。例如,图6所示的节点1和节点2为关键信息点节点。关键信息点节点的属性可以包括检查报告类型(如,血常规、尿常规等)、关键要素特征(如,双肺、心脏等)、关键评价特征(如,双肺纹理清晰、心率正常等)。关键要素特征和关键评价特征可以基于图4所示的第二预测模型确定,将多组关键信息点410输入第二预测模型的嵌入层420,输出为多组关键信息特征430,多组关键信息特征430包括多组关键要素特征和多组关键评价特征。关于关键要素特征、关键评价特征、第二预测模型的更多内容参见图4及其相关描述。
114.知识图谱的边可以反映不同节点之间的连接关系。知识图谱的边可以包括病人个体节点之间的边(如,图6所示的边a)、病人个体节点与关键信息点节点之间的边(如,图6所示的边b)和关键信息点节点之间的边(如,图6所示的边c)。
115.病人个体节点之间的边的属性可以包括该边所连接的病人个体节点对应的病人是否为同科室病例、是否为近亲家属等。例如,图6所示的病人个体节点a和b对应的病人为同科室病例,则节点a和b相连接;又例如,图6所示的病人个体节点c和d对应的病人为近亲家属,则节点c和d相连接。
116.病人个体节点与关键信息点节点之间的边的属性可以包括病人的检查数据是否包含该关键信息点。例如,图6所示的关键信息点节点1表示“双肺纹理清晰”,若病人个体节点a的检查数据包括“双肺纹理清晰”,则节点a和节点1相连接。病人个体节点与关键信息点节点之间的边的属性还包括权重,权重可以反映关键信息点的重要程度。例如,图6所示的边b的权重可以是95。
117.关键信息点节点之间的边的属性可以包括病人的检查报告是否属于同类型的检查报告。例如,图6所示的关键信息点节点1包含血小板计数,关键信息点节点2包含白细胞计数,节点1和2均属于血常规检查报告,则节点1和2相连接。
118.在一些实施例中,分析模块120可以直接基于知识图谱确定相似病例。例如,分析模块可以将病人基础信息相近,且连接相同关键信息点节点数量最多的两个病人个体节点作为相似病例。
119.在一些实施例中,分析模块120可以使用推断模型对知识图谱进行分析处理,从而确定相似病例。
120.推断模型是指用于确定相似病例的模型。在一些实施例中,推断模型620可以对知识图谱610进行处理,获取至少一个相似病人个体及相似程度630。在一些实施例中,推断模型可以是图神经网络模型(graph neural networks,gnn)。
121.如图6所示,推断模型620的输入可以包括知识图谱610,知识图谱610中包括当前病人个体节点(如,节点a)和其他病人个体节点(如,节点b、c、d)。当前病人个体节点是指需要获取与其相似的病例的病人个体所对应的节点,其他病人个体节点是指知识图谱中除当前病人个体节点以外的其他的病人个体节点。推断模型620的输出可以包括至少一个相似病人个体及相似程度630。例如,当前病人个体可以是知识图谱610中的病人个体节点a,至少一个相似病人个体可以是知识图谱610中的病人个体节点b,相似程度可以是90%。其中,相似程度可以由知识图谱中病人个体节点之间的边(如,边a)输出,基于每个病人个体节点与其他病人个体节点之间的边输出的相似程度,确定当前病人个体节点对应的病人的相似病例。
122.在一些实施例中,分析模块120可以基于相似程度确定该相似病人是否可以作为相似病例。例如,若相似程度大于阈值(如,90%),则该相似病人可以作为相似病例。
123.在一些实施例中,推断模型620可以基于历史数据单独训练。在一些实施例中,可以基于多个第五训练样本及第五标签训练得到推断模型620。
124.在一些实施例中,训练推断模型的第五训练样本包括样本知识图谱,样本知识图谱中包括多组样本当前病人个体节点,与第五训练样本相对应的第五标签为样本知识图谱中基于病人个体节点之间的边连接的两个病人个体之间是否相似或相似程度。如可以基于样本知识图谱中通过病人个体节点之间的边连接的节点对应的病人个体的相似程度确定二者是否相似,若相似程度大于阈值(如,90%),则认为二者相似,标签为1;若相似程度小于或等于阈值,则认为二者不相似,标签为0。又如,标签值也可以为通过病人个体节点之间的边连接的节点对应的病人个体之间的相似程度。第五训练样本可以基于历史数据获取,第五标签可以通过人工标注或自动标注的方式确定。以上说明仅为示例,而非限制,第五标签可以通过各种方式获取。
125.将第五训练样本输入推断模型,基于初始推断模型的输出与第五标签构建损失函数,通过损失函数更新初始推断模型的参数,直到训练的初始推断模型满足预设条件,获取训练好的推断模型630,其中,预设条件可以是损失函数小于阈值、收敛,或训练周期达到阈值等。
126.在本说明书的一些实施例中,通过基于患者相关资料构建知识图谱,基于知识图谱来确定相似病例,可以综合考虑患者相关资料中的多种因素以及各类因素之间的关系,保证确定相似病例的准确性,基于知识图谱直接获取相似病例也可以有效节省获取相似病例的时间;并且,将知识图谱作为推断模型的输入来确定相似病例,可以进一步加强确定相似病例的准确性。
127.上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
128.同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一
实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
129.此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
130.同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
131.一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有
±
20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
132.针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
133.最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1