混合云架构下的微创医疗服务系统及其辅助决策方法与流程

文档序号:13558436阅读:715来源:国知局
混合云架构下的微创医疗服务系统及其辅助决策方法与流程
本发明涉及数据处理
技术领域
,尤其涉及一种混合云架构下的微创医疗服务系统及其辅助决策方法。
背景技术
:目前,医疗工作者为患者诊断时,需要有丰富的经验,才能得到准确的临床结果。随着患者的增加,医疗工作者的工作负担越来越重,为获取准确的临床结果,需要查询大量的检查报告和病理检查,从而得到诊断结果。然而,查询上述大量的检查报告和病理检查会占用医疗工作者的时间,降低诊断效率,从而进一步加重医疗工作者的负担。技术实现要素:针对相关技术中的缺陷,本发明提供了一种混合云架构下的微创医疗服务系统及其辅助决策方法,用于解决相关技术中的技术问题。第一方面,本发明实施例提供了一种混合云架构下的微创医疗服务辅助决策方法,所述方法包括:获取目标对象的隐私数据和检查数据;在特征项集合中查询所述隐私数据和所述检查数据中存在的至少一个预设特征项,所述至少一个预设特征项与特征项集合中任意一个特征项重合或者部分重合;以表格形式输出所述至少一个特征项。可选地,特征项集合的获取方法包括:对已有的病历文本进行分词,提取出特征词并量化;所述病历文本包括检查数据,病历数据和隐私数据;构造(x,y)的训练数据,其中x为量化后的特征项,y为处理过的病理检查结果,每一份病历都可以得到这样一对(x,y)的训练样例;遍历x的子集,分别构造(x1,y)、(x2,y)、……、(xn,y)的训练样例,其中n是x的子集数量;选择k中机器学习方法,对每种方法,使用上一步的训练样本,分别训练,保证分类精度大于阈值的情况下,得到若干x的特征子集,选择其分类精度最好的一组特征子集;选择k种机器学习方法,即可得到k个子集,求并集,即为最终特征子集。可选地,所述对已有的病历文本进行分词,提取出特征词并量化,包括:从私有云获取目标对象的隐私数据解密,得到该目标对象的年龄和性别数据;从公有云获取该目标对象的检查数据,根据分词词典对所述检查数据进行文本分词和去停止词,剔除含否定词的短语后得到多个预设特征项;所述多个预设特征项包括键值对型和平行词型,并分别为每个预设特征项进行赋值。可选地,所述分词词典根据历史检查数据确定。第二方面,本发明实施例提供了一种混合云架构下的微创医疗服务辅助决系统,所述系统包括:数据获取模块,用于获取目标对象的隐私数据和检查数据;特征项查询模块,用于在特征项集合中查询所述隐私数据和所述检查数据中存在的至少一个预设特征项,所述至少一个预设特征项与特征项集合中任意一个特征项重合或者部分重合;输出模块,用于以表格形式输出所述至少一个特征项。可选地,所述数据获取模块包括:特征词提取单元,用于对已有的病历文本进行分词,提取出特征词并量化;所述病历文本包括检查数据,病历数据和隐私数据;数据构造单元,用于构造(x,y)的训练数据,其中x为量化后的特征项,y为处理过的病理检查结果,每一份病历都可以得到这样一对(x,y)的训练样例;样例构造单元,用于遍历x的子集,分别构造(x1,y)、(x2,y)、……、(xn,y)的训练样例,其中n是x的子集数量;训练单元,用于选择k中机器学习方法,对每种方法,使用上一步的训练样本,分别训练,保证分类精度大于阈值的情况下,得到若干x的特征子集,选择其分类精度最好的一组特征子集;子集计算单元,用于选择k种机器学习方法得到k个子集,且计算k个子集的并集得到最终特征子集。可选地,所述特征词提取单元包括:解密子单元,用于从私有云获取目标对象的隐私数据解密,得到该目标对象的年龄和性别数据;特征项获取子单元,用于从公有云获取该目标对象的检查数据,根据分词词典对所述检查数据进行文本分词和去停止词,剔除含否定词的短语后得到多个预设特征项;赋值子单元,用于为所述多个预设特征项中每个预设特征项进行赋值,所述多个预设特征项包括键值对型和平行词型。可选地,所述分词词典根据历史检查数据确定。由以上方案可知,本发明通过获取目标对象的隐私数据和检查数据;在特征项集合中查询所述隐私数据和所述检查数据中存在的至少一个预设特征项,所述至少一个预设特征项与特征项集合中任意一个特征项重合或者部分重合;以表格形式输出所述至少一个特征项。可见,本发明能够检查数据中提出与目标对象最相关的预设特征项,输出后辅助医疗人员作决策,可以减轻医护人员的工作负担,降低医疗事件的发生概率。附图说明为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1是本发明实施例提供的一种混合云架构下的微创医疗服务辅助决策方法的流程示意图;图2是本发明实施例提供的构建特征项集合的流程示意图;图3是本发明实施例提供的一种混合云架构下的微创医疗服务辅助决策的框图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1是本发明实施例提供的一种混合云架构下的微创医疗服务辅助决策方法的流程示意图。本方法可以应用于私有云和公有云构成的混合云架构的系统,并且该方法可以辅助医疗人员根据检查数据决策目标对象(例如患者)的症状等情况。参见图1,该方法包括步骤101~步骤103:步骤101,获取目标对象的隐私数据和检查数据。本实施例中目标对象可以为患者,后续以患者为例进行说明。患者在检查时,病历样本上会包括隐私数据(例如姓名、性别)和检查数据(各种生理特征)。为提高数据安全,本实施例中将隐私数据加密后存储在私有云,将检查数据存储在公有云。步骤102,在特征项集合中查询所述隐私数据和所述检查数据中存在的至少一个预设特征项,所述至少一个预设特征项与特征项集合中任意一个特征项重合或者部分重合。本实施例中,选用机器学习领域的k(k为正整数)种不同的特征选择方法,在保证分类精度的情况下,对特征项集合中的特征项进行选择,剔除部分相关性较弱(即相关性低于预设阈值)的特征项,得到与疾病相关性较强(即相关性超过预设阈值)的特征项。本实施例中,特征选择方法可以包括:逻辑回归(lr)、最小近邻算法(knn)、支持向量机(svm)、随机森林(rf)等。这些特征选择方法的选择过程包括:选择特征项集合中的特征子集,病理检查结果作为类标签,训练模型,选择分类精度最好的特征子集,作为选择出来的特征项。例如,(x1,x2,x3,x4,x5,x6,y),x为特征,y为分类标签,用(x1,x2,x4,x5,x6,y)、(x1,x3,x4,x5,x6,y)、(x1,x2,x3,x4,x6,y)……分别进行模型训练,分类精度最好的一组特征项即是最终最相关的特征项。本实施例中,对于每一种特征选择方法,可得到一个预设特征项的集合t1={t1,t2,…,ti,…,tk},i限值范围[1,k],即k种特征选择方法会得到k个特征词集合,最后对k个特征词集合取并集,得到最终的特征项集合。可理解的是,在使用特征项集合之前,需要预先获取该特征项集合,参见图2,包括:本实施例中,获取预设数量的病历样本,可以包括检查数据,病历数据,隐私数据。然后根据每个病历样本中的隐私数据从私有云获取患者的隐私数据,进行解密,取得患者年龄和性别数据。从公有云获取每个病历样本的检查数据。依据每份检测数据构建分词词典,并对检查数据进行分词(即预设特征项)和去停止词。然后剔除如“未见异常”、“边缘不规则”等带否定词的分词。经过分词和剔除后得到的预设特征项包括键值对型和平行词型。平行词型特征词如:“充血”,“水肿”。键值对型特征词如:“黏膜(光滑柔软),血管纹理(清晰),扩张度(好),齿状线(清晰),黏液糊量(中),黏液糊量(清),粘膜(光滑),蠕动(可)”。对于平行词型特征词的选取,需满足α≤df≤γ;其中df为文档频,可以根据具体场景进行设置。对于键值对型特征词,选取其“键”列入特征词集。本实施例中,对两种类型的预设特征词分别设定赋值规进行赋值。例如,对平行词型特征词,按其在病历样本di中出现与否,为该平行词型特征词赋值为或者1。键值对型特征词的赋值,通常是一“键”多“值”,依据其“值”的个数,分别设定不同的赋值规则。例如,边缘(无-0,整齐-0,尚规整-1,尚整齐-1,不规整-2,欠光整-2,不齐-2,不规则隆起-3,粘膜皱缩隆起-3),质(无-0,软-0,脆-1,韧-2,硬-3),蠕动(无-0,可-0,欠佳-1,减少-1,一般-1,稍差-1,消失-3,差-2),溃疡浸润型病灶(无-0,一-1,大面积-2,巨大-3),溃疡病灶表面的描述(无-0,白苔-1,黄(白)苔-2)等,本实施例中仅介绍了几种情况的说明,本领域技术人员可以根据具体场景进行设置,本实施例不作限定。本实施例中,将隐私数据(年龄、性别)和检查数据经处理后提取的预设特征词(键值对型和平行词型)进行融合。并将病历样本集d={d1,d2,...,dm},表示为一个个特征项集合v=(v1,v2,...,vn),其中m表示病历样本数量,n表示特征项维度。步骤103,以表格形式输出所述至少一个特征项。本实施例中,将预设特征项以表格形式输出,这样方便医疗人员根据病历样本进行决策,如表1所示。表1病历样本特征项表特征项键值僵硬1质2…………隆起1.3病变面积2.3可见,本发明能够检查数据中提出与目标对象最相关的预设特征项,输出后辅助医疗人员作决策,可以减轻医护人员的工作负担,降低医疗事件的发生概率。图3是本发明实施例提供的一种混合云架构下的微创医疗服务辅助决策的框图。参见图3,该系统包括:数据获取模块301,用于获取目标对象的隐私数据和检查数据;特征项查询模块302,用于在特征项集合中查询所述隐私数据和所述检查数据中存在的至少一个预设特征项,所述至少一个预设特征项与特征项集合中任意一个特征项重合或者部分重合;输出模块303,用于以表格形式输出所述至少一个特征项。可选地,所述数据获取模块包括:特征词提取单元,用于对已有的病历文本进行分词,提取出特征词并量化;所述病历文本包括检查数据,病历数据和隐私数据;数据构造单元,用于构造(x,y)的训练数据,其中x为量化后的特征项,y为处理过的病理检查结果,每一份病历都可以得到这样一对(x,y)的训练样例;样例构造单元,用于遍历x的子集,分别构造(x1,y)、(x2,y)、……、(xn,y)的训练样例,其中n是x的子集数量;训练单元,用于选择k中机器学习方法,对每种方法,使用上一步的训练样本,分别训练,保证分类精度大于阈值的情况下,得到若干x的特征子集,选择其分类精度最好的一组特征子集;子集计算单元,用于选择k种机器学习方法得到k个子集,且计算k个子集的并集得到最终特征子集。可选地,所述特征词提取单元包括:解密子单元,用于从私有云获取目标对象的隐私数据解密,得到该目标对象的年龄和性别数据;特征项获取子单元,用于从公有云获取该目标对象的检查数据,根据分词词典对所述检查数据进行文本分词和去停止词,剔除含否定词的短语后得到多个预设特征项;赋值子单元,用于为所述多个预设特征项中每个预设特征项进行赋值,所述多个预设特征项包括键值对型和平行词型。可选地,所述分词词典根据历史检查数据确定。需要说明的是,本发明实施例提供的系统与上述方法相对应,上述方法的实施细节同样适用于上述系统,本发明实施例不再对上述系统进行详细说明。本发明的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。本领域技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在于该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是互相排斥之处,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一种浏览器终端的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1