信息处理系统、信息处理方法及装置与流程

文档序号:22041779发布日期:2020-08-28 18:12阅读:169来源:国知局
本发明涉及计算机
技术领域
:,具体而言,涉及一种信息处理系统、信息处理方法及装置。
背景技术
::随着二代测序的普及,在产生了大量的人基因组数据的同时,推进了疾病研究的进展,解决了部分疑难杂症,并造福了部分遗传病患者。然而对于研究者,遗传咨询师或者普通人而言,怎么应用和挖掘这些信息却是一个难点。遗传病研究往往极大程度依赖各类型数据库,比如omim,hgmd,以及pubmed等等,目前暂无一个综合的从遗传病介绍,相关基因描述,突变描述,以及应用的数据库,更没有语言友好的综合数据库。这些已有的单独的数据库,由于其信息往往比较分散不系统,种类繁多且各有侧重,单一数据库信息不全面,且几乎所有这类型的数据库均是英文,以及其他局限,提高了想要使用这些数据的门槛。给研究者或者遗传咨询师们管理,查看,利用以及接解读这些数据带来了极大的困难,给普通人理解这些数据信息设置了障碍。例如,现在一个全基因组测序的样本,能够产生300-400万的snp突变数据,专业的科研学者们虽然可以借助专门的工具,或者软件对突变数据进行挖掘初步筛选,得到几十上百个候选结果。但随后需要对疾病信息,候选的突变信息进行详细的解读,难以靠某种工具完成。科研学者,或者遗传咨询师,此时需要自行查询大量数据库,文献,整理各种资料来进行后续的结果的解读,往往这个阶段是最耗时间,最繁琐的阶段,此时信息获取的不便利,就给这些工作带来了难度,提高了应用门槛。另外,由于现有疾病研究相关的数据库均比较分散,且都是特定语言版本,更新也不及时,不便于科研学者,遗传咨询师,以及普通人群查询和利用。针对上述相关技术中疾病研究相关的数据库比较分散,并且数据库语言大多为英文,无法为使用者提供较好的查询体验的问题,目前尚未提出有效的解决方案。技术实现要素:本发明实施例提供了一种信息处理系统、信息处理方法及装置,以至少解决相关技术中疾病研究相关的数据库比较分散,并且数据库语言大多为英文,无法为使用者提供较好的查询体验的技术问题。根据本发明实施例的一个方面,提供了一种信息处理系统,包括:数据处理模块,用于从第一数据库获取疾病局部信息,并将所述疾病局部信息存储至第二数据库,其中,所述第一数据库为多个,每个所述第一数据库中分别存储有疾病的不同信息;数据查询模块,用于基于疾病检索词从所述第二数据库中搜索得到疾病全局信息;语言类型转换模块,用于调用翻译插件将所述疾病全局信息进行语言类型转换,得到目标疾病全局信息;信息展示模块,用于展示所述目标疾病全局信息。可选地,所述第一数据库包括:在线人类孟德尔遗传数据库,人类基因突变数据库,以及其他生命科学领域数据库;所述第二数据库为分布式文件存储数据库。可选地,该信息处理系统还包括:可视化处理模块,用于基于所述目标疾病全局信息的特征生成预定图表,其中,所述预定图表包括以下至少之一:基于所述目标疾病全局信息生成的疾病变异曲线图,疾病在人群中的分布状态图。可选地,该信息处理系统还包括:报告生成模块,用于基于所述疾病全局信息或所述目标疾病全局信息生成疾病查询报告,其中,所述疾病查询报告包括以下至少之一:预定对象患有疾病的概率,确定预定对象患有疾病的位点。可选地,该信息处理系统还包括:数据输入模块,用于输入所述疾病检索词。可选地,所述数据处理模块,还用于对从所述第一数据库中获取的疾病局部信息进行预定处理,将处理后的所述疾病局部信息存储至所述第二数据库,其中,所述预定处理包括以下至少之一:过滤操作,分类操作,注释操作。可选地,所述数据处理模块包括:验证子模块,用于对通过所述数据输入模块提交的修正信息进行验证,以得到所述修正信息的有效性。可选地,所述数据处理模块还包括:更新子模块,用于在所述修正信息的有效性达到预定数值的情况下,利用所述修正信息对所述第二数据库进行更新。根据本发明实施例的另外一个方面,还提供了一种信息处理方法,应用于上述中任一项所述的信息处理系统,包括:响应于查询请求,进入疾病信息查询任务,并获取查询请求中携带的疾病检索词;基于所述疾病检索词从第二数据库中搜索得到疾病全局信息,其中,所述第二数据中存储有从第一数据库获取疾病局部信息,所述第一数据库为多个,每个所述第一数据库中分别存储有疾病的不同信息;对所述疾病全局信息进行语言类型转换,得到目标疾病全局信息;展示所述目标疾病全局信息。可选地,在所述获取查询请求中携带的疾病检索词之前,该信息处理方法还包括:获取通过所述信息处理系统的数据输入模块输入的登录信息;确定对所述登录信息验证成功。可选地,在所述展示所述目标疾病全局信息之前,该信息处理方法还包括以下至少之一:基于所述疾病全局信息或所述目标疾病全局信息生成疾病查询报告,其中,所述疾病查询报告包括以下至少之一:预定对象患有疾病的概率,确定预定对象患有疾病的位点;基于所述疾病全局信息或所述目标疾病全局信息生成预定图表,其中,所述预定图表包括以下至少之一:基于所述目标疾病全局信息生成的疾病变异曲线图,疾病在人群中的分布状态图。可选地,该信息处理方法还包括:获取通过所述信息处理系统的数据输入模块输入的修正信息;对所述修正信息验证,得到所述修正信息的有效性;确定所述修正信息的有效性达到预定数值,利用所述修正信息对所述第二数据库进行更新。根据本发明实施例的另外一个方面,还提供了一种信息处理装置,使用上述中任一项所述的信息处理方法,包括:第一获取单元,用于响应于查询请求,进入疾病信息查询任务,并获取查询请求中携带的疾病检索词;搜索单元,用于基于所述疾病检索词从第二数据库中搜索得到疾病全局信息,其中,所述第二数据中存储有从第一数据库获取疾病局部信息,所述第一数据库为多个,每个所述第一数据库中分别存储有疾病的不同信息;转换单元,用于对所述疾病全局信息进行语言类型转换,得到目标疾病全局信息;展示单元,用于展示所述目标疾病全局信息。可选地,该信息处理装置还包括:第二获取单元,用于在所述获取查询请求中携带的疾病检索词之前,获取通过所述信息处理系统的数据输入模块输入的登录信息;确定单元,用于确定对所述登录信息验证成功。可选地,该信息处理装置还包括以下至少之一:第一生成单元,用于在所述展示所述目标疾病全局信息之前,基于所述疾病全局信息或所述目标疾病全局信息生成疾病查询报告,其中,所述疾病查询报告包括以下至少之一:预定对象患有疾病的概率,确定预定对象患有疾病的位点;第二生成单元,用于基于所述疾病全局信息或所述目标疾病全局信息生成预定图表,其中,所述预定图表包括以下至少之一:基于所述目标疾病全局信息生成的疾病变异曲线图,疾病在人群中的分布状态图。可选地,该信息处理装置还包括:第三获取单元,用于获取通过所述信息处理系统的数据输入模块输入的修正信息;第四获取单元,用于对所述修正信息验证,得到所述修正信息的有效性;更新单元,用于确定所述修正信息的有效性达到预定数值,利用所述修正信息对所述第二数据库进行更新。根据本发明实施例的另外一个方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述中任一项所述的信息处理方法。根据本发明实施例的另外一个方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任一项所述的信息处理方法。根据本发明实施例的另外一个方面,还提供了一种信息处理设备,包括:存储器,与所述存储器耦合的处理器,所述存储器和所述处理器通过总线系统相通信;所述存储器用于存储程序,其中,所述程序在被处理器执行时控制所述存储器所在设备执行上述中任一项所述的信息处理方法;所述处理器用于运行程序,其中,所述程序运行时执行上述中任一项所述的信息处理方法。在本发明实施例中,采用数据处理模块,用于从第一数据库获取疾病局部信息,并将疾病局部信息存储至第二数据库,其中,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息;数据查询模块,用于基于疾病检索词从第二数据库中搜索得到疾病全局信息;语言类型转换模块,用于调用翻译插件将疾病全局信息进行语言类型转换,得到目标疾病全局信息;信息展示模块,用于展示目标疾病全局信息,通过本发明实施例提供的信息处理系统,实现了将多个数据库中的疾病局部信息进行整合汇总后存储至一个数据库,以便使用者搜索得到比较完整的疾病相关信息的目的,达到了提高使用者的体验的技术效果,同时也提高了信息处理系统的响应速度,降低了对使用者的要求,进而解决了相关技术中疾病研究相关的数据库比较分散,并且数据库语言大多为英文,无法为使用者提供较好的查询体验的技术问题。附图说明此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是根据本发明实施例的信息处理方法的流程图;图2是根据本发明实施例的信息处理系统的框架图;图3是根据本发明实施例的信息处理方法的流程图;图4是根据本发明实施例的信息处理装置的示意图。具体实施方式为了使本
技术领域
:的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。针对上述没有一个综合的从遗传疾病介绍,相关基于描述,突变描述,以及应用的数据库,更没有语言友好的综合数据库;而已有的单独的数据库由于其信息往往比较分散不够系统,种类繁多且各有侧重,单一数据库信息不全面,且无法进行语言类型的切换,以及其他局限性,提高了想要使用这些数据的门槛,给使用者带来了极大的不便的弊端。本发明的提供了一个综合完善的疾病知识和信息的数据库,且同时提供导出,自动英文到中文的翻译,随时更新等功能,便于科研工作者,遗传咨询师以及普通人获取和利用已有科研成果,助力遗传筛查。下面结合下述实施例进行说明。根据本发明实施例的一个方面,提供了一种信息处理系统,图1是根据本发明实施例的信息处理系统的示意图,如图1所示,该信息处理系统包括:数据处理模块11,数据查询模块13,语言类型转换模块15以及信息展示模块17。下面对该信息处理系统进行说明。数据处理模块11,用于从第一数据库获取疾病局部信息,并将疾病局部信息存储至第二数据库,其中,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息。可选的,这里的第一数据库为多个,它们分别有针对性地存储疾病不同的数据,例如,第一一数据库存储有不同疾病的疾病介绍信息,第一二数据库存储有不同疾病的基因描述信息,第一三数据库存储有不同疾病的突变描述信息等。第一数据库中存储的均为疾病的局部信息,即,仅仅是对疾病的某一个方面的信息,并没有疾病比较全面综合的全局信息。可选的,上述第一数据库可以包括:在线人类孟德尔遗传数据库,人类基因突变数据库,以及其他生命科学领域数据库;第二数据库为分布式文件存储数据库。其中,在线人类孟德尔遗传数据库,即,omim数据库,主要记录有所有已知的遗传病、遗传决定的性状及其基因;人类基因突变数据库,即,hgmd数据库,主要用于收录整理已经发表文献中与人类遗传病密切相关的致病位点,致力于收录已发表的人类遗传病致病突变或相关突变;其他生命领域数据库,可以为pubmed数据库,其主要是一个提供生物医学方面的论文搜寻以及摘要,并且免费搜寻的数据库,数据库来源为medline。可选的,第二数据库可以为分布式文件存储数据库,例如,mongodb数据库。可选的,上述疾病局部信息表示描述疾病某一方面的信息;例如,疾病介绍信息,疾病的基因相关信息,疾病的突变信息等。在一种可选的实施例中,数据处理模块11通过第一数据库与第二数据库的接口,从第一数据库中获取疾病局部信息,并对获取的疾病局部信息进行整合处理后,传输至第二数据库,从而使得第二数据库中存储有多种不同疾病比较完整的信息,例如,疾病的介绍信息,疾病的基因相关信息,疾病的突变信息等。即,数据处理模块11可以用于对从第一数据库中获取的疾病局部信息进行整合汇总处理,得到疾病全局信息,进入将疾病全局信息存储至第二数据库。具体地,数据处理模块可以将从多个第一数据库中获取的疾病不同方面的信息进行整个,得到疾病比较完整、综合的信息,从而使得使用者通过一次检索即可得到想要了解的疾病的比较全面的信息。数据查询模块13,用于基于疾病检索词从第二数据库中搜索得到疾病全局信息。可选的,疾病检索词可以是使用者为了查询得到某种疾病的信息而确定的与该疾病相关的词条,例如,疾病名称,疾病简称等可以作为搜索疾病信息的词条。在一种可选的实施例中,当使用者输入疾病检索词后,数据查询模块可以基于疾病检索词从第二数据库中搜索得到疾病比较全面的信息,无需信息处理系统调用多个数据库,以获取疾病不同方面的信息。语言类型转换模块15,用于调用翻译插件将疾病全局信息进行语言类型转换,得到目标疾病全局信息。可选的,上述翻译插件可以进行不同语言之间的转换,当基于数据查询模块13搜索得到疾病全局信息之后,可以基于使用者的需求,将疾病全局信息进行语言类型转换,得到满足使用者需求,便于使用者浏览的语言类型的目标疾病全局信息。信息展示模块17,用于展示目标疾病全局信息。由上可知,在本发明实施例中,可以利用数据处理模块从第一数据库获取疾病局部信息,并将疾病局部信息存储至第二数据库,其中,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息;也可以利用数据查询模块基于疾病检索词从第二数据库中搜索得到疾病全局信息;同时也可以利用语言类型转换模块调用翻译插件将疾病全局信息进行语言类型转换,得到目标疾病全局信息;以及利用信息展示模块展示目标疾病全局信息,实现了将多个数据库中的疾病局部信息进行整合汇总后存储至一个数据库,以便使用者搜索得到比较完整的疾病相关信息的目的,达到了提高使用者的体验的技术效果,同时也提高了信息处理系统的响应速度,降低了对使用者的要求。因此,通过本发明实施例提供的信息处理系统,解决了相关技术中疾病研究相关的数据库比较分散,并且数据库语言大多为英文,无法为使用者提供较好的查询体验的技术问题。在一种可选的实施例中,该信息处理系统还可以包括:可视化处理模块,用于基于目标疾病全局信息的特征生成预定图表,其中,预定图表包括以下至少之一:基于目标疾病全局信息生成的疾病变异曲线图,疾病在人群中的分布状态图。在该实施例中,可以基于查询得到的目标疾病全局信息的特征(例如,疾病的变异情况,疾病在人群中的分布情况,疾病的易感人群,疾病的多发时间,疾病的多发地区)绘制得到预定图表,从而可以使使用者比较直观地得到疾病的相关信息。在一种可选的实施例中,该信息处理系统还包括:报告生成模块,用于基于疾病全局信息或目标疾病全局信息生成疾病查询报告,其中,疾病查询报告包括以下至少之一:预定对象患有疾病的概率,确定预定对象患有疾病的位点。在该实施例中,可以基于疾病全局信息或者目标疾病全局信息生成疾病查询报告;例如,可以基于使用者输入的信息,将其与第二数据库中存储的数据进行比对,从而可以得到预定对象患有疾病的概率,也可以得到确定预定对象患有疾病所依据的点位。在一种可选的实施例中,该信息处理系统还包括:数据输入模块,用于输入疾病检索词。在该实施例中,可以在信息处理系统中设置有数据输入模块,使用者可以通过该模块输入疾病检索词,以进行查询。在一种可选的实施例中,数据处理模块,还用于对从第一数据库中获取的疾病局部信息进行预定处理,将处理后的疾病局部信息存储至第二数据库,其中,预定处理包括以下至少之一:过滤操作,分类操作,注释操作。在该实施例中,由于从第一数据库中获取的疾病局部信息可能会存在一些多余的信息、信息不全的条目等,为了保证第二数据库中存储的疾病信息的可靠性,在从第一数据库中获取疾病局部信息后,会先对其进行预定处理,例如,过滤掉信息不全的条目,并对位点信息添加注释信息,以良好的形式存放于第二数据库中。其中,可以利用annovar等软件对位点信息添加注释信息。在一种可选的实施例中,数据处理模块包括:验证子模块,用于对通过数据输入模块提交的修正信息进行验证,以得到修正信息的有效性。在该实施例中,当使用者获取到目标疾病全局信息后,可以基于自身知识储备或经验验证得到的目标疾病全局信息的有效性、真实性、可靠性等;具体地,可以当使用者认为获取的目标疾病全局信息存在有效性、真实性以及可靠性等问题时,可以通过数据输入模块提交修正信息,此时,验证子模块可以对使用者提交的修正信息进行验证,以得到修正信息的有效性。在一种可选的实施例中,数据处理模块还包括:更新子模块,用于在修正信息的有效性达到预定数值的情况下,利用修正信息对第二数据库进行更新。在该实施例中,可以通过修正信息对第二数据库进行更新,以保证第二数据库的有效性、真实性以及可靠性。另外,更新子模块也可以实时从其他数据库或者网页等获取疾病最新信息,以对第二数据库进行更新。图2是根据本发明实施例的信息处理系统的框架图,如图2所示,该信息处理系统可以包括:前端框架,与使用者进行交互;后台处理框架,进行数据的处理。使用者可以通过前端框架中登录模块输入个人账号以及密码等信息登录进入该信息处理系统,进入个人页面;然后,进入数据库网站,通过启动第二数据库后台框架,第二数据库从第一数据库(例如,hgmd数据库数据、omim数据库数据、pubmed数据库数据)获取疾病局部信息,汇总整合后存储;后台处理框架也可以进行逻辑处理,报告生成以及绘图等,以供前端框架的数据获取以及展示需求。上述信息处理系统的使用主要包括四个部分,自写后台代码、服务器、数据库以及前端展示网站,其中,服务器可以选择nginx或apache,数据库可选择sqlite或mysql,后端框架可以选择django,开发版本可以为2.2版本;另外,本发明实施例的信息处理系统对操作系统是没有限制的,可跨平台使用。其中,后端可通过自写代码获取疾病相关数据库的知识与信息,存放于mongodb,并通过django框架实现前端网页的交互,另外还可以通过自写软件代码实现其他扩展功能,在未来实现更多功能。通过本发明实施例提供的信息处理系统,通过开发软件与代码,整合国际通用的遗传疾病研究相关的突变数据库,疾病知识库以及自动翻译系统,将数据挖掘、数据校正与更新,自动语言翻译等功能集中到一套软件代码中,并形成了一套综合的遗传疾病知识与突变信息的查询与展示体系,能够构建权威且完善的综合型疾病知识库,使非专业预定对象能够便捷地进行综合且全面的遗传疾病相关资源的查询与获取,降低了科研学者、遗传咨询师、普通人分析和理解遗传信息的门槛,助力遗传疾病的诊断与治疗。具有以下优点:1).构建了全面综合的疾病信息知识库:利用软件代码获取疾病相关的各层级的信息,包括背景信息,疾病相关的基因信息,突变信息等,比如整合omim数据库,hgmd数据库,pubmed数据库等权威数据库信息并进行,保证结果的全面性,权威性与准确性;2).数据自动翻译:由于遗传病研究相关的数据库,知识库,几乎都是英文构建,本系统能在使用后自动进行数据信息的翻译,支持出具中英文报告,便于各类型人群的使用和理解;3)操作简单且结果明确:网页端的查询端口,输入查询疾病相关的信息,就能展现全面系统的疾病描述信息,相关致病基因信息,已报道致病突变信息等,并且能进行导出;4)便捷的数据矫正功能:虽然各个数据库权威性已经非常强,但是部分文章的证据力度不一定满足需求,且文献更新的速度很快,公共数据库不一定能及时更新,预定对象实际使用系统的过程中,可以根据查询的结果,判断准确性与新颖性,在网页端提交更新,以后再次应用则自动更新了矫正后的数据信息;5)可扩展的潜力:基于本发明,未来还可以产生许多可扩展的应用,例如,预定对象输入自定义位点,通过综合数据库进行解读和出具报告等。根据本发明实施例,提供了一种信息处理方法的方法实施例,需要说明的是,该信息处理方法应用于上述中任一项的信息处理系统,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图3是根据本发明实施例的信息处理方法的流程图,如图3所示,该信息处理方法包括如下步骤:步骤s302,响应于查询请求,进入疾病信息查询任务,并获取查询请求中携带的疾病检索词。可选的,这里查询请求可以为使用者通过信息处理系统的数据输入模块来输入疾病检索词后,并通过触发查询控件来触发的请求。步骤s304,基于疾病检索词从第二数据库中搜索得到疾病全局信息,其中,第二数据中存储有从第一数据库获取疾病局部信息,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息。可选的,这里的第一数据库为多个,它们分别有针对性地存储疾病不同的数据,例如,第一一数据库存储有不同疾病的疾病介绍信息,第一二数据库存储有不同疾病的基因描述信息,第一三数据库存储有不同疾病的突变描述信息等。第一数据库中存储的均为疾病的局部信息,即,仅仅是对疾病的某一个方面的信息,并没有疾病比较全面综合的全局信息。可选的,上述第一数据库可以包括:在线人类孟德尔遗传数据库,人类基因突变数据库,生命科学领域数据库;第二数据库为分布式文件存储数据库。其中,在线人类孟德尔遗传数据库,即,omim数据库,主要记录有所有已知的遗传病、遗传决定的性状及其基因;人类基因突变数据库,即,hgmd数据库,主要用于收录整理已经发表文献中与人类遗传病密切相关的致病位点,致力于收录已发表的人类遗传病致病突变或相关突变;生命领域数据库,可以为pubmed数据库,其是一个提供生物医学方面的论文搜寻以及摘要,并且免费搜寻的数据库,数据库来源为medline。可选的,第二数据库可以为分布式文件存储数据库,例如,mongodb数据库。可选的,上述疾病局部信息表示描述疾病某一方面的信息;例如,疾病介绍信息,疾病的基因相关信息,疾病的突变信息等。在一种可选的实施例中,数据处理模块通过第一数据库与第二数据库的接口,从第一数据库中获取疾病局部信息,并对获取的疾病局部信息进行整合处理后,传输至第二数据库,从而使得第二数据库中存储有多种不同疾病比较完整的信息,例如,疾病的介绍信息,疾病的基因相关信息,疾病的突变信息等。即,数据处理模块可以用于对从第一数据库中获取的疾病局部信息进行整合汇总处理,得到疾病全局信息,进入将疾病全局信息存储至第二数据库。具体地,数据处理模块可以将从多个第一数据库中获取的疾病不同方面的信息进行整个,得到疾病比较完整、综合的信息,从而使得使用者通过一次检索即可得到想要了解的疾病的比较全面的信息。步骤s306,对疾病全局信息进行语言类型转换,得到目标疾病全局信息。可选的,在本发明实施例中,可以通过调取翻译插件对疾病全局信息基于使用者的需求进行翻译,即,当基于数据查询模块搜索得到疾病全局信息之后,可以基于使用者的需求,将疾病全局信息进行语言类型转换,得到满足使用者需求,便于使用者浏览的语言类型的目标疾病全局信息。步骤s308,展示目标疾病全局信息。由上可知,在本发明实施例中,可以响应于查询请求,进入疾病信息查询任务,并获取查询请求中携带的疾病检索词;基于疾病检索词从第二数据库中搜索得到疾病全局信息,其中,第二数据中存储有从第一数据库获取疾病局部信息,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息;对疾病全局信息进行语言类型转换,得到目标疾病全局信息;展示目标疾病全局信息,实现了将多个数据库中的疾病局部信息进行整合汇总后存储至一个数据库,以便使用者搜索得到比较完整的疾病相关信息的目的,达到了提高使用者的体验的技术效果,同时也提高了信息处理系统的响应速度,降低了对使用者的要求。因此,通过本发明实施例提供的信息处理方法,解决了相关技术中疾病研究相关的数据库比较分散,并且数据库语言大多为英文,无法为使用者提供较好的查询体验的技术问题。在一种可选的实施例中,在获取查询请求中携带的疾病检索词之前,该信息处理方法还可以包括:获取通过信息处理系统的数据输入模块输入的登录信息;确定对登录信息验证成功。在一种可选的实施例中,在展示目标疾病全局信息之前,该信息处理方法还可以包括以下至少之一:基于疾病全局信息或目标疾病全局信息生成疾病查询报告,其中,疾病查询报告包括以下至少之一:预定对象患有疾病的概率,确定预定对象患有疾病的位点;基于疾病全局信息或目标疾病全局信息生成预定图表,其中,预定图表包括以下至少之一:基于目标疾病全局信息生成的疾病变异曲线图,疾病在人群中的分布状态图。在该实施例中,可以基于疾病全局信息或者目标疾病全局信息生成疾病查询报告;例如,可以基于使用者输入的信息,将其与第二数据库中存储的数据进行比对,从而可以得到预定对象患有疾病的概率,也可以得到确定预定对象患有疾病所依据的点位。另外,在该实施例中,也可以基于查询得到的目标疾病全局信息的特征(例如,疾病的变异情况,疾病在人群中的分布情况,疾病的易感人群,疾病的多发时间,疾病的多发地区)绘制得到预定图表,从而可以使使用者比较直观地得到疾病的相关信息。在一种可选的实施例中,该信息处理方法还可以包括:获取通过信息处理系统的数据输入模块输入的修正信息;对修正信息验证,得到修正信息的有效性;确定修正信息的有效性达到预定数值,利用修正信息对第二数据库进行更新。在该实施例中,当使用者获取到目标疾病全局信息后,可以基于自身知识储备或经验验证得到的目标疾病全局信息的有效性、真实性、可靠性等;具体地,可以当使用者认为获取的目标疾病全局信息存在有效性、真实性以及可靠性等问题时,可以通过数据输入模块提交修正信息,此时,可以通过验证子模块对使用者提交的修正信息进行验证,以得到修正信息的有效性。在该实施例中,可以通过修正信息对第二数据库进行更新,以保证第二数据库的有效性、真实性以及可靠性。另外,也可以实时从其他数据库或者网页等获取疾病最新信息,以对第二数据库进行更新。在本发明实施例中,可以通过软件代码整合遗传病相关的各类数据库,涵盖遗传病背景知识,相关的突变基因,突变位点等综合信息,形成了一个遗传病知识与信息的整合系统,并且能实现自动的中文展示,实现专业与非专业数据处理人员对遗传数据的查询和处理,降低科研工作者,遗传咨询师以及普通人获取和利用科研成果的门槛,助力遗传筛查。另外,在本发明实施例中,可以利用自写软件或与处理数据,具体地,可以利用python自写软件代码,从互联网获取各类数据库的数据,并进行整理与翻译,然后存放与mongodb数据库中,形成综合的疾病知识与信息的数据库;云服务器的部署和应用的安装:在云服务器上安装依赖应用,并进行数据库网站搭建,数据库网站搭建依赖django框架。在django框架下,通过自写软件形成几个应用模块,disease_search应用模块用于查询数据库的信息,disease_report应用模块则用于生成相关的报告,其他的应用还有chromosome_plot和diseasedb_api,分别用于绘图及与数据库交互。然后预定对象可以通过浏览器访问主页。在本发明实施例中,利用自写软件获取以及翻译来源于omim,hgmd,pubmed等公共数据库的疾病基本信息,描述信息,疾病相关的基因信息,和具体的相关的突变信息等信息,形成综合的从疾病基础信息,到解释疾病的致病突变的信息的综合疾病知识库。然后,在前端使用php搭建网页来进行展示和管理。随后,预定对象在网页端,输入的疾病名称,利用基于字符串匹配算法在我们构建好的数据库中搜索相关的疾病及表型,可以同时获取这些疾病或表型相关联的基因及位点等综合信息,并可进行导出和相关的扩展应用。该软件的数据主要来源与omim,hgmd,pubmed等国际通用的疾病数据库,数据类型为疾病基础信息,疾病与基因,或者疾病,基因及位点关联等信息,这些数据在存放之前都经过了精心的过滤和注释,过滤掉信息不全的条目,并使用annovar软件对位点信息添加了注释信息,以良好的形式存放于mongodb数据库中。为了实现数据的查询,编写了一套专门用于查询及更新疾病基因关联数据的接口软件,该接口软件可以在linux系统上运行,与mongodb数据库连接,通过pymongo模块查询数据。在预定对象输入要查找的疾病名称后,借助fuzzywuzzy模块提供的字符串匹配算法,找到最相近的疾病或表型名称,在预定对象选定需要的表型后,将这些表型相关的数据库记录全部提取并反馈预定对象。为了保证数据库的内容与时俱进,一方面软件有更新数据库的功能,另一方面预定对象也可以反馈新的数据,通过前端页面的表格提交数据的修改,这些修改的内容会回传到后台并最终反馈记录在数据库中,包括提交人的信息以及提交时间,修改内容均会记录在数据库中。文献相关信息的获取来源于提前收集好的ncbipubmed数据库的文献信息,同时使用google翻译对摘要等内容进行翻译,翻译完成后存放于mongodb数据库中,每次查询均会对涉及的文献进行提取。前端页面的展示及功能主要依赖于javascript+html+css来实现,涉及jquery,datables及bootstrap库等。由于展示的内容较多,为了给预定对象提供良好的浏览体验,对展示的内容分块同时进行异步请求,保证快速的页面加载及功能分离。通过本发明实施例提供的信息处理方法,相对omim数据库更加综合全面,涵盖从疾病基本信息,基因突变,位点突变信息等完整且综合的遗传病研究所需的关键信息;相对于omim数据库更加友好,可以有中英文双版,也可以基于需求设置更多其他版;相对omim数据库使用更加便捷,可以实现网页端的导出与更新;涵盖omim数据库所有的信息;具有更好的可扩展性,未来可以完善更多知识信息,增加例如自定义输入疾病名称与突变信息,利用本发明产生的知识库进行自动解读和出具报告等功能。根据本发明实施例的另外一个方面,还提供了一种信息处理装置,使用上述中任一项的信息处理方法,图4是根据本发明实施例的信息处理装置的示意图,如图4所示,该信息处理装置可以包括:第一获取单元41,搜索单元43,转换单元45以及展示单元47。下面对该信息处理装置进行详细说明。第一获取单元41,用于响应于查询请求,进入疾病信息查询任务,并获取查询请求中携带的疾病检索词。搜索单元43,用于基于疾病检索词从第二数据库中搜索得到疾病全局信息,其中,第二数据中存储有从第一数据库获取疾病局部信息,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息。转换单元45,用于对疾病全局信息进行语言类型转换,得到目标疾病全局信息。展示单元47,用于展示目标疾病全局信息。此处需要说明的是,上述第一获取单元41,搜索单元43,转换单元45以及展示单元47对应于实施例中的步骤s302至s308,上述单元与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述单元作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。由上可知,在本申请上述实施例中,可以利用第一获取单元响应于查询请求,进入疾病信息查询任务,并获取查询请求中携带的疾病检索词;然后利用搜索单元基于疾病检索词从第二数据库中搜索得到疾病全局信息,其中,第二数据中存储有从第一数据库获取疾病局部信息,第一数据库为多个,每个第一数据库中分别存储有疾病的不同信息;并利用转换单元对疾病全局信息进行语言类型转换,得到目标疾病全局信息;以及利用展示单元展示目标疾病全局信息。通过本发明实施例提供的信息处理装置,实现了将多个数据库中的疾病局部信息进行整合汇总后存储至一个数据库,以便使用者搜索得到比较完整的疾病相关信息的目的,达到了提高使用者的体验的技术效果,同时也提高了信息处理系统的响应速度,降低了对使用者的要求,进而解决了相关技术中疾病研究相关的数据库比较分散,并且数据库语言大多为英文,无法为使用者提供较好的查询体验的技术问题。在一种可选的实施例中,该信息处理装置还包括:第二获取单元,用于在获取查询请求中携带的疾病检索词之前,获取通过信息处理系统的数据输入模块输入的登录信息;确定单元,用于确定对登录信息验证成功。在一种可选的实施例中,该信息处理装置还包括以下至少之一:第一生成单元,用于在展示目标疾病全局信息之前,基于疾病全局信息或目标疾病全局信息生成疾病查询报告,其中,疾病查询报告包括以下至少之一:预定对象患有疾病的概率,确定预定对象患有疾病的位点;第二生成单元,用于基于疾病全局信息或目标疾病全局信息生成预定图表,其中,预定图表包括以下至少之一:基于目标疾病全局信息生成的疾病变异曲线图,疾病在人群中的分布状态图。在一种可选的实施例中,该信息处理装置还包括:第三获取单元,用于获取通过信息处理系统的数据输入模块输入的修正信息;第四获取单元,用于对修正信息验证,得到修正信息的有效性;更新单元,用于确定修正信息的有效性达到预定数值,利用修正信息对第二数据库进行更新。根据本发明实施例的另外一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,程序执行上述中任一项的信息处理方法。根据本发明实施例的另外一个方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任一项的信息处理方法。根据本发明实施例的另外一个方面,还提供了一种信息处理设备,包括:存储器,与存储器耦合的处理器,存储器和处理器通过总线系统相通信;存储器用于存储程序,其中,程序在被处理器执行时控制存储器所在设备执行上述中任一项的信息处理方法;处理器用于运行程序,其中,程序运行时执行上述中任一项的信息处理方法。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅是本发明的优选实施方式,应当指出,对于本
技术领域
:的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1