传染病信息知识服务系统的制作方法

文档序号:6447030阅读:149来源:国知局
专利名称:传染病信息知识服务系统的制作方法
技术领域
本实用新型涉及一种信息知识服务系统,特别涉及一种在传染病领域向用户提供信息检索与分析的信息知识服务系统。
背景技术
当前,信息科技的发展已经在各个行业取得了前所未有的进步和应用,使得信息的传递与获取日益方便与快捷,使人们生活、学习、生产效率得到大幅度的提高。但是,信息的海量性、繁杂性和多结构性,也为人们精确查找到所需的信息带来了很多困扰。大幅度提高信息的查询效率,成为当前需要迫切解决的一个问题。搜索引擎提供了一种技术,使用户可以大量、准确、快速的获取到所需的信息,能够满足人们对一般信息的查询需求,节省大量的时间和精力。由于搜索引擎在信息查询的广泛性、快速性和有效性方面的优势,使得依赖于搜索引擎进行信息的即时获取、分析与利用日渐成为人们学习、生活和生产的一个重要环节。然而,当前的搜索引擎技术与方法仍然是不完美的。在不复杂的信息检索系统中, 通常是通过检索数据库文本中包含的关键词完成检索。这种检索的特征是精确度低、查全率低,而且很难对搜索的文献进行进一步的挖掘和分析,难以满足特定领域内用户对数据的精准度和深层次应用的要求。例如,在传染病领域,用户所关心的概念是有限的,但是需要对这些概念进行深度分析,以满足用户对关联、扩检、自定义分类、智能检索的要求。用户希望针对传染病领域的特定概念进行深度检索,也希望通过这些概念之间的关系,快速获得所需的信息资源。但是传统的搜索引擎很难满足在传染病领域用户的特殊需求,无法理解、分析用户的检索需求,更无法做到智能化的引导用户进行探索性的知识检索。

实用新型内容本实用新型的目的在于针对现有技术的缺点,提供一种针对传染病领域的信息知识服务系统,该系统在对传染病领域的相关概念进行深度分析的基础上,能够有效地组织该领域的信息资源,并为用户提供智能化的检索与分析服务。本实用新型提供了一种传染病信息知识服务系统,该系统包括传染病相关信息知识存储器;传染病资源获取处理器;传染病知识标引处理器;传染病应用处理器;其连接关系为传染病资源获取处理器的输出端与传染病相关信息知识存储器的输入端相连,传染病相关信息知识存储器的输出端与传染病知识标引处理器的输入端相连,传染病知识标引处理器的输出端与传染病应用处理器的输入端相连。优选的,所述传染病知识标引处理器包括本体处理器。优选的,所述传染病知识标引处理器还包括本体共享服务处理器,其输入端与本体处理器的输出端相连,输出端与传染病应用处理器的输入端相连。有益效果本实用新型基于传染病领域的数据特点和用户需求,提供了一种使用该领域的概念和关系对信息资源进行知识标引的知识服务系统,该系统集信息收集、分析、加工、整理、 共享等多功能于一体,能够有效地组织该领域的信息资源,并为用户提供智能化的检索与分析服务。

图1为实施例中实现的传染病信息知识服务系统模块结构图。图2为实施例中定义的艾滋病本体概念和关系示意图。
具体实施方式
以下结合附图,具体说明本实用新型的优选实施方式。图1所示为根据本实用新型实现的一种传染病信息知识服务系统,其目的是为了给传染病领域科研人员、管理人员提供传染病相关知识信息的智能化检索与分析。该系统包括1)资源管理模块该模块主要提供存放信息资源的资源库。传染病信息知识服务系统根据整合资源的种类以及为公众提供服务的目的,将该领域知识信息按照数据的特点,划分为新闻库、机构库、专家库、法规库、用户库以及针对每一类传染病具体特征的特定传染病信息库。2)资源获取模块该模块用于对传染病领域的信息资源进行采集,加工成资源库所需结构,并存储到资源库中。所述信息资源包括中英文传染病相关新闻、政策法规、文献资源等相关信息。信息资源的来源包括传染病相关权威机构网站、门户网站、网络数据库、相关文档。可以针对选定的网站,从文献资源、传染病相关新闻、政策法规等栏目进行定向的数据采集;定向数据采集的优点是可以保证采集到优质的信息资源。对传染病领域的特定用户而言,定向数据采集已经可以基本满足用户的需求。也可以使用传统的关键字检索的方式,对网络信息进行粗筛,从而满足用户信息查全的要求。资源获取模块按照资源库定义的分类和每一类数据库的结构,将信息资源存储到对应的资源库中。例如,将针对艾滋病的信息按照资源库结构,分解为作者、主题、摘要、全文、发表时间、数据来源等信息,并存储到艾滋病库中。3)使用传染病领域相关概念对资源库中的信息进行知识标引的信息自动处理模块。知识标引可以针对文献的主题、摘要、全文或者其他部分进行。进行知识标引所使用的概念根据系统的服务对象和服务目的而异。例如,针对医生提供的检索系统和针对管理人员提供的检索系统应该使用不同的概念。本系统的主要目的是为医护人员和管理人员提供智能检索与分析服务,根据系统的服务对象和服务目的, 本系统对用户的检索行为及可能使用的其它应用进行分析,从而提炼出适用于该系统的概念,用来对资源库中的信息进行知识标引。使用自定义概念进行知识标引可以提供更适用于该领域和特定用户的文献分类方法。[0026]传染病领域的特定概念可以与传统的分类方法结合进行文献信息的标引。例如, 一篇艾滋病相关的文献按照自定义的概念,包含“治疗”、“易感人群”等标记,同时也可以按照传统的文献分类方法包含“期刊文献”、“网络”等标记,按照传统的对医学文献的分类包含“病理学”、“病原学”标记。本实施例实现的信息自动处理模块包括 本体构建模块,该本体构建模块针对每一类传染病信息以及服务系统涉及的其他每一类信息构建一个本体,所述本体包括涉及的概念和概念之间的关系。本实施例中构建的本体包括艾滋病本体、结核病本题、肝炎病本体、 新发传染病本体、机构本体、专家本体。本实施例中,根据对艾滋病领域信息资源的特点以及对使用该系统的用户检索行为的分析,构建了艾滋病的本体。该艾滋病的本体用树状结构表示,其中每个节点表示定义的一个概念,每条边表示概念之间的关系,如图2所示。树的根节点即第一层节点为“艾滋病”;在“艾滋病”下与“艾滋病”关联的第二层节点包括“症状”、“治疗”、“传播途径”、“易感人群”、“世界艾滋病日”、“全球首个艾滋病病例”、“专家”;在“症状”下与“症状”关联的第三层节点包括“肿瘤”、“一般性症状”、“呼吸道症状”、“消化道症状”、“神经系统症状”、“皮肤和粘膜损害”;在“治疗”下与“治疗”关联的第三层节点包括“营养治疗”、“肝细胞骨髓移植”、“水果治疗”、“抗HIV病毒药物”;在“传播途径”下与“传播途径”关联的第三层节点包括“母婴传播”、“血液传播”、“性传播”、“公用针具传播”;在“易感人群”下与其关联的第三层节点包括“血友病患者”、“静脉吸毒成瘾者”、“男性同性恋者”、“接受输血及其它血制品者”、“与易感人群有性关系”;在“世界艾滋病日”下与其关联的第三层节点包括“12月1 日”;在“全球首个艾滋病病例”下的第三层节点包括“1981、6美国”;在“专家”下与其关联的第三层节点包括专家的姓名,每个专家的姓名对应该层的一个节点;在“肿瘤”下与其关联的第四层节点包括“卡波希式肿瘤”;在“一般性症状”下与其关联的第四层节点包括“持续发烧”、“盗汗”、“淋巴肿大”、“消瘦”;在“呼吸道症状”下与其关联的第四层节点包括“长期咳嗽”、“胸痛”、“呼吸困难”;在“消化道症状”下与其关联的第四层节点包括“厌食”、“恶心”、“呕吐”、“腹泻”;在“神经系统症状”下与其关联的第四层节点包括“头晕”、“头痛”、“反应迟钝”;在“皮肤和粘膜损害”下与其关联的第四层节点包括“弥漫性丘疹”、“带状疱疹”、 “口腔和咽部粘膜炎症”;在“抗HIV病毒药物”下与其关联的第四层节点包括“叠氮胸苷、双脱氧胞苷、双脱氧肌苷”;在专家姓名下与其关联的第四层节点包括该医生擅长的项目和所在医院名称。艾滋病本体的定义在实际应用中有着非常重要的意义。首先,按照该本体的定义可以为用户展示一条形象的检索路径。用户选择一个概念之后,马上可以展示与该概念相关的其他概念,引导用户进行检索,这种方式对于扩检、智能检索都非常有意义。其次,艾滋病本体的定义为该领域文献的知识标引提供了标引的依据。同一个文献可以包括多个标弓丨,例如同时涉及“易感人群”和“治疗方法”的文献,会包含多个对应所涉及内容的标引。 优选的,系统还可以为每个概念设置同义词表,包括每个概念的同义词及英文译名,以使文献的标引更加准确。对文献的标引可以使用通用方法如“词频统计”来具体实现。本实施例中,概念之间的关系带有权值,该权值可以根据概念之间的关联程度定义,关联越紧密权值越小。例如,通过对文献的分析统计,包含“艾滋病高危人群”的文献 60%也会包含“同性恋者”,则将1与该比例之间的差值0. 4定义为这两个概念之间的权值。如果将本体定义的概念作为图中的节点,概念之间的关系作为图中的边,那么任意两个节点之间可以算出最短路径。用户进行检索的概念与检索出的文献所包含的概念之间可以求得最短路径值,该最短路径值可以作为检索出的文献的相关度。通过该相关度对文献进行排序,可以使用户获得比较精准的信息。为了方便系统的使用和扩展,本实施例中的信息自动处理模块还包括本体共享服务模块,该模块将针对本体的通用应用预先进行处理并封装成接口的形式,对象自动标注模块、知识关系计算模块以及应用模块均可以通过接口使用本体共享服务模块预先处理的结果。例如,针对使用某个标签的精准检索、对关联概念的扩检、动态展示本体中的概念和关系以引导用户检索等常用功能在本实施例中均已经预先实现,并封装成API接口的形式。通过模块化的封装,有利于系统的功能扩展。4)针对传染病领域具体应用的应用模块。在文献自动处理模块的基础上,系统可以为用户提供多种应用。例如可以提供智能问答服务,接收用户以自然语言形式的提问,并对问题进行理解、分析,给出答案;智能检索服务提供检索功能,并向用户提供知识探索性的检索;热点与趋势分析服务对资源库中的信息进行统计分析,发现传染病研究热点;传染病学术关系分析服务对资源库中的数据进行挖掘,发现资源库中不同对象之间的关系。由于在文献自动处理模块中已经将常用功能进行模块化封装,并提供了 API接口,所以非常有利于进行用户应用的定制与开发。应该理解的是,以上所述仅为本实用新型的具体实施方式
,并不用于限定本实用新型的保护范围,凡是在本实用新型的精神和原则之内,对上述内容所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。
权利要求1.一种传染病信息知识服务系统,其特征在于,包括 传染病相关信息知识存储器;传染病资源获取处理器; 传染病知识标引处理器; 传染病应用处理器;其连接关系为传染病资源获取处理器的输出端与传染病相关信息知识存储器的输入端相连,传染病相关信息知识存储器的输出端与传染病知识标引处理器的输入端相连,传染病知识标引处理器的输出端与传染病应用处理器的输入端相连。
2.根据权利要求1所述的一种传染病信息知识服务系统,其特征在于,所述传染病知识标弓I处理器包括本体处理器。
3.根据权利要求2所述的一种传染病信息知识服务系统,其特征在于,所述传染病知识标引处理器还包括本体共享服务处理器,其输入端与本体处理器的输出端相连,输出端与传染病应用处理器的输入端相连。
专利摘要本实用新型涉及一种传染病信息知识服务系统,包括传染病相关信息知识存储器;传染病资源获取处理器;传染病知识标引处理器;传染病应用处理器;其连接关系为传染病资源获取处理器的输出端与传染病相关信息知识存储器的输入端相连,传染病相关信息知识存储器的输出端与传染病知识标引处理器的输入端相连,传染病知识标引处理器的输出端与传染病应用处理器的输入端相连。本实用新型基于传染病领域的数据特点和用户需求,提供了一种使用该领域的概念和关系对信息资源进行知识标引的知识服务系统,该系统集信息收集、分析、加工、整理、共享等多功能于一体,能够有效地组织该领域的信息资源,并为用户提供智能化的检索与分析服务。
文档编号G06F17/30GK202025318SQ201120117110
公开日2011年11月2日 申请日期2011年4月20日 优先权日2011年4月20日
发明者代涛, 孙晓北, 安新颖, 方安, 李杨, 欧阳昭连, 池慧, 王敏, 胡世平, 许培扬, 钟华, 钱庆, 高东平 申请人:中国医学科学院医学信息研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1