利用医药语义网络提高异构系统之间匹配精度的方法

文档序号:6601867阅读:245来源:国知局
专利名称:利用医药语义网络提高异构系统之间匹配精度的方法
技术领域
本发明涉及信息技术领域,尤其涉及一种建立数据仓储的方法。
背景技术
两个或多个不同医药制造企业并购过程中,信息系统异构数据源导致各个医药制造企业的数据无法有效整合,大大降低了企业信息系统整合效果,对并购过程和并购后的工作产生很多难题。目前解决这一问题都是通过手工匹配完成。对此,以前所作的研究大都集中在数据库系统方面,特别是数据库不同模式之间的转换和匹配方面。然而,随着INTERNET的发展,目前很多系统的数据都是在网络上发布, 存在大数据量,数据动态等问题。除去结构化数据之外,很多数据都是半结构化或无结构地,而且数据量极为庞大。传统的启发式的,手动的模式匹配方式无论是在效率或是精度方面都无法满足目前应用对数据集成的要求。数据模式的自动匹配一直是提高系统智能化的一个难点。尤其是医药行业,目前信息化程度较弱,匹配的精度很难提高。因此,提高异构系统之间匹配精度,利用计算机系统对异构数据源进行匹配整合, 从而实现信息系统的有效整合是当前存在并急需解决的问题。

发明内容
为弥补现有技术的不足,本发明目的是提供一种利用医药语义网络提高异构系统之间匹配精度的方法,提供灵活多变、安全稳定的游戏环境。为了实现上述目的,本发明的技术方案如下一种利用医药语义网络提高异构系统之间匹配精度的方法,其特征在于包含如下步骤建立医药行业的语义网络,该建立医药行业的语义网络的方法为将第一语义和第二语义转换为标准模式的语义,建立语义对应关系;对于给定的第一语义,按照对应关系给出匹配的第二语义。所述对应关系包括标准模式与第一语义的对应关系,标准模式与第二语义的对应关系。所述将第一语义和第二语义转换为标准模式的语义的过程为利用语义网络,采用由上而下的,配以剪枝的方法尽快得到候选匹配结果列表。所述结果列表的排序按照匹配度的值从高到低排列。本发明的有益效果应用本发明可以使不同医药企业的不同信息系统异构数据有效整合。
以下结合附图和具体实施方式
来进一步说明本发明。


图1为本发明方法流程示意图;图2为本发明建立医药行业的语义网络的具体流程图。
具体实施例方式为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。某个制药企业的语义我们称为第一语义,另外一个制药企业的语义我们称为第二语义,本发明的目标是提高第一语义和第二语义的匹配精度与速度。此处为了描述与理解本发明简单化,仅以两家制药企业的两种语义为例,更多语义采用相同的原理与方法。参见图1,本发明一种利用医药语义网络提高异构系统之间匹配精度的方法,包含步骤101,建立医药行业的语义网络,存储在数据库中。因为医药行业的特点是专用术语数目庞大,但内容单一,所以建立语义网络非常重要且可行。建立语义网络的详细方法为步骤a,将第一语义和第二语义转换为标准模式的语义。本发明提供一个模式标准, 所有不同模式的(例如两个不同的制药企业的两个模式。为了描述简单化,我们仅用两个模式为例。更多模式采用同样的原理与方法。)语义均对应并转换成同一个标准模式。步骤 b,建立语义对应关系,对应关系包括标准模式与第一语义的对应关系、标准模式与第二语义的对应关系。在转换过程中,利用语义网络,采用由上而下的,并配以剪枝的方法来尽快得到候选匹配结果列表,列表的排序按照匹配度的值从高到低排列。可以在人工的帮助下或是通过机器学习的方法来进一步提高转化的自动化程度和精度。步骤102,对于给定的第一语义,按照对应关系给出匹配的第二语义。应用本发明可以使不同医药企业的不同信息系统异构数据有效整合,大大提高了企业信息系统的整合效果,对并购过程和并购后的工作顺利展开提供支撑。
权利要求
1.一种利用医药语义网络提高异构系统之间匹配精度的方法,其特征在于包含如下步骤建立医药行业的语义网络,该建立医药行业的语义网络的方法为将第一语义和第二语义转换为标准模式的语义,建立语义对应关系;对于给定的第一语义,按照对应关系给出匹配的第二语义。
2.根据权利要求1所述的一种利用医药语义网络提高异构系统之间匹配精度的方法, 其特征在于,所述对应关系包括标准模式与第一语义的对应关系,标准模式与第二语义的对应关系。
3.根据权利要求2所述的一种利用医药语义网络提高异构系统之间匹配精度的方法, 其特征在于,所述将第一语义和第二语义转换为标准模式的语义的过程为利用语义网络, 采用由上而下的,配以剪枝的方法尽快得到候选匹配结果列表。
4.根据权利要求3所述的一种利用医药语义网络提高异构系统之间匹配精度的方法, 其特征在于,所述结果列表的排序按照匹配度的值从高到低排列。
5.根据权利要求1所述的一种利用医药语义网络提高异构系统之间匹配精度的方法, 其特征在于,还包含在人工的帮助下或是通过机器学习的方法来进一步提高转化的自动化程度和精度。
全文摘要
本发明公开的是一种利用医药语义网络提高异构系统之间匹配精度的方法,其包括建立医药行业的语义网络,将第一语义和第二语义转换为标准模式的语义并建立语义对应关系;对于给定的第一语义,按照对应关系给出匹配的第二语义。本发明提供了使不同医药企业的不同信息系统异构数据有效整合的方法,大大提高了企业信息系统的整合效果,对企业并购过程和并购后的工作顺利展开提供了有力支撑。
文档编号G06F17/30GK102236671SQ20101016410
公开日2011年11月9日 申请日期2010年4月29日 优先权日2010年4月29日
发明者刘卉, 王轶彤, 陆明伟 申请人:刘卉, 王轶彤, 陆明伟
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1