一种基于上下文的语义匹配方法和系统与流程

文档序号:20840977发布日期:2020-05-22 17:29阅读:211来源:国知局
一种基于上下文的语义匹配方法和系统与流程

本发明属于软件技术领域,涉及一种基于上下文的语义匹配方法和系统,尤其涉及针对服务模型的资源语义匹配方法。



背景技术:

基于语义的方法能够保证“物理上的连接”,还能实现“逻辑上的连接”,不同服务的建立者和使用者都希望其它的服务能够按着他们的方式来理解数据、信息和知识,使用他们的观点来定义这个世界的定义,来理解这个世界的构成。因此,一个最重要问题是如何调节不同应用服务间的语义冲突,也就是说,如何实现语义匹配。

目前,共享本体是普遍采用的解决语义问题的方法。但是,利用共享本体解决语义问题存在明显的不足。我们知道,共享本体说明一个能够共同理解的词汇,并采用该词汇描述实体的共享信息和关系。使用本体解决语义冲突一般分为三步。首先,定义共享本体;其次,使用本体描述各个独立信息系统中的对象;最后,使用本体判断不同对象间的相似性。这种方法的前提条件是本体能够显著地减少判定异构信息系统不同对象间相似性的复杂性,这种前提条件是基于设计和构建本体的标准。与全局模式方法相似,基于本体的协调过程具有明显不足:从实际和理论两方面,开发和维护这样一个本体几乎是不可能的,特别是在不断进化的语义环境中;本体不支持对语义冲突的确定和分类;本体不提供语义冲突协调机制;本体是不允许同名异义的,对异名同义的解决也存在问题。

另一种使用本体的方法是不同的系统维护自己的独立本体,通过合并两个独立本体来解决语义冲突,但是合并本体的过程同样也是一个复杂的语义协调过程。

面向复杂的问题、大量的知识以及多种媒体时,表示上下文始终是一个挑战。在形式化方法中,上下文作为一种抽象的数学实体,最基本的关系是ist(c,p),表示断言p在上下文环境c中,命题为真。在普适计算中,使用属性和值对的方法建模上下文,该上下文被用于分布式服务框架,服务本身使用简单的具有值的属性列表,服务发现过程等同于对这些属性的精确匹配。属性和值对的上下文表示方法虽然易于管理,但其主要不足是过于简单、缺乏构建复杂上下文的能力。另一类是采用标记语言描述上下文,它是基于profile(简况)的概念,如comprehensivestructuredcontextprofiles(复合结构化上下文简况),在这种方法中,属性名称是上下文敏感的,需要使用profile(简况)中的位置信息来解释。compositecapabilities/preferencesprofilecontextextension(复合能力/引用简况上下文扩展)针对属性的特定方面扩展了useragentprofile(用户代理简况)等词汇,例如位置信息、特定关系类型和依赖,该方法也可以支持context-aware(上下文意识)应用和部分普适计算基础架构,但是对于捕获复杂的上下文关系和约束比较困难。也有扩展了对象角色模型,提出一种上下文图形建模方法,主要依据是上下文分类和描述特征,如,上下文分类包括静态和动态,动态分类又包括profiled(简况)、sensed(感应)、derived(引导),并通过dependson(依赖)关系表示一个事实的改变导致另一个事实的改变,这种方法较适合于普适计算应用领域。还有方法使用从aspect-scale-contextinformation(方面-扩展-上下文信息)三个方面组织上下文,使用本体作为形式化基础,并定义一种contextontologylanguage(上下文本体语言)。上下文本体语言上下文建模方法就是基于“方面-扩展-上下文信息”概念,创建上层本体捕获上下文实体的基本特征,并可转化为web本体语言,在语义上等价于描述逻辑,允许一致性检查和推理。



技术实现要素:

本发明的目的在于:针对现有技术的缺失和不足,提出一种基于上下文的语义匹配方法和系统,解决不同服务的建立者和使用者在服务语义方面的匹配问题,为语义匹配、搜索和互操作提供方法和参考依据。

本发明采用的技术方案如下:

一种基于上下文的语义匹配方法,包括以下步骤:

对不同数据源的数据分别建立语义上下文模型;

对不同数据源的语义上下文模型进行语义比较;

根据语义比较的结果,结合语义维度进行语义冲突类型分类;

根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。

进一步地,所述语义上下文模型包括本体词汇以及围绕该本体词汇的语义上下文。

进一步地,所述语义比较是对上下文格子进行比较,包括对上下文格子的特定化、泛化、交叉、一致四种基础的比较操作。

进一步地,所述语义比较包括:

基于语义上下文模型建立语义匹配模型;所述语义匹配模型以一个名词为中心,扩展多个分支,多个分支用于描述相关的上下文信息;所述语义匹配模型中包含上下文格子;

基于所述语义匹配模型中的上下文格子,进行四种比较操作:特定化、泛化、交叉、一致。

进一步地,所述语义冲突类型分类,其中的语义冲突类型包括命名、抽象、异构,所述命名包括同义词、同名异义词、无关词,所述抽象包括类、聚集、泛化。

进一步地,所述语义转化是进行两个语义相同的词汇在不同上下文环境中的转化。

进一步地,所述语义转化包括精度、数值取值范围、类型、计量单位的转化。

一种基于上下文的语义匹配系统,其包括:

语义上下文模型建立模块,用于对不同数据源的元数据分别建立语义上下文模型;

语义比较模块,用于对不同数据源的语义上下文模型进行语义比较;

语义冲突类型分类模块,用于根据语义比较的结果,结合语义维度进行语义冲突类型分类;

语义转化模块,用于根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。

一种电子装置,其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明的基于上下文的语义匹配方法的指令。

一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明的基于上下文的语义匹配方法。

本发明与现有技术相比的优点在于:

(1)以语义冲突类型分类为判定语义冲突的路线,以语义维度为可操作的评价标准,同时区分语义匹配模型和语义转化模型,完成语义匹配和上下文环境差异转化。

(2)初步划分语义冲突类型和语义维度,构建了语义互操作模型。

(3)基于语义互操作模型,建立了可操作、可比较的语义互操作方法和语义关系。

(4)能够解决不同服务的建立者和使用者在服务语义方面的匹配问题,为语义匹配、搜索和互操作提供方法和参考依据。

附图说明

图1是本发明的语义匹配原理图;

图2是本发明的语义匹配算法实施原理图;

图3是语义格子、语义匹配模型和语义转化模型的示意图。

具体实施方式

以下结合具体实施例和附图对本发明作更详细的说明。

本发明的一种基于上下文的语义匹配方法,其核心实现如图1所示,通过采用本体和上下文相结合的方法构建语义上下文模型、语义冲突类型分类和语义维度、语义匹配模型和语义转化模型、语义比较方法、上下文差异转化方法,实现语义匹配,解决语义模式映射、语义实例转换的问题。

1.语义上下文模型

采用本体与上下文相结合的方法来捕获实体对象表示的语义以及与其他实体对象的语义关系。其中,本体作为语义上下文的基本形式化词汇,这里的本体是较为基础的本体,能够基本达成共识的本体,由本体构成的语义上下文作为语义互操作的基础。例如,“价格”是一个本体词汇,其语义上下文可以是“商店”、“服装”、“人民币”等,从而建立了一个包括“价格”、“商店”、“服装”和“人民币”信息的语义上下文模型,描述一个在商店使用人民币购买服装的场景。

在语义匹配中,上下文需要使隐藏的语义信息显示化表示(称之为“语义上下文”),其目标是使语义达到可操作性,即可映射、可比较、可转换。本发明的语义匹配方法以语义冲突类型分类为判定语义冲突的路线,以语义维度为可操作的评价标准,同时区分语义匹配模型和语义转化模型,完成语义匹配(数据模式映射)和上下文环境差异转化(数据实例转化)。

2.语义冲突和语义维度

语义冲突是指同一个名词在不同的应用场景(即,上下文)中有不同的含义。语义维度是指名词在不同的应用场景(即,上下文)中所包含或者涉及的方面。

语义冲突类型分类起到判定语义冲突路线的作用。在此过程中,语义维度起到细化每个语义冲突类型分类,或者说通过可操作的语义维度可以可操作地、量化地判定语义匹配。

语义冲突类型包括“命名、抽象、异构”三个最高层次分类,这三个最高层次分类还可以进一步细化,如“命名”可以细化为“同义词、同名异义词、无关词”,“抽象”可以细化为“类、聚集、泛化”。其中,“类”是指同一类,“聚集”是指多个类共同表示,“泛化”是指在同一类上的扩展。“异构”是指在语义方面不存在关联性。

3.语义匹配模型和语义转化模型

语义上下文在语义互操作中起到两个基本作用:一是确定语义匹配,完成词汇间的语义映射操作;二是在匹配的条件下,完成差异化转换,支持从一个上下文环境到另一个上下文环境的差异转化。例如“价格”和“费用”可以是一对同义词,而“价格”使用的计量单位为美元,“费用”使用的计量单位为人民币,在完成“价格”和“费用”的语义匹配的基础上,还要依据不同环境中使用计量单位的不同,完成数值的转换。

语义匹配模型的主要作用描述语义上下文,它包括以一个名词为中心,扩展多个分支,多个分支用于描述相关的上下文信息,如图3所示。语义匹配模型中包含上下文“格子”,如图3所示,由价格、商店和服装构成的一个小格子,由价格、商店、服装和人民币构成一个大格子。

语义转化模型主要是完成两个语义相同的词汇在不同上下文环境中的转化,主要由两个语义匹配模型构成,如图3所示。

4.语义比较

语义比较方法是在语义匹配模型的基础上,针对部分上下文的比较,形象地讲,是一种上下文“格子”比较。对上下文“格子”的“特定化”、“泛化”、“交叉”、“一致”四种基础的比较操作。其中,“格子”是语义匹配模型中的一个部分,如图3所示。“特定化”是指大格子包含小格子,那么小格子就是大格子的特定化,表明两者之间具有语义特定化,例如,在图3中,由价格、商店和服装构成的一个小格子可以是其外面由价格、商店、服装和人民币构成大格子的一个特定化。“泛化”是指由一个节点进一步延伸生成的格子,表明两者之间具有语义泛化,例如,在图3中,价格节点进一步延伸生成只包含一个人民币节点的格子。“交叉”是指两个格子既有相同的部分又有不同的部分,表明两者之间具有语义相关。“一致”是指两个格子的内容完全相同,表明两者之间语义相同。

5.上下文差异转化

上下文差异转化方法是在完成语义比较之后,依据上下文转化模型实现从一个上下文环境到另一个上下文环境的语义转化。这方面的上下文差异主要体现在精度、数值取值范围、类型等这一类差异。例如:对于“价格”词汇,在一个上下文环境中使用美元作为单位,而在另外一个上下文环境中使用人民币作为单位,“价格”词汇的数值从一个上下文环境转化到另一个上下文环境中时,需要调解计量单位上的差异。

采用定制规则的方法来实现上下文差异转化,例如,ai:a→b,表示a到b的转化遵循ai规则。

6.基于上下文的语义匹配方法

如图2所示,基于上下文的语义匹配方法的架构主要包括针对数据源的元数据建立数据源的语义上下文模型,在语义互操作部分为匹配算法,包括语义比较模块和语义转化模块。

1)使用初级本体为服务等软件形态建立语义上下文模型,包括初级本体,多个语义维度。

2)使用服务接口,提取服务的语义上下文模型,作为语义匹配的输入数据。

3)对服务匹配双方的语义上下文模型进行语义比较,针对语义冲突词汇,围绕语义冲突词汇动态选定上下文格子,对上下文格子进行“特定化”、“泛化”、“交叉”、“一致”比较操作。

4)根据语义比较的结果,结合语义维度进行语义冲突类型分类,得到语义冲突类型分类结果。

5)根据语义冲突类型分类结果,采用定制的转化规则完成语义转化。

6)对服务匹配双方,完成语义匹配。

下面提供一个具体应用实例。如图3所示,根据基于上下文的语义匹配方法对“价格”和“费用”两个名词进行语义匹配操作,包括以下步骤:

(1)存在两个服务系统a和b,a系统对“价格”这个初级本体词汇,建立语义上下文模型,如图3所示,围绕着“价格”建立包括“商店”、“服装”和“人民币”信息的语义上下文模型,描述一个在商店使用人民币购买服装的场景;b系统对“费用”建立包括“商店”、“服装”和“美元”信息的语义上下文模型,描述一个在商店使用美元购买服装的场景;

(2)a和b两个服务系统将这两个语义上下文模型,作为输入数据,输入语义匹配模块;

(3)首先,语义匹配模块对“价格”和“费用”这两个语义上下文模型进行语义比较,具体操作为“上下文格子”比较,比较结果为互为“交叉(即,存在共同的集合)”,对于“价格”和“费用”来说,存在“商店”和“服装”多个相同点,又存在“人民币”和“美元”少量不同点;

(4)其次,根据语义比较结果,结合语义冲突类型分类和语义维度,可以进一步确定“价格”和“费用”为同义词;

(5)再者,查询制定的转化规则,r:人民币→美元,完成语义转化;

(6)最后,输出结果:在a和b两个服务系统使用场景下,“价格”和“费用”为同义词,其所涉及的语义转化规则为r:人民币→美元。

基于同一发明构思,本发明的另一个实施例提供一种基于上下文的语义匹配系统,其包括:

语义上下文模型建立模块,用于对不同数据源的元数据分别建立语义上下文模型;

语义比较模块,用于对不同数据源的语义上下文模型进行语义比较;

语义冲突类型分类模块,用于根据语义比较的结果,结合语义维度进行语义冲突类型分类;

语义转化模块,用于根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。

其中各模块的具体实施过程参加前文对本发明方法的描述。

基于同一发明构思,本发明的另一个实施例提供一种电子装置(计算机、服务器、智能手机等),其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明方法中各步骤的指令。

基于同一发明构思,本发明的另一个实施例提供一种计算机可读存储介质(如rom/ram、磁盘、光盘),所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明方法的各个步骤。

本发明未详细阐述的部分属于本领域技术人员的公知技术。

以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的原理和范围,本发明的保护范围应以权利要求书所述为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1