一种基于6w语义标识的语义网络模型构建方法

文档序号:10488918阅读:188来源:国知局
一种基于6w语义标识的语义网络模型构建方法
【专利摘要】本发明提供一种基于6W语义标识的语义网络模型构建方法,步骤为:定义概念模型中概念属性的符号表达形式;定义概念模型中概念名称的符号表达形式;定义数据元标识;定义概念本体结构;定义概念模型层次结构的符号表达形式;定义场景本体标识结构的符号表达形式;定义场景语义标识结构;构建语义网络模型。优点为:本发明提供的基于6W语义标识的语义网络模型构建方法,从原子模型开始,逐层向上分别定义了概念、数据元、概念本体结构、概念模型层次结构、场景本体标识结构和场景语义标识结构的符号表达形式;定义规则简单易懂,层次清晰;基于所定义的各种符号表达形式,可有效提高语义网络模型构建效率。
【专利说明】
一种基于6W语义标识的语义网络模型构建方法
技术领域
[0001] 本发明涉及一种语义网络模型构建方法,具体涉及一种基于6W语义标识的语义 网络模型构建方法。
【背景技术】
[0002] 语义网络理论是一种用于表示词与词之间语义关系的网络理论,1973年由美国人 工智能专家司马贺提出。其原理是:以句中词的概念为网络的结点,以沟通结点之间的有向 弧来表示概念与概念之间的语义关系,构成一个彼此相连的网络,以理解自然语言句子的 语义。
[0003] 在语义网络理论的研究中,核心为构建语义网络模型,然而,现有的语义网络模型 的构建具有构建过程复杂的不足,从而不利于语义网络的研究。

【发明内容】

[0004] 针对现有技术存在的缺陷,本发明提供一种基于6W语义标识的语义网络模型构 建方法,可有效解决上述问题。
[0005] 本发明采用的技术方案如下:
[0006] 本发明提供一种基于6W语义标识的语义网络模型构建方法,包括以下步骤:
[0007] S1,定义概念模型中概念属性的符号表达形式;具体包括:
[0008] SI. 1,分别定义概念与概念之间的四种联系,即:条件、约束、关系和规则的符号表 示形式;
[0009] SI. 2,定义概念之间不同依赖程度的符号表示形式;其中,概念之间依赖程度包括 必须、重要和可选;
[0010] 还定义依赖程度与概念之间的位置关系;
[0011] SI. 3,定义概念发生频率的符号表示形式;
[0012] 还定义概念发生频率与概念之间的位置关系;
[0013] S2,定义概念模型中概念名称的符号表达形式,从而得到概念标识;
[0014] 具体包括:
[0015] S2. 1,分别定义概念模型的各个一级概念类的符号表达形式;其中,所述概念模型 的一级概念类为八类,分别为:时间类、地点类、对象类、参与者类、资料类、活动类、特征类 和参照类;
[0016] 所述一级概念类的符号表达形式包括类别编码域和数据编码域;
[0017] S2. 2,分别定义每个所述一级概念类细分后得到的二级概念类的符号表达形式; 并且,所述二级概念类的符号表达形式包括类别编码域和数据编码域;
[0018] 隶属于同一个一级概念类下面的各个二级概念类的类别编码域均与对应的一级 概念类的类别编码域相同;隶属于同一个一级概念类下面的各个二级概念类的数据编码域 各不相同,进而达到唯一标识概念名称的作用;
[0019] S3,定义数据元标识;
[0020] 具体包括:
[0021] 所述数据元是用于定义数据用的最小单元,由具有继承关系的概念构成;根据数 据元所包含的概念的继承关系,将各个概念所对应的概念标识逻辑组合,即得到所述数据 元标识;
[0022] 其中,根据数据元的层次,所述数据元包括概念数据元、逻辑数据元和应用数据 元;
[0023] S4,定义概念本体结构,并将所定义的概念本体结构中涉及到的概念属性用Sl定 义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念 标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达, 从而得到概念本体结构标识;
[0024] S5,根据S4定义的概念本体结构标识,定义概念模型层次结构的符号表达形式;
[0025] S6,根据S5定义的概念模型层次结构,定义场景本体标识结构的符号表达形式;
[0026] S7,根据S6定义得到的场景本体标识结构,定义场景语义标识结构;
[0027] S8,构建语义网络模型;具体包括:
[0028] 1)将概念模型中的特征类组成的通过符号表达的概念本体结构进行整理,作为矩 阵中的纵向列;
[0029] 2)以概念模型中的不重复的概念标识作为横向列;
[0030] 3)通过横向列中的概念标识,遍历纵向列中的概念本体结构,生成相应语义原型 矩阵;
[0031] 4)通过概念标识,将语义原型矩阵的横向列的概念标识进行压缩,只保存最底层 的节点,得到简化矩阵;
[0032] 5)根据概念标识顺序,对步骤4)得到的简化矩阵中的概念标识进行排序,得到排 序后矩阵;所述排序后矩阵的概念标识集中,可更方便的查看语义的联系;
[0033] 6)对步骤5)得到的所述排序后矩阵的纵向列进行扩展,根据概念模型形成的概 念本体结构,将纵向列中的每个所述特征类扩展出时间类、地点类、对象类、参与者类、资料 类、活动类和参照类,从而得到扩展后的纵向列;进而得到扩展后的语义矩阵;
[0034] 7)对步骤6)得到的所述语义矩阵中的横向列和纵向列中的概念之间的关系进行 标识,即得到语义网络模型。
[0035] 优选的,SI. 1中,条件指事前应该具备的,导致事情是否发生;约束指事中应该满 足的,导致事情是否正常;关系指满足了条件和约束事情应该产生的结果;规则指关系、条 件和约束需要规则才能组织在一起。
[0036] 优选的,S5具体为:
[0037] 将概念模型依次划分为4个层次:系列、集合、实体、子集,上层作为下层的条件或 者约束,下层又作为上层的解释,整个结构形成了概念模型层次结构;
[0038] 将所形成的所述概念模型层次结构中的涉及到的概念属性用Sl定义得到的符号 表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将 所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概 念模型层次结构的符号表达形式。
[0039] 优选的,S6具体为:
[0040] S6. 1,定义以下的四层结构:
[0041] 第一层结构,系列:对象、活动;
[0042] 第二层结构,集合:对象、活动、参与者、结果;
[0043] 第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征;
[0044] 第四层结构,子集:时间、地点、对象、特征;
[0045] S6. 2,将上述四层结构组合到一起,其中,结构与结构之间定义分割符号,每个结 构又分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;由此 组合得到场景本体标识结构的符号表达形式。
[0046] 优选的,S6. 1中,还包括:
[0047] 当活动中包含子活动,对象中又包含子对象时,所述四层结构变为:
[0048] 系列:对象、活动;
[0049] 集合:对象、活动、参与者、结果;
[0050] 实体:参与者、活动!子活动、时间、地点、结果、对象、特征;
[0051] 子集:时间、地点、对象!子对象、特征。
[0052] 优选的,还包括:
[0053] 场景本体标识结构具体分为场景本体表示形式和场景本体标识形式,两者均适用 于知识管理,具体如下:
[0054] 场景本体表示形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔 符分隔;
[0055] 场景本体标识形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔 符分隔,并将概念名称替换为概念标识。
[0056] 优选的,S7具体为:
[0057] S7. 1,定义以下的四层结构:
[0058] 第一层结构,系列:对象、活动;
[0059] 第二层结构,集合:对象、活动、参与者、结果;
[0060] 第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征;
[0061] 第四层结构,子集:时间、地点、对象、特征;
[0062] S7. 2,将上述四层结构组合到一起,其中,结构与结构之间定义分隔符号,每个结 构又分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;如果 某个结构中的某个概念具有附带特征或者属性的,则在该概念后首先增加分隔符,再在分 隔符后面增加所述附带特征或者属性,由此组合得到场景语义标识结构的符号表达形式。
[0063] 优选的,还包括:
[0064] 场景语义标识结构具体分为场景语义表示形式和场景语义标识形式,两者均适用 于语义识别,具体如下:
[0065] 场景语义表示形式的构建方法为:
[0066] 将四层结构中的联系符号以及依赖程度符号均去掉,结构与结构之间定义分隔符 号,上层的尾接下层的头,并通过层间分隔符分隔;由此得到场景语义表示形式;
[0067] 将场景语义表示形式中的概念名称替换为概念标识,即得到场景语义标识形式。
[0068] 本发明的有益效果如下:
[0069] 本发明提供一种基于6W语义标识的语义网络模型构建方法,本发明提供的基于 6W语义标识的语义网络模型构建方法,从原子模型开始,逐层向上分别定义了概念、数据 元、概念本体结构、概念模型层次结构、场景本体标识结构和场景语义标识结构的符号表达 形式;定义规则简单易懂,层次清晰;基于所定义的各种符号表达形式,可有效提高语义网 络模型构建效率。
【附图说明】
[0070] 图1为本发明提供的基于6W语义标识的语义网络模型构建方法的流程示意图;
[0071] 图2为原子模型概念关系图;
[0072] 图3为一种具体的概念本体结构示例图;
[0073] 图4为概念"井筒"的本体结构示意图;
[0074] 图5为概念"分公司"的本体结构示意图;
[0075] 图6所示,为概念模型层次结构图。
【具体实施方式】
[0076] 以下结合附图对本发明进行详细说明:
[0077] 如图1所示,本发明提供一种基于6W语义标识的语义网络模型构建方法,6W原则 本来是指诺贝尔文学奖获得者英国作家吉卜林的思考问题、解决问题的"6W原则",在此基 础上明确了业务逻辑6W描述方法,即"Where (什么地方)、When (什么时间)、Who (什么 人)、Which (针对啥)、What (做了什么,含如何做)、Why (为什么)",具体来说,6W是指时 间,活动,对象,地点,参与者,结果这六个场景信息。
[0078] 包括以下步骤:
[0079] S1,定义概念模型中概念属性的符号表达形式;具体包括:
[0080] SI. 1,分别定义概念与概念之间的四种联系,即:条件、约束、关系和规则的符号表 示形式;如图2所示,为原子模型概念关系图;原子模型又称概念模型,因为概念是原子级 概念,概念是用于描述数据的元素。
[0081] 其中,条件指事前应该具备的,导致事情是否发生,可用符号表示;
[0082] 约束指事中应该满足的,导致事情是否正常;可用符号""表示;
[0083] 关系指满足了条件和约束事情应该产生的结果;可用符号" !"表示;
[0084] 规则指关系、条件和约束需要规则才能组织在一起。可用符号"[]"表示;
[0085] SI. 2,定义概念之间不同依赖程度的符号表示形式;其中,概念之间依赖程度包括 必须、重要和可选;可用符号M表示必须,C表示重要,0表示可选;
[0086] 还定义依赖程度与概念之间的位置关系;例如,可定义:M、C和0在使用时放在概 念前面,并以符号"/"作为分隔符;
[0087] SI. 3,定义概念发生频率的符号表示形式;还定义概念发生频率与概念之间的位 置关系;
[0088] 例如,定义η和N为概念发生频率的符号表示形式,分别代表:
[0089] η代表重复次数大于等于1,使用时放在概念后面以符号"/"作为分隔符;
[0090] N代表发生频度大于1,使用时放在概念后面以符号"/"作为分隔符。
[0091 ] S2,定义概念模型中概念名称的符号表达形式,从而得到概念标识;
[0092] 具体包括:
[0093] S2. 1,分别定义概念模型的各个一级概念类的符号表达形式;其中,所述概念模型 的一级概念类为八类,分别为:时间类、地点类、对象类、参与者类、资料类、活动类、特征类 和参照类;
[0094] 所述一级概念类的符号表达形式包括类别编码域和数据编码域;
[0095] S2. 2,分别定义每个所述一级概念类细分后得到的二级概念类的符号表达形式; 并且,所述二级概念类的符号表达形式包括类别编码域和数据编码域;
[0096] 隶属于同一个一级概念类下面的各个二级概念类的类别编码域均与对应的一级 概念类的类别编码域相同;隶属于同一个一级概念类下面的各个二级概念类的数据编码域 各不相同,进而达到唯一标识概念名称的作用;
[0097] 例如,如表1,为原子模型中一级概念类和二级概念类的定义结构表,需要强调的 是,表1所定义的二级概念类仅为一种具体示例,实际应用中,可采用其他方式,对一级概 念类进行细分。
[0098] 表 1
[0100] 进一步的,可定义概念标识由六位数字组成,首位数字代表概念所在的类别编码 域,分别用1、2…8代表时间类、地点类、对象类、参与者类、资料类、活动类、特征类和参照 类;后五位数字代表概念的数据编码域。如表2所示,为概念标识区域示意表;
[0101] 表 2
[0102]
[0103] 例如,对于概念标识103884,代表其属于时间类,序号为:03884。
[0104] S3,定义数据元标识;
[0105] 具体包括:
[0106] 所述数据元是用于定义数据用的最小单元,由具有继承关系的概念构成;根据数 据元所包含的概念的继承关系,将各个概念所对应的概念标识逻辑组合,即得到所述数据 元标识;
[0107] 其中,根据数据元的层次,所述数据元包括概念数据元、逻辑数据元和应用数据 元;
[0108] (1)概念数据元标识
[0109] 概念数据元是描述数据的原子级概念,因此,概念数据元也是概念,概念数据元标 识定义等同概念标识定义,如表3所示,为概念名称、概念标识和概念数据元标识的对应关 系表。
[0110] 表 3

[0112] (2)逻辑数据元标识
[0113] 逻辑数据元是由概念组合而形成的、具有一定逻辑的描述数据的单元,逻辑数据 元是由概念的不同类别组合而成,比如:对象+特征、活动+特征、对象+活动、活动+对象。
[0114] 逻辑数据元不能完整的描述场景约束,只具备一定的逻辑描述能力,如表4所示, 为逻辑数据元由概念组合形成的唯一标识。
[0115] 表 4
[0117] (3)应用数据元
[0118] 应用数据元是由概念组合而形成的、具有明确逻辑含义的描述数据的单元,应用 数据元是由概念的不同类别组合而成,比如:活动+对象+特征。
[0119] 应用数据元能够完整的描述场景约束,具备明确描述逻辑含义能力,如表5所示, 为应用数据元由概念组合形成的唯一标识。
[0120] 表 5
[0122] 应用数据元名称:
[0123] 井筒工程.井.井筒.地质录井.岩心录井.岩心统计.岩心.岩心长度
[0124] 则:上述应用数据元的应用数据元标识表示如下:
[0125] 301244501257. 301235. 301244. 313321515325. 314587515325. 314587521456. 314 587.314587751123
[0126] 其中,以"1. 2"的格式书写时,1和2为模型中的自然顺序号,符号"代表上下级 关系,这样的标识为模型标识,其主要出现在各种模型中。不同的模型中,模型标识代表的 含义也各不相同,原子模型的模型标识表示了不同层级之间的继承关系,业务逻辑模型的 模型标识表示了场景的多维度逻辑关系,元数据模型的标识表示了针对场景具体某一个维 度的逻辑关系。
[0127] S4,定义概念本体结构,并将所定义的概念本体结构中涉及到的概念属性用Sl定 义得到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念 标识表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达, 从而得到概念本体结构标识;
[0128] 具体的,将概念与概念之间用明确的联系表达出来就是概念本体结构,如图3所 示,为一种具体的概念本体结构示例。
[0129] 分别举例不同类概念组成的概念本体结构表达形式:
[0130] 井(M/井号)//概念井必须有一个M项约束才能明确表达井的概念
[0131] 概念"井号"的本体结构:
[0132] 井号[井] //如果井号为非M项概念
[0133] 井:井号 //如果井号为M项概念
[0134] 概念"井筒"的本体结构如图4所示,明确井筒必须要明确井的概念,得到井(M/井 号)!井筒(/M井筒号);
[0135] 概念"分公司"的本体结构如图5所示,明确分公司必须要明确公司的概念,得到 的概念本体结构为:公司(C/专业,M/名称)!分公司(C/录井,M/名称)。
[0136] S5,根据S4定义的概念本体结构,定义概念模型层次结构的符号表达形式;
[0137] 概念模型层次结构定义是指将概念模型依次划分为4个层次:系列、集合、实体、 子集,上层作为下层的条件或者约束,下层又作为上层的解释,整个结构形成了概念模型层 次结构,如图6所示,为概念模型层次结构图。
[0138] 系列给出的是领域的概念,也就是最外延的或者是该领域最大的概念,包含:对 象、活动,例如:城市领域在该层的对象是城市,活动是城市管理等。
[0139] 集合给出的是领域中的流程或者过程,是活动的集合,但整个流程或者过程会产 生一个结果,包含:对象、活动、参与者、结果。例如城市领域在该层的对象就应该是城市下 面的子对象,像道路、房屋等,活动是道路铺设、房屋修建,参与者是筑路工程公司、地产公 司等,结果是一种材料类型的对象,如道路铺设路线图、房屋规划设计图等。
[0140] 实体给出的是流程中具体的活动,也就是具体做某一件事情,包括:参与者、活动、 时间、地点、结果、对象、特征。例如,碾压沥青活动,参与者是压路工、铺路工、沥青等,对象 是路段,结果就是路段铺设进度报告,特征就是路段的铺设的情况描述,如铺设长度,铺设 厚度等。
[0141] 子集给出的是业务对象的描述,主要用于描述对象和对象的特征,包括:时间、地 点、对象、特征。例如路段对象,其特征包括:路段长度、路段厚度、路段宽度、路段载重量等。
[0142] S6,根据S5定义的概念模型层次结构,定义场景本体标识结构的符号表达形式;
[0143] 场景本体标识结构定义与概念模型层次结构定义相同,将场景本体标识的结构依 次划分为四层:
[0144] 系列:对象、活动;
[0145] 集合:对象、活动、参与者、结果;
[0146] 实体:参与者、活动、时间、地点、结果、对象、特征;
[0147] 子集:时间、地点、对象、特征;
[0148] 如表6所示,为岩肩描述内容,它们都是作为约束限定岩肩描述内容。
[0149] 表 6
[0150]
[0151] 场景本体标识结构中的活动有子活动,对象中又有子对象时,场景本体标识结构 为:
[0152] 系列:对象、活动;
[0153] 集合:对象、活动、参与者、结果;
[0154] 实体:参与者、活动!子活动、时间、地点、结果、对象、特征;
[0155] 子集:时间、地点、对象!子对象、特征。
[0156] 场景本体标识结构共有四段,段与段之间用下划线"_"分割,每段中又分为若干 阶,符号"后面到下一个符号"代表一阶,每阶中又有若干位,每个概念代表一位;
[0157] 场景本体标识结构具体分为场景本体表示形式和场景本体标识形式,两者均适用 于知识管理,主要用于存储,具体如下:
[0158] 场景本体表示形式的构建方法为:将结构中上层的尾接下层的头,层间的分隔符 为",例如岩肩描述为:
[0159] "#M/井(M/单位).#C/井筒工程_#11/井筒(M/井号).#C/地质录井.#C/录 井公司.#C/地质总结报告_#C/地质师.#C/岩肩录井井段(深度(顶界,底 界#M/深度.#M/岩肩(M/编号).描述内容",包含了概念之间完整的联系和联系类 型。
[0160] 场景本体标识形式的构建方法为:将结构中上层的尾接下层的头,层间的分隔符 为",将概念名称替换为概念标识,如表7所示,为场景本体标识形式的例子。
[0161] 表 7
[0163] S7,根据S6定义得到的场景本体标识结构,定义场景语义标识结构;
[0164] 场景语义标识结构定义与概念模型层次结构定义相同,场景语义标识结构依次分 为四层:系列(对象、活动)、集合(对象、活动、参与者、结果)、实体(参与者、活动、时间、 地点、结果、对象、特征)、子集(时间、地点、对象、特征);
[0165] 场景语义标识结构弱化了本体标识中的联系关系,去掉不重要的约束;场景语义 标识中,如果四层中有附带特征或者属性的,则需要在主体类后面添加特征,主体与特征之 间以冒号":"分割,,例如以"井:井号.井筒工程"的格式书写;
[0166] 场景语义标识具体分为语义表示形式和语义标识形式,两者均适用于语义识别, 主要用于问题识别,两者的构建方法是将四层结构中的联系符号以及依赖程度符号均去 掉,彼此之间以逗点分隔,上层的尾接下层的头,层间的分隔符为",后者将概念名称替换 为概念标识。如表8,部分概念名称与概念唯一标识对应关系,而表9为描述内容、含油性、 矿物成分的场景语义表示形式和场景语义标识形式的示例,这样就能更具体的理解语义标 识的结构是如何定义了。
[0167] 表 8
[0169] 表 9
[0170]
[0171] S8,构建语义网络模型;具体包括:
[0172] 1)将概念模型中的特征类组成的通过符号表达的概念本体结构进行整理,作为矩 阵中的纵向列;
[0173] 此处的特征类即为:S2. 1中一级概念类中的一类。
[0174] 2)以概念模型中的不重复的概念标识作为横向列;
[0175] 3)通过横向列中的概念标识,遍历纵向列中的概念本体结构,生成相应语义原型 矩阵;
[0176] 4)通过概念标识,将语义原型矩阵的横向列的概念标识进行压缩,只保存最底层 的节点,得到简化矩阵;
[0177] 5)根据概念标识顺序,对步骤4)得到的简化矩阵中的概念标识进行排序,得到排 序后矩阵;所述排序后矩阵的概念标识集中,可更方便的查看语义的联系;
[0178] 6)对步骤5)得到的所述排序后矩阵的纵向列进行扩展,根据概念模型形成的概 念本体结构,将纵向列中的每个所述特征类扩展出时间类、地点类、对象类、参与者类、资料 类、活动类和参照类,从而得到扩展后的纵向列;进而得到扩展后的语义矩阵;
[0179] 7)对步骤6)得到的所述语义矩阵中的横向列和纵向列中的概念之间的关系进行 标识,即得到语义网络模型。
[0180] 本发明提供的基于6W语义标识的语义网络模型构建方法,从原子模型开始,逐层 向上分别定义了概念、数据元、概念本体结构、概念模型层次结构、场景本体标识结构和场 景语义标识结构的符号表达形式;定义规则简单易懂,层次清晰;基于所定义的各种符号 表达形式,可有效提高语义网络模型构建效率。
[0181] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视本发明的保护范围。
【主权项】
1. 一种基于6W语义标识的语义网络模型构建方法,其特征在于,包括以下步骤: S1,定义概念模型中概念属性的符号表达形式;具体包括: S1. 1,分别定义概念与概念之间的四种联系,即:条件、约束、关系和规则的符号表示形 式; S1. 2,定义概念之间不同依赖程度的符号表示形式;其中,概念之间依赖程度包括必 须、重要和可选; 还定义依赖程度与概念之间的位置关系; 51. 3,定义概念发生频率的符号表示形式; 还定义概念发生频率与概念之间的位置关系; 52, 定义概念模型中概念名称的符号表达形式,从而得到概念标识; 具体包括: S2. 1,分别定义概念模型的各个一级概念类的符号表达形式;其中,所述概念模型的一 级概念类为八类,分别为:时间类、地点类、对象类、参与者类、资料类、活动类、特征类和参 照类; 所述一级概念类的符号表达形式包括类别编码域和数据编码域; 52, 2,分别定义每个所述一级概念类细分后得到的二级概念类的符号表达形式;并且, 所述二级概念类的符号表达形式包括类别编码域和数据编码域; 隶属于同一个一级概念类下面的各个二级概念类的类别编码域均与对应的一级概念 类的类别编码域相同;隶属于同一个一级概念类下面的各个二级概念类的数据编码域各不 相同,进而达到唯一标识概念名称的作用; 53, 定义数据元标识; 具体包括: 所述数据元是用于定义数据用的最小单元,由具有继承关系的概念构成;根据数据元 所包含的概念的继承关系,将各个概念所对应的概念标识逻辑组合,即得到所述数据元标 识; 其中,根据数据元的层次,所述数据元包括概念数据元、逻辑数据元和应用数据元; 54, 定义概念本体结构,并将所定义的概念本体结构中涉及到的概念属性用S1定义得 到的符号表达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识 表达;将所定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而 得到概念本体结构标识; 55, 根据S4定义的概念本体结构标识,定义概念模型层次结构的符号表达形式; 56, 根据S5定义的概念模型层次结构,定义场景本体标识结构的符号表达形式; 57, 根据S6定义得到的场景本体标识结构,定义场景语义标识结构; 58, 构建语义网络模型;具体包括: 1) 将概念模型中的特征类组成的通过符号表达的概念本体结构进行整理,作为矩阵中 的纵向列; 2) 以概念模型中的不重复的概念标识作为横向列; 3) 通过横向列中的概念标识,遍历纵向列中的概念本体结构,生成相应语义原型矩 阵; 4) 通过概念标识,将语义原型矩阵的横向列的概念标识进行压缩,只保存最底层的节 点,得到简化矩阵; 5) 根据概念标识顺序,对步骤4)得到的简化矩阵中的概念标识进行排序,得到排序后 矩阵;所述排序后矩阵的概念标识集中,可更方便的查看语义的联系; 6) 对步骤5)得到的所述排序后矩阵的纵向列进行扩展,根据概念模型形成的概念本 体结构,将纵向列中的每个所述特征类扩展出时间类、地点类、对象类、参与者类、资料类、 活动类和参照类,从而得到扩展后的纵向列;进而得到扩展后的语义矩阵; 7) 对步骤6)得到的所述语义矩阵中的横向列和纵向列中的概念之间的关系进行标 识,即得到语义网络模型。2. 根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于, S1. 1中,条件指事前应该具备的,导致事情是否发生;约束指事中应该满足的,导致事情是 否正常;关系指满足了条件和约束事情应该产生的结果;规则指关系、条件和约束需要规 则才能组织在一起。3. 根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S5 具体为: 将概念模型依次划分为4个层次:系列、集合、实体、子集,上层作为下层的条件或者约 束,下层又作为上层的解释,整个结构形成了概念模型层次结构; 将所形成的所述概念模型层次结构中的涉及到的概念属性用S1定义得到的符号表 达;将所定义的概念本体结构中涉及到的概念名称,用S2定义得到的概念标识表达;将所 定义的概念本体结构中涉及到的数据元用S3定义得到的数据元标识表达,从而得到概念 模型层次结构的符号表达形式。4. 根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S6 具体为: S6. 1,定义以下的四层结构: 第一层结构,系列:对象、活动; 第二层结构,集合:对象、活动、参与者、结果; 第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征; 第四层结构,子集:时间、地点、对象、特征; S6. 2,将上述四层结构组合到一起,其中,结构与结构之间定义分割符号,每个结构又 分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;由此组合 得到场景本体标识结构的符号表达形式。5. 根据权利要求4所述的基于6W语义标识的语义网络模型构建方法,其特征在于, S6. 1中,还包括: 当活动中包含子活动,对象中又包含子对象时,所述四层结构变为: 系列:对象、活动; 集合:对象、活动、参与者、结果; 实体:参与者、活动!子活动、时间、地点、结果、对象、特征; 子集:时间、地点、对象!子对象、特征。6. 根据权利要求4所述的基于6W语义标识的语义网络模型构建方法,其特征在于,还 包括: 场景本体标识结构具体分为场景本体表示形式和场景本体标识形式,两者均适用于知 识管理,具体如下: 场景本体表示形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔符分 隔; 场景本体标识形式的构建方法为:将结构中上层的尾接下层的头,层间采用分隔符分 隔,并将概念名称替换为概念标识。7. 根据权利要求1所述的基于6W语义标识的语义网络模型构建方法,其特征在于,S7 具体为: S7. 1,定义以下的四层结构: 第一层结构,系列:对象、活动; 第二层结构,集合:对象、活动、参与者、结果; 第三层结构,实体:参与者、活动、时间、地点、结果、对象、特征; 第四层结构,子集:时间、地点、对象、特征; S7. 2,将上述四层结构组合到一起,其中,结构与结构之间定义分隔符号,每个结构又 分为若干阶,定义相邻阶之间的分隔符;每阶中又有若干位,每个概念代表一位;如果某个 结构中的某个概念具有附带特征或者属性的,则在该概念后首先增加分隔符,再在分隔符 后面增加所述附带特征或者属性,由此组合得到场景语义标识结构的符号表达形式。8. 根据权利要求7所述的基于6W语义标识的语义网络模型构建方法,其特征在于,还 包括: 场景语义标识结构具体分为场景语义表示形式和场景语义标识形式,两者均适用于语 义识别,具体如下: 场景语义表示形式的构建方法为: 将四层结构中的联系符号以及依赖程度符号均去掉,结构与结构之间定义分隔符号, 上层的尾接下层的头,并通过层间分隔符分隔;由此得到场景语义表示形式; 将场景语义表示形式中的概念名称替换为概念标识,即得到场景语义标识形式。
【文档编号】G06F17/27GK105843791SQ201510022110
【公开日】2016年8月10日
【申请日】2015年1月15日
【发明人】夏冬梅
【申请人】克拉玛依红有软件有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1