多级数据存储方法及装置、多级数据结构、信息检索方法_2

文档序号:9646593阅读:来源:国知局
资企业”作为关键词进行搜索时,由于父级词类分类(/外企)、子级词类分类(/外独资企业)和(/中外合资企业)并不具有实际的语义,因而搜索不到相应的信息。为了解决该问题,需要对另外增加三个词类库结构,包括“外企”具有实际语义的一个词类库,“外独资企业”具有实际语义的一个词类库,以及“中外合资企业”具有实际语义的一个词类库,但是这种方式建立的词类库数据结构,由于需要重新增加三个词类库,形成四个并列的词类库,使得词类库的数据存储结构变得较为复杂,并且在进行搜索时,需要对四个词类库分别进行搜索,使得搜索的范围增大,效率降低。
[0045]本发明实施例提供了一种多级数据存储方法、采用单个数据分类结构存储相互关联的多级数据,在单个数据分类结构不仅生成数据标签以及记录数据的上下级关系关联关系信息,并且本发明的存储方法,除了对底层数据标签记录内容外,对底层数据标签之外的其他数据标签也可以记录语义内容,改变了相互关联的多级数据的存储结构,使得存储结构相对简单,由于数据标签记录了语义内容提高信息检索的精度和效率;对底层数据标签之外的数据标签对是都记录语义内容进行判断,提升了数据存储的选择性。
[0046]为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0047]参考图1,本发明一实施例提供了多级数据存储方法,包括步骤:
[0048]步骤S101,分别生成各级数据的数据标签及分别记录各数据标签对应的关联关系信息,并记录底层数据标签的语义内容,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系;
[0049]步骤S102,判断是否对各数据标签记录语义内容;
[0050]步骤S103,如果是,则对对应的数据标签记录语义内容。
[0051]上述存储方法采用单个数据分类结构存储相互关联的多级数据,所述多级数据包含单个第一级数据,并且第一级数据不存在上级数据,底层数据不存在下级数据,对底层数据标签直接记录语义内容,不进行是否记录语义内容的判断。该存储方法使得相互关联的多级数据存储在单个数据分类结构中,存储结构较为简单,并且该存储方法形成的单个相互关联的多层数据在体现各层数据的关系的同时,除了对底层数据标签记录语义内容外,还可以对底层数据标签之外的其他数据标签记录对应的语义内容,提高了信息检索时的效率和精度。
[0052]下面对上述过程进行详细的说明。
[0053]进行步骤S101,分别生成各级数据的数据标签及分别记录各数据标签对应的关联关系信息,并记录底层数据标签的语义内容,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系。
[0054]现有技术中所述数据标签仅作为一种标识,其不具有实际的语义。但是由于本发明中相互关联的所有数据信息都是记录在了一个数据结构中,此时的数据标签不会与其它的数据标签发生冲突,因此数据标签就具有了实际的语义。但是为了便于区分和识别,各级数据对应的数据标签是不同的。
[0055]由于本发明的数据结构只包含单个第一级数据,相应第一级的数据对应的数据标签为一个。
[0056]除第一级数据之外的其他级的数据标签数量可以为多个,各级的数据标签不同,且同一级中的数据标签也不同,便于后续记录相应的上下级数据之间的关系。
[0057]所述分别记录各数据标签对应的关联关系信息包括:对应各数据标签生成携带上级数据的数据标签和下级数据的数据标签的关联关系信息。
[0058]通过记录关联关系信息建立上下级数据的数据标签之间的联系。
[0059]需要说明的是,由于第一级数据不存在上级数据,第一级数据对应的关联关系信息只携带下一极的数据标签,同样,由于底层数据不存在下级数据,底层数据对应的关联关系信息只携带上一级的数据标签。
[0060]由于底层数据标签位于数据结构的叶子节点位置,因此在生成底层数据标签时,便会也记录底层数据标签的语义内容。
[0061 ] 所述底层数据标签的语义内容与所述底层数据标签存储的位置相同。
[0062]在本发明的其他实施例中,当需要添加具有新的数据标签的数据时,在所述数据分类结构中增加该数据的数据标签,并对需要记录语义内容的数据标签记录语义内容;更新所述数据对应的上下级数据的关联关系信息。
[0063]当需要删除一数据标签下的所有数据时,在所述数据分类结构中删除该数据的数据标签、语义内容及关联关系信息;更新所述数据对应的上下级数据的关联关系信息。
[0064]进行步骤S102,判断是否对各数据标签记录语义内容;如果是,则进行步骤S103。
[0065]在一实施例中,判断是否对各数据标签记录语义内容的过程包括:提供字典,所述字典中存储有若干单独词;将数据标签与字典进行匹配,若匹配,则该数据标签为单独词,进行对对应的数据标签记录语义内容步骤。
[0066]判断是否对各数据标签记录语义内容的判断时可以先从第一级的数据标签进行判断,然后逐级对下一级的数据标签进行判断。
[0067]将数据标签与字典进行匹配的目的是判断该数据标签是否为单独词,若数据标签与字典里的某个单独词匹配,则该数据标签为单独词,则进行对该数据标签记录语义内容的步骤;反之,在不匹配时,字典里没有与数据标签匹配的单独词,则该数据标签不是单独词,对该数据标签不记录语义内容。
[0068]当随机对各数据标签是否记录语义内容进行判断时,在另一实施例中,判断是否对各数据标签记录语义内容的过程包括:判断数据标签是否为底层数据标签,若该数据标签不是底层数据标签,则判断该数据标签是否为单独词,若该数据标签为单独词,则进行对该数据标签记录语义内容的步骤。
[0069]判断数据标签是否为单独词的过程包括:提供字典,所述字典中存储有若干单独词;将数据标签与字典进行匹配,若匹配,则该数据标签为单独词。
[0070]可以根据数据标签对应的关联关系信息判断某个数据标签是否为底层数据标签。[0071 ] 在其他实施例中,也可以通过根据应用的需要人为判断是否对某一个数据标签进行记录语义内容的操作。
[0072]进行步骤S103,如果是,则对对应的数据标签记录语义内容。
[0073]所述语义内容为表达对应的数据标签的语义的词语集合。在一实施例中,所述语义内容可以为若干同义词或近义词。
[0074]通过对对应的数据标签记录语义内容,使得该数据标签具有实际的语义,在单个数据结构中即表达了数据标签的语义,使得数据存储结构简单。
[0075]本实施例中,所述语义内容与对应的数据标签存储的位置相同,使得数据标签具有实际语义的同时,数据存储结构较为简单。
[0076]在一实施例中,采用不同方式标记记录有语义内容的数据标签以及未记录有语义内容的数据标签。具体的,可以仅标记记录有语义内容的数据标签,也可以仅标记未记录有语义内容的数据标签,还可以采用不同标记标记两种不同的数据标签,因而,在进行搜索时,可以根据标记快速确定搜索范围,提高搜索的准确性。
[0077]上述多级数据的存储方法形成的多级数据结构,以单个数据分类结构存储相互关联的三级数据进行示例性说明,请参考图2,图2中示出了单个数据分类结构,该单个数据分类结构存储相互关联的三级数据,包括第一级数据、第二级数据和底层数据,第一级数据的数量为一个,所述第一级数据包括一个第一级数据标签,以及与第一级数据标签对应的语义内容和关联关系信息;第二级数据的数量为两个,每个第二级数据包括一个第二级数据标签,以及与该第二级数据标签分别对应的语义内容和关联关系信息;所述底层数据的数量为四个,每个底层数据包括一个底层数据标签,以及与底层数据标签对应的语义内容和关联关系信息。
[0078]需要说明的是,第一级数据标签、第二级数据标签、底层数据标签不相同,且同一层数据中的数据标签也不同。
[0079]需要进一步说明的是,图2中的单个数据分类结构仅作为示例,其他实施例中所述多级数据结构可以存储相互关联的多级(多2级)数据,不应限制发明的保护范围。
[0080]本发明还提供了一种采用上述多级数据存储方法形成词类库的方法,请参考图3,包括步骤:
[0081]步骤S201,分别生成各级数据的数据标签及分别记录各数据标签对应的关联关系信息,并记录底层数据标签的语义内容,所述数据标签为词类标签,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系,所述语义内容是表达所述词类标签语义的词语集合;
[0082]步骤S202,判断是否对各词类标签记录语义内容;
[0083]步骤S203,如果是,则对对应的词类标签记录语义内容。
[0084]下面对上述过程进行进一步说明。
[0085]进行步骤S201,分别生成各级数据的数据标签及分别记录各数据标签对应的关联关系信息,所述数据标签为词类标签,所述
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1