多级数据存储方法及装置、多级数据结构、信息检索方法

文档序号:9646593阅读:380来源:国知局
多级数据存储方法及装置、多级数据结构、信息检索方法
【技术领域】
[0001]本发明涉及数据存储技术,特别涉及一种多级数据存储方法及装置、多级数据结构、息检索方法。
【背景技术】
[0002]知识库,又称为智能数据库或人工智能数据库。知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。
[0003]随着针对知识库的搜索引擎的应用,使得用户通过搜索引擎在知识库中准确而快速地检索到需要的信息。但是实际使用中,不同用户提出问题的角度不同或针对同一问题的问法不同,使得搜索引擎搜到的信息有限或者噪音较大,为了提高检索的效率和准确性,与知识库具有联系的词类库得以建立,词类库将某些同一种类或同一性质的词进行不同词级的管理和应用,进行搜索时,搜索引擎中输入的关键字与词类库中的词类名称进行匹配,快速而准确的判断知识库中是否存在相关信息。
[0004]但是现有技术建立的词类库的数据存储结构较为复杂,并且不能满足搜索的需求,信息检索的精度和效率有待提升。

【发明内容】

[0005]本发明解决的冋题是怎样提尚?目息检索的精度和效率。
[0006]为解决上述问题,本发明提供一种多级数据存储方法,采用单个数据分类结构存储相互关联的多级数据;所述方法包括:
[0007]分别生成各级数据的数据标签及分别记录各数据标签对应的关联关系信息,并记录底层数据标签的语义内容,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系;
[0008]判断是否对各数据标签记录语义内容;
[0009]如果是,则对对应的数据标签记录语义内容。
[0010]可选的,判断是否对各数据标签记录语义内容的过程包括:判断数据标签是否为底层数据标签,若该数据标签不是底层数据标签,则判断该数据标签是否为单独词,若该数据标签为单独词,则进行对该数据标签记录语义内容的步骤。
[0011]可选的,判断数据标签是否为单独词的过程包括:提供字典,所述字典中存储有若干单独词;将数据标签与字典进行匹配,若匹配,则该数据标签为单独词。
[0012]可选的,所述多级数据存储方法还包括:采用不同方式标记记录有语义内容的数据标签以及未记录有语义内容的数据标签。
[0013]可选的,所述语义内容与对应的数据标签存储的位置相同。
[0014]可选的,所述语义内容为表达对应的数据标签的语义的词语集合。
[0015]可选的,所述多级数据存储方法还包括:当需要添加具有新的数据标签的数据时,在所述数据分类结构中增加该数据的数据标签,并对需要记录语义内容的数据标签记录语义内容;更新所述数据对应的上下级数据的关联关系信息。
[0016]可选的,所述多级数据存储方法还包括:当需要删除一数据标签下的所有数据时,在所述数据分类结构中删除该数据的数据标签、语义内容及关联关系信息;更新所述数据对应的上下级数据的关联关系信息。
[0017]本发明实施例还提供了一种由上述多级数据存储方法形成词类库的方法,其中,所述数据标签是词类标签;所述关联关系信息中保存上下级词类名称之间的关系;语义内容是表达所述词类标签语义的词语集合。
[0018]本发明实施例还提供了一种信息检索方法,所述方法包括:
[0019]从接收到的服务请求中确定关键词;
[0020]在所述数据分类结构的语义内容及关联关系信息中检索所述关键词,以得到与所述关键词对应的标准问;
[0021 ] 在服务数据库中查询与所述标准问匹配的服务内容。
[0022]本发明还提供了一种多级数据结构,包括:多级数据标签以及各数据标签对应的关联关系信息;至少部分数据标签的语义内容。
[0023]可选的,所述语义内容与对应的数据标签存在相同的位置。
[0024]可选的,具有语义内容的数据标签位于底层或者为单独词。
[0025]本发明还提供了一种多级数据存储装置,包括:
[0026]数据标签生成单元,用于分别生成各级数据的数据标签;
[0027]关联关系信息记录单元,用于记录各数据标签对应的关联关系信息,所述关联关系信息用于保存该数据及其所对应的上下级数据之间的关系;
[0028]判断单元,用于判断是否对各数据标签记录语义内容;
[0029]语义内容记录单元,用于对需要记录语义内容的数据标签记录语义内容。
[0030]可选的,所述判断单元包括数据标签层级判断单元和单独词判断单元,所述数据标签层级判断单元用于判断数据标签是否为底层数据标签,所述单独词判断单元用于在数据标签不是底层数据标签时,判断该数据标签是否为单独词。
[0031]与现有技术相比,本发明的技术方案具有以下优点:
[0032]本发明的多级数据存储方法,采用单个数据分类结构存储相互关联的多级数据,在单个数据分类结构不仅生成数据标签以及记录数据的上下级关系关联关系信息,并且本发明的存储方法,除了对底层数据标签记录语义内容外,对底层数据标签之外的其他数据标签也可以记录语义内容,改变了相互关联的多级数据的存储结构,使得存储结构相对简单,由于数据标签记录了语义内容提高信息检索的精度和效率;对底层数据标签之外的数据标签记录语义内容进行判断,提升了数据存储的选择性。此外,由于相互关联的所有数据信息都是记录在了一个数据结构中,此时的数据标签不会与其它的数据标签发生冲突,因此数据标签就具有了实际的语义。
[0033]进一步,采用不同方式标记记录有语义内容的数据标签以及未记录有语义内容的数据标签,在对多级数据进行搜索时,可以根据标记快速确定搜索范围,提高搜索的准确性。
[0034]本发明形成词类库的方法,除了对底层词类标签记录语义内容外,对底层词类标签之外的其他词类标签也可以记录语义内容,提高信息检索的精度和效率;对底层词类标签之外的词类标签记录语义内容进行判断,提升了数据存储的选择性。
[0035]本发明的多级数据结构,除了对底层数据标签记录语义内容外,对底层数据标签之外的其他数据标签也可以记录语义内容,提高信息检索的精度和效率。
[0036]本发明的多级数据的存储装置,用于建立多级数据,并可以对数据标签记录语义内容。
[0037]本发明的信息检索方法,对采用上述多级数据存储方法存储的多级数据进行检索时,由于相关的多级数据都是放在一个多级数据结构中,因此只需对该多级数据结构进行检索即可,从而大大缩小了检索数据结构的数目,使得搜索过程更加简单,最终提高了检索的效率,提升了检索的准确度。
【附图说明】
[0038]图1为本发明一实施例多级数据存储方法的流程示意图;
[0039]图2为本发明一实施例多级数据存储方法形成的多级数据结构的示意图;
[0040]图3为本发明一实施例采用多级数据存储方法形成词类库的方法流程示意图;
[0041]图4为本发明一实施例词类库的结构示意图;
[0042]图5为本发明一实施例多级数据存储装置的结构示意图;
[0043]图6为本发明一实施例基于多级数据的信息检索方法的流程示意图。
【具体实施方式】
[0044]如【背景技术】所言,现有技术建立的词类库的数据存储结构较为复杂,且不能满足搜索的需求(比如存在某些关键字检索不到相关信息)。研究发现,词类库的结构为多级数据结构,如:包括父级词类分类、位于父级词类分类下的子级词类分类、位于子级词类分类下的孙级词类分类。在一具体例子中,一词类库包括:父级词类分类(/外企,表示数据标签),父级词类分类(/外企)下包括两个并列的子级词类分类(/外独资企业)和(/中外合资企业),子级词类分类(/外独资企业)下包括若干孙级词类分类(/日企)、(/德企),孙级词类分类就是底层数据,孙级词类分类(/日企)记录对应的语义内容:日企、日资企业,子级词类名称(/德企)记录对应的内容:德企、德资企业,子级词类分类(/中外合资企业)下包括若干孙级词类分类(/中日合资)、(/中美合资),孙级词类分类(/中日合资)记录对应的语义内容:中日合资、中日合资企业,孙级词类分类(/中美合资)记录对应的语义内容:中美合资、中美合资企业,在词类库结构中,孙级词类名称记录的对应内容具有实际的语义,父级词类分类、子级词类分类、孙级词类分类仅作为标签并不表示实际的语义,并且父级词类分类、子级词类分类和孙级词类分类的名称是不能重复的,在搜索引擎进行搜索时,只能对词类库中具有实际语义的内容进行识别,而如果用户如果采用“外企”、“外独资企业”或“中外合
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1