一种关联数据的索引、检索、存储和显示控制的信息系统的制作方法

文档序号:6614547阅读:268来源:国知局
专利名称:一种关联数据的索引、检索、存储和显示控制的信息系统的制作方法
技术领域
本发明涉及信息技术领域,特别涉及一种具有关联关系数据的存储、索引、 检索和呈现控制的信息系统。
背景技术
在当前信息社会里,随着信息技术的逐渐普及,信息系统得到了广泛应用。 随着信息系统中积累的数据越来越多,人们已经逐渐依赖于通过检索来快速的 从信息系统中获得信息。人们在信息系统中检索信息时,常常会得到很多的结 果,其中夹杂的大量不相关内容降低了人们获取信息的效率,同时也降低了系 统资源的有效利用率。这种现象在海量信息系统的检索中显得尤为突出,例如 在现有的搜索引擎中检索某个信息时,常常会得到大量信息,因此,人们不得 不对搜索引擎返回的大量结果逐个进行分辨,以确定是否是所需要的内容,这 导致了低下的信息获取效率。而检索结果不准确、检索质量不高则是目前海量 信息系统中普遍存在的问题。
目前,基于关键词匹配技术的文本检索系统在建立索引时,通常先将文本 中出现的关键词与关键词所在文本的定位信息生成索引数据库,然后用信息系 统提供的检索界面输入检索词进行检索,系统在索引数据库中对用户所提供的 检索词进行匹配查找,得到检索词所在文本的定位信息,最后显示由该定位信息 所确定的文本的摘要或全文。在关键词匹配技术的基础上还可实现布尔检索。
为给文本中存在的信息做索引,索引系统需对文本作语义分析,而文本的 歧义处理是文本语义分析中无法绕过的过程。歧义是指同一种语言形式可以表 示多种意义的现象,歧义可以在词汇、句法、语义、语用等多个层面发生。形 成歧义的主要原因是以一维线性的文本方式组织的语言结构是有限的,而语义 则是无穷的,用有限的结构表达近乎无穷的意思会不可避免的造成一个语言结
构表达多种语义内容的一对多现象,这是产生歧义的根源,也是文本语义分析 技术的最大障碍。例如, 一个词对应于多个含义的一词多义现象、不同的词序 导致的词序歧义等一对多现象。基于一维线性文本的信息组织方式是导致数据 处理系统难以解决其歧义问题的根本原因,因此,在目前信息系统中信息量急 剧增多的背景下,寻找一种能够易于减小语义歧义的信息组织方法就变得非常 迫切。
从检索词与文档这两者之间的关系角度上来说,基于关键词匹配技术的检索 本质上是一种对检索词在文档中的出现关系的检索。由此可以发现,基于关键 词匹配技术的检索在如下两个环节上存在不足第一个环节是在建立索引时, 除了关键词在文本中是否出现的信息,索引数据中没有保存文档中存在的其它 信息。例如,存在于文本中的因果关系、时间先后秩序、空间关系等。这实际 上是在索引过程中就已经丢失了文本里包含的信息,造成了信息缺失,从而使 得索引数据不足以完整的反映文本中的信息。第二个环节是在检索时,由检索 词所构成的布尔检索条件描述的仅是检索词在文本中的出现条件,因此检索条 件缺乏描述文本中复杂语义的能力,这使得用户无法明确、详细的描述检索目 标。上述两个环节中存在的不足直接造成了基于简单关键词匹配技术的检索查 不准、检索质量不高的结果。
目前以web服务器一浏览器为主流模式的互联网应用存在的一个明显的缺 点是,在绝大多数情况下人们只能通过浏览器被动地接收信息,而难以灵活的 对所浏览的信息进行加工处理(如标记、增添、修改等)并对加工处理后所增 添的信息进行灵活共享,这种信息的单向传播方式主要是由超文本的信息组织
方式、存取方式以及显示方式所决定的。虽然有维客(wiki)这样的应用能够在
线的使人们对浏览器中的信息做一些简单的加工和处理,并对所加工后的信息 进行共享,但这仍然离交互的、便捷的对信息进行再加工并灵活共享加工后所 得信息的目标相差甚远。
相比较于用一维线性文本表达语义的方式,使用图形或图画表达语义则更 加直观、形象,这种直观、形象地表达语义的方式最早可以追朔到有文字记载 初期的图画文字和象形文字,但是使用图画文字和象形文字难以表达某些实体 事物和抽象事物。现代的概念图则是一种既保留了图形表达的直观,同时又具 有较强抽象语义表达能力的语义表达方式,由于概念图具有描述一阶逻辑的能 力,因此概念图常常被用来记录及表达思维过程。概念图是一种用图示法来组
织和表达概念及概念间关系的方法。概念图最早在20世纪60年代由美国康奈 儿大学诺瓦克(Jos印h D. Novak)根据奥苏贝尔(David P. Ausubel)的有意 义学习理论提出,但概念图(Conc印t Maps) —词直到20世纪80年代才被提 出。Novak认为概念图是某个主题的概念及其关系的图形化表示,概念图是用 来组织和表征知识的工具。概念图通常将某一主题的有关概念放在圆圈或方框 中,然后用连线将相关的概念和命题连接,连线上标明两个概念之间的意义关 系(弓l自 Novak, J. D. , The Theory Underlying Concept Maps and How to Construct Them. Cornell University,1982)。
概念图方法的主要特征是通过图示的方式在不同的概念间建立各种显式的 图形联系来直观地呈现概念及概念之间的关系。目前市场上的各种概念图工具 有很多,国外有代表性的部份产品有CmapTools , Conc印tDraw, Inspiration 等,国内有代表性的产品有Keystone等。
目前,概念图工具仅提供了按关键词检索的功能,而没有提供直接检索复 杂概念和关系(由多个简单概念和关联关系构成的概念和关系),用户在检索时, 只能采取间接的方式,即只能按关键词检索到与待査复杂概念或复杂关联关系 相关的简单概念或简单关系后,先定位到该简单概念或简单关系所在的显示区 域,然后再移动该显示区域来逐步确认该关系是否就是待査找目标的步骤来完 成检索,这种交互操作方式繁琐、并且需花费用户很大的精力来予以确认。对 这些工具的使用者而言,迫切需要有一种方法能快速检索概念及概念间关联关 系的功能,特别是需要有一种方法能快速检索指定复杂概念或复杂关系的功能。
目前的概念图工具是以整图的数据为单位来进行存储、处理和共享,因此, 如果一个概念图的数据量较大,特别是当图中包含的图像数据较多时,整个概 念图所对应的数据量就越大,从而导致在通过网络进行共享时,数据传输的过 程中将需要更大的网络带宽以及导致更长的传输延迟。由于概念图软件把整图 的数据全部放入数据处理设备的内存中进行操作,因此对数据处理设备的内存
资源要求也较高;整图数据处理方式使得数据处理的粒度较大,因而不利于实 现多用户对概念图中多个对象的并发处理及共享,特别是在大规模多用户并发 处理、共享海量概念图数据的情况下,将直接导致数据处理系统难以进一步提 高处理性能,并且还会导致在共享海量数据时使数据访问冲突的几率增大,进 而导致出现系统性能瓶颈。

发明内容
本发明的目的在于提供一种能直接检索关联数据中的关联信息、便于多用 户并发处理并对处理后的信息灵活共享的涉及索引、检索、数据存储和呈现控 制的信息系统。
本发明索引系统至少包括两个有关联关系的数据块,每个数据块都由位置 信息块和内容信息块组成,内容信息块是数据块中除了位置信息块之外的其余 数据,位置信息块记录与本数据块有关联的其它数据块的位置信息;按照以下 步骤生成索引数据
(1) .建立序列一选择一个数据块(a),以其位置信息(Pa)作为序列 的首项,再从数据块(a)的位置信息块中选取一条位置信息(Pb)作为序列的第2 项,然后从数据块(b)的位置信息块中选取一条位置信息(P。)作为序列的第 3项,同理,从数据块(c)的位置信息块中选取的一条位置信息(Pd)作为序列 的第4项,按照这种对应关系建立序列(Pa, Pb, P。,Pd,...),直至位置信息块 中没有可选位置信息或该序列的长度达到设定长度时停止;
(2) .建立序列二以序列一中各位置信息下脚标对应的数据块中内容信
息块的部份或全部数据建立序列(a, Cb, C。, Cd,...);
(3) .建立字符串用至少包括序列二中的每项并且不改变各项间的先后 顺序,生成字符串;
(4) .确定索引记录的关键词用步骤(3)中所述的字符串作关键词;
(5) .确定索引记录的地址信息选择序列一中至少一个不同项作为地址 息(Pa, Pb, Pc,…);
(6) .将步骤(4)生成的关键词与步骤(5)确定的地址信息匹配生成一 条索引记录; (7)重复步骤(1)到步骤(6),对所有的数据块生成索引数据。 对于上述索引系统中序列一的每一项都不相同。关键词也可以由序列二的 某一子序列的各项生成。
基于上述索引系统,本发明的检索方法是根据用户输入的信息生成所述 数据块集合,用对应于所述索引系统生成关键词的方法生成检索词,然后用该 检索词进行检索,并将结果显示出来。
本发明信息系统,至少包括两个有关联关系的数据块,每个数据块都由位 置信息块、内容信息块和几何信息块组成,位置信息块用于记录与本数据块有关 联的其它数据块的位置信息,几何信息块用于记录数据块在输出设备上输出时 所用到的坐标信息和几何形状信息,不同数据块的几何信息可以被独立地修改, 内容信息块记录的是数据块中除了位置信息块和几何信息块之外的其余数据, 每个数据块最终被独立地存储在非易失性存储设备中,在显示区中不属于任一 当前已显示数据块的几何区域里创建的内容都被保存在独立存取的数据块中。
本发明基于上述信息系统的权限控制方法是:所述数据块由位置信息块、权 限信息块、几何信息块和内容信息块组成,其中内容信息块记录的是数据块中 除了位置信息块、几何信息块和权限信息块之外的信息,权限信息块用于记录 允许哪些用户进行哪些操作的权限信息,用户只能对数据块进行权限所允许的 操作。
基于上述信息系统的显示控制方法是按如下步骤控制数据块的显示
(1) .用两个空散列表Q和M;
(2) .将已显示数据块和需要显示的数据块的位置信息加入其中一个散列 表(Q)中;
(3) .如果Q为空就停止显示过程,如果Q不为空,则从Q中任选一位置
信息(Pa),并将其对应的数据块(a)调入内存;
(4) 将步骤3所述的位置信息(Pa)从Q中移除,将步骤3所述的位置 信息(Pa)加入到M中;
(5)如果所述的位置信息(Pa)所对应的数据块(a)所在的几何区域与当前 显示区域相交,则显示该数据块,否则将该数据块从内存中销毁,并返回步骤
(3);
(6) 如果数据块(a)的位置信息块的内容不为空,则将所有不出现在M中的 (a)的位置块中的位置信息添加到Q中;
(7) 重复步骤3-6。
上述显示控制方法的步骤(5)还可以是如果所述的位置信息(Pa)所对 应的数据块(a)所在的几何区域与当前显示区域相交并且用户具有显示该数据 块的权限,则显示该数据块,否则将该数据块从内存中销毁,并返回步骤(3)。
本发明的有益效果是本发明信息系统通过使用独立存储的所述数据块来 记录关联数据,从而有利于记录易于检索的新对象和新关联关系,并且还有利 于对相应数据地灵活存取、显示及共享等处理,特别有助于实现对复杂对象和 多维关联关系的索引及检索,并且使信息(特别是文字信息)的组织使用更符 合现实世界中事物间联系的网状信息组织方式,而不再限于一维序列的组织方 式。在数据处理系统中创建有关联关系的数据块的同时,就可以根据数据块的 内容自动生成专门的关键词用于记录数据块间的关联信息,这种方法有助于减 少、甚至避免索引数据时语义分析过程中歧义处理的难题。本发明将反映数据 块之间关联关系的专门字符串作为索引数据和检索条件的内容,使得基于本发 明的信息系统具备了索引和检索数据块间复杂关联关系的能力,因而有助于实 现较为准确的检索(相比较一般的基于关键词匹配技术的检索而言)。本发明信 息系统通过使用基于数据块的存储、索引和(二维或多维)图形化显示输出, 实现了对关联信息直观、便捷地记录、存储、检索和显示。
本发明信息系统,由于每个数据块都独立存储和存取,从而有助于降低多 用户同时访问多个数据块时可能发生访问冲突的机率,这同时也有利于索引系 统并行建立索引性能的提高。采用独立的数据块存储和存取方式也便于基于本 发明的索引、检索以及共享功能通过简单的增添数据处理设备来扩大系统的处 理容量以及提高并行处理能力。用户在通过网络下载数据和在客户端处理数据 时,可以优先传输用户当前所关心的数据(如处于当前显示区域内的数据块), 而没有被关注的内容(如没有在当前显示区域内显示的数据块)则可以在后台 传送,或者延后传送或不传送; 一旦被关注数据块不在输出显示区域内时,就 可以在将内存中的数据块保存到非易失性存储设备之后立即将该对象从内存中 移除掉。这样的处理方式有利于降低网络带宽耗占,提高网络利用效率,同时 还可以降低用户端内存资源的耗占,特别是在以图示方式呈现数据块及数据块 间的关联关系时,使用数据块的存储方式进行存取和处理,可使得对系统的内 存资源耗占率始终保持在较低的水平。当输出设备支持二维或三维的输出方式 时,用户可以通过移动(二维或三维的移动)当前显示区域来改变传统的页面
切换方式的web浏览习惯。使用数据块方式存储共享信息时,有助于多用户间 快速、灵活的实现共享信息的编辑、修改、传输和呈现,因而有利于建立计算 机辅助支持的协同工作环境;同时,基于独立存储数据块的权限控制和显示控 制方法有利于用户界面程序实现灵活的呈现、编辑、修改、删除及共享数据块 的功能,解决了当前互联网应用中信息处理粒度较大,难以被多用户对其进行 并行加工处理(如添加、删除、修改、注解、标记等)及灵活共享加工后所得 信息的不足,并且还有助于改变传统web服务器一浏览器应用模式中人常常处 于被动接收信息的境况,从而有助于加速和促进(人的)知识处理(知识的保 存、积累、整理、检索和分享)的迭代过程,促进知识的演化。


图l是需建立索引的概念图
图2是针对图1概念图生成的数据块。
图3是进行检索的第一种实施方式的概念图。
图4是针对图3概念图生成的数据块。
图5是针对图3概念图生成的另一种数据块。
图6是进行检索的第二种实施方式的概念图。
图7是针对图6概念图生成的数据块。
图8是进行检索的第三种实施方式的概念图。
图9是针对图8概念图生成的数据块。
图IO是进行检索的第四种实施方式的概念图。
图11是针对图io概念图生成的数据块。
图12是基于数据块权限控制实施方式的概念图。
图13是用户2没有对用户1所创建的数据块a、 b、 c的写权限时的数据块。 图14是用户2拥有对用户1所创建的数据块a、 b、 c的写权限时的数据块。 图15是基于独立存储数据块的显示控制流程图。
上述附图中每个数据块里的几何信息用于记录数据块在被显示时的大小、 形状和位置。由于如何表示及确定物体间的几何关系是非常成熟的技术,为描 述方便,本发明中没有对几何信息的具体表示方式作详细的说明。
具体实施例方式
一、本发明索引系统的实施方式
这是一个针对概念图建立索引的实施方式,参见图1-图5。 图l所示的是一个概念图,该概念图中示出了三个概念(概念a、概念b、概 念c)以及这些概念间的联系,每一个概念都是一个包含文本的图形,比如概念 a就是包含有字符串"文本A"的椭圆,概念b就是包含有字符串"文本B"的 椭圆,概念c就是包含有字符串"文本C"的椭圆。概念间的联系用线条(如 带箭头的直线、曲线等)来表示,线条上的文字用于表示其联系的类型,如左 边带箭头的直线,上面有"箭头1"的字样,如右边带箭头的直线,上面有"箭 头2"的字样,"箭头1"和"箭头2"用于标识箭头的关系。图1所示的概念 图中的每个概念和概念间的联系都使用不同的数据块表示成图2的数据块集 合。其中,数据块a用于表示概念a,数据块b用于表示概念b,数据块c用于 表示概念c,数据块d用于表示连接概念a和概念b的箭头1,数据块e用于表 示连接概念b和概念c的箭头2。其中,概念a的文本内容为"文本A",概念 b包含的文本内容为"文本B",概念c包含的文本内容为"文本C",箭头l表 示连接概念a和概念b的箭头联系并且其包含的文本内容为"箭头1",曲线1 表示连接概念a和概念b的曲线联系并且包含的文本内容为"曲线1",箭头2 表示连接概念b和概念c的箭头联系并且包含的文本内容为"箭头2"。 数据块的位置信息可以使用URL或URI来表示。 针对图2数据块建立索引数据(假定指定最大序列长度为5):
(1).建立序列一 (本实施方式给出了四种方法)-方法1 :选择数据块a,以其位置信息Pa (表示下标a所对应数据块的位置
信息)作为序列的首项,再从数据块a的位置信息块中选取第一条位置信息Pd
作为序列的第2项,然后从数据块d的位置信息块中选取第一条位置信息Pa作
为序列的第3项,然后依此类推直到达到指定序列长度,得到序列(Pa, Pd, Pa,
Pd, Pa);
方法2:选择数据块a,以其位置信息PJ乍为序列的首项,再从数据块a的 位置信息块中选取第二条位置信息Pf作为序列的第2项,然后从数据块f的位 置信息块中选取第二条位置信息Pb作为序列的第3项,然后依此类推,得到序 列(Pa, Pr, Pb, Pe, P丄
方法3:选择数据块a,以其位置信息Pa作为序列的首项,再从数据块a 的位置信息块中选取序列中未出现的任一位置信息Pd作为序列的第2项,然后 从数据块d的位置信息块中选取序列中未出现的任一位置信息P"乍为序列的第 3项,然后依此类推,得到序列(Pa, Pd, Pb, h, PJ;
方法4:选择方法3中所得序列的一个子序列,如(Pa,Pb,巳);
(2) .建立序列二对应于步骤一中各方法所生成的位置序列依各位置信 息下脚标对应的数据块的内容信息块的数据建立如下序列
方法l:(文本A,箭头l,文本A,箭头1,文本A) 方法2:(文本A,曲线1,文本B,箭头2,文本C) 方法3:(文本A,箭头l,文本B,箭头2,文本C) 方法4:(文本A,文本B,文本C)
(3) .建立字符串
方法l:"文本A箭头1文本A箭头1文本A" 方法2:"文本A曲线1文本B箭头2文本C" 方法3:"文本A箭头1文本B箭头2文本C" 方法4:"文本A文本B文本C"
(4) .确定索引数据的关键词用步骤(3)中所述的字符串分别作为不同 的关键词;
方法l:"文本A箭头1文本A箭头1文本A" 方法2:"文本A曲线1文本B箭头2文本C"
方法3:"文本A箭头1文本B箭头2文本C" 方法4:"文本A文本B文本C"
(5) .确定索引数据的地址信息将序列一中的一个或多个不同项作为地 址信息;
方法1: Pa, Pd
方法2: Pa, Pf, Pb, Pe,P。
方法3:Pa, Pd, Pb, Pe, Pc 方法4: Pa,Pb,Pc
(6) .生成索引记录 方法l:["文本A箭头1文本A箭头1文本A", (P 方法2:["文本A曲线1文本B箭头2文本C", (P 方法3:["文本A箭头1文本B箭头2文本C", (P 方法4:["文本A文本B文本C",(Pa,Pb,Pc)]
(7) .然后选择数据块b、 c、 d、 e重复步骤l-6,生成其它索引数据。 在上述的步骤(2)中还可以仅使用内容数据块的部份数据来生成序列二
方法l: (A,箭头l, A,箭头l, A)
方法2: (A,曲线l, B,箭头2, C)
方法3: (A,箭头l, B,箭头2, C)
方法4: (A,B,C) 或者
方法l: (A,箭头
方法2: (A,曲线
方法3: (A,箭头
方法4: (A,B,C)
在上述的步骤(3)中还可以采用在每项的两端添加字符或字符串对来生成字符 串
方法1:"<文本A〉〈箭头1〉〈文本A〉〈箭头1〉〈文本A〉" 方法2:"〈文本AX曲线1X文本B〉〈箭头2><文本C〉"
Pd)]
Pf, Pb, Pe,Pc)]
Pd, Pb, Pe, Pc)]
,A,箭头,A) ,B,箭头,C) ,B,箭头,C)方法3:"〈文本AX箭头1〉〈文本BX箭头2>〈文本C〉" 方法4:"〈文本AX文本BX文本C〉" 在上述的步骤(3)中还可以采用在每项的分隔处添加字符串来生成字符串 方法l:"文本Al箭头ll文本Al箭头ll文本A" 方法2:"文本Al曲线1l文本Bl箭头2l文本C" 方法3:"文本Al箭头ll文本Bl箭头2l文本C" 方法4:"文本Al文本Bl文本C" 其中符号"〈"、"〉"和"I"可采用其它字符。
当用于关键词的字符串很长时,在步骤(6)中采用某一散列算法(如MD5、 SHA等,本例中用的MD5散列算法)计算关键词的散列值,并以该散列值为主 关键词,以原关键词为辅关键词,位置信息不变,生成索引记录。例如,使用 ANSI编码字符串,采用散列算法MD5时步骤(6)中得到的索引记录如下(为 便于描述,使用16进制字符串表示散列值)
方法1: [ "7BF93490B2766297BD08A4247835B3B3","文本A箭头1文本A 箭头1文本A",(Pa, Pd)]
方法2: [ "421832D457CB458D13E6E0FB55266C7C","文本A曲线1文本B 箭头2文本C",(Pa, Pf, Pb, Pe,Pj ]
方法3: [ "6D78190851FE8313BFF46E1438921352","文本A箭头1文本B 箭头2文本C",(Pa, Pd, Pb, Pe, Pc)]
方法4: ["2117BB3BF7FC07164614D83FB6416928","文本A文本B文本C", (Pa,Pb,Pc)]
本发明索引系统中所述数据块的内容信息块可以是文字、图形、图像、音 频、视频、计算机外部设备的输入及输出指令等数据。
二、检索方法的实施方式 用本发明检索方法进行检索时, 一般的情况下只需直接给出关联数据块, 然后由系统自动产生所述专门字符串进行检索,也可以人工给出专门的字符串 进行检索。当采用计算机屏幕作为人机交互界面时,用户可以通过图示方法检 索各概念及概念之间的关系。以下给出了四个图示检索实施方式,参见图3-图
实施方式一
这是本发明用于图示检索的实施方式参见图3-图11。
当用户在检索时,首先通过人机交互界面给出如图3所示概念图,系统将 该概念图生成如图4所示数据块集合数据块a表示包含有文本内容"A"的概
念a,数据块b表示包含有文本内容"B"的概念b,数据块c表示包含有文本 内容"C"的概念c,数据块d表示连接概念a和概念b的箭头1并且包含文本 内容"箭头1",数据块e表示连接概念b和概念c的箭头2并且包含文本内容
"箭头2",例如,当按照步骤(6)的方法4中生成关键词的方法,可以得到 检索词"文本A文本B文本C",然后以该检索词査找索引,返回检索结果
(Pa,Pb,P。),然后通过人机界面,将对应于这些地址的数据块调入内存并根据 数据块的几何信息显示这些数据块,将这些数据块展现给用户。
图3还可表示成图5的数据块集合,其中后缀"-s"表示关系的起点,后 缀"-e"表示关系的终点。在生成字符串时,使用的是步骤(1)中方法3的 选取不重复数据块的方法,这样也同样可得到"文本Al箭头1l文本Bl箭头21 文本C"等字符串,如果这时是生成索引数据,那么只需将该字符串与其对应 的数据块的位置信息一起存入到数据库中即可。若是在检索时,那么将得到的 字符串直接到索引数据中进行匹配査找并返回结果即可。
在得到检索词"文本A文本B文本C"之后,使用MD5算法得到其散列值
"2117BB3BF7FC07164614D83FB6416928",然后到索引中查找。使用字符串的散 列值作为索引的关键词可以使得索引使用的存储空间更少,这是由于MD5散列 算法的结果只有16个字节,因此可使用更少的索引存储空间,另外,在查询的 时候可由客户端系统先计算出散列值后再到远程服务器或其它客户端进行匹配 查找,从而有利于将计算分摊开来,便于大规模检索系统的实现。当遇到有相 同的散列值的情况时,然后再以检索词作为辅关键词进行匹配查找即可。
实施方式二参见图6和图7。首先用户给出图6概念图,然后系统根据 图6所示概念图生成图7数据块集合,数据块a用于表示概念a,数据块b用 于表示概念b,数据块c用于表示概念c,数据块d用于表示连接概念a和概念
b的箭头l,数据块e用于表示连接概念a和概念c的箭头2。其中,概念a包 含的文本内容为"文本A",概念b包含的文本内容为"文本B",概念c包含的 文本内容为"文本C",箭头1表示连接概念a和概念b的箭头联系并且其包含 的文本内容为"箭头1",箭头2表示连接概念b和概念c的箭头联系并且包含 的文本内容为"箭头2"。则可以由图6所示数据块集合得到检索词"文本A| 箭头I文本B"以及"文本Al箭头l文本C",在检索时,取这两个检索结果返回 的位置信息集合的交集作为检索结果集,然后将检索结果集的数据块调入内存 并根据数据块的几何信息显示这些数据块,将这些数据块展现给用户。
实施方式三参见图8和图9,反映的是具有包含关系的概念,在这种情 况下,概念间的关系用现有技术中文本是难以描述的。特别是图示的内容中所 包含的概念非常多,并且被包含的概念间具有复杂关系时,采用本发明数据块 的组织方式来显式的区分概念以及采用位置信息块来显式的表明概念间的抽象 关系,可以准确地反映图示中所存关系的信息,并进而以此生成准确的关系索 引数据。首先用户给出图8概念图,然后系统根据图8概念图生成图9中的数 据块,其中,当有某个概念的显示区域包含其它概念时,则生成一个新的数据 块用于表示这种包含关系,并且该新数据块的内容信息块的文本内容为"包含", 位置信息块则包含有满足被包含关系的所有数据块的位置信息,数据块a用于 表示概念a,数据块b用于表示概念b,数据块c用于表示概念c,数据块d用 于表示连接概念b和概念c的箭头,数据块e用于表示概念a包含概念b、概 念c以及箭头的关系。其中,概念a的文本内容为"文本A",概念b包含的文 本内容为"文本B",概念c包含的文本内容为"文本C",箭头表示连接概念b 和概念c的箭头联系并且其包含的文本内容为"箭头",可以由图9所示数据块 集合得到检索字符串"〈文本A〉〈包含X〈文本B〉〈箭头〉〈文本D〉"。在索引中 检索后,将得到的地址信息对应的数据块调入内存并根据数据块的几何信息显 示这些数据块,将这些数据块展现给用户。
实施方式四参见图10和图11。该实施方式表示的是各概念间有相交关 系的首先由用户给出图10所示概念图,然后系统根据图10生成图11数据块 集合,其中,数据块a用于表示概念a,数据块b用于表示概念b,由图ll数据块集合可得到检索字符串"〈A〉〈相交〉〈B〉"后进行检索。然后再将对应于检 索结果(地址信息)的数据块调入内存并根据数据块的几何信息显示这些数据 块,将这些数据块展现给用户。
本发明所述索引或检索系统在生成关键词的步骤(1)中若指定的长度为l 时,则索弓I或检索等价于现有的基于关键词的索弓I或检索系统。
本发明所述索引或检索系统还可拓展到三维或更多维人机交互界面的情形, 这时几何信息块中的数据包括更多维的空间信息。本发明特别适用于可表示为 具有逻辑关联、时间关联或空间关联的多个事件、多个事物或多个对象间关联 信息的记录和査询,例如地理信息、书籍分类信息等。
从上述四种检索实施方式可以看出,当用户使用本发明中描述的图示检索方 法时,用户只需设定好图示关系中的概念以及概念间的关联关系,系统自动将 其转换为对应的数据块表示之后,根据本发明所述方法生成专门的字符串,再 以该字符串作为检索条件就可对图示中所具有的概念间关联关系进行检索,这 种方法直观明了,且更接近于人类的自然表达方式,从而可以在检索时使用户 更多的关注于如何描述所要查找的内容,而无需关注与査询内容对应的专门的 字符串的具体写法,这给该该信息系统的使用者提供了便利的人机交互界面; 同时,由于这种图示检索方法较普通关键词检索方法更能够直观、便捷地描述 事物与事物或对象与对象间的关联关系(如通过时间或空间关联起来的事物或 对象之间的关联关系),因此有助于人们在检索时更准确的描述所想要查询的内 容。
用户还可以给出更为复杂的概念图,用户只需设定好概念及概念之间的关 系,由于这些概念图都可以生成与概念图相对应的数据块集合,因此,在关系 索引数据足够详尽的前提下,检索时所提供的关联关系越完整或越详细(如使 用步骤(1)中的方法三来生成专门的关键词进行检索),则以该概念示作 为检索条件进行检索,就可以得到越准确的检索结果。如果以图示中存在的部 份关系描述式为检索条件,则检索系统可以给出与完整图示关系相关、相似或 相近的检索结果。
本发明的索引和检索系统并不局限于概念图这样的应用,概念图仅仅是本
发明中所述数据块及其间关联关系的呈现方式之一,数据块的呈现或表现方式 还可以有其它的方式,例如三维的立体表示。另外,在概念图这种数据呈现方 法中, 一些联系也无需显式地呈现出来,这种联系是无形的,但却是可以被检 索的,这种无形的联系,可以通过预先设定的规则得到,例如数据块在被呈现 的时候,通过测量它们之间的几何区域可以得到它们之间相互的几何信息,如 被包含、相交、所在的相对方位、距离等,这些内容都可以被编码在数据块中, 并且也可以成为索引的对象,从而可以实现对这些信息地检索。
三、本发明信息系统的实施例在显示屏幕上有图3所示概念图,根据关 联关系信息的保存方式的不同(把关联关系独立的和非独立存储),在非易失性 存储设备上或者存储为五个(参见图4,把关联关系独立存储时)或者存储为三 个(参见图5,把关联关系作为内容数据的一部份存储时)独立存储的数据块。 这个信息系统的每个数据块都由位置信息块、内容信息块和几何信息块三部份 组成,位置信息块用于记录与本数据块有关联的其它数据块的存储位置信息,几 何信息块用于记录数据块在屏幕上输出时的坐标信息和几何形状信息,例如,
在图3中概念a的图形(椭圆)在被用户移动时,如果用户拥有修改数据块a (对 应于概念a的数据块)的权限时,则数据块a的几何信息可以被独立地修改并 被记录下来,内容信息块记录的是数据块中除了位置信息块和几何信息块之外 的其余数据,系统中创建的每个新数据块被独立地存储在非易失性存储设备中。 数据块的操作分为两种情况第一种是把关联关系作为独立存储的数据块时(参 见图4),首先在显示区中标出一个几何区域,并在这个区域内填上"文本A" 用于表示概念a,对应于这个几何区域的数据块a是独立存储的,同理可建立 数据块b和数据块c,当在概念a和概念b之间建立"箭头l"的联系时,建立 一个新的数据块d用于表示"箭头1",并且在数据块a和数据块b的位置信息 块中都插入位置信息Pd,在数据块d的位置信息块中插入Pa和Pb,类似的,在 概念b和概念c之间建立"箭头2"联系时,则生成数据块e,并且在数据块e 的位置信息块中插入Pb和P 。,同时在数据块b和c的位置信息块中都插入P 6。 当要删除概念a和概念b之间的箭头1联系时,则将P d从数据块a、 b的位置 信息块中删除掉,并且将数据块d从非易失性存储设备中删除掉,在修改概念
的几何位置或外观时,只需修改相应数据块的坐标或几何形状信息。第二种情 形是把关联关系作为内容数据块的一部份时的情形(参见图5),首先在显示区
中标出一个几何区域,并在这个区域内填上"文本A"用于表示概念a,对应于 这个几何区域的数据块a是独立存储的,同理可建立数据块b和数据块c,当 在概念a和概念b之间建立"箭头1"的联系时,在数据块a的位置信息块中 插入Pb,并且在数据块a的内容数据中的某个区域写上对应联系的名称"箭头 1-s" , "-s"表示起点,(如果系统采用事先定义的箭头的呈现方式的话(例如 采用连接两个概念的直线箭头时,该箭头可以直接由两个概念的中心坐标以及 其边界来确定),那么可以只记录箭头的名称而不用记录关联关系的几何信息, 否则,为了详细的体现每一联系的具体几何形状,因此可以在内容信息中同时 记录该关联关系的几何信息。内容数据中记录关联关系名称或类型的区域的每 项的秩序与位置信息块中每个位置信息的秩序是对应的),同样的,在数据块b 的位置信息块中插入Pa,并且在数据块b的内容信息块中记录对应于h的关系 关系信息"箭头l-e", "-e"表示关联关系的终点,类似的,在概念b和概念 c之间建立"箭头2"联系时,则在数据块b的位置信息块中添加P。并且在数据 块b的内容信息块中的对应区域记录上"箭头2-s",同时在数据块c的内容信 息块中的对应区域记录上"箭头2-e"。当要删除概念a和概念b之间的箭头1 联系时,则将数据块b的位置信息块里的Pa以及对应于Pa的关联关系几何信息 从删除掉,同时将数据块a中的位置信息块里的Pb以及对应于Pb的关联关系几 何信息删除掉,在修改概念的几何位置或外观时,只需修改相应的坐标或几何 形状信息即可。
在对本信息系统的数据进行索引和检索时,可以采用传统的基于一般关键 词匹配技术的索引方法和检索方法,也可以采用本发明所提供的索引方法和检 索方法。
通过TCP/IP协议或P2P协议,在两个或多个基于本发明信息系统的信息系 统之间可以建立网络连接,从而实现在多个系统之间检索并下载其所存储的数 据块,由于将每个概念的图示用独立存取的数据块来共享和实现权限控制,这 使得实时更新和共享当前显示界面中的概念图示变得容易起来,从而有助于实
现实时协作的概念图网络环境。用户可以通过设置每个数据块的权限信息来决 定是否允许其它用户存取、修改、删除或显示数据块。
本发明信息系统在呈现数据块时,各数据块之间是可以被相互独立的修改 的。只要用户拥有对当前数据块的相应权限,就可以修改该数据块中的信息。 比如位置信息、内容信息、几何信息,当修改位置信息时,用户增加或删除当 前数据块与其它数据块的关联关系,就可以修改位置信息中的相应内容;几何 信息同样也可以被修改(例如创建、移动、旋转、改变图形等),这一点本发明 系统与现有技术中基于格式化文本显示的系统(如基于超文本显示的浏览器) 是有本质区别的,而本发明数据块不仅便于体现数据之间的关联关系而且独立 存储在非易失性存储设备中,这些特点使之能对关联数据进行灵活的共享和显 示控制,并便于多用户并发处理,这是现有技术中概念图不能实现的。
四、 基于数据块的权限控制实施例参见图12、 13、 14
若图3概念图是用户1所创建的,用户2在图3所示概念图上增加一个概 念d (参见图12),其对应的数据块为数据块d (参见图13),并且概念d的几 何区域将概念a、概念b和概念c的几何区域都包含在其内部,若用户2没有 对用户l所创建数据块的修改权限时,这时对应生成的数据块集合如图13所示, 这样既避免了对用户1所拥有的数据块进行修改,同时又实现了与被处理信息 的同一显示区域中记录下用户2加工后得到的信息的目的,这有助于日后用户 2 了解相关信息或知识的演化历史;而当用户2拥有对概念a、 b、 c所对应的 数据块的修改权限时,生成的数据块集合如图14所示。对数据块中数据的删除、 修改、显示和存取等操作都根据数据块中的权限信息来予以控制。每个数据块 的权限信息只能或者由创建该数据块的用户,或者是数据块的权限块中记录的 拥有权限的用户,或者是系统管理员才能修改。
五、 数据块的显示控制流程如图15所示,显示控制方法的一个实施例为 若系统已经显示了如图3所示概念图,那么当界面需要更新时(例如用户通过 鼠标移动当前显示窗口或其中某个概念的位置时,或者创建了新的概念,或者 删除了某个概念或关联关系、或者修改了某个概念的几何信息时,如由椭圆的 外形转为长方形时),就会激发执行一次显示控制-
(1) 首先清空两个散列表Q和M;
(2) 将当前已显示的三个数据块(用图5数据块存储图3信息时)的位置信息
加入到Q中;
(3) 如果Q为空则停止显示控制,否则从Q中任取一位置信息(PJ,如果内存 中没有对应数据块(a)的内容,则将数据块(a)调入到内存中;
(4) 将(Pa)从Q中删除,并将(Pa)加入到M中;
(5) 将数据块(a)的几何信息与当前显示区域进行比较,如果(a)的几何区域 与当前显示区域相交并且当前用户拥有显示该数据块的权限,则根据数据 块(a)的几何信息显示数据块(a),否则将数据块(a)从内存中销毁, 并返回步骤(3);
(6) 将所有不出现在M中的数据块(a)的位置信息块中的位置信息添加到Q 中;
(7) 重复步骤(3) - (6)。
当用户在图3中添加一个概念d时(见图12和图13),显示控制方法的步 骤(2)修改为"将当前已显示的三个数据块(用图5数据块存储图3信息时) 以及数据块d的位置信息加入到Q中",然后重复步骤(3) - (6)。
权利要求
1、一种关联数据的索引系统,其特征在于至少包括两个有关联关系的数据块,每个数据块都由位置信息块和内容信息块组成,内容信息块是数据块中除了位置信息块之外的其余数据,位置信息块用于记录与本数据块有关联的其它数据块的存储位置信息;按照以下步骤生成索引数据(1).建立序列一选择一个数据块(a),以其位置信息(Pa)作为序列的首项,再从数据块(a)的位置信息块中选取一条位置信息(Pb)作为序列的第2项,然后从数据块(b)的位置信息块中选取一条位置信息(Pc)作为序列的第3项,同理,从数据块(c)的位置信息块中选取的一条位置信息(Pd)作为序列的第4项,按照这种对应关系建立序列(Pa,Pb,Pc,Pd,...),直至位置信息块中没有可选位置信息或该序列的长度达到设定长度时停止;(2).建立序列二以序列一中各位置信息下脚标对应的数据块中内容信息块的部份或全部数据建立序列(Ca,Cb,Cc,Cd,...);(3).建立字符串用至少包括序列二中的每项并且不改变各项间的先后顺序,生成字符串;(4).确定关键词用步骤(3)中所述的字符串作关键词;(5).确定地址信息选择序列一中至少一个不同项作为地址信息(Pa,Pb,Pc,...);(6).将步骤(4)生成的关键词与步骤(5)确定的地址信息匹配生成一条索引记录;(7)重复步骤(1)到步骤(6),对所有的数据块生成索引数据。
2、 根据权利要求1所述的索引系统,其特征在于所述序列一的每一项都不 相同。
3、 根据权利要求1或2所述的索引系统,其特征在于将序列二中的至少一 项(Ca)所指代的内容数据划成n个区域,构建长度为m的序列三,l<m《n, 该序列中的每项选择所述n个区域中的某个区域的数据,用至少包括序列三中 的每项生成字符串,用该字符串替换步骤(3)所述字符串中的对应项(QO。
4、 根据权利要求l一3之一所述的索引系统,其特征在于关键词由序列二的某一子序列的各项生成。
5、 根据权利要求l一4之一所述的索引系统,其特征在于以所述关键词经 过散列算法处理后得到的散列值作为索引数据的主关键词,以所述关键词作为索引数据的辅关键词。
6、 一种对应于权利要求1-5之一所述索引系统的检索方法,其特征在于根 据用户输入的信息而生成的所述数据块集合,用对应于所述索引系统生成关键 词的方法生成检索词,然后用该检索词进行检索,并将结果显示出来。
7、 一种信息系统,其特征在于至少包括两个有关联关系的数据块,每个数 据块都由位置信息块、内容信息块和几何信息块组成,位置信息块用于记录与本 数据块有关联的其它数据块的位置信息,几何信息块用于记录数据块在输出设 备上输出时所用到的坐标信息和几何形状信息,不同数据块的几何信息可以被 独立地修改,内容信息块记录的是数据块中除了位置信息块和几何信息块之外 的其余数据,每个数据块最终被独立地存储在非易失性存储设备中,在显示区中 不属于任一当前已显示数据块的几何区域里创建的内容都被保存在独立存取的 数据块中。
8、 一种基于权利要求7所述的信息系统的权限控制方法,其特征在于, 所述数据块由位置信息块、权限信息块、几何信息块和内容信息块组成,权限 控制信息块用于记录哪些用户可以进行哪些操作的权限信息,其中内容信息块 记录的是数据块中除了位置信息块、几何信息块和权限信息块之外的信息,用 户只能对数据块进行权限所允许的操作。
9、 一种基于权利要求7所述的信息系统的显示控制方法,其特征在于按如 下步骤控制数据块的显示-(1) .用两个空散列表Q和M;(2) .将需要显示的数据块和已经在显示区中被呈现的数据块的位置信息 加入其中一个散列表(Q)中;(3) .如果Q为空就停止显示控制过程,如果Q不为空,则从Q中任选一 位置信息(Pa),如果内存中没有与其对应的数据块,则将其对应的数据块(a)调 入内存;(4)将步骤3所述的位置信息(Pa)从Q中移除,将步骤3所述的位置信 息(Pa)加入到M中;(5) 如果所述的位置信息(Pa)所对应的数据块(a)所在的几何区域与当前 显示区域相交,则显示该数据块,否则将该数据块从内存中销毁,并返回步骤(3);(6) 将所有不出现在M中的数据块(a)的位置块中的位置信息添加到Q中;(7) 重复步骤3-6。
10、 一种基于权利要求8所述的信息系统的显示控制方法,其特征在于按 如下步骤控制数据块的显示(1) .用两个空散列表Q和M;(2) .将需要显示的数据块和己经在显示区中被呈现的数据块的位置信息 加入其中一个散列表(Q)中;(3) .如果Q为空就停止显示控制过程,如果Q不为空,则从Q中任选一 位置信息(Pa),如果内存中没有与其对应的数据块,则将其对应的数据块(a)调 入内存;(4) 将步骤3所述的位置信息(Pa)从Q中移除,将步骤3所述的位置信 息(Pa)加入到M中;(5) 如果所述的位置信息(Pa)所对应的数据块(a)所在的几何区域与当前 显示区域相交并且用户具有显示该数据块的权限,则显示该数据块,否则将该 数据块从内存中销毁,并返回步骤(3);(6) 将所有不出现在M中的数据块(a)的位置块中的位置信息添加到Q中;(7) 重复步骤3-6。
全文摘要
本发明公开了一种涉及关联数据的索引、检索、存储和显示控制的信息系统。本发明索引系统至少包括两个有关联关系的数据块,每个数据块都由位置信息块和内容信息块组成,内容信息块是数据块中除了位置信息块之外的其余数据,位置信息块记录与本数据块有关联的其它数据块的位置信息,按规定步骤生成索引数据,检索方法是根据用户输入的信息生成所述数据块集合,用对应于所述索引系统生成关键词的方法生成检索词,然后用该检索词进行检索,并将结果显示出来。基于数据块与当前显示区的几何关系进行显示控制。利用本发明系统能直接检索关联数据中的关联信息、便于实现多用户并发处理并对处理后的信息灵活共享。
文档编号G06F17/30GK101178733SQ20071019253
公开日2008年5月14日 申请日期2007年12月7日 优先权日2007年12月7日
发明者彭海杰 申请人:彭海杰
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1