信息检索装置和方法

文档序号:6457757阅读:174来源:国知局
专利名称:信息检索装置和方法
技术领域
本发明涉及一种信息检索装置和方法。
背景技术
为了向用户呈现信息以及针对所呈现的信息由用户执行某些行
为,使用被称为图形用户接口(GUI)的技术。普通的GUI被设计成当 用户通过操作例如鼠标的指示设备(指点设备)来指示窗口中的对象 时,能够显示一个菜单窗口,其示出了针对对象的行为列表。当用户 在该菜单窗口中选择想要的项时,执行对应于所述项的行为。特别是, 在GUI中被称为上下文菜单的技术能够显示菜单,同时根据目标数 据的格式来限制可选择的操作。这使得用户可以容易地指示行为。
提出了和GUI相关的多种技术。例如,已经存在一种技术,其 从用户在浏览的文档中标记的关键字的含义来估计用户的意图,以及 呈现根据用户意图从多个候选中选出的项的菜单(例如参照JP-A 2006-65754 (特开))。根据这个公开文本中揭示的技术,要在菜单中呈 现的项的顺序被预先确定。
假定有多个要呈现的项。在这种情况下,如果用户频繁选择的项 在菜单中未指定的低顺序位置显示,用户将会花去许多时间来找出想 要的项,导致复杂的操作。当用户要从多个链接的菜单中选择一个项 时,所述操作的复杂度尤其值得注意。

发明内容
设计本发明以解决信息检索装置中的上述问题,所述信息检索装 置根据指定的关键字和在菜单中选择的项来执行信息检索,本发明的 目的是提供一种信息检索装置和信息检索方法。
根据本发明的一个方面,提供了一种信息检索装置,包括显示单元,其显示示出了多个估计的含义项的第一显示菜单以及示出了与在 所述第一显示菜单上选择的所述含义项相对应的多个检索目标项的 第二显示菜单。日志存储单元存储对所述第一和第二显示菜单的选择 日志。估计单元从所述选择日志中估计检索目标项选择倾向。排序单 元基于所述选择倾向对所述多个检索目标项进行排序。显示单元在根 据排序排列了多个检索目标项之后,在所述第二显示菜单中显示所述 多个检索目标项。


图1是根据实施例的信息检索系统的方框图; 图2是示出含义的上下文菜单和检索目标的上下文菜单的例子 的视图3是示出了系统和用户之间的交互的概要的视图4是示出了排序过程的流程图5是示出了日志表的具体例子的视图6是示出了产生检索目标的N元的过程的流程图;以及
图7是示出了其中考虑到同现选择倾向的排序过程的流程图。
具体实施例方式
如图1所示,信息检索系统包括字典/规则库1、用于估计关键字 的含义的第一估计单元(含义估计单元)2、检索目标知识库3、用于搜 索检索目标的搜索单元4、用于存储检索目标选择日志的存储单元5、 用于估计检索目标的选择倾向的第二估计单元6、检索目标的排序单 元7、控制单元8、显示器9、指示设备10以及信息检索单元11。
当含义估计单元2估计关键字的含义时使用字典/规则库1 ,所述 字典/规则库1是彼此相关联地存储了多个关键字和多个关键字具有 的多个含义项(以下简称"含义")的数据库。
含义估计单元2通过利用关键字搜索字典/规则库1来估计用户 所指定或者选择的所述关键字的多个含义。通过含义估计单元2获取 的估计结果表示成菜单,并在控制单元8的控制下通过显示器9呈现给用户。参照图2,当用户利用指示设备10在显示器9上显示的文 档中选择关键字"川崎"时,含义估计单元2估计所述关键字"川崎" 的含义是"地点名","人名","站名",或者"公司名",并将估计结 果呈现给用户。
检索目标知识库3是存储有多个含义以及与各个含义相对应的 多个检索目标项(以下简称为"检索目标")的数据库。更具体地,所 述数据库是存储有关键字的含义、检索目标以及附加关键字的组合的 知识数据库。
检索目标搜索单元4从预先构建的检索目标知识库3中搜索与用 户从含义估计结果中选择出来的关键字的含义相关联的检索目标。检 索目标搜索结果被表示成菜单,并在控制单元8的控制下通过显示器 9呈现给用户。
图2示出了用户在认为"站名"适合当作关键字"川崎"的含义 的情况下选择"站名"的例子,艮卩,所述关键字的含义是"站名"时, 系统确定有下列检索目标,如"察看周边地图","察看时间表","搜 索餐饮场所","査看站场向导地图","搜索旅馆","查看天气预报", "搜索银行","搜索公交车站","搜索出租车停靠点","搜索电影院", 以及"搜索便利店",并将它们呈现给用户。
控制单元8是控制系统和用户之间的交互的主要部分,例如是 CPU。显示器9显示文档、用户通过使用指示设备10所选择的关键 字的含义的上下文菜单,以及与所述关键字相对应的检索目标的上下 文菜单。
指示设备IO相当于一种指点装置,例如用户手动操作以在所浏 览的文档中选择关键字、从系统所呈现的关键字的含义的上下文菜单 中选择适当的含义,或者从与系统呈现的关键字相对应的检索目标的 上下文菜单中选择适当的检索目标。
信息检索单元11基于用户从检索目标搜索结果中选择的检索目 标向现有的检索引擎或者检索服务发出信息检索请求,并获取检索结 果。在图2所示的情形中,当用户选择"搜索旅馆"作为检索目标 21 B寸,信息检索单元11将关键字"旅馆"添加到关键字"川崎"中,并向现有的检索引擎输出检索请求。信息检索单元11接收检索引擎
获取的检索结果。控制单元8通过显示器9将所述检索结果呈现给用 户。
检索目标选择日志存储单元5存储用户选择的检索目标的日志。 更具体的,存储单元5存储选择日志,所述选择日志包含在关键字的 含义的上下文菜单中所选择的含义以及在对应于所述关键字的检索 目标的上下文菜单中所选择的检索目标。
检索目标选择倾向估计单元6从检索目标的上下文菜单中为关 键字的每个含义计数用户选择的检索目标的频率,并为所述关键字的 每个含义估计用户的检索目标选择倾向。
检索目标排序单元7基于检索目标选择倾向估计单元6获取的结 果为关键字的各个含义对检索目标排序(排列顺序)。控制单元8将排 序结果表示成检索目标上下文菜单,并通过显示器9将其呈现给用 户。
将参照图3来描述系统和用户之间的交互概况。 [交互概况1]
歩骤1:用户在显示器9中浏览的文档中选择关键字(图3中的 )。
步骤2:控制单元8将用户选择的关键字发送至含义估计单元
2(图3中的"(2)")。然后控制单元8接收由含义估计单元2估计的 关键字的含义列表,将所述含义列表表示为菜单,并通过显示器9将 其呈现给用户(图3中的"(3)")。
步骤3:用户从显示器9中显示的关键字的含义的菜单中选择对 于信息检索来说适当的含义。
步骤4:控制单元8将由用户选择的关键字的含义发送到检索目 标搜索单元4。控制单元8随后接收由检索目标搜索单元4搜出的检 索目标的列表(图3中的"(4)")。控制单元8还将检索目标的列表表 示成菜单,并通过显示器9将其呈现给用户(图3中的"(5)")。
步骤5:用户在显示器9显示的检索目标菜单中选择适当的检索 目标。步骤6:控制单元8将用户所选择的检索目标发送给信息检索单
元11。控制单元8通过显示器9将信息检索单元11所获取的检索结 果呈现给用户(图3中的"(6)")。
将从用户操作的角度介绍图3中示出的交互的例子。假定用户正 在观看Web浏览器或者邮件发送者的委员会邀请(committee irwitation)。还假定用户想知道到委员会的位置的地图,并且已经在 正文中选择了公司T(上述步骤1)。这个实施例的信息检索系统确定 用户选择的关键字的含义为"公司",将"公司/组织"表示成菜单, 并将其呈现给用户(上述步骤2)。用户选择所呈现的含义(上述步骤3)。 系统随后基于由用户选择的关键字的含义"公司/组织"搜索检索目 标知识库3,列出检索目标,将检索目标的列表表示成菜单,并将其 呈现给用户(上述步骤4)。由于用户想知道到公司T的地图,所以他/ 她从以这种方式呈现的菜单中选择检索目标"搜索地图"(上述步骤 5)。系统在将附加的关键字"地图"添加到由用户选择的关键字"公 司T"后,基于与由用户选择的检索目标相对应的检索目标知识来向 信息检索引擎输出检索请求(上述步骤6)。
本实施例的信息检索系统除了具有通过多个链接的菜单执行信 息检索同时縮小检索目标的机制之外,还包括将检索目标排序的功 能。
下面是用户和系统之间的交互以及系统中的操作。 [交互概况2]
步骤l:用户在显示器9中浏览的文档中选择关键字。
步骤2:控制单元8将由用户选择的关键字发送至含义估计单元 2,接收由含义估计单元2估计的关键字的含义的列表,将所述含义 的列表表示成菜单,并通过显示器9将其呈现给用户。
步骤3:用户从显示器9上显示的关键字的含义中选择对于检索 来说适当的含义。
步骤4,控制单元8首先将用户选择的关键字的含义发送至检索 目标搜索单元4。控制单元S随后将由检索目标搜索单元4搜索出的 检索目标发送至排序单元7,并从检索目标排序单元7中接收检索目标排序结果。控制单元8将检索目标排序结果表示成菜单,并通过显 示器9将其呈现给用户。
步骤5':用户从显示器9中显示的检索目标中选择对用户适当的 检索目标。这时,系统将由用户选择的"关键字的含义"和"与关键 字的含义相对应的检索目标"作为日志信息存储在检索目标选择日志 存储单元5中。
步骤6:控制单元8将由用户选择的检索目标发送至信息检索单 元ll,并将信息检索单元ll输出的检索结果呈现给用户。
显然,从上述描述可知,在概况2中的交互中对应于步骤4的步 骤4'和对应于步骤5的步骤5'和在概要1中的交互中的步骤4和步 骤5不同。
系统被配置为使得在由系统自身确定的预定时间、由用户设置的 预定时间,或者用户希望的时间,检索目标选择倾向估计单元6基于 存储在检索目标选择日志存储单元5中的信息来计算用户的含义选 择和检索目标选择的统计倾向。
下面将介绍检索目标选择日志存储单元5 、检索目标选择倾向估 计单元6以及检索目标排序单元7的操作。
(检索目标选择日志存储单元5的操作)
检索目标选择日志存储单元5从用户首次使用所述信息检索系 统的时间点开始,连续存储用户的检索目标选择日志。假定每个日志 数据被表示成(m,s,t)的组合,并基于选择的时间按时间顺序存储。假 定当选择事件发生时,存储单元5将(m,s,t)存储到日志表H中。在这 种情况下,m表示关键字的含义类型,s表示检索目标类型,t表示 时间,H[k](k^l,2,…)表示日志表。图5示出了日志表的具体例子。
(检索目标选择倾向估计单元6的操作)
假定检索目标选择倾向估计单元6已经估计到用户的下面三类 检索目标选择倾向。
单个检索目标的短期选择倾向
单元6获取从用户选择关键字的时刻开始的24小时内每个含义 的检索目标选择频率mi-Cl-sj,并为每个含义将检索目标按照频率的降序排列。设11^=1,2,...,画)是第1个含义类型,^(]=1,2,...,^)是第 j个检索目标类型,mi-Cl-sj是对应于含义mi的检索目标sj的短期频 率,NM是含义的总数,NS是检索目标的总数。下面是获取单个检 索目标的短期选择倾向的过程。 获取单个检索目标的短期选择倾向的过程
步骤(a-l):准备短期检索目标频率表C1[NM][NS]和短期含义频 率表CM1[NM]。
步骤(a-2):系统对所述短期检索目标频率表C1[NM][NS]和所述 短期含义频率表CM1[NM]进行初始化。
步骤(a-3):系统向各个关键字的含义分配编号来准备表示所述含 义和所述编号之间的对应关系的含义表M[NM]。在这种情况下,含 义m被输入到M[i]。
步骤(a-4):系统向各个检索目标分配编号来准备表示所述检索目 标和所述编号之间的对应关系的检索目标表S[NS]。在这种情况下, 检索目标s被输入到S[j]。
步骤(a-5):从检索目标选择日志中选择一个日志数据。
步骤(a-6):系统确定所述日志数据的时间t是否在从用户选择关 键字的时刻开始的时间T内。时间T可以是由系统设计者预先确定 的时间(例如,24小时)或者由用户设置的时间。
步骤(a-7):如果时间t在时间T之前,过程返回至步骤(a-5)。
步骤(a-8):系统通过使用日志的含义m搜索含义表M来获取含 义编号L在这种情况下,如果M[ihm,贝i」i可以被当作对应的编号。
步骤(a-9):系统通过使用日志的检索目标s搜索检索表S来获取 检索目标编号j。在这种情况下,如果S[j]-s,贝Uj可以被当作对应的 编号。
步骤(a-10):系统将Cl[i]冚的频率值加一,并将CMl[i]的频率值加一。
步骤(a-ll):过程返回至步骤(a-5)。
单个检索目标的长期选择倾向
系统获取从用户第一次使用信息检索系统的时间点开始的每个含义的检索目标选择频率mi-C2-sj,并为每个含义将检索目标按照频 率的降序排列。设mi(i-l,2,…,NM)是含义类型,sj(^l,2,.。.,NS)是检 索目标类型,mi-C2-sj是对应于含义mi的检索目标sj的长期频率, NM是含义的总数,NS是检索目标的总数。
下面是获取单个检索目标的长期选择倾向的过程。 获取单个检索目标的长期选择倾向的过程
步骤(b-l):准备长期检索目标频率表C2[NM][NS]和CM2[NM]。
步骤(b-2):系统对长期检索目标频率表C2[NM][NS]和CM2[NM] 进行初始化。
步骤(b-3):此步骤与上面介绍的步骤(a-3)相同。
步骤(b-4):此步骤与上面介绍的步骤(a-3)相同。
步骤(b-5):从日志表中选择一个日志数据。
步骤(b-6):系统通过利用日志数据的含义m搜索含义表M来获 取含义编号i。在这种情况下,如果M[i;hm,贝i」i可以被当作对应的 编号。
步骤(b-7):系统通过利用日志数据的检索目标s搜索检索目标表 S来获取检索目标编号j。在这种情况下,如果S[Jhs,贝ijj可以被当 作对应的编号。
步骤(b-8):系统将C2[i][j]的频率值加一。系统将CM2[i]的频率 值加一。
步骤(b-9):过程返回至步骤(b-5)。
检索目标的同现选择倾向
信息检索系统从用户第一次使用所述系统的时间点开始即保存 了与按吋间顺序的同现检索目标的组合相关联的用户选择频率,比如 "检索目标B在检索目标A被选择后立刻被选择"和"检索目标B 在检索目标A被选择后立刻被选择,而检索目标C在检索目标B被 选择后立刻被选择"。该操作相当于从用户第一次使用所述信息检索 系统的吋间点开始,即产生与按时间顺序的同现检索目标的组合相关 联的N元。
下面将参照图6的流程图描述产生由用户选择的检索目标的N元的过程。产生检索目标的N-元的过程步骤(C-1):系统向关键字的含义和检索目标的组合分配标签编 号。在这种情况下,系统将不同的标签编号分配给包括不同含义的组 合,即使所述组合包括相同的检索目标。因此,准备标签编号表L[NM][NS],并将标签编号设置成L。按照升序分配自然数来作为标 签编号。假定自然数被分配给含义和检索目标的组合,如L[站名][査 看周边地图]=1。步骤(c-2):系统利用日志表H的每个日志数据(m,s,t)的含义m和 检索目标s的组合来搜索标签编号表L,并将对应的标签编号分配给 日志数据。这时,首先系统利用日志数据的含义m搜索曰志表M来 获取含义编号i,通过利用所述日志数据的检索目标s搜索表S来获 取目标编号j,以及从L[i][j]获取日志数据的标签编号。步骤(c-3):系统将步骤(c-2)应用到日志表H的所有日志数据中, 从H
到最近的日志数据中检测标签编号,以及通过依次排列所述标 签编号来产生标签编号串a。这时,所述标签编号串a的长度由la 表不。步骤(c-4):系统将具有长度kx的标签编号串a当作一个编号串, 并通过将编号从所述编号串的头部一个接一个地移除来一次产生编 号串,从而产生la个编号串(标签编号子串)。步骤(c-5):由于在步骤(c-4)中产生的la个编号串包括标签编号 (也就是自然数),所以所述编号串按照编号的升序重新排列。步骤(c-6):系统从每个编号串的头部开始计数,以检査在步骤(c-5) 中重新排列的编号串中,有多少个邻近的编号串的编号相互一致,并 将 一 致的编号的数量保存作为每个编号串的附加信息 P[q](q-l,2,…,la)。步骤(c-7):在步骤(c-5)中重新排列的所述编号串中,各个编号串 中从头部开始的N个编号彼此相同,系统一次从每个编号串的头部 开始计数,直至存储在P中的数值达到N个或更少。由于这个计数 值可以被当作N个编号的N元频率,所以每一次检测到新的N个编号时,将(编号和N元频率)作为N元数据GN[p](p4,2,….)保存。当用户基于含义估计单元2估计的关键字的含义确定所述关键 字的含义时,控制单元8将所述关键字的含义发送至检索目标搜索单 元4。检索目标搜索单元4通过使用所述关键字的含义在检索目标知 识库3中搜索与所述含义相对应的检索目标。如图2所示,如果有多个按此方式搜索出的检索目标,则检索目 标排序单元7基于检索目标选择倾向估计单元6获取的结果来对所述 检索目标进行排序。下面三种情况是在对检索目标排序时可能的情 况 一种情况中要考虑到单个检索目标的短期选择倾向; 一种情况中 要考虑到单个检索目标的长期选择倾向;以及一种情况中要考虑到单 个目标的同现选择倾向。考虑到单个检索目标的短期选择倾向的情况下的排序过程-步骤(d-l):检索目标排序单元7基于关键字的含义m从上面介绍的含义表M中检查所述关键字的编号i。步骤(d-2):检索目标排序单元7基于由检索目标搜索单元4搜索出的检索目标类型s,从上面介绍的检索目标表S中检査所述检索目标的编号j。步骤(d-3):检索目标排序单元7通过从短期检索目标频率表Cl 中检测值Cl[i][j]来获取检索目标的频率值。步骤(d-4):检索目标排序单元7通过将步骤(d-2)和(d-3)应用到由 检索目标搜索单元4搜索出的所有检索目标来获取每个检索目标的 频率值。步骤(d-5):检索目标排序单元7基于在步骤(d-4)中获取的检索目 标的频率值,按照频率值的降序将检索目标搜索单元4搜索出的所述 检索目标重新排列。 '考虑到单个检索目标的长期选择倾向的情况下的排序过程步骤(e-l):检索目标排序单元7基于关键字的含义m从上面介绍的含义表M中检查所述关键字的编号i。步骤(e-2):检索目标排序单元7基于由检索目标搜索单元4搜索出的检索目标类型s,从上面介绍的检索目标表S中检查所述检索目标的编号j。步骤(e-3):检索目标排序单元7通过从长期检索目标频率表C2 中检测值C2[i][j]来获取检索目标的频率值。步骤(e-4):检索目标排序单元7通过将步骤(e-2)和(e-3)应用到由 检索目标搜索单元4搜索出的所有检索目标来获取每个检索目标的 频率值。步骤(e-5):检索目标排序单元7基于在步骤(e-4)中获取的检索目 标的频率值,通过将检索目标搜索单元4搜索出的检索目标按照频率 值的降序重新排列来对所述检索目标进行排序。将根据图7的流程图来介绍考虑到检索目标的同现选择倾向的 情况下的排序过程。考虑到检索目标的同现选择倾向的情况下的排序过程步骤(f-l):当用户从系统呈现的关键字含义菜单中选择并确认关键字的适当含义时,检索目标排序单元7通过从日志表H中的N-l 个在前的检索来获取关键字的含义和检索目标的组合。步骤(f-2):如果前一个检索日志数据被存储在H[k-l]中,则由于 可以从H[k-l]中获取关键字的含义mk-l和检索目标sk-l,所以检索 目标排序单元7从含义表M和检索目标表S中分别获取含义编号和 检索目标编号,并从标签编号表L中获取所述检索的标签编号。步骤(f-3):检索目标排序单元7通过将步骤(e-2)分别应用到在步 骤(f-l)中获取的N-l个在前的检索中来获取各个检索的标签编号。步骤(f-4):检索目标排序单元7通过排列与第N-l个检索至前一 个检索相对应的标签编号来产生N-1个标签编号串。步骤(f-5):检索目标排序单元7检测N元数据GN中的所有N 元数据,其中第一至第N-1个编号串彼此一致。步骤(f-6):检索目标排序单元7从步骤(f-5)中获取的每个N元数 据中提取标签编号串的最后一个标签编号。然后单元7通过基于所述 标签编号搜索标签编号表来指定构成所述最后一个标签编号的关键 字的含义和检索目标。步骤(f-7):检索目标排序单元7从在步骤(f-6)中提取的标签编号中提取用户选择的含义与构成所述标签编号的含义相一致处的标签编号,并获取检索目标和N元频率值。步骤(f-8):检索目标排序单元7通过按照N元频率值的降序重新 排列在步骤(f-7)中获取的检索目标来将其排序。这种方式的排序检索目标能够像例如图3所示的情况执行下面 的信息检索。假定系统正在通过使用检索目标选择倾向估计单元6来 i十算三元(tri-gram)。(1) 用户使用指示设备10在委员会邀请通知中选择"公司T",并 从系统呈现的菜单中选择检索目标"搜索地图"来搜索公司T的地图 页面。(2) 用户察看公司T的地图页面,发现离公司T最近的车站是浜 松町车站。用户随后使用指示设备在所述页面中选择"浜松町",并 从系统呈现的菜单中选择"访问向导"来搜索向导页面。(3) 假定用户在向导页面中选择了 "浜松町"。在这种情况下,当 依次选择检索目标"搜索地图"和"访问向导"时,系统从含义和检 索目标以及检索倾向的选择日志数据中知道,检索目标"搜索车站周 围地图"最常被选择。系统因而在检索目标菜单中将"搜索车站周围 地图"排序最高,并将所述菜单呈现给用户。用户因而能够通过选择在所呈现的检索目标菜单中排序最高的 "搜索车站周围地图"来容易地访问目标信息。还假定用户己经知道在WWW新闻站点上介绍了公司T的新产 品。这时,用户能够执行下面的信息检索。(1) 用户使用指示设备10来在站点的网页上选择新产品的名称, 并从系统呈现的菜单中选择"搜索制造者的目录页"来搜索公司T 的所述站点的目录页。(2) 用户读取所述目录页,并对产品产生兴趣。用户从而希望了 解所述产品的更详细的信息,并因而利用指示设备10再次在所述页 面中选择所述产品的名称。同时,用户从系统呈现的检索目标菜单中 选择"检查评价信息"来搜索口碑站点。(3) 假定用户在检查完所述产品的评价之后希望购买所述产品,并已经利用指示设备IO在口碑站点选择了所述产品的名称。在这种 情况下,当依次选择检索目标"搜索制造者的目录页"以及"检査评 价信息"时,系统从含义、检索目标和检索倾向的选择日志数据中知 道,检索目标"访问购买站点"最常被选择。系统从而在所述检索目 标菜单中将"访问购买站点"排序最高,并将所述菜单呈现给用户。(4)用户能够通过在所呈现的检索目标菜单中选择排序最高的"访问购买站点"来容易地访问目标信息。在本实施例中,基于下列过程考虑到单个检索目标的短期选择倾 向来执行排序就足够了。考虑到单个检索目标的短期选择倾向来执行排序的过程2:[步骤(g-l)]:当用户激活执行信息检索的终端时,检索目标排序单元7读取所述长期检索目标频率表C2。[步骤(g-2)]:检索目标排序单元7通过使用长期检索目标频率表C2来对关键字的每个含义的检索目标进行排序,并保持排序结果直至终端关闭。假定要为关键字的每个含义产生检索目标排序表RS一mi。[步骤(g-3)]:当用户选择关键字和所述关键字的含义mi时,检 索目标排序单元7基于所述含义mi的检索目标排序表RS_mi对检索 目标进行排序。[步骤(g-4)]:当用户新执行信息检索时,检索目标排序单元7对 用户所选择的、在含义的检索目标排序表RS—mi中排序最高的检索 目标进行排序。[步骤(g-5)]:每次执行检索时,检索目标排序单元7执行步骤 (g-4),并不断更新所述检索目标排序表。在本实施例中,检索目标排序单元7可以基于图4中示出的算法 来对检索目标进行排序。也就是说,在用户激活终端时执行的第一个检索操作中,检索目 标排序单元7考虑到长期选择倾向对检索目标进行排序。在激活终端之后的第二至第N个检索操作中,检索目标排序单 元7考虑到短期选择倾向对检索目标进行排序。假定在所述终端激活之后的第N个和后续的捡索操作中,包含 了所述检索的N元不存在于所述N元数据GN中,或者即使这样的 N元存在于所述N元数据GN中,N元的最后一个标签编号处的含义 也和用户选择的含义不同。或者,假定包含所述检索的N元存在于 所述N元数据GN中,并且N元的最后一个标签编号处的含义和用 户选择的含义一致。即使在这种情况下,如果N元频率值小于预定 阈值Thc,检索目标排序单元7也将考虑到短期选择倾向来对检索目 标进行排序。假定在上述情况之外的其它情况下,检索目标排序单元7考虑到 N元频率来对检索目标进行排序。在上述情况下,为了搜索和用户使用指示设备IO选择的关键字 相关联的信息,需要从系统呈现的关键字的含义的菜单中选择适当的 含义,并且从和所述关键字相关联的检索目标菜单中选择适当的检索 目标。在这种情况下,由于用户必须从两个菜单中选择适当的信息, 所以很难说检索时的操作复杂度被大大减少。下面是通过只向用户呈 现检索目标菜单而不呈现含义菜单,来降低用户操作次数的例子。假定在这种情况下,在用户开始使用信息检索系统之后,用户已 经以上述方式将信息检索执行到某种程度,并且系统已经存储了足够 数量的用户操作日志数据。还假定系统已经获取了短期含义频率值 CM1[NM]和长期含义频率值CM2[NM]。假定用户不希望选择含义菜单。在这样的系统中,能够通过使用 户选择"不显示含义菜单"来执行这样的操作。假定其后,当估计用 户选择的含义时,含义估计单元2根据频率值来对估计结果进行加 权。即,含义估计单元2将通过将每个含义的频率值除以频率值的总 和所获取的值作为置信因子纳入考虑当中。考虑到对检索目标进行排 序的下面三种情况 一种情况中考虑到单个检索目标的短期选择倾 向; 一种情况中考虑到单个检索目标的长期选择倾向;以及一种情况 中考虑到检索目标的同现选择倾向。 考虑到单个检索目标的短期选择倾向的情况下的排序系统通过使用含义估计单元2输出的置信因子将步骤(d-l)至步骤(d-5)应用到各个含义来对每个含义的检索目标进行排序。这时,在 步骤(d-4)中,系统通过用含义的置信因子乘以各个检索目标的频率值 来对所述频率值进行更新。假定系统为从含义估计单元2输出的所有 含义执行所述操作,基于使用置信因子归一化的频率值来对所有获取 的检索目标进行排序,并将产生的菜单呈现给用户。假定当用户从按 此方式排序的检索目标中选择适当的检索目标时,系统将包括具有最 高短期含义频率值CM1[NM]的检索目标的关键字的含义之一当作所 述检索中关键字的含义。使系统按此方式确认关键字的含义使得有可 能通过从步骤(a-l)到步骤(a-l l)的过程来获取单个检索目标的短期选 择倾向。考虑到单个检索目标的长期选择倾向的情况下的排序系统通过使用含义估计单元2输出的置信因子将步骤(e-l)至步 骤(e-5)应用到各个含义来对检索目标进行排序。这时,在步骤(e-4) 中,系统通过用含义的置信因子乘以各个检索目标的频率值来更新所 述频率值。假定系统为从含义估计单元2输出的所有含义执行所述操 作,基于使用置信因子归一化的频率值来对所有获取的检索目标进行 排序,并将产生的菜单呈现给用户。假定当用户从按此方式排序的检 索目标中选择适当的检索目标时,系统将包括具有最高长期含义频率 值CM2[NM]的检索目标的关键字的含义之一当作所述检索中关键字 的含义。使系统按此方式确认关键字的含义使得有可能通过从步骤 (c-l)到步骤(c-7)的过程来获取单个检索目标的长期选择倾向。 考虑到检索目标的同现选择倾向的情况下的排序 当用户执行信息检索时,系统执行上述步骤(f-l)至步骤(f-8)来对 检索目标进行排序,并将结果表示成菜单。假定在这时,在步骤(f-7) 中,系统针对在步骤(f-6)中提取的所有标签编号获取检索目标和N元 的频率值。当用户从按此方式排序的检索目标中选择适当的检索目标 时,系统将包括具有最高长期含义频率值CM2[NM]的检索目标的关 键字的含义之一 当作在所述检索中关键字的含义。使系统按此方式确 认关键字的含义使得有可能通过从步骤(b-l)到步骤(b-9)的过程来获 取检索目标的同现选择倾向。当多个用户终端整合有根据本实施例的信息检索装置时,各个用 户终端能够获取检索目标选,日志和选择倾向。在这种情况下,优选 地各个用户终端通过网络连接到服务器,同一台服务器执行对各个用 户的检索目标选择日志和选择倾向的数据的中央控制,以使各个用户 共享所述数据。这样使得给定的用户能够使用从任意的另一个用户的 检索目标选择日志计算出的单个检索目标的短期选择倾向、单个检索 目标的长期选择倾向以及检索目标的同现选择倾向。而且,系统能够 从通过组合所有用户的检索目标选择日志所获取的数据中推出单个 检索目标的短期选择倾向、单个检索目标的长期选择倾向以及检索目 标的同现选择倾向,并且使得每个用户能够在信息检索时使用它们。 这样还可以进一步提高信息检索时的可操作性和便利性。如上所述,根据本实施例,当用户通过指示设备10在显示的文 档中指定关键字时,系统估计该关键字的含义,并将含义候选表示成 菜单。系统随后通过显示器9将所述菜单呈现给用户。当用户在菜单 中为信息检索选择适当的关键字时,系统在预先构建的知识库3中搜 索与所述关键字的含义相对应的检索目标,并将结果以菜单的形式呈 现给用户。在这种情况下,基于系统的用户访问日志,根据检索目标 的选择频率来对检索目标进行排序,并将其表示为菜单。用户可以在 检索目标被排序的菜单中选择排序高的检索目标,并执行和所述关键 字相关联的希望的信息检索。这样能够防止在用户频繁选择的检索目 标显示在菜单中未指定的低顺序位置的情况下,搜索希望的项的操作 花费太长时间,或者搜索希望的项的操作变得复杂,从而提高了可操 作性。注意,本发明并不局限于上述实施例,在本发明的精神和范围内, 组成要素可以有各种各样的变化,并可以实现到各种执行阶段中。将 上述实施例中揭示的多种组成要素适当的组合能够形成各种各样的 发明。例如,可以省略每个实施例中的所有的组成要素中的几个组成 要素。而且,根据需要还可以组合不同实施例的组成要素。
权利要求
1、一种信息检索装置,包括第一数据库,其彼此相关联地存储多个关键字以及所述多个关键字所具有的多个含义项;第二数据库,其存储所述多个含义项以及分别与所述多个含义项相对应的多个检索目标项;控制单元,其接受用户指定的关键字;第一估计单元,其通过使用所述指定的关键字搜索所述第一数据库来估计所述指定的关键字的多个含义项;搜索单元,其在所述第二数据库中搜索分别与所述多个所估计的含义项相对应的多个检索目标项;显示单元,其显示示出了所述多个估计的含义项的第一显示菜单以及示出了所搜索到的检索目标项中的至少一个的第二显示菜单,所搜索到的检索目标项中的所述至少一个对应于在所述第一显示菜单上选择的含义项;日志存储单元,其存储包括在所述第一显示菜单上选择的含义项以及在所述第二显示菜单上选择的检索目标项的选择日志;第二估计单元,其根据所述选择日志,估计对于与在所述第一显示菜单上选择的所述含义项相对应的所述第二显示菜单上的检索目标项的选择倾向;以及排序单元,其基于所述选择倾向对所述多个检索目标项执行排序,其中所述显示单元根据所述排序在所述第二显示菜单上显示所述检索目标项中的所述至少一个。
2、 根据权利要求1所述的装置,其中所述第二数据库还存储多 个附加关键字,并且所述装置还包括信息检索单元,其在将所述多个 附加关键字中的一个添加到所述指定的关键字上之后执行信息检索, 所述多个附加关键字中的所述一个对应于在所述第二显示菜单上选择的检索目标项。
3、 根据权利要求1所述的装置,其中所述排序单元执行排序, 使得被更频繁地选择的检索目标项排序更高。
4、 根据权利要求1所述的装置,其中所述第二估计单元通过根 据所述选择日志计算在所述第一显示菜单上选择的含义项和在所述 第二显示菜单上选择的检索目标项的组合的频率来估计所述选择倾 向。
5、 根据权利要求1所述的装置,其中所述第二估计单元通过根 据所述选择日志计算在所述第一显示菜单上选择的含义项和在所述 第二显示菜单上选择的检索目标项的组合的N元统计值来估计所述 选择倾向。
6、 一种信息检索方法,包括在第一数据库中彼此相关联地存储多个关键字以及所述多个关 键字所具有的多个含义项;在第二数据库中存储所述多个含义项以及分别与所述多个含义 项相对应的多个检索目标项;接受用户指定的关键字;通过使用所述指定的关键字搜索所述第一数据库来估计所述指 定的关键字的多个含义项;在所述第二数据库中搜索分别与所述多个所估计的含义项相对 应的多个检索目标项;显示示出了所述多个估计的含义项的第一显示菜单以及示出了 所搜索到的检索目标项中的至少一个的第二显示菜单,所搜索到的检 索目标项中的所述至少一个对应于在所述第一显示菜单上选择的含 义项;存储包括在所述第一显示菜单上选择的含义项以及在所述第二显示菜单上选择的检索目标项的选择日志;根据所述选择日志,估计对于与在所述第一显示菜单上选择的所述含义项相对应的所述第二显示菜单上的检索目标项的选择倾向;以 及基于所述选择倾向对所述多个检索目标项执行排序, 其中根据所述排序在所述第二显示菜单上显示所述检索目标项 中的所述至少一个。
7、 根据权利要求6所述的方法,其中所述第二数据库还存储多 个附加关键字,并且所述方法还包括在将所述多个附加关键字中的一 个添加到所述指定的关键字上之后执行信息检索,所述多个附加关键 字中的所述一个对应于在所述第二显示菜单上选择的检索目标项。
8、 根据权利要求6所述的方法,还包括执行排序,使得被更频 繁地选择的检索目标项排序更高。
9、 根据权利要求6所述的方法,还包括通过根据所述选择日志 计算在所述第一显示菜单上选择的含义项和在所述第二显示菜单上 选择的检索目标项的组合的频率来估计所述选择倾向。
10、 根据权利要求6所述的方法,还包括通过根据所述选择日志 计算在所述第一显示菜单上选择的含义项和在所述第二显示菜单上 选择的检索目标项的组合的N元统计值来估计所述选择倾向。
全文摘要
一种信息检索装置包括显示单元,其显示出了多个估计的含义项的第一显示菜单以及示出了与在所述第一显示菜单上选择的所述含义项相对应的多个检索目标项的第二显示菜单。日志存储单元存储对所述第一和第二显示菜单的选择日志。估计单元从所述选择日志中估计检索目标项选择倾向。排序单元基于所述选择倾向对所述多个检索目标项进行排序。显示单元在根据排序排列了多个检索目标项之后,在所述第二显示菜单中显示所述多个检索目标项。
文档编号G06F17/30GK101276368SQ20081000312
公开日2008年10月1日 申请日期2008年1月10日 优先权日2007年3月28日
发明者石谷康人, 铃木优 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1