检索关键词改进装置、服务器及方法

文档序号:6480863阅读:260来源:国知局
专利名称:检索关键词改进装置、服务器及方法
技术领域
本发明涉及信息检索领域,更具体地讲,涉及一种检索关键词改 进装置、服务器和方法,其中,该检索关键词改进装置、服务器和方 法能够通过扩展用户为信息检索而输入的关键词来检索适当缩减的 信息。
背景技术
作为通过筒单操作来执行信息检索的技术,已公知一种根据用户
指定的关键词从共现率(co-occurrence ratio )关键词数据库中获取辅 助关键词,并利用指定的关键词和辅助关键词进行检索的技术(例如, 参见日本特开2006-79366 )。
由于在传统的技术中并不更新定义的关键词,所以例如当作为检 索目标的文档的属性改变或者出现新文档时,无法获得准确的检索结 果。

发明内容
根据本发明的一方面,提供了一种检索关键词改进装置,该装置 包括历史累积单元,被配置为以彼此关联的关系累积多个第一文档 或与所述第一文档对应的索引和多个第一检索目标识别信息项目,所 述多个第一检索目标识别信息项目对应于与用于检索的关键词相关 联的第一检索目标,所述第一检索目标识别信息项目被用于检索第一 文档;提取单元,被配置为在包括在笫一文档中的新文档和用于检索 所述新文档的新的检索目标识别信息项目被累积在历史累积单元中 的情况下,从所述新文档中提取作为附加关键词候选项的词,所述词 在所述新文档中的出现次数大于所述词在第 一文档中的除了所述新文档之外的每个文档中的出现次数;附加关键词累积单元,被配置为 累积与所述附加关键词候选项不同的多个附加关键词和与这些附加 关键词对应的多个第二检索目标识别信息项目;存储单元,被配置为 存储所述附加关键词候选项和与所述附加关键词候选项对应的第三 检索目标识別信息项目;查询产生单元,被配置为基于输入关键词、 与所述输入关键词相关联的第二检索目标、以及与对应于第二检索目 标的第四检索目标识别信息项目对应的附加关键词中的一个附加关 键词来产生第一检索查询,并且被配置为基于所述输入关键词、第二 检索目标和与笫四检索目标识别信息项目对应的附加关键词候选项
来产生第二检索查询;列表产生单元,被配置为产生包括与第一检索 查询和第二检索查询对应的检索结果的第一检索结果列表;笫一选择
单元,被配置为从第一检索结果列表中选择作为期望的检索结果的第 二文档;和移动单元,被配置为在第一选择单元从与第二检索查询对 应的第二检索结果列表中选择期望的检索结果的情况下,将所述附加 关键词候选项和第三检索目标识别信息项目移动到附加关键词累积 单元,其中第二检索结果列表包括在第一检索结果列表中。
根据本发明的另一方面,提供了一种服务器装置,该服务器装置 包括历史累积单元,被配置为以彼此关联的关系累积从由多个检索 结果形成的检索结果列表中选择为期望的检索结果的多个第一文档 和对应于与用于检索的关键词相关联的检索目标的多个检索目标识 别信息项目,检索目标识别信息项目被用于检索第一文档;提取单元, 被配置为在包括在第一文档中的新文档和用于检索所述新文档的新 的检索目标识别信息项目被累积在历史累积单元中的情况下,从所述 新文档中提取作为附加关键词候选项的词,所述词在所述新文档中的 出现次数大于所述词在第一文档中的除了所述新文档之外的每个文 档中的出现次数;和存储单元,被配置为存储所述附加关键词候选项 和与所述附加关键词候选项对应的另一检索目标识别信息项目。


图l是示出了根据实施例的检索关键词改进装置的框图2是示出了图1中示出的关键词输入单元的输入屏幕的示例的
图3是示出了图1中示出的检索目标累积单元的内容示例的表; 图4示出了由图1中示出的检索目标呈现/指定单元呈现的显示 屏幕示例的图5是示出了图1中示出的附加关键词累积单元的内容示例的
表;
图6是示出了图1中示出的附加关键词候选项保持单元的内容示 例的表;
图7A是示出了包括在由图1中示出的检索结果接收单元接收的 检索结果中的第一检索结果的表;
图7B是示出了包括在检索结果中的第二检索结果的表;
图8示出了图1中示出的检索结果列表产生单元的操作示例的流
程图9是示出了由图1中示出的检索结果列表产生单元产生的检索 结果列表的示例的图IO是示出了由图1中示出的检索结果呈现单元呈现的检索结 果列表的示例的图ll是示出了当在图10中选择了标号1001表示的项目时的作 为图1中示出的检索结果呈现单元呈现的检索结果的正文的示例的 图12是示出了图1中示出的正确答案确定/选择单元的操作示例 的流程图13是示出了累积在图1中示出的历史累积单元110中的历史 的示例的表;
图14是示出了累积在附加关键词累积单元中并由图1中示出的 附加关键词更新单元更新的内容示例的表;
图15是示出了图1中示出的附加关键词候选项提取单元的操作示例的流程图;以及
图16是示出了根据实施例的变型例的检索关键词改进装置和服 务器的框图。
具体实施例方式
将参照附图详细描述根据实施例的检索关键词改进装置和服务 器。在下面的描述中,相同的标号表示相同的元件,并将避免重复的 描述。
本实施例是一种向用户提供用户接口的互联网检索辅助装置,该 用户接口是在用户的PC上可操作用于互联网检索的软件,并且用于 访问互联网上的称作搜索引擎的服务。
本实施例的检索关键词改进装置、服务器和方法可以获取准确的 检索结果。
参照图l,将描述本实施例的检索关键词改进装置。
本实施例的检索关键词改进装置包括关键词输入单元101、检索 目标呈现/指定单元102、附加关键词累积单元103、检索查询产生单 元104、检索查询发送单元105、检索结果接收单元106、检索结果列 表产生单元107、呈现单元108、正确答案确定/选择单元109、历史 累积单元110、附加关键词候选项提取单元111、附加关键词候选项 保持单元112、附加关键词更新单元113、检索目标累积单元114和 关键词分析单元115。呈现单元108包括检索结果呈现单元116和菜 单呈现单元117。
关键词输入单元101接受用作检索线索的用户的关键词输入。可 利用作为用于接受使用键盘进行的字符输入的现有软件组件的文本 框形式来输入关键词。另选地,可以使用利用诸如鼠标的定点装置从 显示在屏幕上的文档中选择的字符串作为关键词。后面将参照图2来 描述关键词输入单元101的屏幕示例。
检索目标累积单元114累积与关键词有关的检索目标的候选项。 每个检索目标被用于检索文档。后面将参照图3描述检索目标累积单元114的内容示例。
关键词分析单元115对通过关键词输入单元101输入的每个关键 词的语义类別进行分析,并将分析结果传送到检索目标呈现/指定单元 102。预先设定关键词分析单元115分析的语义类别的类型。在本实 施例中,例如,将"人名"、"公司名"、"车站名"、"设施名,,和"地名" 设定为预先设定的语义类别。关键词分析单元115是通过已知的固有 表示提取方法(例如,记载在Yumi Ichimura等人所写的"A Study of the Relations among Question Answering, Japanese Named Entity Extraction, and Named Entity Taxonomy", IPSJ SIG Technical Report, NL-161-3, 2004中)实现的。因此,这里将不进行详细的描述。
检索目标呈现/指定单元102从检索目标累积单元114读取与关 键词分析单元115的分析结果有关的检索目标的多个候选项,并利用 包含在呈现单元108中的菜单呈现单元117来呈现读取的候选项。检 索目标呈现/指定单元102还接收用户对期望检索目标的指定。针对每 个呈现的检索目标,呈现预先设定的候选项。另选地,可呈现基于输 入关键词的意思而缩减的候选项。后面将参照图4来描述菜单呈现单 元117所呈现的屏幕示例。
附加关键词累积单元103针对每个检索目标累积将被添加到用 户输入的关键词的附加关键词,从而能够适当地检索每个检索目标。 图5示出了附加关键词累积单元103的内容示例。
检索查询产生单元104从附加关键词累积单元103读取与检索目 标呈现/指定单元102指定的检索目标对应的附加关键词,并将它们与 输入到关键词输入单元101的关键词合并,以根据预先设定的格式产 生检索查询。检索查询产生单元104可从后面描述的附加关键词候选 项保持单元112读取与在附加关键词累积单元103中累积的附加关键 词不同的附加关键词,以产生多个检索查询。后面将参照图5和图6 来描述与检索查询产生单元104相关的更多细节。
当检索查询产生单元104已产生多个检索查询时,检索查询发送 单元105将这些查询顺序地发送到检索服务。例如,检索查询发送单
ii元105经由互联网将这些查询发送到称作搜索引擎的现有检索服务。 检索查询发送单元105可以以用户指定的检索目标为单位访问不同的 搜索引擎。另外,并不总是需要将检索查询发送单元105连接到互联 网上的检索服务。检索查询发送单元105可连接到用于对存储在本地 PC硬盘中的文件进行检索的称作桌面搜索引擎的搜索引擎,或者可 连接到内联网上的数据库管理系统。后面将参照图6详细描述检索查 询发送单元105。
检索结果接收单元106读取由外部搜索引擎执行的检索的结果。 如果检索查询发送单元105已经将多个检索查询发送到搜索引擎,则 检索结果接收单元106从搜索引擎顺序地读取与所述查询对应的检索 结果。后面将参照图6、 7A和7B详细描述检索结果接收单元106。
检索结果列表产生单元107根据由检索结果接收单元106读取的 检索结果产生检索结果列表。当检索结果接收单元106已读取了多个 检索结果时,这些检索结果被合并到单个检索结果列表中。后面将参 照图8和图9来详细描述合并多个检索结果的方法。
基于检索结果列表产生单元107产生的检索结果列表,包含在呈 现单元108中的检索结果呈现单元116向用户呈现每个检索结果的标 题、URL或摘要,并且呈现与用户指定的文档对应的检索结果的正文。 可经由互联网通过检索结果接收单元106来获取每个检索结果的正 文。另选地,当用户已选择了检索结果中的任何一个时,检索结果呈 现单元116可直接访问互联网以获取正文。后面将参照图10和图11 来描述检索结果呈现单元116呈现的检索结果列表示例。
正确答案确定/选择单元109监视用户对检索结果呈现单元116 的操作,根据通过监视而获取的信息来确定检索结果列表中的哪个文 档是用户期望的文档,并选择该期望的检索结果。因此,正确答案确 定/选择单元109从通过合并多个检索结果而获得的检索结果列表中 选择作为期望的检索结果的文档。另外,正确答案确定/选择单元109 从检索结果列表产生单元107获取检索列表。
后面将参照图12来详细描述正确答案确定/选择单元109的确定处理。正确答案确定/选择单元109可仅选择一个文档作为用户期望的 文档,可选择多个文档作为用户期望的文档,或者可确定检索结果都 不是用户期望的检索结果。后面将参照图12来详细描述正确答案确 定/选择单元109的向附加关键词更新单元113发送指令的处理。
历史累积单元110累积正确答案确定/选择单元109的确定结果。 具体地讲,历史累积单元110累积指示由用户指定的检索目标的信息 以及被确定为用户期望的文档(即确定为正确)的文档的正文。历史 累积单元IIO可累积XJRL作为与确定为正确的文档相关的索引,而 不是累积文档的正文。另外,当检索查询产生单元104已产生了多个 检索查询并且被正确答案确定/选择单元109确定为正确的文档仅与 所述查询中的一个对应时,或者当包括在对应于检索查询之一的检索 结果列表中的元素的排位(rank)高于包括在对应于其它检索查询的 检索结果列表中的同一元素的排位时,历史累积单元110指示附加关 键词更新单元113更新附加关键词。图13示出了历史累积单元110 的内容示例。
当从正确答案确定/选择单元109接收到指令时,附加关键词更 新单元113向附加关键词累积单元103发送在保持在附加关键词候选 项保持单元112中的附加关键词候选项中包括的并且由正确答案确定 /选择单元109选择的附加关键词候选项,从而更新在附加关键词累积 单元103中累积的附加关键词。后面将参照图14详细描述附加关键 词更新单元113。
当历史累积单元110累积新的历史信息时,附加关键词候选项提 取单元111对历史信息执行统计处理,确定对应于检索目标的附加关 键词中的哪个应该被更新,并从历史累积单元110中提取新的附加关 键词候选项。后面将参照图15详细描述附加关键词候选项提取单元 111的处理。
附加关键词候选项保持单元112保持(存储)由附加关键词候选 项提取单元111提取的附加关键词候选项。图6示出了附加关键词候 选项保持单元112的内容示例。
13现在参照图2,将描述关键词输入单元101的屏幕示例。
图2示出了用户已输入了关键词"东京公园"的情况。当用户操作
检索按钮201将该关键词输入到关键词输入单元101时,检索目标呈
现/指定单元102从检索目标累积单元114读取对应于与该关键词相关
的检索目标候选项的ID (识别数据)。
然后参照图3,将描述在检索目标累积单元114中累积的检索目
标示例。
在图3中,例如,标号301表示写为"检索地图"的检索目标。例 如,如果输入的关键词表示地名或设施名,则用户选择这个检索目标 来检索与该关键词对应的地图信息。相似地,标号302表示写为"检 索新闻"的检索目标。如果用户希望检索与输入的关键词相关的新闻 信息,则用户选择这个检索目标。
参照图4,将描述由检索目标呈现/指定单元102呈现的屏幕示例。
在此假定用户选择了图4中写为"检索地图"的检索目标401 。即, 假定用户希望检索与关键词"东京公园"相关的地图信息。当用户指定 了检索目标时,检索查询产生单元104利用与指定的检索目标对应的 检索目标ID (检索目标识别信息)作为索引,从附加关键词累积单元 103读取附加关键词。
然后参照图5,将描述在附加关键词累积单元103中累积的附加 关键词示例。
在图5的情况下,检索查询产生单元104利用与指定的检索目标 "检索地图"对应的检索目标ID "T001"(由图3中的标号303表示) 作为索引,从附加关键词累积单元103读取附加关键词"地图"、"方 向"和"位置,,(由图5中的标号501表示)。
之后,检索查询产生单元104根据用户指定的关键词"东京公园" 和从附加关键词累积单元103读取的附加关键词,产生第一检索查询。 在这个实施例中,检索查询产生单元104通过OR (或)逻辑将附加 关键词相互连接,然后通过AND (与)逻辑将这样连接的附加关键词与用户输入的关键词连接,从而产生得到的布尔公式数据作为检索查
询。即,在上述的示例中,产生第一检索查询"东京公园AND地图 OR位置OR方向"。产生检索查询的过程并不限于上述过程。例如, 产生适于各个检索目标的检索查询的过程可以例如以脚本的形式与 附加关键词一起存储在附加关键词累积单元103中。在这种情况下, 检索查询产生单元104读取该脚本,并根据读取的脚本产生第一检索 查询。
之后,检索查询产生单元104参考附加关键词候选项保持单元 112,并利用指定的检索目标的检索目标ID作为索引来在其中检测与 用户指定的检索目标对应的附加关键词候选项,然后读取它们。
参照图6,将描述保持在附加关键词候选项保持单元112中的附 加关键词候选项的示例。后面将参照图15描述选择保持在附加关键 词候选项保持单元112中的附加关键词候选项的方法。
在该实施例中,关键词"周边地图"被保持作为与检索目标 ID"T001"对应的附加关键词候选项,并被检索查询产生单元104读 取。在检索查询产生单元104从附加关键词候逸项保持单元112读取 了一个或多个附加关键词候选项之后,除了已经产生的第一检索查询 之外,它根据读取的附加关键词候选项产生第二检索查询。在该实施 例中,检索查询产生单元104通过OR逻辑连接附加关键词候选项, 并通过AND逻辑将连接的附加关键词与用户输入的关键词连接,从 而产生得到的布尔公式数据作为检索查询。在这个示例中,由于仅有 一个附加关键词候选项,所以不需要执行通过OR逻辑的附加关键词 候选项连接,因此,产生第二检索查询"东京公园AND周边地图"。
由检索查询产生单元104产生的第一检索查询和第二检索查询 被发送到检索查询发送单元105。如果没有产生第二检索查询,则仅 将第一检索查询发送到检索查询发送单元105,并仅对第一检索查询 执行下面的处理。
检索查询发送单元105将第一检索查询和第二检索查询转换成 与不包括本实施例的现有搜索引擎匹配的格式,并将得到的数据发送到搜索引擎。与互联网上的现有搜索引擎匹配的检索查询格式是公知 的,因此不再进行详细描述。
检索结果接收单元106接收与从检索查询发送单元105发送的检 索查询对应的检索结果。这时,检索结果接收单元106从检索查询发 送单元105接收与从其发送到搜索引擎的检索查询相关的信息,并根 据该信息来区分分別与第一检索查询和第二检索查询对应的笫一检 索结果和第二检索结果。
参照图7A和图7B,将描述由检索结果接收单元106接收的检 索结果的示例。
图7A示出了与第一检索查询对应的第一检索结果的示例,图7B 示出了与第二检索查询对应的第二检索结果的示例。图7A和图7B
仅示出了作为检索结果的排位、标题和URL。然而,可以接收检索结 果文档的正文或摘要作为每个检索结果的另外的元素。另外,尽管图 7A和图7B仅示出了第一至第五排位的检索结果,但是更大数量的元 素可被添加到每个检索结果。
参照图8,将描述检索结果列表产生单元107的操作示例。 检索结果列表产生单元107利用由检索结果接收单元106接收的 每个检索结果作为输入,根据图8的流程图来产生检索结果列表。
(5801) 从检索结果接收单元106读取第一检索结果(例如,图7A 中示出的内容)。
(5802) 确定是否从检索结果接收单元106接收到第二检索结果。 如果接收到了第二检索结果,则该程序进行到步骤S803,而如果没有 接收,则该程序进行到步骤S805。
(5803) 从检索结果接收单元106读取第二检索结果(例如,图7B 中示出的内容)。
(5804) 从第二检索结果中去除包括在步骤S803读取的第二检索 结果中同时也包括在第一检索结果中的检索结果文档。
(5805) 重新设置或删除现有的检索结果列表。
(5806) 当在步骤S803读取了第二检索结果时,确定在步骤S801读取的第一检索结果和在步骤S803读取的第二检索结果是否均为空。 如果它们均为空,则该程序进行到步骤S811,而如果第一检索结果和 第二检索结果中的至少 一个不为空,则该程序进行到步骤S807。
如果在步骤S802确定没有接收到第二检索结果,则确定在步骤 S801读取的第一检索结果是否为空。如果确定第一检索结果为空,则 该程序进行到步骤S811,而如果确定第一检索结果不为空,则该程序 进行到步骤S807。
(5807) 确定在步骤S801读取的第一检索结果是否为空。如果确 定第一检索结果为空,则该程序进行到步骤S809,而如果确定第一检 索结果不为空,则该程序进行到步骤S808。
(5808) 在步骤S801读取的第一检索结果的最高级别的元素被移 动到检索结果列表。
(5809) 确定在步骤S803读取的第二检索结果是否为空。如果确 定第二检索结果为空,则该程序进行到步骤S806,而如果确定第二检 索结果不为空,则该程序进行到步骤S810。
(5810) 在步骤S803读取的第二检索结果的最高级别的元素被移 动到检索结果列表。之后,该程序返回至步骤S806。
(5811) 得到的检索结果列表被输出到检索结果呈现单元116。 然后参照图9,将描述检索结果列表产生单元107产生的检索结
果列表的示例。
基于图7中示出的第一检索结果和笫二检索结果,检索结果列表 产生单元107根据图8的流程图产生图9中示出的检索结果列表。在 图9的"源,,列中,"2"被记录在与从第二检索结果复制的文档对应的 单元格中,而"l,,被记录在其它单元格中。
参照图10,将描述由检索结果呈现单元116呈现的检索结果列 表的示例。
检索结果,并将该列表呈现给用户,如图10所示。
图IO按顺序示出了包含在检索结果列表中的标题和URL。标题
17和各个URL通过超链接进行链接,从而当用户利用诸如鼠标的定点 装置点击每个字符串时,检索结果呈现单元116利用已知的互联网连 接技术将该串与对应的URL连接,从而获取对应的文档并呈现获取 的文档的正文。
当观看图IO的检索结果列表时,用户能够检测检索结果列表中 的哪个检索结果对应于期望的信息,并选择认为合适的标题或URL。 在此假定由于用户想检索与"东京公园"有关的地图,所以他们确定图 10中由标号1001指示的第二排位的检索结果"东京公园周边地图"是 他们最想要的检索结果,并且点击标号1001指示的标题或URL。图 ll示出了当点击标号1001指示的标题或URL时与由检索结果呈现单 元116呈现的并与所选择的检索结果对应的正文的示例。
现在参照图12,将描述正确答案确定/选择单元109的操作示例。 正确答案确定/选择单元109监视用户对检索结果呈现单元116 的操作,确定用户认为检索结果列表中的检索结果中的哪一个是期望 的,并选择该期望的检索结果。
(51201) 保持正确候选项的变量c被重新设置为空状态。
(51202) 定时器变量t被重新设置为0。
(51203) 确定检索结果呈现单元116是否呈现正文。如果确定显 示正文,则该程序进行到步骤S1204,而如果确定没有显示正文,则 该程序进行到步骤S1201。
(51204) 确定由检索结果呈现单元116呈现的文档是否与保持在 变量c中的文档相同。如果确定呈现的文档与保持在变量c中的文档 不同,则该程序进行到步骤S1205。
(51205) 检索结果呈现单元116呈现的文档作为正确候选项被赋 值给变量c。
(51206) 定时器变量t增加1。
(51207) 确定定时器变量t是否大于预先设置的阈值D。如果确定 定时器变量t大于预先设置的阈值D,则该程序进行到步骤S1208, 而如果确定定时器变量t不大于预先设置的阈值D,则该程序返回到步骤S1203。
(51208) 确定保持在变量c中的检索结果元素的源是否包括在第 二检索结果中。如果确定所述检索结果元素包括在第二检索结果中, 则该程序进行到步骤S1209,而如果所述检索结果元素不包括在第二 检索结果中,则该处理终止。
(51209) 与保持在变量c中的文档对应的检索目标ID被输出到附 加关键词更新单元113。
作为图12所示的过程的结果,这样的文档被确定为正确,即, 该文档包括在正文已被用户浏览过的文档中,并且其正文被用户浏览 了预定时间或更长时间,而没有浏览任何其它的文档。这里假定具有 图ll所示的正文的文档,即,与图10中的标号1001对应的文档, 被确定为正确。如果确定为正确的文档仅包括在第二检索结果中,即, 如果图9中的"源单元格,,中的值为2,则正确答案确定/选择单元109 将与由检索目标呈现/指定单元102指定的检索目标对应的检索目标 ID发送到附加关键词更新单元113(S1209)。在这种情况下,"T001" 作为检索目标ID被发送到附加关键词更新单元113。
另外,当正确答案确定/选择单元109确定某一文档为正确时, 该文档的标题、正文和检索目标ID被累积在历史累积单元110中。 图13示出了累积在历史累积单元110中的历史示例。
参照图13和图14,将描述附加关键词更新单元113。
在从正确答案确定/选择单元109接收到检索目标ID时,附加关 键词更新单元113从附加关键词候选项保持单元112读取与接收的检 索目标ID对应的一个或多个附加关键词候选项,并从附加关键词候 选项保持单元112删除所述候选项。在这个示例中,附加关键词更新 单元113读取作为附加关键词候选项的"周边地图,,(由图6中的标号 601表示)。
之后,附加关键词更新单元113将从附加关键词候选项保持单元 112接收的附加关键词候选项添加到累积在附加关键词累积单元103 中并与检索目标ID对应的附加关键词中。在这个示例中,项目"周边地图"被添加到与检索目标ID"001,,对应的附加关键词"地图、方向、 位置"(由图5中的标号501表示)中(图14中的S1401)。即,当 在利用附加关键词的检索中不能检测到的正确文档能够在利用附加 关键词候选项的检索中被检测到时,附加关键词候选项被添加作为附 加关键词。
参照图15,将描述附加关键词候选项提取单元111的操作示例。 当新的历史元素被添加到历史累积单元110时,附加关键词候选 项提取单元111根据图15的流程提取新的附加关键词候选项。
(51501) 作为新添加的历史元素的检索目标ID被赋值给保持检索 目标ID的变量T。例如,T祐z没置为TOOl。
(51502) 将计数器变量i重新设置为0。
(51503) 使得用于保持词排列(word arrangement)的变量X为

(51504) 确定计数器变量i是否小于历史元素的数量。如果i小于 历史元素的数量,则该程序进行到步骤S1505,而如果i不小于历史 元素的数量,则该程序进行到步骤S1511。
(51505) 从历史累积单元110读取第i历史元素的正文、标题和检 索目标ID。
(51506) 以字符类型为单位划分读取的正文和标题,以获得词。 例如,字符类型包括数字、日文字、符号、英文字和汉字。
(51507) 确定在步骤S1505读取的作为历史元素的检索目标ID与 在步骤S1501设置的T是否相同。如果确定它们相同,则该程序进行 到步骤S1508,而如果确定它们不同,则该程序进行到步骤S1510。
(51508) 在步骤S1506获得的词;故添加到变量X,并且该程序进 行到步骤S1510。
(51509) 在步骤S1506获得的词被添加到变量Y,并且该程序进 行到步骤S1510,其中,变量Y也保持词排列并且与变量X不同。
(51510) 计数器变量i增加1,并且该程序返回至步骤S1504。
(51511) 将与计数器变量i不同的计数器变量j重新设置为0。(51512) 确定j是否小于变量X保持的词的数量。如果确定j小 于所述词的数量,则该程序进行到步骤S1513,而如果确定j不小于 所述词的数量,则该程序终止。
(51513) 计算变量X所保持的第j词Kj的统计分数Dj。后面将 描述统计分数Dj的计算方式。
(51514) 确定Dj是否大于预先设置的阈值P。如果确定Dj大于 预先设置的阈值P,则该程序进行到步骤S1515,而如果确定Dj不大 于阈值P,则该程序进行到步骤S1517。
(51515) 确定词Kj是否已经存储在附加关键词累积单元103或附 加关键词候选项保持单元112中。如果确定词Kj已经存储在附加关 键词累积单元103或附加关键词候选项保持单元112中,则程序进行 到步骤S1517,而如果确定词Kj没有被存储,则程序进行到步骤 S1516。
(51516) 词Kj被添加到附加关键词候选项保持单元112中。
(51517) 变量j增加1,并且该程序返回至步骤S1S12。 在步骤S1513计算的统计分数Dj例如通过下式给出, Dj=(n/N)/(m/M)
其中,n:变量X中的词Kj的出现次数
N:变量X中的所有词的总出现次数
m:变量Y中的词Kj的出现次数
M:变量Y中的所有词的总出现次数
如果m-O,则预先设置的常数值Dmax ( >P )被赋值给Dj。 定性地看,如果一个词在与某个检索目标ID对应的正确文档中
出现很多次并且在与其它检索目标ID项目对应的正确文档中出现的
次数不多,则假定该词的统计分数Dj的值高。统计分数不是必须由
上述的表达式给出,也可以通过任何其它表达式给出。只要给出的统
计分数具有相似的定性性质就足够了 。 (变型例)
现在参照图16,将描述该实施例的变型例。在该变型例中,包括在图1中示出的检索关键词改进装置中的历
史累积单元110、附加关键词候选项提取单元111和附加关键词候选 项保持单元112在服务器1600上工作,其中,服务器1600不同于改 进装置的其它单元在其上进行工作的PC。另外,服务器1600上的单 元(历史累积单元110、附加关键词候选项提取单元111和附加关键 词候选项保持单元112)被多个PC访问。即,根据该变型例的检索 关键词改进装置包括关键词输入单元101、检索目标呈现/指定单元 102、附加关键词累积单元103、检索查询产生单元104、检索查询发 送单元105、检索结果接收单元106、检索结果列表产生单元107、呈 现单元108、正确答案确定/选择单元109、附加关键词更新单元113、 检索目标累积单元114和关键词分析单元115。呈现单元108包括检 索结果呈现单元116和菜单呈现单元117。
在这个变型例中,历史累积单元110累积多个用户产生的检索历 史,并且附加关键词候选项提取单元lll从用户的检索历史中提取附 加关键词候选项。因此,可以将从其它用户的检索历史中提取的附加 关键词候选项添加到附加关键词累积单元103,因此,检索关键词改 进装置的用户可以使用这些附加关键词。这意味着检索关键词改进装 置的用户能够更方便地使用该装置。
在上述的实施例和变型例中,当执行越来越多的检索时,设置越 来越多的适当关键词,可以降低开发关键词所需的成本。另外,即使 在作为检索目标的文档的属性发生变化时,逐渐地设置符合改变的属 性的关键词,因而可以获得适当的检索结果。
其它的优点和变型例对于本领域技术人员来说也是容易想到的。
性实施例。因此,在不脱离由权利要求及其等同物限定的总体发明构 思的精神或范围的情况下,可以作出各种变型。
权利要求
1、一种检索关键词改进装置,该装置包括历史累积单元,被配置为以彼此关联的关系累积多个第一文档或与所述第一文档对应的索引和多个第一检索目标识别信息项目,所述多个第一检索目标识别信息项目对应于与用于检索的关键词相关联的第一检索目标,所述第一检索目标识别信息项目被用于检索第一文档;提取单元,被配置为在包括在第一文档中的新文档和用于检索所述新文档的新的检索目标识别信息项目被累积在历史累积单元中的情况下,从所述新文档中提取作为附加关键词候选项的词,所述词在所述新文档中的出现次数大于所述词在第一文档中的除了所述新文档之外的每个文档中的出现次数;附加关键词累积单元,被配置为累积与所述附加关键词候选项不同的多个附加关键词和与这些附加关键词对应的多个第二检索目标识别信息项目;存储单元,被配置为存储所述附加关键词候选项和与所述附加关键词候选项对应的第三检索目标识别信息项目;查询产生单元,被配置为基于输入关键词、与所述输入关键词相关联的第二检索目标、以及与对应于第二检索目标的第四检索目标识别信息项目对应的附加关键词中的一个附加关键词来产生第一检索查询,并且被配置为基于所述输入关键词、第二检索目标和与第四检索目标识别信息项目对应的附加关键词候选项来产生第二检索查询;列表产生单元,被配置为产生包括与第一检索查询和第二检索查询对应的检索结果的第一检索结果列表;第一选择单元,被配置为从第一检索结果列表中选择作为期望的检索结果的第二文档;和移动单元,被配置为在第一选择单元从与第二检索查询对应的第二检索结果列表中选择期望的检索结果的情况下,将所述附加关键词候选项和第三检索目标识别信息项目移动到附加关键词累积单元,其中第二检索结果列表包括在第一检索结果列表中。
2、 根据权利要求1所述的装置,其中,如果用户已确定第二文 档是期望的检索结果,则第 一选择单元从第 一选择结果列表中选择第 二文档。
3、 根据权利要求2所述的装置,其中,查询产生单元中的第二 检索目标是第一检索目标中用户选择的一个检索目标。
4、 根据权利要求1所述的装置,还包括 输入单元,被配置为输入所述输入关键词;分析单元,被配置为分析所述输入关键词的语义类别;和 显示单元,被配置为根据分析单元获得的分析结果,显示包括第二检索目标的检索目标茱单;与所述输入关键词相关联的第二检索目标是从检索目标菜单中选择的。
5、 根据权利要求1所述的装置,其中,在(n/N)/(m/M)的值大于 第 一 阈值的情况下,提取单元提取所述词作为所述附加关键词候选 项,n表示所述词在所述新文档中的出现次数,N表示所述新文档中 的所有词的出现次数,m表示所述词在第 一文档中的除了所述新文档 之外的文档中的出现次数,M表示第一文档中的除了所述新文档之外 的文档中的所有词的出现次数。
6、 根据权利要求l所述的装置,其中,列表产生单元包括 确定单元,被配置为确定是否存在对应于第二检索查询的第一检索结果;第一读取单元,被配置为在确定存在第一检索结果的情况下读取 第一检索结果;第二读取单元,被配置为读取与第一检索查询对应的第二检索结 果;和删除单元,被配置为从第一检索结果中删除包括在第二检索结果 中的文档。
7、 根据权利要求6所述的装置,其中,列表产生单元还包括 重新设置单元,被配置为重新设置第一检索结果列表的内容以获得重新设置的列表;和更新单元,被配置为通过执行下面的操作,即,将包括在第二检 索结果中的最高排位的第一结果元素移动到所述重新设置的列表,然 后将包括在第一检索结果中的最高排位的第二结果元素移动到所述 重新设置的列表的紧跟在第一结果元素之后的位置,并重复所述操作 直到包括在第一检索结果和第二检索结果中的所有检索结果元素均 被处理,从而更新第一检索结果列表。
8、 根据权利要求l所述的装置,其中,第一选择单元包括测量单元,被配置为测量被用户浏览并且包括在第二检索结果列 表中的第三文档被连续显示的时间;第二选择单元,被配置为在测得的时间大于第二阈值的情况下选 择第三文档作为期望的检索结果。
9、 根据权利要求8所述的装置,其中,第一选择单元还包括 确定单元,被配置为确定第三文档是否是第二检索查询的检索结果;和识别单元,被配置为在确定单元确定了第三文档是第二检索查询 的检索结果的情况下,识別与第三文档对应的第五检索目标识别信息 项目。
10、 根据权利要求l所述的装置,其中,列表产生单元产生的第 一检索结果列表包括以检索结果为单位的与笫一检索查询和第二检 索查询中的一个对应的信息。
11、 一种服务器装置,该服务器装置包括历史累积单元,被配置为以彼此关联的关系累积从由多个检索结 果形成的检索结果列表中选择为期望的检索结果的多个笫一文档和 对应于与用于检索的关键词相关联的检索目标的多个检索目标识别 信息项目,检索目标识别信息项目被用于检索第一文档;提取单元,被配置为在包括在第一文档中的新文档和用于检索所述新文档的新的检索目标识别信息项目被累积在历史累积单元中的 情况下,从所述新文档中提取作为附加关键词候选项的词,所述词在 所述新文档中的出现次数大于所述词在第 一 文档中的除了所述新文档之外的每个文档中的出现次数;和存储单元,被配置为存储所述附加关键词候选项和与所述附加关 键词候选项对应的另一检索目标识别信息项目。
12、 一种检索关键词改进方法,该方法包括准备历史累积单元,所述历史累积单元被配置为以彼此关联的关 系累积多个第一文档或与所述第一文档对应的索引和多个第一检索 目标识别信息项目,所述多个第一检索目标识别信息项目对应于与用 于检索的关键词相关联的第一检索目标,所述第一检索目标识别信息 项目被用于检索第一文档;在包括在第一文档中的新文档和用于检索所述新文档的新的检 索目标识别信息项目被累积在历史累积单元中的情况下,从所述新文 档中提取作为附加关键词候选项的词,所述词在所述新文档中的出现 次数大于所述词在第一文档中的除了所述新文档之外的每个文档中 的出现次数;准备附加关键词累积单元,所述附加关键词累积单元被配置为累 积与所述附加关键词候选项不同的多个附加关键词和与这些附加关 键词对应的多个第二检索目标识别信息项目;在存储单元中存储所述附加关键词候选项和与所述附加关键词 候选项对应的第三检索目标识别信息项目;基于输入关键词、与所述输入关键词相关联的第二检索目标、以 及与对应于第二检索目标的第四检索目标识别信息项目对应的附加 关键词中的 一个附加关键词来产生第 一检索查询;基于所述输入关键词、第二检索目标和与第四检索目标识别信息 项目对应的附加关键词候选项来产生第二检索查询;产生包括与第一查询和第二查询对应的检索结果的第一检索结 果列表;从第一检索结果列表中选择作为期望的检索结果的第二文档;以及在第一选择单元从与第二检索查询对应的第二检索结果列表中 选择期望的检索结果的情况下,将所述附加关键词候选项和第三检索 目标识别信息项目移动到附加关键词累积单元,其中第二检索结果列 表包括在第一检索结果列表中。
13、 一种方法,该方法包4舌准备历史累积单元,所述历史累积单元被配置为以彼此关联的关 系累积从由多个检索结果形成的检索结果列表中选择为期望的检索 结果的多个第一文档和对应于与用于检索的关键词相关联的检索目 标的多个检索目标识别信息项目,检索目标识别信息项目被用于检索 第一文档;在包括在第一文档中的新文档和用于检索所述新文档的新的检 索目标识别信息项目被累积在历史累积单元中的情况下,从所述新文 档中提取作为附加关键词候选项的词,所述词在所述新文档中的出现 次数大于所述词在第一文档中的除了所述新文档之外的每个文档中 的出现次数;以及在存储单元中存储所述附加关键词候选项和与所述附加关键词 4美选项对应的另 一检索目标识别信息项目。
全文摘要
本发明提供了检索关键词改进装置、服务器及方法。该检索关键词改进装置包括在新文档和用于检索所述新文档的新的检索目标识别信息项目被累积的情况下从所述新文档中提取作为附加关键词候选项的词的单元,所述词在所述新文档中的出现次数大于所述词在第一文档中的除了所述新文档之外的每个文档中的出现次数;基于输入关键词、与输入关键词相关联的第二检索目标和附加关键词中的一个关键词产生第一检索查询并且产生第二检索查询的单元;在从与第二检索查询对应的第三检索结果列表中选择了期望的检索结果的情况下移动附加关键词候选项和第三检索目标识别信息项目的单元。
文档编号G06F17/30GK101546328SQ20091000822
公开日2009年9月30日 申请日期2009年2月19日 优先权日2008年3月27日
发明者国分智晴, 铃木优 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1