数据搜索装置、数据搜索方法和程序的制作方法

文档序号:6360454阅读:115来源:国知局
专利名称:数据搜索装置、数据搜索方法和程序的制作方法
技术领域
本发明涉及数据搜索。
背景技术
专利文件I公开了一种技术,其中当用户用移动终端拍摄车站站牌的照片时,与照片中所示的图像相对应的查询信息被发送到车站信息提供服务器,并且从车站信息提供服务器发送关注车站的车站相关信息。现有技术文件
专利文献专利文献I JP-A-2009-13069
发明内容
本发明要解决的问题在专利文献I公开的技术中,由于要搜索的信息局限于与预定主体相关的信息,即,“车站”,所以相对容易提供用户想要的搜索结果。然而,当存在大范围的进行搜索的对象或者对进行搜索的主体没有具体限制时,经常发生的情况是获得了并非用户所想要的无关搜索结果。因而,本发明的目的是能够基于从用户发送的信息来进行加权搜索,从而提供用户有可能寻求的搜索结果。解决问题的方案根据本发明的一个实施方式的一种数据搜索装置包括数据获取单元,所述数据获取单元获取包含一个或者更多个字符串的输入数据;关键字提取单元,所述关键字提取单元根据预设规则从包含在被所述数据获取单元获取的所述输入数据中的所述一个或者更多个字符串提取一个或者更多个关键字;数据识别单元,所述数据识别单元针对被所述关键字提取单元提取的所述一个或者更多个关键字在彼此关联地存储了所述关键字和相关数据项目的数据库中进行搜索,并且识别与所述一个或者更多个关键字相关联的相关数据项目,其中所述相关数据项目是与所述关键字有关的数据项目;以及数据输出单元,所述数据输出单元输出被所述数据识别单元识别的相关数据项目作为对应于输入数据的数据。在优选实施方式中,所述关键字提取单元向包含在被所述数据获取单元获取的所述输入数据中的所述一个或者更多个字符串的每一个字符串分配级别,并且提取具有更高级别的字符串作为所述关键字。更优选地,根据每一个字符串的显示模式或者输入字段确定所述级别。在另一个优选实施方式中,存在多个数据库,级别被分配给多个数据库中的每一个数据库,以及所述数据识别单元通过向在具有更高级别的数据库中进行的搜索的结果赋予更高的优先级来识别相关数据项目。在又一个优选实施方式中,存在多个数据库,级别被分配给多个数据库中的每一个数据库,以及所述数据识别单元通过组合所述数据库的级别和所述关键字的级别来识别所述相关数据项目。在又一个优选实施方式中,所述数据获取单元与代表发送时间、终端的位置以及涉及终端的属性中的至少一个的附加数据一起获取从终端发送的输入数据,以及所述数据识别单元根据基于所述附加数据确定的级别识别所述相关数据项目。在另一个方面,本发明提供一种信息搜索方法,包括获取包含一个或者更多个字符串的输入数据;根据预设规则从包含在所述输入数据中的所述一个或者更多个字符串提取一个或者更多个关键字;针对所述一个或者更多个关键字在彼此关联地存储了所述关键字和相关数据项目以能够被搜索的数据库中进行搜索,并且识别与所述一个或者更多个关键字相关联的相关数据项目;以及输出所述相关数据项目作为对应于输入数据的数据。在又一个方面,本发明提供一种使计算机执行以下步骤的程序获取包含一个或 者更多个字符串的输入数据的步骤;根据预设规则从包含在所述输入数据中的所述一个或者更多个字符串提取一个或者更多个关键字的步骤;针对所述一个或者更多个关键字在彼此关联地存储了所述关键字和相关数据项目以能够被搜索的数据库中进行搜索,并且识别与所述一个或者更多个关键字相关联的相关数据项目到步骤;以及输出所述相关数据项目作为对应于输入数据的数据的步骤。发明效果根据本发明,能够基于从用户发送的信息进行加权搜索从而提供用户有可能寻求的信息。


图I是示出数据搜索系统的构造的框图。图2是示出通信终端的构造的框图。图3是示出第二服务器的构造的框图。图4是示出第一服务器的控制单元的功能构造的功能框图。图5是示出第二服务器的控制单元的功能构造的功能框图。图6是示出备忘录数据的格式的示例的图。图7是示出由第二服务器执行的处理的流程图。图8是示出向通信终端发送的相关数据的显示的示例的图。图9是示出级别依赖于性别而改变的数据库的示例的图。附图标记说明10 :数据搜索系统100 :第一服务器;200 :第二服务器;300 :通信终端;210 :控制单元;211 :数据获取单元;212 :关键字提取单元;213 :数据识别单元;214 :数据输出单元;220 :存储单元;230 :通信单元
具体实施例方式[示例性实施方式]图I是示出数据搜索系统的构造的框图,其为本发明的一个示例性实施方式。如图I所示,本示例性实施方式的数据搜素系统10包括第一服务器100、第二服务器200和通信终端300,其中第一服务器100和通信终端300经由网络NWl彼此通信。在此示例中,第二服务器200具有与本发明的数据搜索装置相对应的功能。此外,通信终端300具有与本发明的外部终端相对应的功能。在数据搜索系统10中,第一服务器100和第二服务器200被数据搜索服务提供商使用。另一方面,通信终端300被使用数据搜索服务的一方使用。在以下描述中,使用通信终端300的一方将被称为“用户”。尽管附图中未示出,但是数据搜索系统10中可以存在多个通信终端300 (以及它们的用户)。在本示例性实施方式中,通信终端300是无线通信终端。在此情况下,网络NWl至少包括移动通信网络。在此移动通信网络可以是无线LAN(局域网)。通信终端300例如是移动电话或者智能电话。然而,应注意的是,本发明的外部终端不限于无线通信终端,只要能够进行数据通信就行,并且可以是诸如连接到因特网的个人计算机这样的装置。图2是示出通信终端300的构造的框图。如图2所示,通信终端300包括控制单元310、存储单元320、通信单元330、显示单元340、操作单元350、摄影单元360和定位单元370。控制单元310包括诸如CPU (中央处理单元)的数学处理单元和对应于主存储装置的·存储器,并且执行程序以控制通信终端300的各个部分。存储单元320包括与诸如闪存存储器这样的辅助存储装置相对应的存储单元,并且存储被控制单元310使用的数据。存储在存储单元320中的数据包括由用户进行的操作产生的备忘录数据。通信单元330包括用于与网络NWl通信的接口,并且发送和接收包括备忘录数据和相关数据的数据。显示单元340包括诸如液晶显示器和用于其的驱动单元这样的显示介质,并且在预定的显示表面上显示图像。操作单元350包括诸如键盘这样的输入单元,其接收用户进行的操作向控制单元310通知操作的内容。摄影单元360拍摄对象的图像以生成图像数据。该图像数据作为备忘录数据的一部分被存储在存储单元320中。定位单元370测量通信终端300的位置,并且生成代表测量到的位置的位置信息。定位单元370执行的定位方法例如是使用GPS (全球定位系统)的方法,尽管可以是另一个方法(例如,基于与通信终端300通信的移动通信网络的基站的位置导出通信终端300的位置的方法)。第一服务器100是具有临时保存从通信终端300接收的数据的功能的服务器装置。此外,第一服务器100具有利用接收的数据被保存的时段使第二服务器200进行针对与保存的数据有关的附加数据的搜索。在本示例性实施方式中,保存在第一服务器100中的数据被称为“备忘录数据”。备忘录数据可以是通信终端300的用户输入的字符和/或图像的数据。备忘录数据是本发明的输入数据的示例。第二服务器200是具有搜索要被添加到备忘录数据中的数据并且将其发送到第一服务器100的功能的服务器装置。第二服务器200使用一个或者多个数据库来搜索与备忘录数据有关的数据。在本示例性实施方式中,被第二服务器200搜索并且发送的数据被称为“相关数据”。相关数据例如是通过HTML (超文本标记语言)或者类似的标记语言描述的数据,但是可以是包含可被用户使用的信息的任何数据,诸如字符、图像、链接(超链接)、声音等。图3是第二服务器200的框图。如图3所示,第二服务器200包括控制单元210、存储单元220和通信单元230。控制单元210包括诸如CPU的数学处理单元和对应于主存储装置的存储器,并且执行程序以控制第二服务器200的各个部分。存储单元220包括诸如硬盘这样的存储单元,并且存储被控制单元210使用的数据。通信单元230包括用于与第一服务器100通信的接口,并且发送和接收包括备忘录数据和相关数据的数据。应注意的是由于第一服务器100的总体构造与第二服务器200的相同,示出构造的附图被省略。然而,为了便于说明,第一服务器100的控制单元、存储单元和通信单元将被分别称为“控制单元110”、“存储单元120”和“通信单元130”。在第一服务器100中,存储在存储单元120中的数据的内容不同于存储在第二服务器200中的数据的内容,并且第一服务器100与第二服务器200不同还在于第一服务器100连接到网络NWl。图4是示出第一服务器100的控制单元110的功能构造的功能框图。控制单元110执行程序以实现图4所示的数据获取单元111、数据保存单元112和数据输出单元113的功能。数据获取单元111获取从通信终端300发送的备忘录数据,并且获取从第二服务器200发送的相关数据。数据保存单元112使数据获取单元111获取到的备忘录数据和相 关数据存储在存储单元120中。数据保存单元112进行的存储不仅仅服务于数据搜索服务的功能,而且服务于备忘录数据备份的功能。在本示例性实施方式中,服务于这些功能的数据存储被称为“保存”。数据输出单元113输出数据获取单元111获取到的或者数据保存单元120保存的备忘录数据和相关数据。图5是示出第二服务器200的控制单元210的功能构造的功能框图。控制单元210执行程序以实现数据获取单元211、关键字提取单元212、数据识别单元213和数据输出单元214的功能。数据获取单元211获取从第一服务器100发送的备忘录数据和包含在多个数据库DB1,DB2,. . .,DBn中的数据。关键字提取单元212根据预设规则向包含在备忘录数据中的字符串分配级别(rank),并且提取要在搜索中使用的一个或者更多个关键字。数据识别单元213通过在搜索条件中使用关键字提取单元212提取的关键字来进行搜索,并且识别与搜索条件相匹配的相关数据。在相关数据项目的识别中,数据识别单元213使用上述数据库081,082,...,0811。在此应注意的是η的值是大于或者等于2的任意整数。数据库DBl-DBn是数据的集体,其中关键字和相关数据项目彼此关联。数据库DBl-DBn可以被存储在存储单元220中,尽管它们可以位于第二服务器200的外部。此外,第二服务器200可以使用位于第二服务器的内部和外部的数据库的组合。数据输出单元214输出被数据识别单元213识别的相关数据项目作为对应于备忘录数据的数据。应注意的是,在数据库DBl-DBn位于第二服务器200的外部的情况下,即,当它们在外部装置中时,数据识别单元213可以通过向外部装置发送关键字作为搜索查询并且从外部装置获取相关数据项目来识别相关数据项目。即,在此情况下,数据获取单元211不必须读出并且获取包含在数据库DBl-DBn中的全部数据,获取与所寻求的关键字相对应的相关数据项目就足够了。数据库DBl-DBn被根据多个判据分类,并且每一个数据库都被配置为包含根据预定判据组织的关键字。在此判据例如可以是关键字的词性(普通名词、专有名词等)、关键字的含义或者内容等。例如,数据库DBl-DBn可以包括选择性地收集了地名和公共设施名称的数据库、选择性地收集了与电影有关的关键字的数据库、选择性地收集了与餐厅有关的关键字的数据库等。此外,数据库DBl-DBn可以根据电影的风格、意大利美食、中国美食等被更精细地分类。
应注意的是,数据库DBl-DBn中的两个或者更多个中可以包含相同的关键字。例如,关键字“面食”可以被包含在普通名词的数据库和餐馆的数据库中。此外,在关键字是著名(或者当前上映的)电影的名称并且同时也是普通名词的情况下,该关键字可以被包含在普通名词的数据库和电影的数据库中。此外,数据库DBl-DBn均具有预指派的级别。在本示例性实施方式中假定具有较小值的级别是占优的或者假定更高的优先级。然而,应注意的是例如,类似于游戏中的分数,涉及本发明的级别可以是具有较大值的级别是占优的。这适用于数据库的级别以及字符串的级别的每一个。通过与其它数据库的相对比较来确定数据库的级别。数据库的级别实质上是示出在搜索中多个数据库中的哪个数据库被认为具有更高优先级(或者应被加权)的指示符。例如,有时优选地为收集了专有名词的数据库赋予比收集了普通名词的数据库的级别更高的级别(或者,具有更小值的级别)。应注意的是,可以通过数据搜索服务提供商适当地确定多个数据库中的哪个应被赋予更高优先级,并且级别不必是固定的,可以依赖于区域、季节等改变。此外,数据库的级别可以根据社会或等的当前趋势而改变。例如,包含频繁出现在诸 如博客或者搜索引擎这样的预定网站中的词语或者短语作为关键字的数据库的级别,或者包含流行词语的数据库的级别可以被数据搜索服务提供商临时提高。上面是数据搜索系统10的构造的描述。在这个构造中,用户使用通信终端300来创建备忘录数据。用户创建的备忘录数据可以包括描述在用户使用通信终端300的过程中想到的主意、用户的日程表等的数据。除了使用通信终端300的操作单元350输入字符,用户还可以拍摄对象的照片(电影的海报、商店的广告牌、产品包装、火车定时表等)作为对象外观的提醒。当备忘录数据被用户创建时,通信终端300在存储单元320中存储备忘录数据。此夕卜,通信终端300在适当定时向第一服务器100发送备忘录数据,以备份备忘录数据。备忘录数据被备份的定时可以是用户请求备份的定时或者可以是与用户进行的操作无关的规则地重复定时。第一服务器100和第二服务器200利用备忘录数据被保存的状态,并且协作地进行添加相关数据到保存的备忘录数据的操作。第一服务器100向第二服务器200发送从通信终端300接收的备忘录数据,并且作为对其的响应,第二服务器200向第一服务器100发送与备忘录数据有关的相关数据。如果能够确定发送的相关数据对应于哪个备忘录数据项目,则向第一服务器100仅仅发送相关数据就足够了,不必发送备忘录数据。例如,在每一个备忘录数据项目都被指派唯一 ID的情况下,第二服务器200向第一服务器100发送相关数据和ID就足够了。当相关数据已经被寻求并且被第二服务器200发送时,第一服务器100保存这些相关数据,并且在适当定时将其发送到通信终端300。第一服务器100可以在通信终端300的用户所请求的定时发送相关数据,尽管可以在接收到该相关数据之后立即发送相关数据,而不是作为对用户的请求的响应。应注意的是,不必针对每一个备忘录数据项目进行针对相关数据的搜索。例如,从进行搜索的备忘录数据项目中排除不能提取出值得搜索的有意义字符串的备忘录数据项目。这种备忘录数据项目不必从第一服务器100发送到第二服务器200,并且不必从通信终端300发送到第一服务器100。此外,第一服务器100可以存储包含从进行搜索的备忘录数据项目中排除的备忘录数据项目中包含的字符串,从而当这种字符串被提取了大于或者等于预定次数的次数时,该字符串被识别为新词。这种新词可以从第一服务器100通知给数据搜索服务提供商,以被新添加到任何一个数据库中。图6是示出备忘录数据的格式的示例的图。在这个示例中,备忘录数据项目具有三个输入字段;即,“标题”、“细节”和“图像”。“标题”是其中插入了与用户输入的备忘录数据的标题或者题目相对应的字符串的输入字段。字体大小、颜色和/或字体体系可以是可变的。此外,“图像”是被附到摄影单元360生成的图像数据上的输入字段。应注意的是,备忘录数据项目不必具有所附的图像数据。此外,“细节”是其中插入了被第二服务器200从图像数据提取的字符串的输入字段。因而,输入字段“细节”处于在备忘录数据从第一服务器100发回之前不能插入字符串的状态(空白状态)。然而,不禁止用户在输入字段“细节”中输入数据,并且用户可以按照需要输入任何字符串等。
图7是当搜索相关数据时第二服务器200执行的处理的流程图。如图7所示,第二服务器200的控制单元210首先经由通信单元230获取备忘录数据(步骤SI)。在获取了备忘录数据之后,控制单元210确定备忘录数据是否包含图像数据(步骤S2)。如果备忘录数据包含图像数据,则控制单元210分析图像数据所代表的图像,并且识别包含在图像中的字符(步骤S3)。通过使用已知的OCR (光学字符识别)技术进行步骤S3的处理。此时,如果识别出的字符是外语字符,则控制单元210可以根据需要进行翻译。应注意的是,在识别出的字符包含具有与其它字符不同的大小和/或颜色的字符情况下,控制单元210可以将这种差异和该字符相关联地存储,并且将该字符的显示位置与该字符相关联地存储。另一方面,如果备忘录数据不包含图像数据,则控制单元210跳过步骤S3的处理。接着,控制单元210从备忘录数据中提取字符串(步骤S4)。根据此处理,控制单元210对用户输入的字符(图6中的“标题”)以及在步骤S3识别的字符进行已知的形态分析,以将字符识别为各个单元,每一个单元都形成语素(例如,词性)。接着,控制单元210提取每一个通过在句子中适当地组合连续语素而形成的字符串。应理解的是,字符串在此可以包含可以由字符代码表示的任何项目,并且可以不仅仅包括所谓的字符而且包括数字或者符号。在提取了字符串之后,控制单元210向每一个提取的字符串分配级别(步骤S5)。作为与其它字符串的比较的结果来确定字符串的级别。其它字符串在此可以限于搜索中使用的备忘录数据项目所包含的字符串,尽管也可以包括可假定的各种字符串,与是否被包括在备忘录数据中无关。字符串的级别实质上是指示在搜索中多个字符串中的哪个字符串被认为具有更高优先级的指示符。在从备忘录数据提取的字符串中包含的字符包括诸如大小、颜色、字体体系、显示位置等于显示模式有关的信息的情况下,控制单元210可以在级别上反映这种与显示模式有关的信息。例如,可以假定备忘录数据项目中具有比其它字符更大的大小的字符在此备忘录数据项目中具有更重要的含义。此外,在备忘录数据项目中的特定字符串被下划线或者用与其它字符串的颜色不同的颜色表示的情况下,可以假定由很高的可能性在句子中强调该字符串。因而,在这种字符串被提取的情况下,控制单元210对该字符串设定比其它字符串的级别更闻的级别。此外,控制单元210可以与诸如搜索引擎这样的外部信息源协作进行字符串的排序。例如,可以说有很高的可能性被搜索引擎频繁搜索的字符串指示了流行或者吸引公众注意的项目。因此,在这种字符串被提取的情况下,控制单元210可以将字符串的级别提高到比其它字符串的级别更高。此外,控制单元210可以基于从备忘录数据提取的字符串属于哪个输入字段来进行排序。在图6的示例中,控制单元210可以对写入在“标题”中的字符串设定更高的级别,或者可以对从图像识别出的字符串设定更高的级别。应注意的是,控制单元210可以通过组合基于多个视点的级别来计算整体级别。例如,控制单元210能够根据以上示例性地描述的多个方法多次进行排序,之后,通过进行预定操作(相加、相乘等)来组合根据这些多个方法获得的向每一个字符串指派的级别,从而通过此操作计算出的值被用作级别。 在字符串的排序完成之后,控制单元210从多个字符串提取一个或者更多个关键字(步骤S6)。此时,控制单元210参照向字符串赋予的级别,并且提取一个或者更多个具有较高级别的字符串作为关键字。接着,控制单元210针对这种从多个数据库中的备忘录数据中提取出的关键字进行搜索,并且识别与该关键字相关联的相关数据项目(步骤S7)。如果相关数据项目可以被识别,则控制单元210进一步识别存储了相关数据项目的数据库的级别。应注意的是在步骤S7中,控制单元210可以将所谓的“表达的变化”考虑在内。表达的变化在此指示对具有相同含义的词语或者短语(例如,词语或者短语的同义词或者缩略语)可能使用不同表达方式。即,在从备忘录数据提取的关键字和包含在数据库中的关键字的比较中,不仅仅当它们相同时而且当其中一个是另一个的同义词时,控制单元210可以确定它们彼此匹配。就这一点,控制单元210确定在步骤S7中是否识别了多个相关数据项目(步骤S8),并且依赖于该确定的结果,之后进行不同的操作。在步骤S7识别了单个相关数据项目的情况下,控制单元210使该相关数据项目被输出并且经由通信单元230发送到第一服务器100 (步骤S11)。另一方面,在步骤S7识别了多个相关数据项目的情况下,控制单元210通过组合其中存储了相关数据项目的数据库的级别和与相关数据项目相关联的关键字的级别来计算整体级别(步骤S9),并且仅仅输出具有更高的整体级别的预定数量的相关数据项目(步骤S10)。作为简单示例,组合在此包括将数据库的级别和关键字的级别相加或者相乘。另选地,组合这些级别可以包括通过用不同的预定系数乘以级别来对各个级别加权,并且相加或者相乘经加权的值。应注意的是,在从包含在备忘录数据中的图像数据提取关键字的情况下,控制单元210将包含在图像数据中的关键字的数据与相关数据一起输出。图8是示出向通信终端300发送的相关数据的显示的示例的图。在图8中,字符串“电影ABC影院下午7 00见面”已经被输入在备忘录数据的输入字段“标题”中。在此假定“ABC电影院”是电影院的名称。此外,图像数据对应于电影的海报,并且包含作为电影标题的字符串“XYC”以及字符串“2月27日开始巡回放映”。在此示例中,在备忘录数据的输入字段“细节”中添加了图像数据中识别的字符串。此外,在针对相关数据的搜索中,电影院名称“ABC影院”以及电影的标题“XYZ”被认为是具有比诸如“电影”、“晚7 :00”、“见面”、“2月”、“27日”和“巡回放映”这样的其它字符串更高的优先级。结果,作为相关数据获得的信息项目是与“ABC影院”和“ΧΥΖ”有关的信息项目。通信终端300使显示单元340显示链接LI和L2,以使得能够参照这些信息项目。作为链接LI和L2的选择的结果可以获得的信息项目例如是“ABC影院”和“XYZ”的官方网站,或者示出通过预定搜索引擎“ABC影院”或者“XYZ”的搜索结果的网页。应注意的是,链接LI和L2的显示顺序遵循在上述步骤S9中计算出的整体级别。此外,通信终端300可以根据级别改变相关数据的各个项目的显示信息的显示大小和/或量。例如,通信终端300可以依赖于级别改变显示模式,从而具有更高级别的相关数据项目例如被以更大的字符显示。此外,链接LI和L2的说明可以根据信息的内容改变。例如,在图8的示例中,链接LI和L2的说明的每一个包括字符串“这是与(关键字)有关的信息”。然而,如果链接LI是对“ABC影院”周围的地图的链接,则说明可以是“您可以参照ABC影院周围的地图”;并且如果链接L2是对上映“XYC”的计划表的链接,则说明可以是“您可以参照放映XYZ的计划表”。如在以上描述的,在本示例性实施方式的数据搜索系统10中,可以在没有用户明确的搜索请求的情况下利用备忘录数据的备份来针对相关数据进行搜索,因而将相关数据 添加到备忘录数据中。此外,在数据搜索系统10中,还能够在搜索中使用包含在图像数据中的字符串,并且在备忘录数据上反映字符串的识别结果。此外,在数据搜索系统10中,能够使用对字符串设定的级别或者对数据库设定的级别或者其组合来进行加权搜索。结果,有可能进行其中备忘录数据中包含的字符串中更显眼的字符串被认为具有更高优先级的搜索,或者其中具有与备忘录数据中包含的字符串的更高相关性的数据库被认为具有更高优先级的搜索,因而,有很高的可能性能够提供用户寻求的信息。[变型例I]以上描述的示例性实施方式仅仅是用于进行本发明的示例。可以通过对上述示例性实施方式应用以下的变型例来进行本发明。应注意的是以下变型例可以按照需要以任意组合进行。<变型例1>当向第一服务器100发送备忘录数据时,通信终端300可以与备忘录数据一起发送关于备忘录数据的附加数据。附加数据在此代表数据的发送时间(数据、时间等)、通信终端300的位置以及关于通信终端300的属性中的至少一个。这种数据对应于本发明的附加数据。可以用定位单元370生成的位置信息来表示通信终端300的位置。此外,关于通信终端300的属性不仅仅包括通信终端300自身的属性,而且包括通信终端300的用户的属性(性别、年龄、职业、爱好等)。在后者的情况下,通信终端300预存储了用户的属性。当通信终端300发送这种附加数据时,第二服务器200接收附加数据,并且基于字符串或者数据库的级别来识别相关数据,其中级别是根据接收到的附加数据的内容来确定的。例如,第二服务器200通过使用其中收集了针对每一个区域的信息项目的数据库或者优先级等级依赖于性别、年龄等改变的数据库,针对相关数据进行搜索。此外,在备忘录数据包含与位置信息代表的位置或者发送时间紧密相关的字符串的情况下,第二服务器200可以提高该字符串的级别。例如,在备忘录数据的发送时间是夏天并且备忘录数据包含与夏天有关的字符串(诸如“夏天度假”或者“海水浴”)的情况下,第二服务器向字符串分配级别使得这种字符串的级别被提闻。图9是示出其级别依赖于性别而改变的数据库的示例的图。在图9的示例中,数据库DBl是针对男性级别高而针对女性级别低的数据库。另一方面,数据库DB2是针对女性级别高而针对男性级别低的数据库。即,在本示例中,数据库DBl是其中收集了主要定位于男性的信息项目的数据库,数据库DB2是其中收集了主要定位于女性的信息项目的数据库。在此情况下,如果发送备忘录的通信终端300的用户是女性,则第二服务器200在进行涉及备忘录数据的搜索中使用具有更高优先级的数据库DB2。<变型例2>以上描述的数据搜索系统10被配置为包括不同的服务器;即,第一服务器100和第二服务器200。然而,本发明的服务器装置可以使第一服务器100和第二服务器200的功能实现在单个装置中。此外,以上描述的示例性实施方式中向第二服务器200提供的一些 功能可以被作为第一服务器100的功能实现。例如,在备忘录数据被发送到第二服务器200之前,识别包含在图像中的字符串的功能(步骤S2-S4)或者对字符串排序的功能(步骤S5)可以由服务器100预先执行。换句话说,可以说这些功能对于本发明的数据搜索装置而言不是不可或缺的。应注意的是步骤S2-S5的处理可以在通信终端300中执行而不是在第一服务器100中或者在第二服务器200中。<变型例3>本发明不必要求向字符串的组和数据库的组分配级别,并且如果这些组中的至少一个被分配了级别则本发明可以实现。在本发明中,在字符串的组或者数据库的组不被分配级别的情况下,不必使用未被分配级别的一个组的多个成员。例如,在本发明中,在搜素中使用多个分级别数据库的情况下,从备忘录数据中提取的字符串(关键字)的数量可以仅仅是一个。类似地,在本发明中,在搜素中使用多个分级别关键字的情况下,数据库的数量可以仅仅是一个。此外,在本发明中,在使用了多个数据库的情况下,多个数据库逻辑上彼此区分就足够了,这些数据库不必被配置为物理上彼此隔开。因此,这些数据库不必分别被存储在存储单元中,而是可以作为独立的数据集合体被存储在同一存储单元中。此外,字符串或者数据库的级别可以是使相同级别被分配到不同的字符串或者数据库。例如,在从备忘录数据中提取三个字符串的情况下,这些字符串的级别可以是使其中特定一个的级别高并且其它两个的级别相同。<变型例4>不必通过使用备忘录数据的备份来进行本发明。即,类似于通常的数据搜索,本发明可以被进行为,当外部终端的用户请求搜索时,作为对此请求的响应进行针对相关数据的搜索。<变型例5>本发明可以不仅仅是数据搜索装置、服务器装置或者包括数据搜索装置的数据搜索系统,而且是用于实现它们的方法或者用于使计算机执行图5所示的功能的程序。可以以诸如光盘这样的存储了程序的存储介质的形式提供这种程序,或者可以被提供以经过诸如因特网这样的网络被下载到计算机上,以安装在计算机上。
权利要求
1.一种数据搜索装置,所述数据搜索装置包括 数据获取单元,其获取包含一个或更多个字符串的输入数据; 关键字提取单元,其根据预设规则从包含在所述数据获取单元获取的所述输入数据中的所述一个或更多个字符串中提取一个或更多个关键字; 数据识别单元,其针对所述关键字提取单元提取的所述一个或更多个关键字在彼此关联地存储了所述关键字和相关数据项目的数据库中进行搜索,并且识别与所述一个或更多个关键字相关联的相关数据项目,其中,所述相关数据项目是与所述关键字有关的数据项目;以及 数据输出单元,其输出被所述数据识别单元识别的相关数据项目作为与所述输入数据相对应的数据。
2.根据权利要求1所述的数据搜索装置,其中,所述关键字提取单元向包含在所述数据获取单元获取的所述输入数据中的所述一个或更多个字符串中的每一个字符串分配级别,并且提取具有较高级别的字符串作为所述关键字。
3.根据权利要求2所述的数据搜索装置,其中,级别是根据每一个字符串的显示模式或者输入字段来确定的。
4.根据权利要求1所述的数据搜索装置,其中, 存在多个数据库, 为所述多个数据库中的每一个数据库分配了级别,以及 所述数据识别单元通过向在具有较高级别的数据库中进行的搜索的结果赋予较高的优先级来识别所述相关数据项目。
5.根据权利要求2所述的数据搜索装置,其中, 存在多个数据库, 为所述多个数据库中的每一个数据库分配了级别,以及 所述数据识别单元通过将所述数据库的级别和所述关键字的级别进行组合来识别所述相关数据项目。
6.根据权利要求1所述的数据搜索装置,其中, 所述数据获取单元获取从终端发送的输入数据,以及表示发送时间、该终端的位置和与该终端有关的属性中的至少一个的附加数据,并且 所述数据识别单元根据基于所述附加数据而确定的级别来识别所述相关数据项目。
7.一种数据搜索方法,所述数据搜索方法包括以下步骤 获取包含一个或更多个字符串的输入数据; 根据预设规则从包含在所获取的输入数据中的所述一个或更多个字符串中提取一个或更多个关键字; 针对所提取的一个或更多个关键字在彼此关联地存储了所述关键字和相关数据项目以能够搜索的数据库中进行搜索,并且识别与所述一个或更多个关键字相关联的相关数据项目,其中,所述相关数据项目是与所述关键字有关的数据项目;以及输出所识别的相关数据项目作为与所述输入数据相对应的数据。
8.一种使计算机执行以下步骤的程序 获取包含一个或更多个字符串的输入数据;根据预设规则从包含在所获取的输入数据中的所述一个或更多个字符串中提取一个或更多个关键字; 针对所提取的一个或更多个关键字在彼此关联地存储了所述关键字和相关数据项目以能够搜索的数据库中进行搜索,并且识别与所述一个或更多个关键字相关联的相关数据项目,其中,所述相关数据项目是与所述关键字有关的数据项目;以及 输出所识别的相关数据项目作为与所述输入数据相对应的数据。
全文摘要
公开了一种基于从或用户发送的信息进行加权搜索从而能够提出用户有可能寻求的信息的数据搜索装置。数据搜索装置获取要在搜索中使用的备忘录数据(S1),从备忘录数据中提取关键字(S4)接着对关键字分配级别(S5)。数据搜索装置在多个数据库中针对关键字进行搜索以识别相关数据(S6)。类似于关键字,数据库被排序。当多个相关数据项目被识别时,数据搜索装置基于相关数据项目的搜索中使用的关键字的级别和数据库的级别来计算整体级别(S8),并且输出具有较高级别的相关数据项目(S9)。
文档编号G06F17/30GK102893280SQ20118002385
公开日2013年1月23日 申请日期2011年5月12日 优先权日2010年5月14日
发明者森松亚佳, 桥田直树, 铃木贯太郎, 山本美沙 申请人:株式会社Ntt都科摩
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1