联想辞典制作装置的制作方法

文档序号:6655329阅读:257来源:国知局
专利名称:联想辞典制作装置的制作方法
技术领域
本发明涉及制作联想辞典的联想辞典制作装置,该联想辞典保存有存储在数据库中的信息中的单词相互间的关联。
背景技术
以往,作为制作用于检索数据库的联想辞典的方法,已知有通过人手工检查数据库的信息的单词相互间的关系而制作辞典的方法、以及对电子化文本中的所有单词利用出现频率信息等自动地制作联想辞典的方法等。此外,还公开了下述文本处理装置,该文本处理装置为了制作各领域的联想辞典而由用户输入检索条件,以符合所输入的检索条件的文本为对象来制作联想辞典,从而能够制作符合检索条件所表示的领域的联想辞典(例如参照专利文献1)。此外,公开了下述联想辞典制作装置,该联想辞典制作装置为了与个人的需求对应,通过增加从用户所输入的检索关键字和用户从与其对应的多个关联词候补中选择的关联词之间的关联度,能够制作适应于用户的联想辞典(例如参照专利文献2)。
专利文献1日本特开平10-134075号公报专利文献2日本特开2000-348042号公报但是,在以往的制作并利用各领域的联想辞典的文本处理装置中,为了制作各领域的联想辞典而需要用户输入检索条件。因此,在制作符合用户嗜好的领域的联想辞典的情况下,用户为了取得精度较高的联想辞典而必须输入表示领域的最合适的检索条件。这样考虑最合适的检索条件对于用户来说是非常困难的。例如,频繁地视听新闻或文娱信息、经济市场状况等信息节目的用户,为了获得符合嗜好的高精度的联想辞典,作为检索条件,不知道输入“新闻”、“文娱”、“经济”、“信息”的哪一个为好。
此外,在通过用户选择对检索关键字的关联词而自动地变更关联度来制作适合于用户的联想辞典的以往的联想辞典制作装置中,用户在取得适合的辞典之前必须输入与嗜好匹配的全检索关键字并选择与该检索关键字对应的关联词,直到精度提高,从而用户的负担较大。例如,在对一个演出者姓名建立关联并保存了多个演出者姓名的联想辞典的情况下,为了提高联想辞典的精度,用户必须对多个演出者选择保存在联想辞典中的演出者姓名和从该演出者姓名联想到的演出者,用户的负担较大。

发明内容
所以,本发明是鉴于上述情况而做出的,目的是提供一种能够简单且有效地制作与用户嗜好相匹配的联想辞典的联想辞典制作装置。
为了达到上述目的,有关本发明的联想辞典制作装置是制作联想辞典,该联想辞典存储多个单词间的关系的联想辞典制作装置,其特征在于,具备单词选择机构,从表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词,作为关联词候补;关联词保存机构,根据保存有作为检索对象的信息的数据库,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词与上述关联词建立关联,保存到联想辞典中。由此,能够简单且有效地制作与用户嗜好相匹配的联想辞典。
发明效果由以上的说明可知,根据有关本发明的联想辞典制作装置,能够简单且有效地制作联想辞典,该联想辞典保存有与用户嗜好相匹配的单词。


图1是表示包括有关本发明的实施方式1的联想辞典制作装置的信息检索装置的结构的框图。
图2是表示保存在联想辞典存储部中的联想辞典的一例的图。
图3是表示保存在简档(profile)存储部中的简档的一例的图。
图4是表示在实施方式1的信息检索装置中制作联想辞典时的动作的流程的流程图。
图5是表示在实施方式1的信息检索装置中检索信息时的动作的流程的流程图。
图6是表示保存在联想辞典存储部中的联想辞典的一例的图。
图7是表示包括有关本发明的实施方式2的联想辞典制作装置的信息检索装置的结构的框图。
图8是表示在实施方式2的信息检索装置中制作联想辞典时的动作的流程的流程图。
图9是表示保存在联想辞典存储部中的联想辞典的一例的图。
图10是表示由实施方式2、4的信息检索装置检索的内容的一例的图。
图11是表示实施方式2、4的信息检索装置的(a)在显示部中显示的内容的一例、(b)保存在显示内容存储部中的内容的一例的图。
图12是表示实施方式2、4的信息检索装置的(a)在显示部中显示的内容的一例、(b)保存在显示内容存储部中的内容的一例的图。
图13是表示包括有关本发明的实施方式3的联想辞典制作装置的信息检索装置的结构的框图。
图14是表示在实施方式3的信息检索装置中制作联想辞典时的动作的流程的流程图。
图15是表示保存在联想辞典存储部中的联想辞典的一例的图。
图16是表示包括有关本发明的实施方式3的联想辞典制作装置的信息检索装置的其他结构的框图。
图17是表示包括有关本发明的实施方式4的联想辞典制作装置的信息检索装置的结构的框图。
图18是表示在实施方式4的信息检索装置中制作联想辞典时的动作的流程的流程图。
符号说明101内容存储部102联想辞典存储部103、201、301、401联想辞典制作部104简档存储部105、203、304 单词选择部106、305 关联度计算部107输入部108联想检索部109检索条件生成部110检索部202显示内容存储部204显示部205画面制作部206广播波接收部302嗜好内容提取部303嗜好符合信息存储部
具体实施例方式
有关本发明的联想辞典制作装置是制作联想辞典,该联想辞典存储多个单词间的关系的联想辞典制作装置,其特征在于,具备单词选择机构,从表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词,作为关联词候补;关联词保存机构,根据保存有作为检索对象的信息的数据库,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词与上述关联词建立关联,保存到联想辞典中。由此,能够简单且有效地制作与用户嗜好相匹配的联想辞典。
这里,上述单词选择机构也可以从保存有表示用户嗜好的信息的简档中取得上述表示用户嗜好的信息。由此,能够简单地取得表示用户嗜好的信息。
此外,上述关联词保存机构也可以根据在上述数据库中的出现频率,分别计算上述关联词探索单词和上述关联词候补之间的关联度,选择计算出的关联度为阈值以上的上述关联词候补,作为与上述关联词探索单词相关联的关联词。由此,能够选择关联度较高的关联词,能够制作存储有关联度较高的关联词的联想辞典。
此外,上述联想辞典制作装置也可以还具备显示信息提取机构,该显示信息提取机构提取与用户所阅览的显示有关的信息;上述单词选择机构将由上述显示信息提取机构提取的与上述显示有关的信息作为上述表示用户嗜好的信息,从与上述显示有关的信息中选择任意的单词作为关联词探索单词,选择包含在与上述显示有关的信息中的除上述关联词探索单词以外的单词,作为关联词候补。由此,能够从与用户所阅览的显示有关的信息中提取表示用户嗜好的信息。
此外,上述联想辞典制作装置也可以还具备检索机构,该检索机构从上述数据库中检索符合检索条件的信息;上述用户所阅览的显示是信息检索的结果;上述显示信息提取机构提取与上述信息检索的结果有关的信息,作为与上述显示有关的信息。由此,能够从与由用户进行的信息检索的结果有关的信息中取得表示用户嗜好的信息。
此外,上述显示信息提取机构也可以从上述信息检索的结果中提取在显示画面上显示规定时间以上的信息,作为与上述显示有关的信息。由此,能够将例如仅以较少的时间显示的信息等不判断为由用户阅览的信息而将其排除。
此外,上述用户所阅览的显示也可以是播放节目;上述显示信息提取机构提取与上述播放节目有关的信息,作为与上述显示有关的信息。由此,能够制作适应于用户的视听行为的联想辞典。
此外,上述显示信息提取机构也可以从上述播放节目中提取与在显示画面上显示规定时间以上的播放节目有关的信息,作为与上述显示有关的信息。由此,能够将例如仅以较少的时间显示的播放节目等不判断为由用户视听的信息而将其排除。
此外,上述联想辞典制作装置也可以还具备嗜好符合信息提取机构,该嗜好符合信息提取机构利用保存有表示用户嗜好的信息的简档,从上述数据库中提取符合用户嗜好的信息,作为嗜好符合信息;上述关联词保存机构参照从上述数据库中提取的上述嗜好符合信息,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词和上述关联词建立关联并保存到联想辞典中。由此,能够制作使单词的关联程度适合于用户的联想辞典。
此外,上述单词选择机构也可以将由上述嗜好符合信息提取机构提取的上述嗜好符合信息作为上述表示用户嗜好的信息,从上述嗜好符合信息中选择任意的单词作为关联词探索单词,选择包含在上述嗜好符合信息中的除上述关联词探索单词以外的单词作为关联词候补。由此,能够制作仅存储有符合用户喜好的单词的联想辞典。
此外,上述单词选择机构也可以从保存有表示用户嗜好的信息的简档中取得上述表示用户嗜好的信息,从上述表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词作为关联词候补。由此,能够制作仅存储有符合用户喜好的单词的联想辞典。
此外,上述联想辞典制作装置也可以还具备显示信息提取机构,提取与用户所阅览的显示有关的信息;嗜好符合信息提取机构,利用保存有表示用户嗜好的信息的简档,从上述数据库中提取符合用户嗜好的信息作为嗜好符合信息;上述单词选择机构将由上述显示信息提取机构提取的与上述显示有关的信息作为上述表示用户嗜好的信息,从与上述显示有关的信息中选择任意的单词作为关联词探索单词,选择包含在与上述显示有关的信息中的除上述关联词探索单词以外的单词作为关联词候补;上述关联词保存机构参照从上述数据库中提取的上述嗜好符合信息,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词和上述关联词建立对应并保存到联想辞典中。由此,能够制作联想辞典,该联想辞典仅存储与用户的视听行为适应的单词,并且单词的关联程度适应于用户嗜好。
另外,本发明不仅可以作为这种联想辞典制作装置来实现,也可以作为以这种联想辞典制作装置所具备的特征性机构为步骤的联想辞典制作方法来实现,或者作为使计算机执行这些步骤的程序来实现。并且,不言而喻,这种程序能够经由CD-ROM等记录介质或因特网等传送媒体发送。
下面对本发明的各实施方式分别参照附图进行说明。
(实施方式1)图1是表示包括有关本发明的实施方式1的联想辞典制作装置的信息检索装置的结构的框图。
该信息检索装置是用来制作保存有单词相互间的关联的联想辞典、并且利用联想辞典进行信息检索的装置,如图1所示,包括内容存储部101、联想辞典存储部102、联想辞典制作部103、输入部107、联想检索部108。
内容存储部101保存有与电视播放节目有关的信息及与储存在硬盘录制机等中的内容有关的信息等。
联想辞典存储部102对保存在内容存储部101中的内容内的多个单词保存有表示反映了用户嗜好的单词间的关系的联想辞典。图2是表示保存在联想辞典存储部102中的联想辞典的一例的图。在联想辞典存储部102中,例如如图2所示,将有关联的单词设为组的关联词对(关联词1、关联词2)和表示关联词对的关联程度的关联度建立对应并保存,作为(关联词对、关联度),保存有((松下太郎、松下次郎)、80)、(松下太郎、松下花子)、70)、(松下次郎、松下花子)、90)、(松下次郎、松下三郎)、80)、……。
联想辞典制作部103是联想辞典制作装置,该联想辞典制作装置对于保存在内容存储部101中的内容,计算从与用户嗜好有关的信息即简档(profile)提取的单词对的关联度,将作为计算对象的单词对和计算出的关联度建立对应并保存在联想辞典存储部102中,具备简档存储部104、单词选择部105、以及关联度计算部106。
简档存储部104保存有与用户嗜好有关的信息即简档。作为一例,在简档中包含有用户喜好的内容所属的类型、喜好的标题及演出者、视听时间等,保存有与各个数据(类型、标题、演出者、视听时间等)建立了对应的表示喜好程度的权重值等。图3是表示保存在简档存储部104中的简档的一例的图。在简档中,例如如图3所示,将表示数据的种类的标记、数据、和表示用户对数据的喜好程度的权重值建立对应并存储,作为(标记、数据、权重值),保存有((<演出者姓名>、松下太郎、90)、(<演出者姓名>、松下次郎、85)、(<演出者姓名>、松下三郎、80)、(<演出者姓名>、松下花子、80)、(<类型>、电视剧、90)、(<播放时间>、12:00~13:00、90)、……)。
单词选择部105每到规定的时间就从保存在简档存储部104中的简档中选择单词,作为关联词探索单词,再选择包含在简档中的除关联词探索单词以外的单词,作为关联词候补。作为一例,单词选择部105从保存在简档存储部104中的图3的简档中选择数据作为关联词探索单词,再选择包含在简档中的除关联词探索单词以外的单词,作为关联词候补。此外,也可以仅将权重值为规定的阈值以上的数据作为对象,设置关联词探索单词和关联词候补。
关联度计算部106参照保存在内容存储部101中的内容,计算由单词选择部105选择的关联词探索单词和关联词候补的单词之间的关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词设为关联词对,将关联词对和关联度建立对应并保存在联想辞典存储部102中。这里,作为关联度的计算方法,例如有利用相互信息量(MI)的方法。具体而言,如果设包含有单词W1和单词W2的内容数为a、不包含单词W1而包含单词W2的内容数为b、包含单词W1而不包含单词W2的内容数为c、不包含单词W1和单词W2两者的内容数为d、总内容数为N(=a+b+c+d),则可以通过MI=log2(aN/((a+b)(a+c))求出。此外,作为一般的关联度的计算方法,也有利用Dice-coefficient、加权Dice-coefficient、t-score、χ平方值、对数似然比等的方法。此外,关联度计算部106也可以参照保存在内容存储部101中的内容,分别对由单词选择部105选择的关联词探索单词和关联词候补的单词,将单词的前后文本分解为词素或单词,生成以词素或单词的有无、出现次数、和将出现频率(tf值)与idf(inverse document frequency逆文本频率)值相乘后的tfi·idf值等为成分的矢量,计算关联词探索单词的矢量与关联词候补的各单词的矢量间的余弦距离或欧几里得距离的倒数等,作为关联度。
输入部107包括键盘及鼠标、遥控器等输入装置,用户输入包括检索关键字的检索条件及输入数据。
联想检索部108是下述处理部从联想辞典存储部102取得从输入部107输入的检索条件和与包含在检索条件中的检索关键字相关联的关联词,生成检索扩展条件,从内容存储部101取得与检索扩展条件匹配的内容,作为检索结果进行输出,该联想检索部108具备检索条件生成部109及检索部110。
检索条件生成部109从联想辞典存储部102取得以规定的阈值以上的关联度与包含在从输入部107输入的检索条件中的检索关键字建立了对应的关联词,根据所取得的关联词和检索关键字生成检索扩展条件。
检索部110从内容存储部101取得与由检索条件生成部109生成的检索条件匹配的内容,作为检索结果。
在这样构成的本实施方式的信息检索装置中,对于制作联想辞典时的动作例进行说明。图4是表示制作联想辞典时的动作的流程的流程图。
单词选择部105每到规定的时间就从保存在简档存储部104中的简档中选择单词,作为关联词探索单词,再选择包含在简档中的除关联词探索单词以外的单词,作为关联词候补(步骤S101)。作为具体的一例,单词选择部105每隔作为规定的时间的1周,从保存在简档存储部104中的图3的简档中,将单词“松下太郎、松下次郎、……”作为关联词探索单词,再对于关联词探索单词“松下太郎”,将包含在图3的简档中的除关联词探索单词“松下太郎”以外的单词“松下次郎、松下三郎、松下花子、电视剧、12:00~13:00、……”作为关联词候补,同样,对于其他关联词探索单词“松下次郎、松下三郎、……”也选择关联词候补。
关联度计算部106参照保存在内容存储部101中的内容,计算由单词选择部105选择的关联词探索单词和关联词候补的单词之间的关联度(步骤S102),判断关联度是否比规定的阈值大(步骤S103)。结果,在关联度比规定的阈值大的情况下(步骤S103中的“是”),将关联词探索单词和关联词候补的单词作为关联词对,将该关联词对和关联度建立对应并保存到联想辞典存储部102中(步骤S104)。另一方面,在关联度为规定的阈值以下的情况下(步骤S103中的“否”),什么处理都不进行。对包含在关联词候补中的所有单词进行这些处理(步骤S102~步骤S104)(步骤S105),再对所有的关联词探索单词进行这些处理(步骤S102~步骤S105)(步骤S106)。在上述的例子中,关联度计算部106参照保存在内容存储部101中的内容,对于由单词选择部105选择的各个关联词探索单词“松下太郎、松下次郎、……”,计算与各个关联词候补“松下次郎、松下三郎、松下花子、电视剧、12:00~13:00、……”、“松下太郎、松下三郎、松下花子、电视剧、12:00~13:00、……”、……的各单词之间的关联度。作为一例,计算出(关联词探索单词、关联词候补的单词、关联度)为(松下太郎、松下次郎、80)、(松下太郎、松下三郎、40)、(松下太郎、松下花子、70)、(松下太郎、电视剧、20)、(松下太郎、12:00~13:00、30)、(松下次郎、松下太郎、80)、(松下次郎、松下三郎、80)、(松下次郎、松下花子、90)、(松下次郎、电视剧、10)、(松下次郎、12:00~13:00、40)、……,将关联度比规定的阈值(作为一例而设为50)大的(关联词探索单词、关联词候补的单词、关联度)保存到联想辞典存储部102中。此时的联想辞典存储部102的内容如图2所示。
接着,说明在本实施方式的信息检索装置中检索信息时的动作例。图5是表示检索信息时的动作的流程的流程图。
检索条件生成部109受理由用户从输入部107输入的检索条件(步骤S201)。在上述的例子中,作为一例,假设由用户从输入部107输入了检索条件“松下太郎的节目”。
接着,检索条件生成部109从联想辞典存储部102取得以规定的阈值以上的关联度与包含在从输入部107输入的检索条件中的检索关键字建立了对应的关联词(步骤S202)。接着,检索条件生成部109根据所取得的关联词和检索关键字,生成检索扩展条件(步骤S203)。在上述的例子中,检索条件生成部109从联想辞典存储部102取得以规定的阈值(作为一例设规定的阈值为75)以上的关联度与包含在从输入部107输入的检索条件“松下太郎的节目”中的检索关键字“松下太郎”建立了对应的关联词“松下次郎”,生成检索扩展条件“松下太郎+松下次郎”,该检索扩展条件“松下太郎+松下次郎”表示包含有所取得的关联词“松下次郎”或检索关键字“松下太郎”的任一个。
检索部110从内容存储部101取得与由检索条件生成部109生成的检索条件匹配的内容,作为检索结果(步骤S204)。在上述的例子中,检索部110根据由检索条件生成部109生成的检索条件“松下太郎+松下次郎”,从内容存储部101中取得包含有“松下太郎”或“松下次郎”的任一个关键字的内容,作为检索结果。
另外,在本实施方式中,单词选择部105每隔规定的时间从保存在简档存储部104中的简档中选择关联词探索单词和关联词候补,但也可以不是每隔规定的时间,而是每当更新简档时选择关联词探索单词和关联词候补。通过这样,能够在用户嗜好变化时不产生时间差地取得关联词对。
此外,在本实施方式中,关联度计算部106对由单词选择部105选择的关联词探索单词和关联词候补的所有单词,计算关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词作为关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部102中,但并不限于此。例如,关联度计算部106也可以在计算由单词选择部105新选择的关联词对和其关联度时,在使存储在联想辞典存储部102中的所有关联度都衰减后,在联想辞典存储部102中已经存在与新计算了关联度的关联词对相同的关联词对的情况下,通过将已经存储在联想辞典存储部102中的关联度和由关联度计算部106新求出的关联度相加来更新。在此情况下,在关联度计算部106中,在作为(关联词探索单词、关联词候补的单词、关联度)而新计算出(松下太郎、松下次郎、60)的情况下,将存储在图2所示的联想辞典存储部102中的关联度乘以衰减参数(作为一例为0.8)而使其衰减,将已经存在的关联词对(松下太郎、松下次郎)的衰减后的关联度64与新求出的关联度60相加后的值124作为关联词对(松下太郎、松下次郎)的关联度,保存到联想辞典存储部102中。结果,联想辞典存储部102的内容如图6所示那样被更新。通过这样,能够得到考虑到对过去的内容的关联度的关联度,能够提高关联度的精度。
此外,例如也可以对由单词选择部105选择的关联词探索单词和关联词候补的所有单词,计算关联度,不论关联度是否比规定的阈值大,都将关联词探索单词和关联词候补的单词作为关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部102中。另外,如本实施方式那样,如果在关联度比规定的阈值大的情况下将关联词对和关联度建立对应并存储到联想辞典存储部102中,则能够减小存储容量。
如上所述,根据本实施方式,通过从表示用户嗜好的信息即简档中选择保存在联想辞典中的单词,能够制作仅保存符合用户喜好的单词的联想辞典。进而,在用户检索内容时,通过利用该制作的联想辞典,能够利用符合用户嗜好的单词进行检索条件的扩展。由此,能够使扩展后的检索结果符合用户嗜好。
(实施方式2)图7是表示包括有关本发明的实施方式2的联想辞典制作装置的信息检索装置的结构的框图。这里,与实施方式1相同标号的结构要素进行相同的动作,省略对它们的详细的说明。
本实施方式的信息检索装置是用来制作保存有单词相互间的关联的联想辞典、并且利用联想辞典进行信息检索的装置,如图7所示,包括内容存储部101、联想辞典存储部102、输入部107、联想检索部108、联想辞典制作部201、显示部204、画面制作部205、以及广播波接收部206。
显示部204具有CRT显示器、液晶显示器(LCD)、等离子显示器(PDP)等,是显示所输入的显示画面信息的设备。广播波接收部206经由天线207接收电视播放节目等内容。
画面制作部205将由检索部110检索到的检索结果变换为显示画面信息,将显示画面信息输出给显示部204,并且将由广播波接收部206接收到的电视播放节目等内容输出给显示部204。进而,画面制作部205提取与由检索部110检索到的检索结果有关的文本信息及与显示在显示部204上的电视播放节目等内容有关的信息,作为与显示有关的信息,保存到显示内容存储部202中。
联想辞典制作部201是下述联想辞典制作装置对于保存在内容存储部101中的内容,计算从所显示的检索结果提取的单词对的关联度,将作为计算对象的单词对和计算出的关联度建立对应并保存到联想辞典存储部102中,该联想辞典制作部201具备显示内容存储部202、单词选择部203、以及关联度计算部106。
显示内容存储部202存储与显示的检索结果有关的文本信息及与显示的内容有关的信息、即与显示有关的信息。单词选择部203每当在显示内容存储部202中保存新的文本信息时,通过对该文本信息进行词素解析等来提取单词,从该提取的单词选择单词,作为关联词探索单词,再在提取的单词中生成以除关联词探索单词以外的单词作为关联词候补的多个组。
关联度计算部106参照保存在内容存储部101中的内容,计算由单词选择部203选择的关联词探索单词和关联词候补的单词之间的关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词做成关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部102中。这里,作为关联度的计算方法,采用与实施方式1同样的方法。
说明在这样构成的本实施方式的信息检索装置中制作联想辞典时的动作例。图8是表示制作联想辞典时的动作的流程的流程图。
这里,画面制作部205设为将由检索部110检索到的检索结果变换为显示画面信息,将显示画面信息输出给显示部204,或者将由广播波接收部206接收到的电视播放节目的内容输出给显示部204。作为一例,在显示检索结果的情况下,假设由用户输入检索条件“松下太郎的节目”,检索结果为“松下太郎”演出的动画内容和动画内容的说明即文本“演出松下太郎、松下花子、松下三郎”。另一方面,在显示电视播放节目等内容的情况下,假设作为有关内容的文本信息而显示具有“演出松下次郎、松下花代”的内容。
首先,画面制作部205在显示由检索部110检索的检索结果的情况下,将有关检索结果的文本信息作为与显示有关的信息保存到显示内容存储部202中,在显示由广播波接收部206接收到的内容的情况下,将有关内容的文本信息作为与显示有关的信息保存到显示内容存储部202中(步骤S301)。另外,在显示由广播波接收部206接收到的内容的情况下,也可以是如果显示了规定时间(例如10分钟等)以上,则将有关内容的文本信息保存到显示内容存储部202中。在显示上述例子的检索结果的情况下,画面制作部205将由检索部110检索到的“松下太郎”演出的动画内容的说明即文本“演出松下太郎、松下花子、松下三郎”保存到显示内容存储部202中。此外,在显示上述例子的由广播波接收部206接收到的内容的情况下,将“演出松下次郎、松下花代”保存到显示内容存储部202中。
从画面制作部205将文本信息保存到显示内容存储部202中后,单词选择部203通过对该文本信息进行词素解析等而提取单词,从该提取的单词中选择单词作为关联词探索单词,再在所提取的单词中生成以除关联词探索单词以外的单词作为关联词候补的多个组(步骤S302)。例如,在将文本“演出松下太郎、松下花子、松下三郎”保存到显示内容存储部202中的情况下,单词选择部203通过对“演出松下太郎、松下花子、松下三郎”进行词素解析,提取例如表示姓名的单词“松下太郎、松下花子、松下三郎”,生成(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),作为(关联词探索单词、(关联词候补))。
关联度计算部106参照保存在内容存储部101中的内容,计算由单词选择部105选择的关联词探索单词和关联词候补的单词之间的关联度(步骤S303),判断关联度是否比规定的阈值大(步骤S304)。在其结果为关联度比规定的阈值大的情况下(步骤S304中的“是”),将关联词探索单词和关联词候补的单词作为关联词对,将该关联词对和关联度建立对应并保存到联想辞典存储部102中(步骤S305)。这里,新计算了关联度的关联词对由于有1个单词作为关联词探索单词的情况和作为关联词候补的单词的情况,所以会发生重复,在省略了该重复后保存到联想辞典存储部102中。另一方面,在关联度为规定的阈值以下的情况下(步骤S304中的“否”),不进行任何处理。对包含在关联词候补中的所有单词进行这些处理(步骤S303~步骤S305)(步骤S306)。再对所有关联词探索单词进行这些处理(步骤S303~步骤S306)(步骤S307)。在上述的例子中,关联度计算部106参照保存在内容存储部101中的内容,对于由单词选择部105选择的(关联词探索单词、(关联词候补))的组即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),计算各个关联词探索单词和关联词候补的各单词之间的关联度。作为一例,计算(关联词探索单词、关联词候补的单词、关联度)为(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),将关联度比规定的阈值(作为一例而设为50)大的(关联词探索单词、关联词候补的单词、关联度)加到将保存在图2所示的联想辞典存储部102中的关联度乘以衰减参数(作为一例为0.8)而衰减后的联想辞典存储部102中。此情况的联想辞典存储部102的内容成为图9所示那样。
另外,在本实施方式中,关联度计算部106在更新联想辞典存储部102时,在将存储在联想辞典存储部102中的所有关联度衰减后,在联想辞典存储部102中已经存在与新计算了关联度的关联词对相同的关联词对的情况下,将已经保存在联想辞典存储部102中的关联度与由关联度计算部106新求出的关联度相加而进行更新,但并不限于此。例如,关联度计算部106也可以将新计算了关联度的关联词对原样与关联度建立对应并保存到联想辞典存储部102中。
此外,在本实施方式中检索了动画内容,但并不限于此,也可以是超文本或因特网上的WEB页。在此情况下,画面制作部205将由检索部110检索到的超文本或WEB页的显示文本保存到显示内容存储部202中,再将检索到的超文本或WEB页的文本变换为显示画面信息,将显示画面信息输出给显示部204。作为具体的一例,在由检索部110检测到由图10所示的HTML语言记述的文件“name.html”的情况下,画面制作部205从文件“name.html”将图11(b)所示的显示文本“松下太郎、松下花子、松下三郎、松下次郎”保存到显示内容存储部202中,再将文件“name.html”变换为显示画面信息,在显示部204上如图11(a)所示那样输出显示画面信息。进而,在显示部204上没有显示全部文本的情况下,画面制作部205也可以仅将显示的文本保存到显示内容存储部202中。在上述的实施例中,在作为一例而如图12(a)所示那样显示由图10的HTML语言记述的文件“name.html”的情况下,画面制作部205如图12(b)所示那样仅将显示文本“松下太郎、松下花子、松下三郎”保存到显示内容存储部202中。通过这样,能够仅根据从用户视听到的内容的文本提取的单词来制作联想辞典,能够制作适应于用户的视听行为的联想辞典。此外,画面制作部205也可以将在显示部204上显示了规定时间以上的文本作为显示的文本来处理。由此,能够去除仅在滚动时显示而没有被用户阅览的文本。
此外,画面制作部205将与由检索部110检索的内容有关的文本信息保存在显示内容存储部202中,但在内容为动画内容且存在与动画内容的各场景或每个帧对应的文本的情况下,画面制作部205也可以仅将与用户视听的动画内容的场景或帧对应的文本保存到显示内容存储部202中。通过这样,能够仅根据与用户视听的动画内容的场景或帧对应的文本制作联想辞典,能够对于动画内容制作适应于用户的视听行为的高精度的联想辞典。
如上所述,根据本实施方式,通过从与用户视听的内容有关的文本中选择保存到联想辞典中的单词,能够制作适应于用户的视听行为的联想辞典。进而,用户在检索内容时通过利用该制作的联想辞典,能够利用与用户的视听行为相匹配的单词进行检索条件的扩展。由此,能够使扩展后的检索结果适应于用户的视听行为。
(实施方式3)图13是表示包括有关本发明的实施方式3的联想辞典制作装置的信息检索装置的结构的框图。这里,与实施方式1相同标号的结构要素进行相同的动作,省略对它们的详细的说明。
本实施方式的信息检索装置是用来制作保存有单词相互间的关联的联想辞典、并且利用联想辞典进行信息检索的装置,如图13所示,包括内容存储部101、联想辞典存储部102、输入部107、联想检索部108、以及联想辞典制作部301。
联想辞典制作部301是下述联想辞典制作装置从保存在内容存储部101中的内容中提取嗜好符合信息作为有关与用户嗜好匹配的内容的文本,再对嗜好符合信息计算从嗜好符合信息提取的单词对的相关度,将作为计算对象的单词对和计算出的关联度建立对应并保存到联想辞典存储部102中,该联想辞典制作部301具备简档存储部104、嗜好内容提取部302、嗜好符合信息存储部303、单词选择部304、以及关联度计算部305。
嗜好符合信息存储部303保存有关与用户嗜好匹配的内容的文本即嗜好符合信息。嗜好内容提取部302从保存在内容存储部101中的内容中,利用保存在简档存储部104中的与用户嗜好有关的信息即简档,提取有关与用户嗜好匹配的内容的文本即嗜好符合信息,保存到嗜好符合信息存储部303中。
单词选择部304对于保存在嗜好符合信息存储部303中的嗜好符合信息,通过进行词素解析等提取单词,从该提取的单词中选择单词作为关联词探索单词,再在所提取的单词中生成以除关联词探索单词以外的单词作为关联词候补的多个组。
关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,计算由单词选择部304选择的关联词探索单词和关联词候补的单词之间的关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词作为关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部102中。这里,作为关联度的计算方法,采用与实施方式1同样的方法。
说明在这样构成的本实施方式的信息检索装置中制作联想辞典时的动作例。图14是表示制作联想辞典时的动作的流程的流程图。
嗜好内容提取部302从保存在内容存储部101中的内容中,利用保存在简档存储部104中的例如图3所示那样的简档,提取有关与用户嗜好匹配的内容的文本即嗜好符合信息,保存到嗜好符合信息存储部303中(步骤S401)。作为具体的一例,嗜好内容提取部302从简档存储部104取得(标记、数据、权重值),在文本中包含有数据的关键字的情况下,分别对有关保存在内容存储部101中的各内容的各文本,加上对该关键字的权重,在该加法的结果超过了规定的阈值的情况下,将超过了该阈值的文本保存到嗜好符合信息存储部303中。作为一例,嗜好内容提取部302从内容存储部101中提取文本“类型电视剧,演出松下太郎、松下花子、松下三郎”,作为嗜好符合信息保存到嗜好符合信息存储部303中。
单词选择部304通过对保存在嗜好符合信息存储部303中的嗜好符合信息进行词素解析等而提取单词,从该提取的单词中选择单词作为关联词探索单词,再在提取的单词中生成以除关联词探索单词以外的单词作为关联词候补的多个组(步骤S402)。在上述的例子中,单词选择部304通过对保存在嗜好符合信息存储部303中的文本“类型电视剧,演出松下太郎、松下花子、松下三郎”进行词素解析,提取例如表示姓名的“松下太郎、松下花子、松下三郎”,生成(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),作为(关联词探索单词、(关联词候补))。
关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,计算由单词选择部304选择的关联词探索单词和关联词候补的单词之间的关联度(步骤S403),判断关联度是否比规定的阈值大(步骤S404)。在其结果为关联度比规定的阈值大的情况下(步骤S404中的“是”),将关联词探索单词和关联词候补的单词作为关联词对,将该关联词对和关联度建立对应并保存到联想辞典存储部102中(步骤S405)。这里,新计算了关联度的关联词对由于有1个单词作为关联词探索单词的情况和作为关联词候补的单词的情况,所以会发生重复,在省略了该重复后保存到联想辞典存储部102中。另一方面,在关联度为规定的阈值以下的情况下(步骤S404中的“否”),不进行任何处理。对包含在关联词候补中的所有单词进行这些处理(步骤S403~步骤S405)(步骤S406)。再对所有关联词探索单词进行这些处理(步骤S403~步骤S406)(步骤S407)。在上述的例子中,关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,对于由单词选择部304选择的(关联词探索单词、(关联词候补))的组即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),计算各个关联词探索单词和关联词候补的各单词之间的关联度。作为一例,计算(关联词探索单词、关联词候补的单词、关联度)为(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),将关联度比规定的阈值(作为一例而设为50)大的(关联词探索单词、关联词候补的单词、关联度)保存在联想辞典存储部102中。此情况的联想辞典存储部102的内容成为图15所示那样。
此外,对于检索信息时的动作,由于与实施方式1相同,所以省略它们的详细的说明。
另外,在本实施方式中,关联度计算部305对由单词选择部304选择的关联词探索单词和关联词候补的所有单词计算关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词作为关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部102中,但并不限于此。例如,关联度计算部305也可以在新计算出由单词选择部304选择的关联词对和其关联度时,在使保存在联想辞典存储部102中的所有关联度衰减后,在联想辞典存储部102中已经存在与新计算了关联度的关联词对相同的关联词对的情况下,通过将已经存储在联想辞典存储部102中的关联度和由关联度计算部106新求出的关联度相加来更新。在此情况下,关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,对于由单词选择部304选择的(关联词探索单词、(关联词候补))的组即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),计算各个关联词探索单词和关联词候补的各单词之间的关联度。作为一例,计算(关联词探索单词、关联词候补的单词、关联度)为(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),将关联度比规定的阈值(作为一例而设为50)大的(关联词探索单词、关联词候补的单词、关联度)加到将保存在图2所示的联想辞典存储部102中的关联度乘以衰减参数(作为一例为0.8)而衰减后的联想辞典存储部102中。此情况下的联想辞典存储部102的内容成为图9所示那样。通过这样,能够得到考虑到对过去的内容的关联度的关联度,能够提高关联度的精度。
此外,在本实施方式中,单词选择部304从嗜好符合信息存储部303中选择关联词探索单词和关联词候补,但也可以例如像图16所示那样,与实施方式1同样地从简档存储部104选择关联词探索单词和关联词候补。进而,也可以仅以权重值为特定的阈值以上的数据为对象,作为关联词探索单词和关联词候补。通过这样,由于仅将强烈地反映了用户嗜好的数据保存到联想辞典存储部102中,所以能够使用户嗜好更强烈地反映在保存于联想辞典存储部102中的单词中。
如上所述,根据本实施方式,能够制作联想辞典,该联想辞典从与用户嗜好匹配的内容中选择保存到联想辞典中的单词,并且通过也计算关联程度,仅保存与用户喜好相匹配的单词,并且单词的关联程度也适应于用户。进而,用户在检索内容时,通过利用该制作的联想辞典,能够进行与用户嗜好相匹配的联想,利用与用户嗜好相匹配的单词进行检索条件的扩展。
(实施方式4)图17是表示包括有关本发明的实施方式4的联想辞典制作装置的信息检索装置的结构的框图。这里,与实施方式1~3相同标号的结构要素进行相同的动作,省略对它们的详细的说明。
本实施方式的信息检索装置是用来制作保存有单词相互间的关联的联想辞典、并且利用联想辞典进行信息检索的装置,如图17所示,包括内容存储部101、联想辞典存储部102、输入部107、联想检索部108、显示部204、画面制作部205、广播波接收部206、以及联想辞典制作部401。
联想辞典制作部401是下述联想辞典制作装置从保存在内容存储部101中的内容中提取嗜好符合信息作为有关与用户嗜好匹配的内容的文本,再对嗜好符合信息计算从所显示的检索结果中提取的单词对的相关度,将作为计算对象的单词对和计算出的关联度建立对应并保存到联想辞典存储部102中,该联想辞典制作部401具备简档存储部104、嗜好内容提取部302、嗜好符合信息存储部303、显示内容存储部202、单词选择部203、以及关联度计算部305。
嗜好符合信息存储部303保存有关与用户嗜好匹配的内容的文本即嗜好符合信息。嗜好内容提取部302从保存在内容存储部101中的内容中,利用保存在简档存储部104中的与用户嗜好有关的信息即简档,提取有关与用户嗜好匹配的内容的文本即嗜好符合信息,保存到嗜好符合信息存储部303中。
显示内容存储部202存储与所显示的检索结果有关的文本信息及与所显示的内容有关的信息、即与显示有关的信息。单词选择部203每当在显示内容存储部202中新保存文本信息时,通过对该文本信息进行词素解析等来提取单词,从该提取的单词选择单词作为关联词探索单词,再在提取的单词中生成以除关联词探索单词以外的单词为关联词候补的多个组。
关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,计算由单词选择部304选择的关联词探索单词和关联词候补的单词之间的关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词作为关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部102中。这里,作为关联度的计算方法,采用与实施方式1同样的方法。
说明在这样构成的本实施方式的信息检索装置中制作联想辞典时的动作例进行。图18是表示制作联想辞典时的动作的流程的流程图。
这里,画面制作部205与实施方式2同样,将由检索部110检索到的检索结果变换为显示画面信息,将显示画面信息输出给显示部204,并且将由广播波接收部206接收到的电视播放节目等内容输出给显示部204。作为一例,在显示检索结果的情况下,假设由用户输入检索条件“松下太郎的节目”,检索结果为“松下太郎”演出的动画内容和动画内容的说明即文本“演出松下太郎、松下花子、松下三郎”。另一方面,在显示电视播放节目等内容的情况下,假设显示具有“演出松下次郎、松下花代”的内容,作为有关内容的文本信息。
首先,画面制作部205与实施方式2同样,在显示由检索部110检索的检索结果的情况下,将有关检索结果的文本信息作为有关显示的信息保存到显示内容存储部202中,在显示由广播波接收部206接收到的内容的情况下,将有关内容的文本信息作为有关显示的信息保存到显示内容存储部202中(步骤S501)。另外,在显示由广播波接收部206接收到的内容的情况下,也可以是如果显示了规定时间(例如10分钟等)以上,则将有关内容的文本信息保存到显示内容存储部202中。在显示上述例子的检索结果的情况下,画面制作部205将由检索部110检索到的“松下太郎”演出的动画内容的说明即文本“演出松下太郎、松下花子、松下三郎”保存到显示内容存储部202中。此外,在显示上述例子的由广播波接收部206接收到的内容的情况下,将“演出松下次郎、松下花代”保存到显示内容存储部202中。
接着,嗜好内容提取部302与实施方式3同样,从保存在内容存储部101中的内容中,利用保存在简档存储部104中的例如图3所示那样的简档,提取有关与用户嗜好匹配的内容的文本即嗜好符合信息,保存到嗜好符合信息存储部303中(步骤S502)。作为具体的一例,嗜好内容提取部302从简档存储部104取得(标记、数据、权重值),在文本中包含有数据的关键字的情况下,分别对与保存在内容存储部101中的各内容有关的各文本加上对该关键字的权重,在该加法的结果超过了规定的阈值的情况下,将超过了该阈值的文本保存到嗜好符合信息存储部303中。作为一例,嗜好内容提取部302从内容存储部101中提取文本“类型电视剧,演出松下太郎、松下花子、松下三郎”,作为嗜好符合信息保存到嗜好符合信息存储部303中。
从画面制作部205将文本信息保存到显示内容存储部202中后,单词选择部203通过对该文本信息进行词素解析等而提取单词,从该提取的单词中选择单词作为关联词探索单词,再在提取的单词中生成以除关联词探索单词以外的单词作为关联词候补的多个组(步骤S503)。例如,在将文本“演出松下太郎、松下花子、松下三郎”保存到显示内容存储部202中的情况下,单词选择部203通过对“演出松下太郎、松下花子、松下三郎”进行词素解析,提取例如表示姓名的单词“松下太郎、松下花子、松下三郎”,生成(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),作为(关联词探索单词、(关联词候补))。
关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,计算由单词选择部203选择的关联词探索单词和关联词候补的单词之间的关联度(步骤S504),判断关联度是否比规定的阈值大(步骤S505)。在其结果为关联度比规定的阈值大的情况下(步骤S505中的“是”),将关联词探索单词和关联词候补的单词作为关联词对,将该关联词对和关联度建立对应并保存到联想辞典存储部102中(步骤S506)。这里,新计算了关联度的关联词对由于有1个单词作为关联词探索单词的情况和作为关联词候补的单词的情况,所以会发生重复,在省略了该重复后保存到联想辞典存储部102中。另一方面,在关联度为规定的阈值以下的情况下(步骤S505中的“否”),不进行任何处理。对包含在关联词候补中的所有单词进行这些处理(步骤S504~步骤S506)(步骤S507)。再对所有关联词探索单词进行这些处理(步骤S504~步骤S507)(步骤S508)。
在上述的例子中,关联度计算部305参照保存在嗜好符合信息存储部303中的嗜好符合信息,对于由单词选择部203选择的(关联词探索单词、(关联词候补))的组即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),计算各个关联词探索单词和关联词候补的各单词之间的关联度。作为一例,计算(关联词探索单词、关联词候补的单词、关联度)为(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),将关联度比规定的阈值(作为一例而设为50)大的(关联词探索单词、关联词候补的单词、关联度)加到将保存在图2所示的联想辞典存储部102中的关联度乘以衰减参数(作为一例为0.8)而衰减后的联想辞典存储部102中。此情况的联想辞典存储部102的内容成为图9所示那样。
另外,在本实施方式中,关联度计算部305在更新联想辞典存储部102时,在将存储在联想辞典存储部102中的所有关联度衰减后,在联想辞典存储部102中已经存在与新计算了关联度的关联词对相同的关联词对的情况下,将已经保存在联想辞典存储部102中的关联度与由关联度计算部305新求出的关联度相加而进行更新,但并不限于此。例如,关联度计算部305也可以将新计算了关联度的关联词对原样与关联度建立对应并保存到联想辞典存储部102中。
此外,在本实施方式中检索了动画内容,但并不限于此,也可以是超文本或因特网上的WEB页。在此情况下,画面制作部205将由检索部110检索到的超文本或WEB页的显示文本保存到显示内容存储部202中,再将检索到的超文本或WEB页的文本变换为显示画面信息,将显示画面信息输出给显示部204。作为具体的一例,在由检索部110检测到由图10所示的HTML语言记述的文件“name.html”的情况下,画面制作部205从文件“name.html”将图11(b)所示的显示文本“松下太郎、松下花子、松下三郎、松下次郎”保存到显示内容存储部202中,再将文件“name.html”变换为显示画面信息,在显示部204上如图11(a)所示那样输出显示画面信息。进而,在显示部204上没有显示全部文本的情况下,画面制作部205也可以仅将显示的文本保存到显示内容存储部202中。在上述的实施例中,在作为一例而如图12(a)所示那样显示由图10的HTML语言记述的文件“name.html”的情况下,画面制作部205如图12(b)所示那样仅将显示文本“松下太郎、松下花子、松下三郎”保存到显示内容存储部202中。通过这样,能够仅根据从用户视听到的内容的文本提取的单词来制作联想辞典,能够制作适应于用户的视听行为的联想辞典。此外,画面制作部205也可以将在显示部204上显示了推定时间以上的文本作为显示的文本来处理。由此,能够去除仅在滚动时显示而没有被用户阅览的文本。
此外,画面制作部205将与由检索部110检索的内容有关的文本信息保存在显示内容存储部202中,但在内容为动画内容且存在与动画内容的各场景或每个帧对应的文本的情况下,画面制作部205也可以仅将与用户视听的动画内容的场景或帧对应的文本保存到显示内容存储部202中。通过这样,能够仅根据与用户视听的动画内容的场景或帧对应的文本制作联想辞典,能够对于动画内容制作适应于用户的视听行为的高精度的联想辞典。
如上所述,根据本实施方式,通过从与用户视听的内容有关的文本中选择保存到联想辞典中的单词,再对与用户嗜好匹配的内容计算关联程度,由此,能够仅存储适应于用户的视听行为的单词,并且制作单词的关联程度适应于用户的视听行为的联想辞典。进而,用户在检索内容时,通过利用该制作的联想辞典,能够进行与用户嗜好相匹配的联想,利用适应于用户的视听行为的单词,进行检索条件的扩展。由此,能够使扩展后的检索结果适应于用户的视听行为,而且使联想适应于用户嗜好。
另外,在上述实施方式1中,内容存储部101相当于保存有作为检索对象的信息的数据库,单词选择部105相当于单词选择机构,关联度计算部106相当于关联词保存机构。
此外,在上述实施方式2中,单词选择部203相当于单词选择机构,画面制作部205相当于显示信息提取机构,关联度计算部106相当于关联词保存机构,检索部110相当于检索机构。
此外,在上述实施方式3中,嗜好内容提取部302相当于嗜好符合信息提取机构,单词选择部304相当于单词选择机构,关联度计算部305相当于关联词保存机构。
此外,在上述实施方式4中,嗜好内容提取部302相当于嗜好符合信息提取机构,单词选择部203相当于单词选择机构,关联度计算部305相当于关联词保存机构,画面制作部205相当于显示信息提取机构,检索部110相当于检索机构。
工业实用性有关本发明的联想辞典制作装置能够制作联想辞典,该联想辞典能够在利用联想辞典进行检索条件的扩展时,使为了扩展而附加的检索条件适应于用户嗜好或视听行为,例如作为能够访问硬盘录制机或DVD录制机、TV、组合音响、因特网来进行信息检索的终端等,是具有实用性的。
权利要求
1.一种联想辞典制作装置,制作联想辞典,该联想辞典存储多个单词间的关系,其特征在于,具备单词选择机构,从表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词,作为关联词候补;关联词保存机构,根据保存有作为检索对象的信息的数据库,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词与上述关联词建立关联,保存到联想辞典中。
2.如权利要求1所述的联想辞典制作装置,其特征在于,上述单词选择机构从保存有表示用户嗜好的信息的简档中取得上述表示用户嗜好的信息。
3.如权利要求1所述的联想辞典制作装置,其特征在于,上述关联词保存机构根据在上述数据库中的出现频率,分别计算上述关联词探索单词和上述关联词候补之间的关联度,选择计算出的关联度为阈值以上的上述关联词候补,作为与上述关联词探索单词相关联的关联词。
4.如权利要求1所述的联想辞典制作装置,其特征在于,上述联想辞典制作装置还具备显示信息提取机构,该显示信息提取机构提取与用户所阅览的显示有关的信息;上述单词选择机构将由上述显示信息提取机构提取的与上述显示有关的信息作为上述表示用户嗜好的信息,从与上述显示有关的信息中选择任意的单词作为关联词探索单词,选择包含在与上述显示有关的信息中的除上述关联词探索单词以外的单词,作为关联词候补。
5.如权利要求4所述的联想辞典制作装置,其特征在于,上述联想辞典制作装置还具备检索机构,该检索机构从上述数据库中检索符合检索条件的信息;上述用户所阅览的显示是信息检索的结果;上述显示信息提取机构提取与上述信息检索的结果有关的信息,作为与上述显示有关的信息。
6.如权利要求5所述的联想辞典制作装置,其特征在于,上述显示信息提取机构从上述信息检索的结果中提取在显示画面上显示规定时间以上的信息,作为与上述显示有关的信息。
7.如权利要求4所述的联想辞典制作装置,其特征在于,上述用户所阅览的显示是播放节目;上述显示信息提取机构提取与上述播放节目有关的信息,作为与上述显示有关的信息。
8.如权利要求7所述的联想辞典制作装置,其特征在于,上述显示信息提取机构从上述播放节目中提取与在显示画面上显示规定时间以上的播放节目有关的信息,作为与上述显示有关的信息。
9.如权利要求1所述的联想辞典制作装置,其特征在于,上述联想辞典制作装置还具备嗜好符合信息提取机构,该嗜好符合信息提取机构利用保存有表示用户嗜好的信息的简档,从上述数据库中提取符合用户嗜好的信息,作为嗜好符合信息;上述关联词保存机构参照从上述数据库中提取的上述嗜好符合信息,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词和上述关联词建立关联并保存到联想辞典中。
10.如权利要求9所述的联想辞典制作装置,其特征在于,上述单词选择机构将由上述嗜好符合信息提取机构提取的上述嗜好符合信息作为上述表示用户嗜好的信息,从上述嗜好符合信息中选择任意的单词作为关联词探索单词,选择包含在上述嗜好符合信息中的除上述关联词探索单词以外的单词作为关联词候补。
11.如权利要求9所述的联想辞典制作装置,其特征在于,上述单词选择机构从保存有表示用户嗜好的信息的简档中取得上述表示用户嗜好的信息,从上述表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词作为关联词候补。
12.如权利要求1所述的联想辞典制作装置,其特征在于,上述联想辞典制作装置还具备显示信息提取机构,提取与用户所阅览的显示有关的信息;嗜好符合信息提取机构,利用保存有表示用户嗜好的信息的简档,从上述数据库中提取符合用户嗜好的信息,作为嗜好符合信息;上述单词选择机构将由上述显示信息提取机构提取的与上述显示有关的信息作为上述表示用户嗜好的信息,从与上述显示有关的信息中选择任意的单词作为关联词探索单词,选择包含在与上述显示有关的信息中的除上述关联词探索单词以外的单词,作为关联词候补;上述关联词保存机构参照从上述数据库中提取的上述嗜好符合信息,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词和上述关联词建立对应并保存到联想辞典中。
13.一种联想辞典制作方法,制作联想辞典,该联想辞典存储多个单词间的关系,其特征在于,包括单词选择步骤,从表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词,作为关联词候补;关联词保存步骤,根据保存有作为检索对象的信息的数据库,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词与上述关联词建立关联,保存到联想辞典中。
14.一种程序,用来制作联想辞典,该联想辞典存储多个单词间的关系,其特征在于,使计算机执行单词选择步骤,从表示用户嗜好的信息中选择任意的单词作为关联词探索单词,选择包含在上述表示用户嗜好的信息中的除上述关联词探索单词以外的单词作为关联词候补;关联词保存步骤,根据保存有作为检索对象的信息的数据库,从上述关联词候补中选择与上述关联词探索单词相关联的关联词,将上述关联词探索单词与上述关联词建立关联,保存到联想辞典中。
全文摘要
提供一种能够简单且有效地制作与用户嗜好相匹配的联想辞典的联想辞典制作装置。联想辞典制作部(103)具备简档存储部(104),保存有与用户嗜好有关的信息即简档;单词选择部(105),每隔规定的时间从保存在简档存储部(104)中的简档中选择单词,作为关联词探索单词,再选择包含在简档中的除关联词探索单词以外的单词,作为关联词候补;关联度计算部(106),参照保存在内容存储部(101)中的内容,计算由单词选择部(105)选择的关联词探索单词和关联词候补的单词之间的关联度,在关联度比规定的阈值大的情况下,将关联词探索单词和关联词候补的单词作为关联词对,将关联词对和关联度建立对应并保存到联想辞典存储部(102)中。
文档编号G06F17/28GK1930567SQ20058000814
公开日2007年3月14日 申请日期2005年12月27日 优先权日2005年1月7日
发明者续木贵史, 九津见洋 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1