Interactiveprogramsearchdevice的制作方法

文档序号:6592855阅读:155来源:国知局
专利名称:Interactive program search device的制作方法
技术领域
本发明涉及一种对话式节目检索装置,通过由用户反复选择对于检索到的节目相 关联进行提示的字词,来检索想视听的节目。
背景技术
以往,人们提出了一种关联词提示装置,当针对用户所输入的检索条件显示检索 结果时,以例如在检索结果数少时等防止检索遗漏的目的,提示与检索条件关联性高的字 词来作为关联字词(例如参见专利文献1)。在该关联词提示装置中,用户为了除根据最开 始的检索条件所取得的检索结果之外还取得新的检索结果,要从提示的关联字词之中选择 一个关联字词。关联词提示装置将选择出的关联字词和检索条件进行逻辑和连接(通过取 得关联字词和检索条件之间的逻辑和来连接双方),按照逻辑和连接后的条件进行重新检 索。这里,由于提示给用户的关联字词是和用户所输入的检索条件关联强的关联字词,因而 用户可以从开始所取得的检索结果逐渐增多检索结果。另外,人们还提出了一种文本挖掘程序,提示用户输入的二个字词经由什么样字词结合起来这样的信息(例如参见专利文献2)。专利文献1 日本特开平10-334106号公报专利文献2 日本特开2004-21763号公报

发明内容
但是,就以往的关联词提示装置而言,只是提示检索条件的关联字词,对于检索条 件提示其关联字词的原因却不提示给用户。这种情况下,存在例如在用户无法理解检索条 件和关联字词的联系时,用户通过选择关联字词而取得与根据检索条件已得到的检索结果 完全不同的检索结果这样的课题。另外,同样的情况下,存在因为用户认为当前从关联词提 示装置提示的关联字词错误,所以难以选择用户无法理解与检索条件之间的联系的关联字 词这样的课题。图14是表示以往的检索结果和关联字词的显示一例的附图。在图14所示 的例子中,用户想要搜索与健康信息有关的节目,在首先输入了“信息”和检索条件时,作为 其检索结果和检索条件“信息”的关联字词提示出在谈话·信息节目中演出的“松下太郎” 和在健康 信息节目中演出的“松下次郎”。此时,在用户即将从显示出的关联字词选择一个 关联字词进行重新检索的情况下,由于用户想检索健康信息节目,因而应当选择关联字词 “松下次郎”。但是,因为不提示检索条件“信息”和关联字词“松下次郎”的联系“健康·信 息”,所以用户难以判断应当选择关联字词“松下太郎”和“松下次郎”的哪一个。另外,就以往的文本挖掘程序而言,只是提示作为将用户所输入的二个字词间结 合起来的字词的路径字词,用户所输入的检索条件、已取得的检索结果及用户的爱好未反 映在路径字词中。因此,有时用户不理解所提示的路径字词,或者和所输入的检索条件及所 取得的检索结果关系不密切的字词作为路径字词被提示给用户。因而,存在用户无法理解 二个字词间的联系这样的课题。
还有,检索条件不限于由用户输入的情形,也有时从节目信息等自动提取,但是那 种情况下,仍有同样的课题。因此,本发明是鉴于上述情况而做出的,其目的为提供对话式节目检索装置及对 话式节目检索方法,可以由用户容易地理解所取得的检索条件和显示的关联字词之间的联系。为了达到上述目的,本发明所涉及的对话式节目检索装置用来使用检索字词来检 索节目,其特征为,具备节目信息存储部,按节目存储着表示节目内容的节目信息;联想 辞典存储部,存储着使上述节目信息中包含的字词彼此相关联的联想辞典;取得部,取得上 述检索字词;取得履历存储部,存储由上述取得部取得的上述检索字词和该检索字词被取 得的频次,作为取得履历信息;节目检索部,使用上述取得履历信息,以该取得履历信息中 包含的字词为检索条件,从上述节目信息检索节目;联想源字词提取部,从上述取得履历信 息中包含的字词之中,提取使联想字词联想的联想源字词;联想字词提取部,使用上述联想 辞典,提取与上述联想源字词相关联的联想字词;原因字词提取部,从与上述联想源字词之 间的关联度及与上述联想字词之间的关联度的双方为指定关联度以上的字词之中,提取上 述取得履历信息中包含的字词,作为说明上述联想源字词和上述联想字词的联系的原因字 词;以及显示部,显示作为由上述节目检索部检索到的节目的节目检索结果、上述联想字词 和上述原因字词。根据该结构,可以将与用户所输入或者从节目信息所取得的检索字词和用户选择 并决定出的节目的节目信息关联的取得履历信息,反映于说明检索条件和根据检索条件联 想的联想字词之间的联系的原因字词中。因为取得履历信息由用户知晓的字词组成,所以 用户可以理解原因字词的意思,能够由用户容易地理解所输入的检索条件和显示的关联字 词之间的联系。还有,本发明不仅仅是可以作为具备这种特征性处理部的对话式节目检索装置来 实现,也可以作为把对话式节目检索装置中包含的特征性处理部当作步骤的对话式节目检 索方法来实现,或者作为使计算机执行对话式节目检索方法中包含的特征性步骤的程序来 实现。而且,不言而喻,那种程序可以通过CD-ROM (Compact Disc-Read Only Memory)等的 记录媒体或因特网等通信网络使之流通。发明效果如上,根据本发明所涉及的对话式节目检索装置,可以将与用户所输入或者从节 目信息所取得的检索字词和用户选择并决定出的节目的节目信息关联的取得履历信息,反 映于说明检索条件和联想字词的联系的原因字词中,能够将该原因字词提示给用户。因此, 用户能够通过查看已知晓或者可理解的原因字词,容易地理解检索条件和关联字词有关系 的原因。


图1是本发明实施方式中对话式节目检索装置的结构图。图2是表示本发明实施方式中表现节目信息存储部中存储的节目信息之内容的 一例的附图。图3是表示本发明实施方式中表现联想辞典存储部中存储的联想辞典之内容的一例的附图。图4是表示本发明实施方式中表现取得履历存储部中存储的取得履历信息之内 容的一例的附图。图5是表示本发明实施方式中表现检索结果节目的节目信息之内容的一例的附 图。图6是表示本发明实施方式中表现显示部上显示之内容的一例的附图。图7A是表示本发明实施方式中的对话式节目检索装置动作的流程图。图7B是表示本发明实施方式中的用户输入处理流程的流程图。图8是表示本发明实施方式中表现取得履历存储部中存储的取得履历信息之内 容的一例的附图。图9是表示本发明实施方式中表现暂时选择检索向量之内容的一例的附图。图10是表示本发明实施方式中表现暂时选择检索结果的节目信息之内容的一例 的附图。图11是表示本发明实施方式中表现显示部上显示之内容的一例的附图。图12是表示本发明实施方式中表现显示部上显示之内容的一例的附图。图13是表示本发明实施方式中表现取得履历存储部中存储的取得履历信息之内 容的一例的附图。图14是表示以往的检索结果及关联字词的显示一例的附图。符号说明
100对话式节目检索装置
101取得部
102节目信息存储部
103联想辞典存储部
104取得履历存储部
105节目检索部
106检索结果存储部
107显示部
108暂时选择检索部
109联想源字词提取部
110联想字词提取部
111原因字词提取部
具体实施例方式下面,一边参照附图一边说明本发明实施方式中的对话式节目检索装置。图1是表示本发明实施方式所涉及的对话式节目检索装置结构的框图。对话式节目检索装置100用来将显示检索结果时与检索结果节目关联的关联字 词和下述原因字词提示给用户,该原因字词表示检索结果节目和关联字词之间的联系。对 话式节目检索装置100具备取得部101、节目信息存储部102、联想辞典存储部103、取得履 历存储部104、节目检索部105、检索结果存储部106、显示部107、暂时选择检索部108、联想源字词提取部109、联想字词提取部110及原因字词提取部111。取得部101例如由键盘或鼠标、遥控等的输入装置构成,是受理来自用户的节目 名输入或检索字词选择,并取得节目名或检索字词的处理部。节目信息存储部102在多个节目中,存储着作为节目识别符的“节目ID”、作为节 目信息的“元数据”和“元数据中包含的字词”。图2是表示节目信息存储部102中存储的节目信息一例的附图。在节目信息存储 部102中例如图2所示,按每个节目,相关联地存储着确定节目的作为节目识别符的“节目 ID”、“元数据”和“元数据中包含的字词”。“元数据”包括作为广播节目的日期与时间之“广 播日期与时间”、作为节目的开始时间之“广播开始时间”、“节目名”、节目所属的“类型”、作 为在节目中演出的演员名字之“演员名”以及说明节目的内容之“节目内容”。具体而言,在 节目信息存储部102中,作为(节目ID ;广播日期与时间;广播开始时间;节目名;类型;演 员名;节目内容;元数据中包含的字词),存储((01 ;2006/8/22 ;12:00 ;松下太郎时间;综 艺;松下太郎、松下三郎;松下太郎邀请日本的著名嘉宾展开谈话。;松下太郎、综艺、松下三 郎、日本、嘉宾、谈话)、(02 ;2006/8/22 ;13:00 ;白天的日本列岛;信息;松下花子、松下次 郎;日本列岛各地的直播。;日本、日本列岛、信息、松下花子、松下次郎)、(03 ;2006/8/23 ; 16:00 ;请交给松下次郎;综艺;松下次郎、松下四郎;松下次郎回答视听者的咨询。还有健 康信息。;松下次郎、综艺、松下四郎、咨询、健康、信息、健康信息)、…)。这里,“元数据中 包含的字词”也可以使用语态素分析技术或者固有表现提取技术等,从“元数据”提取。联想辞典存储部103针对存储于节目信息存储部102中的“元数据中包含的字 词”,存储着表示多个字词之间相关联和字词间关联度的联想辞典。作为求取字词间关联度 的方法,例如能举出利用字词之间的相互信息量的方法。也就是说,使下述字词之间利用相 互信息量等相关联,该字词若是节目信息则在一个节目内,或者若是一般性文章则在一篇 短文内、段落内等的汇总之中共现。此时,若例如字词A和字词B在相同节目内经常共现,则 字词A和字词B的关联度变大。另外,虽然在字词A出现的节目中字词B经常出现,但是如 果字词B在字词A不出现的节目中经常出现,则关联度变小。也就是说,关联度高意味着, 在相同节目中经常出现的字词。除了这种利用相互信息量的方法之外,作为一般的关联度 计算方法,还有利用Dice-coefficient、加权Dice-coefficient、t-score、x平方值及对数 似然比等的方法。图3是表示相关联地存储例如在相同节目中出现的字词之间的联想辞典一例的 附图。在联想辞典存储部103中例如图3所示,作为(字词、字词、关联度),存储((松下 太郎、综艺、60)、(松下太郎、松下三郎、20)、(松下太郎、日本、30)、…、(松下太郎、松下次 郎、80)、(松下次郎、综艺、70”")。取得履历存储部104存储着从取得部101所取得的由用户输入的检索字词或用户 选择并决定出的节目的节目信息,来作为取得履历信息。图4是表示相对应地存储例如字词和包含字词的节目之选择频次的取得履历信 息一例的附图。在取得履历存储部104中例如图4所示,作为(字词、选择频次),存储((松 下太郎、5)、(综艺、20)、(松下三郎、3)、(日本、6)、(嘉宾、15)、(谈话10)、(日本列岛、 2)、…)。这里,当前作为(字词、选择频次)存储的(松下太郎、5)的意思是用户意识到 “松下太郎”的次数。所谓意识到的次数指的是,例如用户将作为检索字词选择出“松下太郎”的频次和视听下述节目的视听频次相加后的值,该节目保持字词“松下太郎”出现的节 目内容。节目检索部105使用取得履历存储部104中存储的取得履历信息,从存储于节目 信息存储部102中的节目信息检索节目,将检索到的节目作为检索结果节目。检索结果存储部106存储着从节目检索部105输出的检索结果节目的节目信息。图5是表示检索结果存储部106中存储的检索结果节目的节目信息一例的附图。 在检索结果存储部106中例如图5所示,按每个节目,相关联地存储“检索结果的次序”、“节 目ID”、“元数据”和“元数据中包含的字词”。“元数据”包括“广播日期与时间”、“广播开始 时间”、“节目名”、“类型”、“演员名”及“节目内容”。例如,作为(检索结果次序;节目ID;广 播日期与时间;广播开始时间;节目名;类型;演员名;节目内容;元数据中包含的字词), 存储(1 ;01 ;2006/8/22 ;12:00 ;松下太郎时间;综艺;松下太郎、松下三郎;松下太郎邀请 日本的著名嘉宾展开谈话。;松下太郎、类型、松下三郎、日本、嘉宾、谈话)。显示部107将存储于检索结果存储部106中的检索结果节目的节目信息、由联想 字词提取部110提取的对于检索结果节目的联想字词和由原因字词提取部111提取的原因 字词,提示给用户。这种显示部107例如包括CRT (Cathode-Ray Tube)显示器、液晶显示器 (IXD)、等离子体显示器(PDP)等的显示装置,来构成。暂时选择检索部108在从如同图6那样显示于显示部107上的检索结果节目,实 施由用户使用取得部101给一个节目指派焦点的暂时选择时,从检索结果存储部106取得 作为暂时选择出的节目的暂时选择节目的节目信息。然后,暂时选择检索部108使用取得 履历存储部104中存储的取得履历信息和暂时选择节目的节目信息,从节目信息存储部 102中存储的节目信息检索节目,将检索到的节目作为暂时选择检索结果。联想源字词提取部109使用取得履历存储部104中存储的取得履历信息,从暂时 选择节目的节目信息中包含的字词提取选择频次最高的字词来作为联想源字词。也就是 说,由联想源字词提取部109提取的联想源字词是使当前和检索字词关联的联想字词联想 的字词,联想源字词提取部109从取得履历信息中包含的字词之中,提取该联想源字词。联想字词提取部110从由暂时选择检索部108检索的暂时选择检索结果的节目信 息中包含的字词,在联想辞典存储部103中存储的联想辞典里,提取和由联想源字词提取 部109提取的联想源字词以特定阈值以上的关联度相关联的字词,来作为联想字词。原因字词提取部111使用由联想源字词提取部109提取的联想源字词、由联想字 词提取部110提取的联想字词和在取得履历存储部104中存储的取得履历信息,从存储于 联想辞典存储部103中的联想辞典提取字词,将所提取的字词作为表示联想源字词和联想 字词之间的联系的原因字词。使用图7A及图7B的流程图,来说明这样所构成的根据本实施方式的对话式节目 检索装置动作例。图7A是说明对话式节目检索装置100动作的流程图。图7B是说明用户 输入的流程图。若用户从取得部101输入了检索字词(图7B的步骤S201),则在取得履历存储部 104中所存储的取得履历信息内未包含检索字词时,在该取得履历信息中添加检索字词。另 外,在取得履历存储部104中已经作为取得履历信息存储了检索字词时,在与检索字词对 应的选择频次的值上加上1 (图7A的步骤S101)。作为具体的一例,用户从取得部101输入检索字词“松下太郎”。然后,在取得履历存储部104中所存储的取得履历信息内不包含字 词“松下太郎”时,作为“字词、选择频次”在取得履历信息中新添加(松下太郎、1)。另外, 在取得履历存储部104中已经包含了作为取得履历信息的字词“松下太郎”时,通过在与字 词“松下太郎”对应的选择频次上加上1,来更新取得履历信息。作为一例,在图8中表示输 入了字词“松下太郎”时更新前的取得履历信息,在图4中表示更新后的取得履历信息。在 图8所示的更新前的取得履历信息中,字词“松下太郎”的选择频次是“4”,与之相对,在图 4所示的更新后的取得履历信息中,选择频次被更新成“5”。节目检索部105使用取得履历存储部104中存储的取得履历信息从存储于节目信 息存储部102中的节目信息检索节目,将检索到的节目作为检索结果节目(步骤S102)。在 上述例子中,作为节目的检索方法,为了检索与此前用户所输入的检索条件或者用户选择 出的节目相近的节目,节目检索部105针对各节目,从取得履历信息取得与元数据中包含 的字词对应的选择频次并进行加法运算,将加法运算后的合计值作为节目的得分。然后,节 目检索部105将节目按得分顺序重新排列,把特定阈值以上的节目作为检索结果节目。作 为一例,图2所示的节目ID为01的节目得分若使用图4所示的取得履历信息进行了计算, 则成为将字词“松下太郎”的选择频次“5”、字词“综艺”的选择频次“20”、字词“松下三郎” 的选择频次“3”、字词“日本”的选择频次“6”、字词“嘉宾”的选择频次“15”及字词“谈话” 的选择频次“10”加法运算后的值“59”。同样,节目检索部105针对全部的节目求取得分, 将特定阈值以上的得分的节目作为检索结果节目。在图5中表示作为检索结果节目存储到 检索结果存储部106中的一例。显示部107将存储于检索结果存储部106中的检索结果节目的节目信息提示给用 户(步骤S103)。在图6中表示将图5所示的检索结果节目提示给用户的显示例。暂时选择检索部108从显示于显示部107上的检索结果节目,受理用户引起兴趣, 并使用取得部101暂时选择出(步骤S202)的节目(步骤S104)。暂时选择检索部108从检索结果存储部106取得暂时选择节目的节目信息,使用 取得履历存储部104中所存储的取得履历信息和暂时选择节目的节目信息,从节目信息存 储部102中所存储的节目信息检索节目,将检索到的节目作为暂时选择检索结果(步骤 S105)。在上述例子中,设为从图6所示的显示于显示部107上的检索结果节目,用户使用 取得部101作为暂时选择节目,输入了节目号码“ 1 ”。暂时选择检索部108若从取得部输入 了节目号码“1”,则从检索结果存储部106取得与节目号码“1”对应的作为节目信息(节目 ID ;广播日期与时间;广播开始时间;节目名;类型;演员名;节目内容;元数据中包含的字 词)的(01 ;2006/8/22 ;12:00 ;松下太郎时间;综艺;松下太郎、松下三郎;松下太郎邀请日 本的著名嘉宾展开谈话。;松下太郎、综艺、松下三郎、嘉宾、谈话)。接着,暂时选择检索部 108将取得履历存储部104中所存储的取得履历信息作为暂时选择检索向量。在暂时选择 检索向量中不存在暂时选择节目的元数据中包含的字词时,暂时选择检索部108在暂时选 择检索向量中添加检索字词。已经在暂时选择检索向量中存在暂时选择节目的元数据中包 含的字词时,暂时选择检索部108在暂时选择检索向量与检索字词对应的选择频次的值上 加上1。这里,在图9中表示取得履历信息是图4所示的取得履历信息,且节目ID “01”的 节目为暂时选择节目时制作的节目ID “01”的暂时选择检索向量一例。接着,暂时选择检 索部108针对各节目,从暂时选择检索向量取得元数据中包含的字词的选择频次并进行加法运算,将加法运算后的合计值作为节目的得分。最后,暂时选择检索部108将节目按得分 顺序重新排列,把特定阈值以上的节目作为暂时选择检索结果。这里,在图10中表示暂时 选择检索结果的一例。也就是说,暂时选择检索结果被认为是使之反映出暂时选择节目的 节目检索结果。联想源字词提取部109使用取得履历存储部104中存储的取得履历信息从暂时 选择节目的节目信息中包含的字词之中,提取选择频次最高的字词来作为联想源字词(步 骤S106)。在上述例子中,联想源字词提取部109提取作为暂时选择节目的节目ID “01” 的节目元数据中包含的字词之中,作为在图4所示的取得履历信息中选择频次最高的字词 的“综艺”,来作为联想源字词。取得履历信息反映出用户的兴趣。因此,联想源字词提取部 109可以将暂时选择节目的节目信息中包含的字词之中应当表示出用户最感兴趣的字词作 为联想源字词。联想字词提取部110从由暂时选择检索部108检索的暂时选择检索结果的节目 信息中包含的字词之中,在联想辞典存储部103中存储的联想辞典里,提取和由联想源字 词提取部109提取的联想源字词以特定阈值以上的关联度相关联的字词,来作为联想字词 (步骤S107)。在上述例子中,从作为由暂时选择检索部108检索的暂时选择检索结果之节 目的节目ID “01”、“10”、“03”的元数据中包含的字词,在图3所示的联想辞典存储部103 中存储的联想辞典里,提取和由联想源字词提取部109所提取的联想源字词“综艺”以特定 阈值(作为一例是“50”)以上的关联度相关联的字词“松下太郎”、“松下次郎”,来作为联 想字词。也就是说,可以检索暂时选择检索结果的字词应当在暂时选择检索结果的节目信 息之中。因此,联想字词提取部110可以将暂时选择检索结果的节目信息中包含的字词之 内,和联想源字词之间的关联性强的字词作为联想字词。还有,虽然这里检索字词也作为联 想字词,但是检索字词也可以不作为联想字词。原因字词提取部111使用由联想源字词提取部109提取的联想源字词、由联想字 词提取部110提取的联想字词和存储在取得履历存储部104中的取得履历信息,从存储于 联想辞典存储部103中的联想辞典提取字词,将所提取的字词作为表示联想源字词和联想 字词之间的联系的原因字词(步骤S108)。在上述例子中,原因字词提取部111在图4所 示的取得履历存储部104中所存储的字词里,将选择频次为特定阈值(作为一例是10)以 上的字词“综艺”、“嘉宾”、“谈话”、…、作为处理的对象。原因字词提取部111从成为对象 后的字词之中,选择和由联想源字词提取部109提取的联想源字词“综艺”以特定阈值以上 的关联度(作为一例将阈值设为50)相关联,且和由联想字词提取部110提取的联想字词 “松下太郎”以特定阈值以上的关联度(作为一例将阈值设为50)相关联的字词,来作为原 因字词的备选。再者,原因字词提取部111提取选择出的原因字词备选之内,来自联想源字 词的关联度和来自联想字词的关联度之和变得最大的字词,来作为表示联想源字词“综艺” 和联想字词“松下太郎”之间的联系的原因字词。具体而言,在“综艺”和“谈话”的关联度 为80,并且“松下太郎”和“谈话”的关联度为70的情况下,由于“谈话”从联想源字词以阈 值50以上相关联,且从联想字词以阈值50以上相关联,因而是原因字词的备选。再者,来 自联想源字词的关联度(80)和来自联想字词的关联度(70)之和为150。在将这种计算对 全部的字词进行后的结果为,关联度之和150最大的情况下,“谈话”成为原因字词。同样, 原因字词提取部111还提取表示联想源字词“综艺”和联想字词“松下太郎”的联系的原因字词。其结果为,作为表示联想源字词“综艺”和联想字词“松下太郎”的联系的原因字词 提取了 “谈话”,作为表示联想源字词“综艺”和联想字词“松下太郎”的联系的原因字词提 取了 “健康”。也就是说,原因字词提取部111可以将与联想源字词及联想字词的双方结合 起来的字词之内,存储在取得履历信息中的字词作为原因字词。显示部107通过和已经显示的检索结果节目的节目信息一起,将由联想字词提取 部110提取的联想字词和由原因字词提取部111提取的原因字词,显示于自身具备的显示 装置上,来提示给用户(步骤S109)。在上述例子中,在图11中表示提示给用户的显示例。 在图11中,作为与检索字词“松下太郎”关联(与检索结果节目关联)的关联字词,显示出 联想字词“松下太郎”和“松下次郎”。另外,作为说明检索字词“松下太郎”和关联字词“松 下太郎”之间的联系的原因字词显示出“谈话”,作为说明检索字词“松下太郎”和关联字词 “松下次郎”之间的联系的原因字词显示出“健康”。再者,在用户不满足于检索结果,而在联想字词(关联字词)中提示出有兴趣的字 词,并从取得部101输入字词时(步骤S110的“是”,步骤S203的“联想字词之一”(作为一 例是“松下次郎”)),对话式节目检索装置100再次执行上述处理,在用户从取得部101决 定节目的选择来视听节目时(步骤S110的“否”,步骤S203的“来自检索结果的想视听的 节目”),由未图示的影像再生装置再生用户选择出的节目。根据本实施方式,当用户从检索结果暂时选择节目来提示关联字词时,提示反映 出取得履历信息的原因字词。因此,可以提示用户能容易地理解节目和关联字词之间关系 的原因字词。上面,对于本发明所涉及的对话式节目检索装置,根据实施方式进行了说明,但是 本发明并不限定为上述的实施方式。在上述实施方式中,联想字词提取部110从由暂时选择检索部108检索的暂时选 择检索结果的节目信息中包含的字词之中,在联想辞典存储部103中存储的联想辞典里, 提取了和由联想源字词提取部109提取的联想源字词以特定阈值以上的关联度相关联的 字词,来作为联想字词。除此之外,联想字词提取部110还可以考虑取得履历存储部104中 所存储的取得履历信息,来取得联想字词。例如,联想字词提取部110在由暂时选择检索部 108检索的暂时选择检索结果的节目是节目ID“01”、“10”、“03”的情况下,将节目ID“01,,、 “10”、“03”的元数据中包含,且图4所示的取得履历存储部104中所存储的字词之内选择频 次为特定阈值(作为一例是10)以上的字词,作为联想字词的备选。联想字词提取部110也 可以从联想字词的备选之中,在图3所示的联想辞典存储部103中存储的联想辞典里,提取 和由联想源字词提取部109所提取的联想源字词以特定阈值以上的关联度相关联的字词, 来作为联想字词。这样一来,就可以使联想字词成为反映出用户输入或选择节目、用户爱好 的字词。也就是说,因为在联想字词的提取时考虑到取得履历信息,所以可以提取用户易于 理解的联想字词。另外,在上述实施方式中,原因字词提取部111使用由联想源字词提取部109提取 的联想源字词、由联想字词提取部110提取的联想字词和存储在取得履历存储部104中的 取得履历信息,从存储于联想辞典存储部103中的联想辞典提取字词,将所提取的字词作 为表示联想源字词和联想字词之间的联系的原因字词。除此之外,原因字词提取部111还 可以在节目信息存储部102中所存储的节目信息里,考虑联想源字词出现的节目数、联想
12字词出现的节目数和原因字词的备选字词出现的节目数,将在联想源字词和联想字词出现 的节目数以上的节目中出现的字词作为原因字词。这样一来,与联想源字词和联想字词相 比在节目信息中出现频次更高的字词,也就是对于用户来说易于想到的字词就作为原因字 词被提取,其结果为,可以将用户比联想源字词及联想字词更加能够容易地理解的原因字 词提示给用户。另外,在上述实施方式中,原因字词提取部111只将说明联想源字词和联想字词 之间的联系的字词作为原因字词,但是在用户选择节目,并对该节目将关联字词提示给用 户的情况下,联想源字词也可以作为原因字词提示给用户。这样一来,用户就可以容易地理 解着重于节目的哪个字词提示出了联想字词。另外,在上述实施方式中,原因字词提取部111作为原因字词只将一个字词提示 给用户,但是也可以以存储在取得履历存储部104中的字词之内选择频次为特定阈值以上 的字词为对象,在和联想源字词及联想字词以特定阈值以上的关联度相关联的字词中,且 按来自联想源字词的关联度和来自联想字词的关联度之和大的顺序选择多个字词,提取选 择出的多个字词来作为原因字词。在图12中表示原因字词为多个时的显示内容。例如,作 为关联字词“松下太郎”的原因字词,显示出“谈话”、“嘉宾”及“喜剧”。这样一来,原因字 词就成为多个,用户可以更为容易地理解联想字词被提示的原因。另外,在上述实施方式中,在用户从取得部101决定节目的选择来视听节目的情 况下,还可以将存储在取得履历存储部104中的取得履历信息废弃。这样一来,就不再存在 过去的选择履历。因此,可以使开始检索之后用户选择出的字词和节目,更为强调地在节目 检索、联想源字词提取及原因字词提取中进行反映。另外,在上述实施方式中,通过由暂时选择检索部108按每个暂时选择节目提取 暂时选择检索结果,由联想源字词提取部109从暂时选择检索结果提取联想源字词,来按 每个节目变更关联字词。再者,因为联想源字词提取部109从由节目检索部105检索的全 部节目的节目信息决定联想源字词,所以也可以提取对检索结果全体的关联字词。另外,在上述实施方式中,存储在取得履历存储部104中的取得履历信息使用用 户从取得部101所输入的检索字词,进行了更新。再者,也可以使用用户视听并选择出的节 目或者下述节目的节目信息,来更新取得履历信息,上述节目为用户选择出的关联字词联 想的基础。也就是说,取得部101并不是由上述那种键盘或鼠标、遥控等的输入装置构成, 并通过用户输入来取得检索字词,而是一种处理部,该处理部从上述节目信息自动取得检 索字词,使用所取得的检索字词,来更新取得履历存储部104中所存储的取得履历信息。具 体而言,例如在用户视听并选择出节目ID “01”的节目时,取得部101取得节目ID “01”的 元数据中包含的各字词“松下太郎”、“综艺”、“松下三郎”、“日本”、“嘉宾”、“谈话”,来作为 检索字词。取得部101在该检索字词不存在于取得履历存储部104的取得履历信息中时, 和该字词一起,作为选择频次将值“ 1 ”新添加于取得履历信息中,在该检索字词存在于取得 履历信息中时,通过在与该检索字词对应的选择频次上加上1,来更新取得履历信息。作为 一例,在图13中表示,在取得履历信息为图4时,用户视听并选择出节目ID “01”的节目时 更新后的取得履历信息。如图13所示,字词“松下太郎”、“综艺”、“松下三郎”、“日本”、“嘉 宾”及“谈话”的选择频次与图4所示的选择频次相比分别增加了 1。这样一来,由于还使 用用户有意选择出的节目来更新取得履历信息,因而与只使用用户选择出的字词相比,可以更为快速地使取得履历信息与用户的爱好相适应。另外,在上述实施方式中,原因字词提取部111使用由联想源字词提取部109提取 的联想源字词、由联想字词提取部110提取的联想字词和存储在取得履历存储部104中的 取得履历信息,从存储于联想辞典存储部103中的联想辞典提取字词,将其作为表示联想 源字词和联想字词之间的联系的原因字词,但是原因字词的决定方法并不限于此。例如,在 存储于联想辞典存储部103中的联想辞典是下述可迁律联想辞典的情况下,还可以具备节 目联想辞典,该节目联想辞典认为在相同节目中频次较高地共现的字词有关系,使有关系 的字词相关联进行存储,上述可迁律联想辞典在认为相同节目中出现的字词有关系时考虑 字词关系中的可迁律使字词相关联进行存储。另外,原因字词提取部111也可以将在节目 联想辞典中与联想源字词及联想字词的双方结合起来的字词之内,取得履历信息中存储的 字词作为原因字词。再者,在存储于联想辞典存储部103中的联想辞典是下述节目联想辞 典的情况下,原因字词提取部111也可以将联想源字词作为原因字词,上述节目联想辞典 认为在相同节目中频次较高地共现的字词有关系,使有关系的字词相关联进行存储。这样 一来,在考虑到可迁律的联想辞典中,由于联想源字词和联想字词以特定的字词进行中介 使之相关联,因而可以将通过使用节目联想辞典进行中介的字词备选作为使联想源字词和 联想字词相关联的原因字词,提示给用户。另外,在使用节目联想辞典从联想源字词提取联 想字词的情况下,由于联想源字词和联想字词直接相关联,因而可以将联想源字词作为使 联想字词联想后的原因字词,提示给用户。本发明当将利用联想辞典进行检索结果的扩充及缩小所用的检索条件备选和作 为提示检索条件备选的原因的原因字词提示给用户时,可以使原因字词与用户的爱好、检 索行为及视听行为相适应。因此,本发明作为可以访问硬盘记录器、DVD记录器、TV、音频组 件及因特网进行信息检索的终端等,是有用的。以往,当将关联字词提示给用户时,只是集中显示对输入的字词相关联的字词,来 作为关联字词。因此,用户需要考虑对输入字词的关联字词意思上的距离,或者判断提示的 关联字词是否恰当,来选择并输入恰当的字词。在本发明中,因为通过使提示的原因字词与 用户的爱好及检索履历相适应,用户就可以理解表示输入字词和关联字词之间的联系的原 因字词,所以可以容易地选择符合检索目的的关联字词。另外,因为可以容易地选择符合检索目的的关联字词,所以用户可以准确度良好 地检索希望的节目信息。应当认为,此次公示的实施方式在所有的方面都是示例,并不用来进行限制。本发 明的范围不是根据上述的说明而是根据权利要求所示,并且希望包括和权利要求均等的意 思及范围内的全部变更。产业上的可利用性本发明可以利用于反复选择对于用户检索到的节目相关联进行提示的字词,检索 想视听的节目的对话式节目检索装置等中。
权利要求
一种对话式节目检索装置,使用检索字词来检索节目,其特征为,具备节目信息存储部,按节目存储着表示节目内容的节目信息;联想辞典存储部,存储着使上述节目信息中包含的字词之间相关联的联想辞典;取得部,取得上述检索字词;取得履历存储部,存储由上述取得部取得的上述检索字词和该检索字词被取得的频次,作为取得履历信息;节目检索部,使用上述取得履历信息,以该取得履历信息中包含的字词为检索条件,从上述节目信息检索节目;联想源字词提取部,从上述取得履历信息中包含的字词之中,提取使联想字词联想的联想源字词;联想字词提取部,使用上述联想辞典,提取与上述联想源字词相关联的联想字词;原因字词提取部,从与上述联想源字词之间的关联度及与上述联想字词之间的关联度的双方为指定关联度以上的字词之中,提取上述取得履历信息中包含的字词,作为说明上述联想源字词和上述联想字词的联系的原因字词;以及显示部,显示作为由上述节目检索部检索到的节目的节目检索结果、上述联想字词和上述原因字词。
2.如权利要求1所述的对话式节目检索装置,其特征为,上述取得部还取得暂时选择上述显示部上显示的上述节目检索结果中的某一个结果 的指令,上述对话式节目检索装置还具备暂时选择检索部,该暂时选择检索部使用作为暂时选 择出的节目的暂时选择节目的节目信息和上述取得履历信息,从上述节目信息检索节目, 将检索到的节目作为暂时选择检索结果,上述联想源字词提取部从上述取得履历信息和上述暂时选择节目的节目信息提取联 想源字词,上述联想字词提取部从上述暂时选择检索结果的节目信息中包含的字词,提取上述联 想辞典里与上述联想源字词相关联的联想字词。
3.如权利要求2所述的对话式节目检索装置,其特征为,上述联想源字词提取部从上述暂时选择节目的节目信息中包含的字词中,提取上述取 得履历信息中频次最高的字词,作为上述联想源字词。
4.如权利要求2所述的对话式节目检索装置,其特征为,上述联想字词提取部从上述暂时选择检索结果的节目信息中包含的字词,提取上述联 想辞典里与上述联想源字词相关联的字词,并从所提取的上述字词中提取上述取得履历信 息中包含的字词,作为联想字词。
5.如权利要求1所述的对话式节目检索装置,其特征为,上述原因字词提取部使用上述联想源字词、上述联想字词和上述取得履历信息从上述 联想辞典提取多个字词作为原因字词备选,从所提取的上述原因字词备选中,在上述节目 信息存储部中所存储的上述节目信息里,使用包含有上述联想源字词的节目数、包含有上 述联想字词的节目数和包含有原因字词备选的各字词的节目数,决定上述原因字词。
6.如权利要求1所述的对话式节目检索装置,其特征为,在上述联想字词提取部为了提取联想字词所使用的联想辞典是使相同节目中出现的 字词彼此相关联地存储的节目联想辞典的情况下,上述原因字词提取部将上述联想源字词 作为上述原因字词;在上述联想字词提取部为了提取联想字词所使用的联想辞典是可迁律 联想辞典的情况下,上述原因字词提取部使用上述联想源字词、上述联想字词和上述取得 履历信息从上述节目联想辞典提取上述原因字词,上述可迁律联想辞典是在认为相同节目 中出现的字词有关系时考虑字词关系中的可迁律制作出的。
7.如权利要求1所述的对话式节目检索装置,其特征为,上述节目检索部按上述节目从上述取得履历信息取得该节目的上述节目信息中包含 的字词的频次,且计算所取得的频次的和,将计算出的上述频次的和为指定阈值以上的节 目作为检索结果。
8.如权利要求1所述的对话式节目检索装置,其特征为,上述取得履历存储部还存储用户视听过的节目的节目信息中包含的字词或者用户浏 览过的节目信息中包含的字词和视听上述节目的频次或者浏览上述节目信息的频次,作为 上述取得履历信息。
9.一种对话式节目检索方法,由计算机使用检索字词来检索节目,其特征为,包含取得步骤,取得上述检索字词;节目检索步骤,使用取得履历信息,从在节目信息存储部中按节目存储的表示节目内 容的节目信息中检索节目,上述取得履历信息存储在取得履历存储部中,表示在上述取得 步骤中取得的检索字词和该检索字词被取得的频次;联想源字词提取步骤,从上述取得履历信息中包含的字词之中,提取使联想字词联想 的联想源字词;联想字词提取步骤,使用联想辞典存储部中存储的使上述节目信息中包含的字词之间 相关联的联想辞典,提取与上述联想源字词相关联的联想字词;原因字词提取步骤,从与上述联想源字词之间的关联度及与上述联想字词之间的关联 度的双方未指定关联度以上的字词中,提取上述取得履历信息中包含的字词,作为说明上 述联想源字词和上述联想字词的联系的原因字词;以及显示步骤,将作为在上述节目检索步骤中检索到的节目的节目检索结果、上述联想字 词和上述原因字词显示于显示部。
10.一种程序,使用检索字词来检索节目,其特征为,使计算机执行取得步骤,取得上述检索字词;节目检索步骤,使用取得履历信息,从在节目信息存储部中按节目存储的表示节目内 容的节目信息检索节目,上述取得履历信息存储在取得履历存储部中,表示在上述取得步 骤中取得的检索字词和该检索字词被取得的频次;联想源字词提取步骤,从上述取得履历信息中包含的字词之中,提取使联想字词联想 的联想源字词;联想字词提取步骤,使用联想辞典存储部中存储的使上述节目信息中包含的字词之间相关联的联想辞典,提取与上述联想源字词相关联的联想字词;原因字词提取步骤,从与上述联想源字词之间的关联度及与上述联想字词之间的关联 度的双方为指定关联度以上的字词中,提取上述取得履历信息中包含的字词,作为说明上 述联想源字词和上述联想字词的联系的原因字词;以及显示步骤,将作为在上述节目检索步骤中检索到的节目的节目检索结果、上述联想字 词和上述原因字词显示于显示部。
全文摘要
文档编号G06F17/30GK101952825SQ20098010577
公开日2011年1月19日 申请日期2009年2月18日 优先权日2008年2月20日
发明者Matsuura Satoshi, Tsuzuki Takashi 申请人:Panasonic Corp
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1