用户简表编辑设备、方法和程序的制作方法

文档序号:7618865阅读:172来源:国知局
专利名称:用户简表编辑设备、方法和程序的制作方法
技术领域
本发明涉及编辑包括涉及用户的信息的用户简表的用户简表编辑设备,和该设备中采用的用户简表编辑方法和程序,当记录设备进行自动记录时,记录设备参考所述用户简表。
背景技术
当用户不能实时欣赏或者意欲稍后再次欣赏将要广播的内容(例如电视节目,音乐等)时,他们有时对录制进行编程,以便在广播之后观看录制的内容。一些记录设备使用户能够在正在录制节目的时候,从起点开始节目的重放。例如,为了录制电视节目,一般通过指定节目的频道和时间,或其标识符来进行编程。此外,与近来的数字广播的普及相适应,自动录制和用户利用电子节目指南(EPG)指定的关键字,例如比赛或人名对应的节目的系统已被付诸实践。
自动记录真正满足某一用户的兴趣的内容的主要方法有两种。第一种是创建其中利用一组关键字或搜索条件来表达用户兴趣的用户简表。第二种是参考涉及和所述某一用户具有相同兴趣的其它用户的视听信息。
例如,日本专利申请KOKAI公告No.11-008810公开了第一种方法,即,利用和用户的兴趣对应的搜索条件搜索EPG的方法,不过该公告目的不在于提供一种编程方法。但是实际上,用户的兴趣更含糊,于是,用户通常难以利用一组关键字或搜索条件明确地表达他们的兴趣。例如,即使用户意欲事先进行编程,以便录制特定电影导演的所有作品,用户可能记不住作品的名称。类似地,即使用户对某位女演员感兴趣,他们可能记不得该女演员的姓名,而只是仅仅说“扮演某部电影的女主人公的女演员”。从而,描述详细的用户简表(profile)需要大量的时间和努力。
日本专利申请KOKAI公告No.2002-218363公开了第二种方法,该方法也称为“合作过滤”。在该公告的技术中,用户选择“意见领导者”,该“意见领导者”选择某一节目。这种合作过滤在某种程度上有用。但是实际上,用户具有不同的兴趣,于是,作为对每个用户规划哪个节目应被录制的方法,合作过滤被认为存在局限性。
如上所述,为了对用户实现所希望的规划,必须创建用户简表。但是,用户可能感到利用一组关键字或搜索条件指明他们的并不总是明确的兴趣麻烦费事。
为了简化用户简表的准备,可通过系统和每个用户之间的对话来确定用户简表。日本专利申请KOKAI公告No.2003-255992公开一种具有使用户能够与系统会话的功能的系统。在该系统中,例如进行下述会话系统“待录制的节目何时开始?”用户“9:00pm”系统“该节目在哪个频道?”用户“11频道”特别地,日本专利申请KOKAI公告No.2003-255992描述一种为了有效地把用户引到所需的节目而做出的关于应向用户提供何种问题,以及如何排列这些问题的发明。但是,该方法只实现用户事先指定的节目的快速编程,并没有克服上面说明的利用一组关键字或搜索条件明确地说明用户的含糊兴趣的困难。
另外,在常规的编程系统中,一旦运动、演员等的名称被指定为关键字,难以重新安排用户简表,使之更适合于用户的兴趣,或者遵循兴趣的变化。即,由于用户不能明确地描述他们的偏爱,因此用户不仅最初难以创建用户简表,而且还难以改变用户简表。
如上所述,现有技术没有提供一种易于编辑用户简表,使之更适合于用户的偏爱的技术。

发明内容
本发明使用户能够容易地编辑用户简表,以便使其更适合于他们的偏爱。
根据本发明的第一方面,提供一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得和内容相关的至少一个问题的获取单元;从问题抽取至少一个搜索项的搜索抽取单元;根据搜索项,通过网络收集与问题相关的有关信息的收集单元;根据搜索项的多个位置和所述问题,从有关信息抽取指示用于编辑用户简表的至少一个候选信息的至少一个候选回答的回答抽取单元;和根据所有或部分候选回答,编辑用户简表的编辑单元。
根据本发明的第二方面,提供一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得字符串的获取单元;通过网络收集和字符串相关的第一串信息的收集单元;根据字符串,从第一串信息抽取指示用于编辑用户简表的信息候选的候选信息的抽取单元;和根据所有或部分候选信息,编辑用户简表的编辑单元。
根据本发明的第三方面,提供一种供与网络连接的、用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表的编辑设备之用的编辑方法,用户简表包括和用户的偏爱相关的偏爱信息,所述方法包括获得和内容相关的至少一个问题;从问题抽取至少一个搜索项;根据搜索项,通过网络收集与问题相关的有关信息;根据搜索项的多个位置和所述问题,从有关信息抽取指示用于编辑用户简表的候选信息的至少一个候选回答;和根据所有或部分候选回答,编辑用户简表。
根据本发明的第四方面,提供一种保存在介质中,用于使计算机起与网络连接的,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表的编辑设备的作用的程序,用户简表包括和用户的偏爱相关的偏爱信息,所述程序包括指令计算机获得和内容相关的至少一个问题的单元;指令计算机从问题抽取至少一个搜索项的单元;指令计算机根据搜索项,通过网络收集与问题相关的有关信息的单元;指令计算机根据搜索项的多个位置和所述问题,从有关信息抽取指示用于编辑用户简表的候选信息的至少一个候选回答的单元;和指令计算机根据所有或部分候选回答,编辑用户简表的单元。
根据本发明的第五方面,提供一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得和内容相关的至少一个问题的获取单元;从问题抽取至少一个搜索项的搜索项抽取单元;通过网络收集与搜索项相关的网页信息的收集单元,所述网页信息包括标记信息;估计问题的回答类型标记信息的估计单元;根据搜索项和回答类型标记信息,从网页信息抽取用于编辑用户简表的至少一个候选回答的候选回答抽取单元;和根据所有或部分候选回答,编辑用户简表的编辑单元。


图1图解说明根据本发明第一实施例的记录/再现设备的配置例子;图2是图解说明在包含于第一实施例中的问题分析单元中采用的过程例子的流程图;图3是图解说明在包含于第一实施例中的搜索单元中采用的过程例子的流程图;图4A和4B用于说明在第一实施例中采用的对候选回答的得分计算方法的例子;图5是图解说明在包含于第一实施例中的信息抽取单元中采用的过程例子的流程图;图6是图解说明在包含于第一实施例中的简表管理单元中采用的过程例子的流程图;
图7图解说明根据本发明第二实施例的记录/再现设备的配置例子;图8图解说明在第二实施例中采用的,向用户呈现的问题屏幕图像的一个例子;图9是图解说明在包含于第二实施例中的简表管理单元中采用的过程例子的流程图;图10是图解说明在包含于第一实施例中的问题产生单元中采用的过程例子的流程图。
具体实施例方式
下面参考

本发明的实施例。
(第一实施例)图1图解说明根据本发明的第一实施例的采用用户简表编辑设备的记录/再现设备的配置例子。
如图1中所示,该记录/再现设备包括用户简表编辑单元1和记录/再现单元2。
用户简表编辑单元1用于在记录/再现设备进行自动记录时,编辑包括涉及用户的自动记录的信息的用户简表。用户简表编辑单元1包括输入单元11,问题分析单元12,搜索单元13,通信单元14,信息抽取单元15,输出单元16和简表管理单元17。
记录/再现单元2对应于适合于电子节目指南(EPG)的记录装置,例如磁带录像机,DVD记录器等。记录/再现单元2包括记录/再现处理单元21,EPG存储器22,简表存储器23和内容存储器24。本质上,记录/再现单元2可以是已知装置。此外,虽然在本实施例中,既具有记录功能又具有再现功能的设备被用作例子,不过它可以只具有记录功能。
虽然图1中表示用户简表编辑单元1被包含在记录/再现设备中,不过它可以是能够与记录/再现设备连接的外部装置。
下面说明图1中的每个部件。
在用户简表编辑单元1中,输入单元11被用于输入用户的请求(一串自然语言字符),菜单选择信息等。输入单元11由诸如键盘、鼠标、麦克风之类的输入装置形成。
问题分析单元12分析用户的问题(例如估计该问题的回答的类型)。
搜索单元13根据用户的问题产生搜索条件,并根据搜索条件搜索因特网3上的网页(例如,它通过通信单元14向因特网3上提供的网页搜索服务发出搜索请求)。搜索单元13还根据问题分析单元12的分析结果(例如用户的问题的回答的类型)和从包含在信息抽取单元15通过通信单元14获得的搜索结果中的网页抽取的信息,产生用户的问题的候选回答。
通信单元14连接用户简表编辑单元1和因特网3。通信单元14由例如将与因特网连接的网络装置形成。
虽然在本实施例中,因特网被用作网络例子,不过可以使用另一网络。在后一情况下,通信单元14连接用户简表编辑单元1和另一网络,并在所述另一网络上进行搜索。
信息抽取单元15被用于获得搜索结果(例如,通过通信单元14,从在因特网3上提供的网页搜索服务获得作为对搜索请求的回答的搜索结果),从而从包括在搜索结果中的网页抽取信息,该信息被搜索单元13用于产生用户问题的候选回答。
输出单元16向用户提供搜索单元13产生的候选回答,用户等。输出单元16可由诸如显示器,扬声器之类的输出装置形成。
简表管理单元17管理用于记录满足用户兴趣的内容的用户简表(例如,把关键字加入用户简表中)。
可使问题分析单元12,搜索单元13和信息抽取单元15利用例如在Prager,J.等在Question-answering by predictive annotation,ACM SIGIR2000,pp.184-191,2000,ISBN1-58113-226-3中描述的问答系统。
另一方面,在记录/再现单元2中,EPG存储器22保存EPG获取单元(未示出)获得的EPG。EPG可在和内容相同的频道上广播(例如内容和EPG可通过多路复用被结合),或者由相同的媒体广播为内容。EPG可由与内容不同的通信媒体广播,或者可由记录媒体分发。此外,记录/再现设备可通过诸如因特网之类的网络获得EPG。
简表存储器23保存用户简表。每个用户简表可由例如用户简表编辑单元1的简表管理单元17编辑。但是,用户简表当然可被修改,使得它们可由用户任意编辑。
内容存储器24保存记录/再现处理单元21处理后的内容。对于内容应以何种形式保存在内容存储器24中没有任何特殊的限制(例如,内容可以压缩状态,编码状态或未处理状态被保存)。
记录/再现处理单元21根据EPG和每个用户简表,确定内容输入单元(未示出)输入的每项内容是否应被自动记录,如果确定该项内容发被自动记录,那么把所述每项内容记录在内容存储器24中。如果用户简介包含至少一个关键字(例如,由项“AND”、“OR”、“NOT”等连接的多个关键字),并且EPG包含涉及一项内容(例如程序)的至少一个关键字(例如,串联排列的多个关键字),以及如果在用户简表的至少一个关键字和EPG的至少一个关键字之间找到预定的关系,那么可确定该项内容(节目)应被自动记录。预定的关系意味着例如,这些关键字相互一致或者呈上位概念和从属概念的关系。当然,就EPG或用户文件的结构,以及根据EPG和用户简表,确定每项内容是否应被自动记录的程序来说,各种变化都是可能的。
参见图1,首先粗略地说明在本实施例中执行的处理例子,随后详细说明图1中所示的每个部件执行的处理。
首先,为了指定应被自动记录的内容的类型(或者编程的标准),用户利用输入单元11输入问题,例如“A soap opera starring ****”,****表示特定演员姓名。
当从输入单元11收到问题时,问题分析单元11执行回答类型识别的处理,从而确定请求的回答类型是人名(PERSON),地名(LOCATION)或者节目标题(TITLE)。在本实施例中,由于请求剧名,因此回答类型被确定为“TITLE”。
随后,搜索单元13从问题分析单元12接收问题,从而产生搜索条件,并请求通信单元14进行搜索。根据问题“A soap opera starring ****”,通过词法分析获得三个搜索项“****”、“starring”和“opera”,并将其用作搜索条件。通信单元14把搜索条件传送给现有的因特网搜索引擎,从而获得网页搜索结果,并下载每个网页的内容。
之后,信息抽取单元15从输出自通信单元14的网页抽取信息。从而,标记“TITLE”被附加到表示剧名的诸如“xxx”、“△△△”之类的字符串上,而标记“PERSON”被附加到表示演员姓名的诸如“****”之类的字符串上。
之后,搜索单元13接收通过把指示回答类型的标记附加到每个搜索结果上而获得的信息,并利用现有的问答技术从该信息选择用户问题的候选回答。从而,作为对例如“A soap opera starring ****”的候选回答,获得指示剧名的具有相应标记“TITLE”的诸如“xxx”、“△△△”之类的字符串。
之后,输出单元16向用户提供候选回答。用户可利用输入单元11从候选回答中选择一个或多个,或者不选择它们中的任意一个。例如,如果用户选择“xxx”和/或“△△△”,那么关键字“xxx”和/或“△△△”被传送给简表管理单元17,简表管理单元17再把“xxx”和/或“△△△”登记到它们的用户文件中。
上述处理使得“xxx”和/或“△△△”能够被自动输入到用户简表中,即使用户记不住或者不知道他们想要安排记录/再现设备记录的“A soapopera starring ****”的剧名。
下面将详细说明分别由问题分析单元12,搜索单元13,信息抽取单元15和简表管理单元17执行的处理例子。
图2表示由第一实施例中的问题分析单元12执行的处理例子。
问题分析单元12从输入单元11接收用户的问题(步骤S1),随后利用例如回答类型估计规则121,估计问题的回答类型(步骤S2),并把问题和回答类型估计结果发送给搜索单元13(步骤S3)。
回答类型估计规则可由例如模式匹配实现。具体地说,通过描述一种规则,例如如果问题的最后一项是“opera”、“film”或“work”,那么回答类型被设置为“TITLE”,如果问题的最后一项是“heroine”或者“actresss”,那么回答类型被设置为“PERSON”,能够实现回答类型估计。从而,回答类型“TITLE”被分配给例如问题“movies directed by Mr.***”(***表示某一人名),而回答类型“PERSON”被分配给例如问题“thehero of xxx”。
图3表示由第一实施例中的搜索单元13搜索的处理例子。
搜索单元13从问题分析单元12接收问题和回答类型估计结果(步骤S11),随后利用例如词法分析字典131执行关于该问题的词法(morphological)分析,从而获得搜索项(步骤S12)。从而,可从问题“movies directed by Mr.***”抽取诸如“***”、“directed”、“work”之类的搜索项。已知的技术可被用于实现词法分析字典131的结构和利用该字典的词法分析。
之后,搜索单元13把这些搜索项发送给通信单元14,并请求利用在因特网上公布的现有搜索引擎搜索网页(步骤S13)。
随后,搜索单元13从信息抽取单元15获得通过使网页搜索结果经过信息抽取处理而得到的文本数据(步骤S14)。
借助信息抽取处理,在网页的文本数据中,诸如“movie<TITLE>xxx</TITLE>”之类的标记被附加到例如“movie xxx”上,而诸如“moviedirector<PERSON>****</PERSON>”之类的标记被附加到例如“moviedirector***”上。
如果回答类型估计结果是“TITLE”,那么具有标记“TITLE”的网页的数据项被看作候选回答,根据关于搜索项和候选回答的距离计算,向每个候选回答赋予一个得分。
现在参见图4,说明计算每个候选回答的得分的得分计算方法的例子。这里假定从用户的问题“movies directed by Mr.***”获得三个搜索项“***”、“directed”和“work”,并且作为利用这三项在因特网上的搜索的结果,获得两个网页,“网页1”和“网页2”。如图4A中所示的“网页1”包含文本“the 1990′s work′xxx′directed by Mr.***”,它包括所有这三个搜索项。另一方面,如图4B中所示的“网页2”包含文本“the profit of thenewest“△△△”directed by Mr.*** is...”,它只包括搜索项“***”和“directed”。此外,如图4A和4B中所示,诸如“PERSON”和“TITLE”之类的标记被附加在网页上。
在图4A和4B的例子中,由于对问题“movies directed by Mr.***”的回答类型估计结果是“TITLE”,因此从网页1获得的“xxx”和从网页2获得的“△△△”被看作候选回答。这种情况下,如果每个候选回答的得分被定义为,例如“命中搜索项之间的距离的倒数的总和”,那么包括在其中命中搜索项的数目更大,并且相邻的每对搜索项之间的距离更接近的文本中的候选回答(图4A和4B的例子中的“xxx”)可被赋予更高的得分。距离可被定义为文本字符串中字符的长度。另一方面,可通过地文本进行词法分析并计算单词的数目,定义所述距离。作为上述处理的结果,“xxx”可作为第一候选回答提供给用户,“△△△”作为第二候选回答提供给用户。和图4A和4B的例子不同,如果从多个网页获得相同的候选回答“xxx”,那么通过进行计算网页的总分的处理(多数得票处理),计算最终的候选回答。
最后,搜索单元13根据它们的得分,对候选回答排序,并把n个高分候选回答发送给输出单元16(步骤S16)。
图5表示由第一实施例中的信息抽取单元15进行的处理例子。
信息抽取单元15接收由通信单元14下载的网页的文本数据项(步骤S21),并利用例如信息抽取规则151对被看作候选回答的文本数据项的各个部分进行附加标记,例如“TITLE”、“PERSON”、“LOCATION”等的处理(步骤S22)。图4A和4B中表示了信息抽取单元15的处理结果的例子。已知的技术可被用于实现信息抽取规则151的结构和利用规则151附加标记的处理(例如,“***代表′person′,xxx和△△△代表′TITLE′”的信息可被加入到信息抽取规则151中)。
最后,信息抽取单元15把带有标记的文本数据项发送给搜索单元13(步骤S23)。
图6表示由第一实施例中的简表管理单元17执行的处理例子。
简表管理单元17接收用户通过输入单元11选择的候选回答,并把选择的候选回答加入他们的保存在记录/再现单元2的简表存储器23中的简表中。例如,当输出单元16显示第一候选回答“xxx”和第二候选回答“△△△”时,如果用户通过输入单元11选择“xxx”,那么新的关键字“xxx”被加入到用户简表中。从而,从EPG中自动选择并记录和“xxx”匹配的节目。
上述处理使用户能够仅仅通过输入问题“movies directed by Mr.***”就能获得作品的名称,例如“xxx”,并且使得获得的名称(关键字)能够容易地加入到每个用户简表中。
类似地,如果用户输入问题“the hero of movie xxx”,那么上述处理使用户能够获得其回答类型是“PERSON”的诸如“◆◆◆”、“...”(这些代表演员姓名)之类的候选回答。从而,即使用户不知道或者记不住演员的姓名,他们也能够把演员的姓名加入到他们的简表中。
在上面的说明中,用户的输入采取问题的形式。下面将说明用户的输入不是采取问题的形式的情况(尽管该输入由自然语言字符形成)。
具体地说,假定用户已输入字符串“***”(***代表某一人名),而不是“movies directed by Mr.***”。这种情况下,利用已知技术,例如词法分析,输入的字符串可被自动确定为人名(除了人名之外的字符串也是一样的)。如果规则“输入字符串代表人名,回答类型为“PERSONNAL”或“TITLE””被加入到回答类型估计规则中,那么作为对上面的输入字符串的回答类型估计的结果,能够获得“PERSONNAL”和“TITLE”。之后,如果对每个情况“PERSON”和“TITLE”都应用上面说明的处理,那么能够获得与“***”相关的候选人名,以及和“***”相关的候选作品名。把这些候选回答提供给用户足以使他们可选择作为加入到其简表中的关键字的一个或多个候选回答。
至于问题“movies directed by Mr.***”,回答类型可被缩小到“TITLE”,而至于不是采取问题的形式的输入字符串“***”,难以自动把回答类型缩小到“PERSON”或者“TITLE”。于是,为了获得满足用户意图的候选回答,如果必须缩小回答类型,那么当用户输入字符串时或者当需要时,可允许用户指定回答类型,或者可允许用户输入采取问题形式的根据其确定回答类型的字符串。
如上所述,在本实施例中,即使用户的兴趣含糊,并且用户难以登记详细的关键字,通过每个用户和系统之间的对话,也能够容易地创建适合于编程的用户简表。
虽然本实施例采用“TITLE”、“PERSON”和“LOCATION”作为回答类型,不过回答类型并不局限于此,相反可以采用其它各种回答类型。例如,就问题“the prize granted to Director ***”,可以使用回答类型“PRIZE”。
在上面的说明中,输出单元16向用户呈现搜索单元13获得的候选回答,从而允许他们通过输入单元11选择一个或多个候选回答,简表管理单元17把对应于选择的候选回答的字符串加入到每个用户简表中(这在下面将被称为“对话模式”)。另一方面,可使简表管理单元17把搜索单元13获得的所有候选回答,或者利用预定标准选择的候选回答加入到每个用户简表中,如图1中的虚线101所示(这在下面将被称为“自动模式”)。此外,关于应使用对话模式还是自动模式的确定可由用户完成。
此外,在对话模式和自动模式下,均可以通过把全部或部分候选回答用作新的输入字符串,以反馈方式重复从分析、搜索、信息抽取、候选回答产生、选择到加入用户简表的一系列处理,如图1中的点划线102所示。例如,可以进行下面的第一和第二处理。
首先,输入询问导演某一作品的导演的姓名的问题,随后作为候选回答获得该导演的姓名。之后,通过把该导演的姓名输入为字符串,获得该导演所执导的其它电影的名称,每部其它作品的男主角的姓名,该导演作为演员出现于其中的作品的名称。利用获得的姓名和名称作为输入字符串,获得其它候选回答。重复这些处理步骤,从而把在处理的重复期间获得的全部或部分候选回答看作最终的候选回答。
其次,通过把某一导演的姓名作为字符串输入,获得该导演所执导的作品的名称,每部作品的男主角的姓名,该导演作为演员出现于其中的作品的名称等。利用获得的姓名和名称作为输入字符串,获得其它候选回答。重复这些处理步骤,从而把在处理的重复期间获得的全部或部分候选回答看作最终的候选回答。
可使用户能够设置重复的次数。
(第二实施例)在第一实施例中,通过把字符串,例如来自用户的问题输入系统,能够把关键字加入到用户简表中。相反,在第二实施例中,即使例如用户没有输入任何问题,也能够把关键字加入到用户简表中。具体地说,在第二实施例中,通过根据与用户的兴趣相关的信息产生可代替输入字符串使用的信息,实现把关键字加入到用户简表中。
图7图解说明根据第二实施例的采用用户简表编辑设备的记录/再现设备的配置例子。从图7与图1的比较易于理解,图7的配置包括问题产生单元18。注意图7还表示用户简表编辑单元1被包含在记录/再现设备中的情况,不过它可以是能够与记录/再现设备连接的外部装置。
参见图7,首先粗略说明在第二实施例中执行的处理例子,然后详细说明由图7中所示的每个部件执行的处理。
在第二实施例中,将主要说明与第一实施例的不同之处。
例如,当用户完成部分内容或者整个内容的欣赏时,记录/再现单元2把该情况通知简表管理单元17。
当被告知时,简表管理单元7产生搜索与欣赏内容相关的信息的问题。当用户已欣赏名为“xxx”的电影时,简表管理单元17自动产生相关问题,例如“导演电影xxx的导演”,“电影xxx的女主角”等。
简表管理单元17产生的每个相关问题被发送给搜索单元13。搜索单元13利用例如如第一实施例中的因特网进行问答处理,从而获得例如导演和/或女演员的姓名的候选回答。
第二实施例与第一实施例的不同在于在第二实施例中,对简表管理单元17自动产生的相关问题,而不是对用户输入的问题进行问答处理。
在第一实施例中,甚至能够处理不是采取问题形式的输入字符串。第二实施例也一样。例如,简表管理单元17可以只向搜索单元13发送名称“xxx”。
问题产生单元18从搜索单元13接收相关问题和与之对应的候选回答信息,从而产生给用户的问题,并把该问题发送给输出单元16。
例如,当用户已欣赏电影“xxx”时,如图8中所示,向用户呈现一个菜单选择类型问题。在图8的例子中,导演电影“xxx”的人名“△△△”,和电影“xxx”的女主角的人名“???”作为将被输入用户简表的候选关键字被提供给用户。当用户已通过输入单元11检查例如“△△△”时,用户能够容易地把“△△△”作为关键字加入到用户简表中。在图8的例子中,作为“导演△△△的其它重要作品”,还提供其它名称“□□□”和“”。获得这种信息的方法将在后面说明。
第二实施例可被修改,使得首先向用户提出问题“Did you enjoy themovie xxx”,只有当用户回答YES(是)时,才呈现和图8中所示的类似的信息。此外,如果用户回答NO(否),即,如果他们对电影xxx不感兴趣时,可向用户呈现诸如“Do you want to delete the followingpersonal name from profile”之类的问题,从而允许用户指定要从简表删除的关键字。在任何情况下,简表管理单元17根据从用户获得的回答改变用户简表的内容。
在上面的情况下,可进行下述处理。例如,向每个关键字分配一个加权值,所述加权值选自下限值为0到上限值为1的范围中。
如果用户回答YES,并且如果指定的关键字未被登记在用户简表中,那么该关键字被加入到用户简表中,同时向其分配为1的加权值。如果指定的关键字已被登记,并且如果分配给其的加权值小于1,那么增大加权值。如果加权值为1,那么不进行任何操作。
相反,如果用户回答NO,并且如果指定的关键字未被登记在用户简表中,那么不进行任何操作。如果指定的关键字已被登记,并且如果分配给其的加权值大于0,那么减小加权值。如果加权值为0,那么不进行任何操作。
另一方面,例如,如果用户回答NO,并且如果指定的关键字已登记在用户简表中,同时加权值大于0,那么减小加权值。在其它情况下,不进行任何操作。
在任何情况下,当加权值变成0时,关键字可从用户简表中删除。
在上面说明的例子中,就增大/减小加权值的方法和使用加权值的方法来说存在变化。例如,可通过增加/减去恒定值(例如1.0、0.5等),或者通过把加权值乘以/除以恒定值(例如2)来增大/减小加权值。此外,只有当加权值为0时,才能使该关键字无效。另一方面,如果加权值不小于某一阈值,那么关键字可被看作有效,如果加权值小于某一阈值,那么该关键字可被看作无效。
图9表示了在包含于第二实施例中的简表管理单元17中采用的过程例子。
首先,简表管理单元17从记录/再现单元2接收指示用户已欣赏特定内容的信号(步骤S41)。这可通过检测例如记录/再现单元2的状态从内容再现状态到再现停止状态的转变来容易地实现。
随后,简表管理单元17自动产生和上述特定内容相关的问题(步骤S42)。具体地说,如果用户已欣赏如上所述名为“xxx”的电影,那么根据例如事先产生的模板181,自动产生相关问题,例如“the director of themovie xxx”,“the heroine in the movie xxx”。这些问题被发送给问题分析单元12(步骤S42),从而开始和在第一实施例中执行的类似的问答处理。
第二实施例中问题分析单元12、搜索单元13、通信单元14和信息抽取单元15执行的处理基本上和第一实施例中执行的处理相同。于是,将不对所述处理进行详细说明。例如,通过选择问答处理的第一候选回答,能够自动获得人名“△△△”作为对相关问题“the director of the moviexxx”的回答,能够自动获得人名“???”作为对相关问题“the heroine of themovie xxx”的回答。此外,如果根据作为回答获得的人名“△△△”自动产生次级相关问题,例如“△△△”导演的电影,那么利用所述次级相关问题进行问答处理,能够获得电影名称,例如“xxx”、“□□□”、“”作为新的候选回答。如果“xxx”(它是用户已欣赏的电影的名称)被自动删除,那么如图8中所示的信息(它指示排除“xxx”的其它重要作品)被呈现给用户。
图10表示在包括于第二实施例中的问题产生单元18中使用的过程例子。
问题产生单元18从搜索单元13接收相关问题和回答(步骤S51),利用例如事先产生的模板191产生给用户的问题,并在输出单元16上显示和图8中显示的类似的信息(步骤S53)。
如上所述,在第二实施例中,当用户已欣赏内容时,可向用户建议如何更新他们的简表。因此,即使用户未定地变得喜欢电影“xxx”,诸如该电影的导演或女主角是否应作为关键字被加入用户的简表中之类的备选问题可被呈现给用户。
上面,当用户已欣赏内容时,根据内容的名称进行处理。但是,当用户欣赏内容时,可根据和内容相关的除名称之外的数据进行处理。此外,当用户对除用户已欣赏的内容之外的内容进行处理时,可根据除首先提及的内容之外的内容的名称,或者根据和除首先提及的内容之外的内容相关的不同于名称的其它数据进行处理。
注意目前可用的问答技术不是完美的问答技术,于是,不保证对某一问题的正确回答百分之百是第一候选回答。但是,由于在因特网上存在巨大数量的冗余文本数据,因此如果如同第一实施例中一样,利用冗余数据进行基于多数票原理的候选回答得分计算,能够提高候选回答的可靠性。此外,在如同第二实施例中一样,所使用的应用的类型被限制的情况下,难以提高用于问答的每个模块,例如候选物类型估计,信息抽取的准确性。
另外在第二实施例中,对话模式和自动模式都可被实现。此外,可允许用户设置应使用对话模式和自动模式中的哪一种。另外在第二实施例中,通过把所有或部分候选回答用作输入字符串,可反馈地重复从分析、搜索、信息抽取、候选回答产生、选择到加入用户简表的一系列处理。
第一和第二实施例可被组合。
虽然在实施例中,对日语数据进行处理,不过本发明并不局限于日语数据。在例如使用英语数据的情况下,如果代替词法分析,使用诸如词性标记之类的已知技术就足够了。
也可通过利用具有恰当机构的计算机,执行安装在计算机中的软件来实现上述每种功能。
此外,也可用使计算机能够执行预定过程,或者使计算机能够起预定装置的作用,或者使计算机能够实现预定功能的程序的形式实现实施例。另外,实施例甚至可被实现成保存程序的计算机可读记录介质。
本领域的技术人员易于想到其它优点和修改。于是,本发明并不局限于这里表示和说明的具体细节和典型实施例。因此,在不脱离由附加权利要求和它们的等同限定的一般发明原理的精神或范围的情况下,可做出各种修改。
权利要求
1.一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得和内容相关的至少一个问题的获取单元;从问题抽取至少一个搜索项的搜索项抽取单元;通过网络收集与搜索项相关的有关信息的收集单元;根据有关信息中搜索项和所述问题之间的距离,从有关信息抽取用于编辑用户简表的至少一个候选回答的候选回答抽取单元;和根据所有或部分候选回答,编辑用户简表的编辑单元。
2.按照权利要求1所述的设备,其中获取单元获得至少一个字符串作为问题。
3.按照权利要求1所述的设备,其中收集单元收集至少一个网页作为相关信息。
4.按照权利要求1所述的设备,其中候选回答抽取单元利用邻近搜索,抽取候选回答。
5.按照权利要求1所述的设备,其中候选回答抽取单元利用命名实体抽取,抽取候选回答。
6.按照权利要求1所述的设备,其中候选回答抽取单元利用词性标记,抽取候选回答。
7.按照权利要求1所述的设备,还包括根据问题确定候选回答的类型的确定单元,其中搜索项抽取单元根据问题和类型抽取搜索项。
8.按照权利要求1所述的设备,还包括根据偏爱信息产生至少一个字符串的产生单元,其中收集单元收集和字符串相关的相关信息,而不是收集有关信息。
9.按照权利要求1所述的设备,其中编辑单元包括向用户呈现候选回答的呈现单元,从用户获得指令以从呈现的候选回答中选择数据的获取单元,和根据选择的数据编辑用户简表的编辑单元。
10.按照权利要求1所述的设备,其中在不向用户呈现候选回答的情况下,编辑单元根据所有或部分候选回答编辑用户简表。
11.按照权利要求1所述的设备,其中当候选回答抽取单元抽取候选回答时,收集单元还收集和候选回答相关的候选相关信息;和候选回答抽取单元还从候选相关信息抽取候选回答。
12.一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得字符串的获取单元;通过网络收集和字符串相关的第一串信息的收集单元;根据字符串,从第一串信息抽取指示用于编辑用户简表的信息候选的候选信息的抽取单元;和根据所有或部分候选信息,编辑用户简表的编辑单元。
13.一种编辑方法,用在与网络连接的用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表的编辑设备中,用户简表包括和用户的偏爱相关的偏爱信息,所述方法包括获得和内容相关的至少一个问题;从问题抽取至少一个搜索项;通过网络收集与搜索项相关的有关信息;根据有关信息中搜索项和所述问题之间的距离,从有关信息抽取用于编辑用户简表的至少一个候选回答;和根据所有或部分候选回答,编辑用户简表。
14.一种保存在介质中,用于使计算机起与网络连接的,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表的编辑设备的作用的程序,用户简表包括和用户的偏爱相关的偏爱信息,所述程序包括指令计算机获得和内容相关的至少一个问题的单元;指令计算机从问题抽取至少一个搜索项的单元;指令计算机通过网络收集与搜索项相关的有关信息的单元;指令计算机根据有关信息中搜索项和所述问题之间的距离,从有关信息抽取用于编辑用户简表的至少一个候选回答的单元;和指令计算机根据所有或部分候选回答,编辑用户简表的单元。
15.一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得和内容相关的至少一个问题的获取单元;从问题抽取至少一个搜索项的搜索项抽取单元;通过网络收集与搜索项相关的网页信息的收集单元,所述网页信息包括标记信息;估计问题的回答类型标记信息的估计单元;根据搜索项和回答类型标记信息,从网页信息抽取用于编辑用户简表的至少一个候选回答的候选回答抽取单元;和根据所有或部分候选回答,编辑用户简表的编辑单元。
全文摘要
一种与网络连接的编辑设备,用于编辑当确定是否每项内容要被记录时记录设备参考的用户简表,用户简表包括和用户的偏爱相关的偏爱信息,所述设备包括获得和内容相关的至少一个问题的获取单元;从问题抽取至少一个搜索项的搜索项抽取单元;通过网络收集与搜索项相关的有关信息的收集单元;根据搜索项和所述问题,从有关信息抽取用于编辑用户简表的至少一个候选回答的候选回答抽取单元;和根据所有或部分候选回答,编辑用户简表的编辑单元。
文档编号H04N5/445GK1705364SQ20051007432
公开日2005年12月7日 申请日期2005年6月1日 优先权日2004年6月2日
发明者酒井哲也 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1