信息处理设备以及用于搜索内容的评价的方法和系统的制作方法

文档序号:6465363阅读:119来源:国知局
专利名称:信息处理设备以及用于搜索内容的评价的方法和系统的制作方法
技术领域
本发明涉及用于搜索内容例如广播节目内容或存储在封装介质 中的内容的评价的设备、方法和系统。
背景技术
随着近来硬盘驱动器的容量的增加,能够记录如此大量的电视广 播节目内容以至于超过一天长度的记录和再现设备已经出现了。很多 这样的记录和再现设备都装备有基于用户登记的嗜好信息或关键字 自动选择电视广播节目内容并记录所选择的电视广播节目内容的特 征。因此,用户经常被迫去考虑要再现记录的大量电视广播节目内容 中的哪些内容。
上述类型的记录再现设备的用户能够从记录的大量电视广播节 目内容中选择任意的记录的电视广播节目内容,并能够再现和观看所 选择的电视广播节目内容。但是,理想的情况是,当选择要再现的记 录的电视广播节目内容时,用户能够知道对记录的电视广播节目内容 中的每一个的评价。对记录的电视广播节目内容中的每一个的评价可 用作从大量电视广播节目内容中选择理想内容的基础。
在因特网上,有大量网站,用户在上面写下其对各种主题的感想 或观点。人们已经提出了这样一种系统,该系统用于收集关于各种主 题的这种感想或观点,并且使用词素分析(morphological analysis )
技术或语法(syntactic analysis)分析技术来分析这些感想或观点, 从而确定关于这些主题的评价(例如,参见日本专利公布No, 2003-248681、 2003-157255、 2003-157254和2003-157253 )。

发明内容
然而,在上面所列的文献中描述的系统没有把关于电视广播节目 内容的主题信息的特性考虑在内,而是处理各种主题的通用系统。因 此,为了确定评价,必须爬行通过(crawl through )巨大数量的类型 广泛的多种网站,以便从这些网站中收集数据并存储这些数据。因此, 服务器系统的规模相应地就必须很大。
更具体来说,在因特网上有巨大数量的网站,在相关技术的上述 系统中,访问这些巨量网站中的每一个以l更从每一个网站的网页中收 集数据并存储这些数据,并且对这样存储的包含关于这些主题的感想 和观点的巨大数量的信息进行词素分析和句法分析,从而确定评价。 因此,服务器系统的规模不可避免地会非常大。
由于需要超大规模的服务器系统,因此很难使个人用户拥有的个 人装置能够对内容(例如电视广播节目内容)的评价进行搜索。此外, 在相关技术中,逐个地访问巨大数量的网站,以便收集包含关于目标 主题(即,应当搜索关于它的评价的主题)的感想和观点,因此要经 过很长时间才能获得关于该评价的信息,即搜索结果。
问题,并且提供使得在相对较短的时间和相对更小规模的结构下获得 内容的评价结果成为可能的设备、方法和系统。
根据本发明的一个实施例,提供一种信息处理设备,该信息处理 设备包括获取部分;关键字提取部分;站点搜索(site search)部 分;第一站点选择部分;第二站点选择部分;和评价结果获取部分。 获取部分被配置为获取内容相关信息,该内容相关信息包含内容的标 题和描述该内容的内容的信息。关键字提取部分被配置为从由获取部 分获取的内容相关信息中提取搜索关键字。站点搜索部分被配置为通
的网站,并获取关于作为搜索结果而被找到的多个网站的信息。第一 站点选择部分被配置为从作为由站点搜索部分执行的搜索的结果而
被找到的多个网站中选择前N个网站,N为预定的大于l的整数。第 二站点选择部分被配置为访问由第一站点选择部分选择的N个网站 中的每一个以便从该N个网站中的每一个的网页中提取文章,并且选 择该N个网站中的两个或更多个作为种子站点(seed site),从每一 个种子站点提取的文章包含个数超过预定阀值的搜索关键字的例子。 评价结果获取部分被配置为从由第二站点选择部分选择的两个或更 多个种子站点和链接到这些种子站点的下级网站中收集文章,并从收 集到的文章中获取内容的评价结果。
根据上述信息处理设备,关键字提取部分从要搜索其评价的内容 的内容相关信息中提取搜索关键字。然后,站点搜索部分(例如搜索 引擎)自动逐个地访问因特网上的网站以便从每一个网站的网页中收 集信息,并检测具有包含由关键字提取部分提取的搜索关键字的网页 的网站。
然后,第 一站点选择部分从具有包含搜索关键字的网页的那些网 站中选择前N个网站。N为预定的大于l的整数。
然后,第二站点选择部分访问由第一站点选择部分选择的N个 网站,以便从该N个网站中的每一个的网页中提取文章,并选择该N 个网站中的两个或更多个作为种子站点。从每一个种子站点中提取的 文章包含个数超过预定阀值的搜索关键字的例子。这里,种子站点是 指从其开始爬行通过链接到其上的较低级网站的网站。
评价结果获取部分爬行通过由第二站点选择部分选择的种子站 点和链接到种子站点的下级网站(即,逐个地访问这些网站),以便 从每一个网页中收集文章。然后,评价结果获取部分对收集到的文章 进行词素分析和句法分析,例如,以便获取该内容的评价结果。
根据该信息处理设备,由第 一站点选择部分和第二站点选择部分 在两个步骤中从作为搜索结果而被找到的网站中选择更小数量的网
站,从该更小数量的网站的网页中收集用于获取评价结果的文章,并 且从这些收集到的文章中获得评价结果。因此,该信息处理设备具有 比相关技术中的那些设备更小规模的结构,但是能够在相对更小的时 间内获得评价结果。
根据本发明的另一个实施例,提供一种信息处理设备,该信息处
理设备包括获取部分;关键字提取部分;站点搜索请求部分;第一 站点选择部分;第二站点选择部分;和评价结果获取部分。获取部分 被配置为获取内容相关信息,该内容相关信息包含内容的标题和描述 该内容的内容的信息。关键字提取部分被配置为从由获取部分获取的 内容相关信息中提取搜索关键字。站点搜索请求部分被配置为请求因 特网上的搜索站点搜索具有包含由关键字提取部分提取的搜索关键 字的网页的网站,并获取关于作为搜索结果而被找到的多个网站的信 息。第一站点选择部分被配置为从作为由搜索站点执行的搜索的结果 而被找到的多个网站中选择前N个网站,N为预定的大于1的整数。 第二站点选择部分被配置为访问由第一站点选择部分选择的N个网 站中的每一个以便从该N个网站中的每一个的网页中提取文章,并且 选择该N个网站中的两个或更多个作为种子站点,从每一个种子站点 提取的文章包含个数超过预定阀值的搜索关键字的例子。评价结果获 取部分被配置为从由第二站点选择部分选择的两个或更多个种子站 点和链接到这些种子站点的下级网站中收集文章,并从收集到的文章 中获取内容的评价结果。
与前面描述的信息处理设备不同,该信息处理设备没有站点搜索 部分。替代的是,该信息处理设备具有站点搜索请求部分。该站点搜 索请求部分请求因特网上的搜索站点对具有包含由关键字提取部分 提取的擻索关键字的网页的网站进行搜索,并获取关于作为搜喻结果 而被找到的多个网站的信息。
于是,与前面描述的信息处理设备的情况也一样,由第一站点选 择部分和第二站点选择部分从作为搜索的结果而被找到的网站中选
择更小数量的网站,并且使用所选择的更小数量的网站来获取评价结
果。从自所述更小数量的网站收集的文章中获取评价信息。
该信息处理设备没有站点搜索部分,并且,替代的是,该信息处 理设备请求因特网上的搜索站点执行搜索。因此,该信息处理设备具 有比前面描述的信息处理设备更小规模的结构。即,使用因特网上的 搜索站点允许该信息处理设备在结构上具有减小的规模,因此该信息 处理设备甚至可以被包含在个人使用的装置例如记录和再现设备中。 根据本发明的又一个实施例,提供一种用于搜索由信息处理设备
使用的内容的评价的方法,该方法包括以下步骤获取步骤;提取步 骤;搜索和获取步骤;选择步骤;以及访问和选择步骤。获取步骤获 取内容相关信息,该内容相关信息包含该内容的标题和描述该内容的 内容的信息。提取步骤从在获取步骤中获取的内容相关信息中提取搜 索关键字。搜索和获取步骤通过因特网搜索具有包含在提取步骤中提 取的搜索关鍵字的网页的网站,并获取关于作为搜索结果而被找到的 多个网站的信息。选择步骤从作为搜索步骤中的搜索的结果而被找到 的多个网站中选择前N个网站,N为预定的大于1的整数。访问和选 择步骤访问在选择步骤中选择的N个网站中的每一个,以便从该N 个网站中的每一个的网页中提取文章,并选择该N个网站中的两个或 更多个作为种子站点,从每一个种子站点提取的文章包含个数超过预 定阀值的搜索关键字的例子。
根据本发明的又一个实施例,提供一种用于搜索内容的评价的系 统,该系统包括服务器设备、网络以及通过网络连接到服务器设备的 客户端设备。服务器设备包括获取部分;关键字提取部分;站点搜 索部分;第一站点选择部分;第二站点选择部分;评价结果获取部分; 存储部分;和评价结果发送部分。获取部分被配置为获取内容相关信 息,该内容相关信息包含内容的标题和描述该内容的内容的信息。疾 键字提取部分被配置为从由获取部分获取的内容相关信息中提取搜
索关键字。站点搜索部分被配置为通过因特网搜索具有包含由关键字 提取部分提取的搜索关键字的网页的网站,并获取关于作为搜索结果
而被找到的多个网站的信息。第 一 站点选择部分被配置为从作为由站 点搜索部分执行的搜索的结果而被找到的多个网站中选择前N个网 站,N为预定的大于l的整数。第二站点选择部分被配置为访问由第 一站点选择部分选择的N个网站中的每一个以便从该N个网站中的 每一个的网页中提取文章,并且选择该N个网站中的两个或更多个作 为种子站点,从每一个种子站点提取的文章包含个数超过预定阀值的 搜索关键字的例子。评价结果获取部分被配置为从由第二站点选择部 分选择的两个或更多个种子站点和链接到这些种子站点的下级网站 中收集文章,并从收集到的文章中获取内容的评价结果。存储部分被 配置为存储由评价结果获取部分获取的多个内容的评价结果,从而使 得每一种评价结果都与用于识别所述内容中的对应的一个内容的信
息相关联。评价结果发送部分被配置为当通过网络从客户端设备接 收到用于获取评价结果的评价请求时,从存储在存储部分中的多个内 容的评价结果中读取由包含在获取请求中的用于识别内容的信息所 识别的内容的评价结果,并且将读取的评价结果通过网络发送到该获 取请求的发送者,其中该获取请求包含用于识别内容的信息。该客户 端设备包括被配置为通过网络向服务器设备发送用于获取评价结果 的获取请求的部分,其中该获取请求包含用于识别内容的信息;以及 被配置为从服务器设备接收内容的评价结果并将该评价结果通知用 户的部分。
根据本发明的上述实施例,在两个步骤中从作为搜索的结果而被 找到的网站中选择更小数量的网站,从所述更小数量的网站的网页中 收集用于获取评价结果的文章,并且从这些收集到的文章中获得评价 结杲。因此,实现了结构规模的减小,而且,仍然可以在相对较短的 时间内获得内容的评价结果。


图1是示出根据本发明第一实施例的信息处理设备的示例性硬 件结构的框图。
图2是示出包括根据第一实施例的信息处理设备的系统的结构
的概要的视图。
图3是示出在根据第一实施例的信息处理设备中使用的评价规 贝寸词典(reputation rule dictionary )的流程图。
图4是示出用于在根据第一实施例的信息处理设备中使用的评 价规则词典中的词典数据的实例的视图。
图5、 6、 7、 8和9均是示出由根据第一实施例的信息处理设备 执行的评价搜索处理的一部分的流程图。
图10是示出由根据第一实施例的信息处理设备显示的示例性评 价结果的视图。
图11是示出包括根据本发明第二实施例的信息处理设备的评价 搜索系统的示例性结构的概要的视图。
图12是示出根据第二实施例的信息处理设备的示例性硬件结构 的框图。
图13是示出在根据本发明的一个实施例的评价搜索系统中的客 户端设备的示例性硬件结构的框图。
具体实施例方式
在下文中,将参考附图描述本发明的实施例。信息处理设备的第 一 实施例
根据本发明第一实施例的信息处理设备是一种记录和再现设备, 例如所谓的硬盘记录器,该记录和再现设备能够接收电视广播并将接 收到的电视广播的数据存储到"记录信息存储部分"例如硬盘,并且还 能够从记录信息存储部分读取数据并再现该数据。
图1示出记录和再现设备1的硬件结构,该记录和再现设备1 是根据第一实施例的信息处理设备。图2示出包括根据本实施例的记 录和再现设备1的内容评价搜索系统的配置的概要。
如图2中所示,根据本实施例的记录和再现设备1连接到监视设 备2和因特网3。具有搜索引擎的搜索站点4、大量的公告板站点5、 大量的博客站点6等连接到因特网3。尽管没有示出,但是监视设备
2具有用于显示图像的显示器例如液晶显示器(LCD)和用于输出再 现声音的扩音器。
如果搜索站点4通过因特网3从搜索请求终端例如记录和再现设 备1接收搜索关键字,那么搜索站点4使用搜索引擎对具有包括该搜 索关键字的网页的网站进行搜索,并将搜索结果发送到该搜索请求终 端。例如,搜索结果包括作为搜索结杲而被找到的统一资源定位符 (URL)等。
公告板站点5中的每一个都是提供电子公告板的网站,在电子公 告板中,访问该网站的因特网用户可以随意地记入他们的观点、感想 等。该公告板站点5由企业公司或个人管理。关于内容或其它各种主 题的观点、感想等记入在公告板站点5中的每一个的电子公告板上。
博客站点6中的每一个都是其中个人或企业公司记入日记条目 (diary entry)、对书籍或电影的评论、或者各种其它类型信息的网 站。更不用说,关于这些内容的观点、感想等有时也在这些博客站点 发表。博客站点的URL通常包含单词"blog"。
根据第一实施例的记录和再现设备1没有对具有包括该搜索关 键字的网页的网站执行搜索的搜索引擎,而是请求搜索站点4对具有 包括该搜索关键字的网页的网站执行搜索。
然后,根据本实施例的记录和再现设备1从搜索站点4获取搜索 结果,即,作为搜索结果而被找到的网站,并从这些网站中选择将要 用来获得正在搜索其评价的内容的评价结果(即,关于评价的信息) 的网站。然后,根据本实施例的记录和再现设备l从所选择的网站的 网页和链接到所选择的网站的下级网站的网页中收集书面信息,以便 从该书面信息中获得上述内容的评价结果的信息。然后,记录和再现 设备1从该书面信息中检测关于该评价的话语(words),并基于检 测到的关于该评价的话语(words)获得评价结果。然后,在本实施 例中,记录和再现设备1将评价结果发送到监视设备2,该监视设备 2显示该评价结果或将该评价结果作为声音输出,从而将评价结果呈 现给用户。
如图l中所示的记录和再现设备l的示例性硬件结构配置用来实 现上述功能。如图1中所示,根据本实施例的记录和再现设备l包括
控制部分IO、"电视广播接收和记录/再现部分,,20、评价搜索部分30、 评价搜索用词典40和系统总线100。控制部分IO、"电视广播接收和 记录/再现部分"20、评价搜索部分30和评价搜索用词典40与系统总 线100相连。
在本实施例中,控制部分10由微型计算机形成,并包括中央处 理单元(CPU) 11、用于程序的只读存储器(ROM) 12和用于工作 区域的随机存取存储器(RAM) 13。
ROM 12存储关于电视广播节目选择的控制程序、关于电视广播 节目内容的记录和再现的控制程序、用于搜索内容的评价和获取评价 结果的程序,以及其它程序。CPU 11在使用RAM 13作为工作区域 时执行存储在ROM12中的程序,从而控制上述的多种处理。
"电视广播接收和记录/再现部分"20包括"电视广播波接收和解 码部分"21、记录和再现部分22、记录信息存储部分23、监视器输出 接口 24、操作部分25,以及操作部分接口 26。通过操作部分接口 26, 控制部分10接收使用操作部分25输入的用户操作的输入,并确定用 户操作的输入对应于什么指令。然后,基于确定结果,控制部分10 根据该指令执行处理控制。
在本实施例中,"电视广播波接收和解码部分"21具有接收模拟 地面电视广播、数字地面电视广播、广播卫星(BS)广播、通信卫星 (CS)广播等的特征。
"电视广播波接收和解码部分"21基于从控制部分10供给的电视
并且将通过解码获得的电视广播节貝内容的视频和音频信号AV发送 到系统总线IOO。
基于用户通过使用操作部分25进行的广播波选择操作输入和广 播节目选择操作输入,控制部分10生成要供给到电视广播波接收和 解码部分21的电视广播节目选择控制信号。
当控制部分10确定用户既没有通过操作操作部分25发出记录开 始指令又没有通过操作操作部分25发出再现开始指令时,控制部分 10允许已经从电视广播波接收和解码部分21发送到系统总线100的 视频和音频信号AV通过监视器输出接口 24发送到监视设备2,从而 在监视设备2的显示器上显示视频,音频由扩音器输出。
同时,当控制部分10确定用户通过操作操作部分25发出记录开 始指令时,控制部分10允许已经从电视广播波接收和解码部分21发 送到系统总线100的视频和音频信号AV发送到记录和再现部分22。
记录和再现部分22包括记录编码部分和再现解码部分。当确定 已经接收到记录开始指令时,记录和再现部分22的记录编码部分在 控制部分10的控制下对视频和音频信号AV进行记录编码处理,包 括数据压缩,并且,将所得到的信号写入到记录信息存储部分23以 便存储在其中。
在本实施例中,记录信息存储部分23由硬盘驱动器或大容量半 导体存储器装置形成,因此能够存储相对大量的电视广播节目内容。
在第一实施例中,"电视广播波接收和解码部分,,21具有从电视 广播波中获取电子程序设计指南(electronic programming guide) (EPG)信息的功能。
例如,控制部分10将EPG信息临时存储在RAM13中,并且, 当将已经请求其记录的电视广播节目内容的记录信息存储在记录信 息存储部分23中时,控制部分10从临时存储的EPG信息中提取内 容相关信息,并将提取的内容相关信息存储在记录信息存储部分23 中,以便与记录的电视广播节目内容相关联。内容相关信息包括记录 的电视广播节目内容的标题、出现在内容中的人的姓名、关于该内容 的内容的信息等。
在第一实施例中,例如,在再现记录的内容之一前,用户使用操 作部分25能够发出显示记录的电视广播节目内容(在下文中称为"记 录内容")的列表的指令。
一旦接收到显示记录内容列表的指令,根据本实施例的控制部分
IO就将关于记录的广播节目的列表的信息发送到监视设备2,从而使 监视设备2的显示器显示该列表。该列表示出存储在记录信息存储部 分23中的每一个电视广播节目内容的标题以及记录日期和时间。
在本实施例中,记录内容的该列表不仅可以用来选择期望的记录 内容来开始内容再现,而且可以用来选择期望的记录内容来发出搜索 该内容的评俏、的指令。
在显示记录内容的该列表后, 一旦接收到搜索所选择的记录内容 的评价的指令,如下所述,控制部分10使用评价搜索部分30和评价 搜索用词典40从自因特网3获取的信息中获取所选择的记录内容的 评价结果,并将该评价结果的信息发送到监视设备2,从而监视设备 2的显示器显示该评价结果的信息。参考由监视设备2的显示器显示 的评价结果的信息,用户能够从大量记录内容中选择记录内容之一, 从而开始对所选择的内容进行再现。
当控制部分10确定用户通过操作操作部分25已经发出对从记录 内容的列表中选择的记录内容的再现开始指令时,控制部分10从记 录信息存储部分23读取所选择的记录内容的记录信息,并将该记录 信息发送到记录和再现部分22。
在控制部分10的控制下,记录和再现部分22允许再现解码部分 操作用来对所选择的记录内容的记录信息进行再现解码处理,包括解 压/解码,从而重建视频和音频信号AV。在控制部分10的控制下, 重建的视频和音频信号AV被发送到监视设备2,并且,再现的视频 显示在显示器上,而再现的音频由扩音器输出。
接着,现在将在下文中对评价搜索部分30进行描述。在本实施 例中,评价搜索部分30包括用于连接到因特网3的通信接口 31、 因特网搜索部分32、超文本标记语言(HTML)解析部分33、 HTML 爬行部分34、词素分析引擎35、句法分析引擎36和评价确定部分37。 通信接口 31、因特网搜索部分32、 HTML解析部分33、 HTML爬行 部分34、词素分析引擎35、句法分析引擎36和评价确定部分37中 的每一个与系统总线100相连。
请注意,在这里,因特网搜索部分32、 HTML解析部分33 、 HTML 爬行部分34、词素分析引擎35、句法分析引擎36和评价确定部分37 可以在硬件中实现,或者可以通过软件应用程序实现。在它们通过软 件应用程序实现的情况下,该软件应用程序预先存储在ROM12中。
在本实施例中,评价搜索用词典40包括词素分析词典41、句 法分析词典42、同类词词典(thesaurus dictionary ) 43和评价规贝'J词 典44。这些词典41到44中的每一个都与系统总线100相连。
当用户发出了搜索所选择的记录内容的评价的指令时,评价搜索 部分30中的每一个部件都由控制部分10激活。
因特网搜索部分32在其中存储了搜索站点4的URL。如下所述, 因特网搜索部分32生成包括从所选择的记录内容的内容相关信息中 提取的搜索关键字的站点搜索请求,并且,在控制部分10的控制下, 因特网搜索部分32通过通信接口 31访问搜索站点4,其中,该站点
搜索请求的搜索评价的指令已经被发出。
HTML解析部分33具有分析以HTML格式写入的文档(在下 文中称为"HTML文档";不仅该文章由文本字符构成,而且图像也可 以置于HTML文档中)的处理能力,并且消除标签和图像部分,从 而只提取由文本字符构成的文章部分。这里使用的术语"解析"是指分 析HTML文档,从而只提取文章部分。
HTML爬行部分34执行对多个级别进行下述操作的处理收集 网站上的HTML文档;解析所收集到的HTML文档,以识别链接到 第一网站的网站;收集所识别的链接到第一网站的网站上的HTML 文档;解析所收集到的HTML文档,以识别包含在HTML文档中的 链接;收集所识别的链接的目的地上的HTML文档;解析所收集到 的HTML文档等等。该处理称为"爬行"。
参考词素分析词典41,词素分析引擎35执行这样的处理,即 将短语或段(passage )划分为语素,即在语言中有意义的最小单位; 以及识别每一个语素的语音(speech)部分(例如,名词、动词、副 词、作为主语的助动词的后置词、形容词等)。用于词素分析词典41
的词典数据可以通过因特网3获得,或者可以预先为记录和再现设备 1特定地生成。由于词素分析和词素分析词典是众所周知的,因此这 里省略对它们的详细描述。
在其中段中的每一个单词(word)的语音部分和各单词已经被 识别为由词素分析引擎35执行的词素分析的结果的情形下,句法分 析引擎36在参考句法分析词典42时执行识别根据其构造该段的规则 的操作。用于句法分析词典42的词典数据也可以通过因特网3获得, 或者可以预先为记录和再现设备1特定地生成。由于句法分析和句法 分析词典是众所周知的,因此这里省略对它们的详细描述。
在本实施例中,参考评价规则词典44,评价确定部分37执行将 评估值(评价得分)计算为评价结果的处理。在本实施例中,用于评 价规则词典44的词典数据预先为记录和再现设备1特定地生成。评价规则词典的创建
现在参考图3的流程图对生成用于评价规则词典44的词典数据 的方法的过程进行描述。图4示出用于评价规则词典44的词典数据 的实例。
首先,在评价规则词典44中登记其评价表达(expression )和评 估值(得分)(步骤T1)。这里使用的术语"评价表达,,是指表达肯 定的或否定的观点的单词或短语,例如"有趣的"、"感动的"、"好的"、 "枯燥的"、"无趣的"和"不好的"。给肯定的评价表达分配正的(+ ) 评估值(得分),给否定的评价表达分配负的(-)评估值(得分)。
就正的评价表达而言,如图4所示,例如,给"有趣的,,和"感动 的"分配"+5点"的评估值,给"好的"分配"+2点"的评估值。就负的评 价表达而言,例如,给"枯燥的"和"无趣的"分配"-5点"的评估值,给 "不^^的"分配"-2点"的评估值。
接着,评价表达的程度表达和加权因数(系数)在评价规则词典 44中登记(步骤T2)。这里使用的术语"程度表达"是指显示其所指 的单词或短语的程度的单词或短语,例如"非常"、"相当"、"完全地" 和"高度地"。当程度表达出现在评价表达前面时,程度表达的加权因
数(系数)用作用于评价表达的评估值的系数。
如图4所示,例如,给"非常,,分配"x2"的加权因数(系数),给 "相当"分配"x3"的加权因数(系数)。
最后,通过词素分析引擎35对登记的评价表达和程度表达中的 每一个进行词素分析,并且将分析结果存储在评价规则词典44中, 从而与对应的评价表达或程度表达相关联,如图4所示(步骤T3)。 因此,评价规则词典44的创建完成。请注意,对评价表达和程度表 达的词素分析的结果在下文中将分别称为"评价表达(词素分析结 果),,和"程度表达(词素分析结果)"。
同义词词典43是在其中登记与词条(entry)表达相似(例如同 义词、近义词和缩写词)的表达(在下文中称为"语义相似的表达,,) 的词典。这种语义相似的表达最初登记在同义词词典43中,但是, 如果需要的话,允许用户另外登记同义词、近义词、缩写词等。
当在公告板或博客上记入对内容的评论时,用户可以使用搜索关 键字的同义词、缩写词等。考虑到该事实,准备同义词词典43。如下 所述,在使用同义词词典43的情况下,当搜索内容评价时,搜索关 键字的语义相似的表达也被考虑在内。
[评价搜索处理I
接着,现在将参考图5、 6、 7、 8和9在下文中对搜索存储在记 录信息存储部分23的电视广播节目内容的评价的过程进行描述,该 过程是在具有上述结构的记录和再现设备l中执行的。
图5和图6是示出评价搜索处理的示例性流程的流程图。在根据 本实施例的记录和再现设备1中,在控制部分10的控制下,评价搜 索部分30使用评价搜索用词典40执行评价搜索处理。如上所述,在 本实施例中,当用户从记录内容列表中选择特定记录内容并执行开始 搜索所选择的内容的评价的搜索的操作时,开始由图5和图6的流程 图示出的评价搜索处理。
图7到图9是参考特定实例补充地示出如图5和图6中所示的各 个步骤的处理的流程图。虽然图5和图6的流程与图7到图9的流程
不完全对应,但是这两个流程之间的对应关系是清楚的。
一旦接收到搜索所选择的记录内容的评价的指令,控制部分10 首先读取存储在记录信息存储部分23中的内容相关信息以便与所选 择的记录内容相关联,并且获取已经从EPG荻得的记录内容的标题 和节目内容信息(图5中的步骤S1)。
然后,控制部分IO将获取的内容相关信息(节目信息)供给到 词素分析引擎35,并允许词素分析引擎35对内容相关信息进行词素 分析(图5中的步骤S2)。然后,控制部分10选取作为词素分析结 果而作为名词被检测到的词语(expression)作为搜索关键字,并将 该搜索关键字供给到因特网搜索部分32 (图5中的步骤S3)。
例如,假设在步骤Sl获取的内容相关信息是包含记录内容 "Flamboyance of Royal Family"的标题和包括显示在记录内容中出现 的人员的单词"KimuraTakuo"、 "Minamioji Ginpachi,,等的节目内容 信息(参见图7中的步骤S21)。在这种情况下,作为通过词素分析 进行的名词提取的结果(参见图7中的步骤S22) , "Flamboyance"、 "Royal Family,,、 "Kimura Takuo"、 "Minamioji Gi叩achi,,等作为搜 索关键字提取(参见图7中的步骤S23)。
请注意,在这种情况下,关于标题的词素分析的结果在下文中将 称为"标题(词素分析结果)",而关于节目内容信息的词素分析的结 果在下文中将称为"内容信息(词素分析结果)"
在本实施例中,用于评价搜索的搜索关键字不局限于从上述内容 相关信息中自动提取的那些搜索关键字,而允许用户输入用于评价搜 索的附加的搜索关键字。因此,例如,控制部分10允许在监视设备2 的显示器上显示提示用户输入附加的搜索关键字的消息,并且等待用 户使用操作部分25输入搜索关键字。如果用户输入搜索关键字,那 么控制部分10将输入的搜索关键字作为附加的搜索关键字供给到因 特网搜索部分32 (图5中的步骤S4)。
请注意,用户不是必须输入附加的搜索关键字。用户可以对不需 要附加的搜索关键字的效果输入指令。在这种情况下,控制部分10
消除提示用户输入附加的搜索关键字的消息,并进入下一个步骤。在
这种情况下,只有在图5中的步骤S3中提取的搜索关键字用于评价 搜索。请注意,可以忽略用于接收附加的搜索关键字的步骤S4。
例如,假设用户已经输入了附加的搜索关键字(参见图7中的步 骤S24),并且该附加的搜索关键字是"blog"。在这种情况下,将附 加的搜索关键字"biog,,加入到在图5中的步骤S3(=图7中的步骤S21) 中所获取的搜索关键字(参见图7中的步骤S25)。
请注意,附加的搜索关键字"blog,,是用户为了从博客站点获取评 价信息的目的而添加的关键字。
应该理解,附加的搜索关键字并不局限于本实例。例如,在用户 希望从公告板站点获取评价信息的情况下,用户可以输入"公告板,,作 为搜索关键字。应该理解,作为附加的搜索关键字,用户可以不输入 关于网站的表达,而可以输入与所选择的记录内容(要搜索其评价) 相关的表达。
接着,控制部分10控制因特网搜索部分32将搜索请求发送到搜 索站点。同时,因特网搜索部分32通过通信接口 31和因特网3将包 含所接收到的搜索关键字的搜索请求发送到预先登记的搜索站点4。
响应该搜索请求,搜索站点4搜索具有包含接收到的搜索关键字 的网页的网站,并将作为搜索结果而找到的网站的URL信息发送到 记录和再现设备1。因此,控制部分10通过通信接口 31接收到URL 信息,并将前N个网站的URL信息临时存储到RAM13或记录信息 存储部分23中的空白空间中,例如,该记录信息存储部分23由硬盘 驱动器形成。
只有前N个网站的URL被存储的事实意指从作为搜索结果而被 找到的巨大数量的网站中选择有限数量的网站(评价搜索用网站的第 一选择;图5中的步骤S6)。
在图7的实例中,搜索站点使用"Flamboyance" 、 "Royal Family" 、 "Kimura Takuo,'、 "Minamioji Ginpachi,,等以及夕卜加的 "blog"(参见图7中的步骤S25)作为搜索关键字执行搜索(网络搜
索;参见图7中的步骤S26)。作为该搜索的结果,找到巨大数量的 网站,但是,只存储其中前N个网站的URL(参见图7中的步骤S27)。
请注意,在图5中的步骤S6的评价搜索用网站的第一选择中, 可以^^用包含在URL中的特定单词例如"blog,,来进一步减小网站数 量。包含这种特定单词的URL很可能是特定类型网站的URL,因此 这种特定单词可以用来只选择特定类型的网站。例如,通过使用特定 单词"blog",即,通过只选择其URL包含特定单词"blog"的网站,可 以只提取博客站点。
在本实例中,从前N个网站中选择其URL包含单词"blog"的网 站(参见图8中的步骤S31)。如果从前N个网站中选择的网站数量 大于预定的有限数M(M^V),那么进一步从本实例中所选择的网站 中选择前M个网站(参见图8中的步骤S32)。
请注意,可以这样安排,首先从作为搜索结果而被找到的网站中 选择其URL包含单词"blog"的网站,然后,从所选择的网站中选择 前N个网站。
在如上所述的对评价搜索用网站的第一选择完成后,控制部分 10依次访问所选择的网站以4更从每一个网站中收集HTML文档,将 收集到的HTML文档供给到HTML解析部分33,并控制HTML解 析部分33以从每一个HTML文档中提取文章(图5中的步骤S7,以 及图8中的步骤S33、 S34和S35)。
例如,假设收集到的 HTML 文档之 一 描述 "<HTML><BODY>Yesterday,s Flamboyance of Royal Family was <B>quite<B> amusing!</BODY></HTML>"。在这种情况下,作为由 HTML解析部分33所解析的结果,从该HTML文档中提取文章 "Yesterday's Flamboyance of Royal Family was quite amusing!,,。
接着,控制部分10将所提取的文章中的每一个供给到词素分析 引擎35,并控制词素分析引擎35对所提取的文章进行词素分析,从 而从其中只提取用于检测搜索关键字的名词(图5中的步骤S8,以及 图8中的步骤S36和S37)。
然后,控制部分10识别具有包含如此多以至于"搜索关键字内 容"超出预定阀值th (%)的搜索关键字的HTML文档的网站,并 且选择所识别的网站作为用来搜索评价的网站(第二站点选择)(图 5中的步骤S9,以及图8中的步骤S38和S39)。在该第二站点选择 中选择的网站将在下文中称为"种子站点"。这是因为该站点是下文描 述的爬行的起始点。
在第二站点选择中,当根据从广播节目内容的标题中是否已经提 取了搜索关键字、从节目内容信息中是否已经提取了搜索关键字、或 者用户是否已经另外输入了搜索关键字来给每一个搜索关键字分配 不同权重时,计算搜索关键字内容。
例如,当已经从标题中提取搜索关键字时,给检测到的该搜索关 键字分配1.5的权重;当已经从节目内容信息中提取搜索关键字时, 给检测到的该搜索关键字分配1.0的权重;当用户已经另外输入搜索 关键字时,给检测到的该搜索关键字分配0.8的权重。
例如,假设在步骤S3已经选择五个关键字,即,从标题中提取 的"Flamboyance"和"Royal Family"、从节目内容信息中提取的 "Kimura Takuo"和"Minamioji Ginpachi"、以及用户另外输入的 "blog"。于是,例如,就获得的文章"A blog for everyone: Yesterday's episode of Flamboyance of Royal Family where Kimura Takuo appeared was amusing!"而言,在步骤S8检测到四个搜索关键字,即, "blog"、 Flamboyance"、 "Royal Family,,和"Kimura Takuo,'。
这里,如果检测到上述所有的五个搜索关键字,那么得分是 1.5+1.5+1.0+1.0+0.8=5.8。同时,就上述文章而言,在检测到四个搜索 关键字的情况下,得分是1.5+1.5+1.0+0.8=4.8。因此,在步骤S9中所 计算得到的上述文章的搜索关键字内M 4.8/5.8-82.8 (%)。
在上述阀值 th是70 ( % )的情况下,上述文章的搜索关键字 内容超出了阀值 th。因此,在步骤S9,选择具有包含上述文章的网 页的网站作为种子站点。
接着,控制部分10指示HTML爬行部分34对预定数目的级别
执行爬行,其中,以上述方式选择的每一个种子站点(参见图9中的 步骤S40)作为起始站点(图5中的步骤S10,以及图9中的步骤S41)。
HTML爬行部分34首先收集种子站点上的HTML文档,对收 集到的HTML文档进行解析以识别链接,然后收集所识别的链接的 目的地上的HTML文档,接着对收集到的HTML文档进行解析以识 别包含在该HTML文档中的链接,然后收集所识别的链接的目的地 上的HTML文档,对收集到的HTML文档进行解析等等。HTML爬 行部分34对预定数目的级别重复上述操作。
请注意,在这种情况下,要执行爬行的级别数可以在开始评价搜 索处理之前由用户指定。还应该注意,在开始评价搜索处理之前,可 以允许用户指定是否应该在同 一域上的链接站点的范围内或者在所 有链接站点的范围内执行爬行。
接着,控制部分10将在图5中的步骤S10中收集到的HTML 文档(参见图9中的步骤S42 )供给到HTML解析部分33,并控制 HTML解析部分33以对HTML文档进行解析,从而从其中提取文章 (图6中的步骤S11,以及图9中的步骤S43)。
接着,控制部分10控制词素分析引擎35和句法分析引擎36对 在步骤Sll中提取的文章分别进行词素分析和句法分析(图6中的步 骤S12,以及图9中的步骤S44)。此时的词素分析结果将在下文中 称为"爬行文章(词素分析结果)",而此时的句法分析结果将在下文 中称为"爬行文章(句法分析结果),,。
接着,控制部分10将爬行文章(词素分析结果)和爬行文章(句 法分析结果)供给到评价确定部分37,并使用评价规则词典控制评价 确定部分37,以从步骤S12的处理结果中提取关于所选择的内容(正 搜索其评价)的评估值和评价代表句子(图4中的步骤S13,以及图 9中的步骤S46)。
评价确定部分37首先通过爬行文章(词素分析结果)搜索包含 任何评价表达(词素分析结果)的句子。然后,评价确定部分37对 所找到的这些句子执行以下处理(1),(2)和(3)。 (1)参考爬行文章(句法分析结果),评价确定部分37识别与 评价表达(词素分析结果)在语法上相关的单词,并且,如果所识别 的单词是包含在标题(词素分析结果)或内容信息(词素分析结果) 中的单词,那么评价确定部分37确定该句子描述关于节目的评价(这 类句子在下文中将称为"A类句子")。
(2 )参考爬行文章(句法分析结杲),评价确定部分37识别与 评价表达(词素分析结果)在语法上相关的单词,并且,如果所识别 的单词是与包含在标题(词素分析结果)或内容信息(词素分析结果) 中的单词相关的单词(包含在标题或内容信息中的单词的相关单词), 那么评价确定部分37确定该句子描述关于节目的评价(这类句子在 下文中将称为"B类句子,,)。
这里,术语"相关单词,,是指在语法上相关的单词,例如,同义词 (例如,"Nippon"对于"Japan")或者上位词(例如"Asia"对于 "Japan")。参考同义词词典43以便确定某些单词是否是相关单词。 例如,考虑到与搜索关键字相关的单词可以用于节目评论中的可能 性,执行该处理。
(3)即使已经从爬行文章(词素分析结果)中作为包含评价表 达(词素分析结果)的句子找到的句子不满足上述(1)和(2)中所 提及的条件,那么评价确定部分37确定该句子描述关于节目的评价 (这类句子在下文中将称为"C类句子,,)。
在本实施例中,评价确定部分37分别计算肯定的评价值和否定 的评价值。如果评估值是正的,评价确定部分37参考评价规则词典 44并结合上述A、B和C三种类型句子将找到的评价表达的评估值(得 分)加到肯定的评价值,如果评估值是负的,评价确定部分37将找 到的评价表达的评估值(得分)加到否定的评价值(
请注意,在本实施例中,预先将不同的加权系数分配给类型A、 B和C,并且,评价确定部分37将找到的评价表达的评估值(得分) 乘以与句子类型相对应的加权系数后加到肯定的评价值或否定的评
价值。在这种情况下,这些加权系数保持在评价确定部分37中,并
且这些加权系数满足下列不等式类型A的加权系数>类型B的加权 系数>类型C的加权系数。
请注意,在评价表达(词素分析结果)与上述(1)和(2)中识 别的单词之间的语法关系伴随有否定表达的情况下,评价表达在意思 上是相反的,因此,如果评估值(得分)是正的,则评价确定部分37 将评价表达的评估值(得分)加到否定的评价值,如杲评估值(得分) 是负的,评价确定部分37将评价表达的评估值(得分)加到肯定的 评价值。
此外,在本实施例中,在爬行文章(词素分析结果)中,在任何 程度表达(词素分析结果)都存在于评价表达(词素分析结果)之前 的情况下,评价确定部分37从评价规则词典44中认出程度表达的系 数,并将评价表达的评估值(得分)乘以该系数后加到肯定的评价值 或否定的评价值。
此外,在本实施例中,评价确定部分37将检测到的上述三种类 型的句子存储为"评价代表候补句子"。
接着,控制部分10提取由评价确定部分37计算得到的肯定的评 价值和否定的评价值以及从评价代表候补句子中选取的 一个或多个 句子作为评价结果,将它们转换成显示信息以便在监视设备2的显示 器上显示,并通过监视器输出接口 24将显示信息发送到监视设备2 (图6中的步骤S14,以及图9中的步骤S47)。
图10示出显示的评价结果的实例。评价结果的该实例示出肯定 的评价值(Positive)、否定的评价值(Negative)、几个肯定的代表 句、几个否定的代表句、作为搜索结果而被找到的网站数目、以及提 取的关于评价的句子的数目。
有多种方法可用于从存储的评价代表候补句子中选取几个评价 代表句子。例如,可以优选选取包含从标题中提取的搜索关键字比从 节目内容信息中提取的搜索关键字多的句子。另外,可以优先选取其 中在所有的评价代表候补句子中经常出现的单词具有较高频率的句 子。另外,可以随机地选取几个评价代表句子。
如上所述,根据上述第一实施例,使用搜索关键字通过因特网在 两个步骤中从作为搜索结果而被找到的巨大数量的网站中选择有限 数量的网站,然后,对该有限数量的网站执行爬行以便检测描述评价 的句子,并且从这些检测到的句子中获得评价结果。因此,可以用相 对简单的结构构造评价搜索设备。
因此,如上述实施例一样,记录和再现设备可以装备有作为一个 功能模块的评价搜索部分。因此,并不一定要使用用于确定评价的上 述系统引导连接到因特网的个人电脑去搜索每一个节目的评价。与上 述实施例一样,记录和再现设备自身能够通过因特网搜索每一个节目 的评价和显示该评价。这对用户来说4艮方便。
根据上述第一实施例的信息处理设备是记录和再现设备。但是, 应该理解,根据本发明的信息处理设备不局限于记录和再现设备。还 应该注意,在上述实施例中,搜索广播节目内容的评价,因此从得自
EPG信息的信息中提取搜索关键字。但是,应该理解,这只是一个实 例,对本发明来说不是必要的。例如,在内容提供服务器在其中存储 了内容相关信息例如内容的标题和描述内容的内容的信息的情况下, 信息处理设备可以从内容提供服务器获取内容相关信息,以便从其中 提取搜索关键字。
信息处理设备的第二实施例
在上述第一实施例中,记录和再现设备自身形成根据本发明的信 息处理设备的一个实施例。但是,可以在因特网或者局域网上提供用 于评价搜索的服务器设备。例如,这样的用于评价搜索的服务器设备 也可以形成根据本发明的信息处理设备的一个实施例。下文描述的第 二实施例就是该情况的一个实例。
图11是示出包括根据第二实施例的信息处理设备的系统的概要 的视图。
在第二实施例中,在因特网上提供"节目评价搜索存储服务器设 备"7。节目评价搜索存储服务器设备7包括与上述记录和再现设备1 的评价搜索部分30和评价搜索用词典40相似的部件。假设要对其进
行评价搜索请求,节目评价搜索存储服务器设备7预先存储了内容的 评价结果,并且,响应来自客户端设备例如记录和再现设备l的评价 搜索请求,节目评价搜索存储服务器设备7将存储在其中的对应的评 价结果发送到该客户端设备。
因此,在第二实施例中,与第一实施例不同,记录和再现设备l 不包括上文针对第一实施例描述的评价搜索部分30和评价搜索用词 典40二者,如下所述,替换的是,记录和再现设备l包括作为作出 评价搜索请求的客户端设备的功能模块。
图12是示出节目评价搜索存储服务器设备7的示例性硬件结构 的框图。如图12所示,根据本实施例的节目评价搜索存储服务器设 备7包括控制部分50、评价搜索部分60、评价搜索用词典70、评价 搜索请求部分80和系统总线101。控制部分50、评价搜索部分60、 评价搜索用词典70和评价搜索请求部分80与系统总线101相连。
与上述控制部分10—样,控制部分50由微型计算机形成,并包 括中央处理单元(CPU) 51、用于程序的ROM 52和用于工作区域的 RAM 53。 ROM 52存储用于搜索内容评价和获取评价结果的程序、 用于请求评价搜索的程序、以及其它程序。CPU 51在使用RAM 53 作为工作区域时执行存储在ROM 52中的程序,从而控制上述的多种 处理。
评价搜索部分60具有与上述第一实施例中的评价搜索部分30 相同的结构。在本实施例中,评价搜索部分60包括用于连接到因特 网3的通信接口 61、因特网搜索部分62、HTML解才斤部分63、HTML 爬行部分64、词素分析引擎65、句法分析引擎66和评价确定部分67, 每一个上述部分都与系统总线101相连。在第二实施例中,用来输入 附加的搜索关键字的操作部分68和操作部分接口 69形成评价搜索部 分60的一部分。
这里,因特网搜索部分62、 HTML解析部分63、 HTML爬行部 分64、词素分析引擎65、句法分析引擎66和评价确定部分67可以 在硬件中实现,或者可以通过软件应用程序实现。请注意,在它们通
过软件应用程序实现的情况下,该软件应用程序预先存储在ROM 52 中。
评价搜索用词典70与上述第一实施例中的评价搜索用词典40 相同。在本实施例中,评价搜索用词典70包括词素分析词典71、句 法分析词典72、同义词词典73和评价规则词典74,其中的每一个都 与系统总线101相连。
涉及使用评价搜索部分60和评价搜索用词典70的评价搜索处理 与上述第一实施例中的评价搜索处理相同。但是,服务器设备7对包 含在EPG信息中的所有广播节目内容连续地执行预先在第一实施例 中描述的评价搜索。服务器设备7还将作为该处理的结果而获得的评 价结果(其包括评价评估值、评价代表句子等)存储在评价搜索请求 部分80中的评价结果存储部分81中,从而与对应的广播节目内容相 关联。
评价搜索请求部分80包括评价结果存储部分81、"评价结果获 取请求接收部分"82和"输出评价结果生成部分"83。"评价结果获取请 求接收部分"82通过因特网3从客户端设备接收评价结果获取请求, 并且分析该评价结果获取请求,从而确定其所指的是哪个广播节目内 容。在本实施例中,为了将评价结果获取请求所指的是哪个节目内容 通知服务器设备7,来自客户端设备的评价结果获取请求包括用于识 别要搜索其评价的广播节目内容的"广播节目内容识别信息"。
广播节目内容识别信息的实例包括最初唯一地分配给每一个广
播节目内容的识别信息;每一个广播节目内容的标题;以及分配给每 一个广播节目内容的Gemstar码(G码)。
在评价结果存储部分81中,每一个广播节目内容的评价结果都 被存储,以便与对应的广播节目内容识别信息相关联。
一旦通过通信接口 61接收到评价结果获取请求,评价结果获取 请求接收部分82从评价结果获取请求提取广播节目内容(要搜索其 评价)的识别信息,并将提取到的广播节目内容的识别信息传送到输 出评价结果生成部分83。输出评价结果生成部分83接收广播节目内
容的识别信息,并从评价结果存储部分81获取存储在评价结果存储 部分81中的评价结果,以便与接收到的广播节目内容的识别信息相 关联。然后,输出评价结果生成部分83生成要发送到作出了评价结 果获取请求的客户端设备的"评价结杲发送消息"。然后,输出评价结
果生成部分83将生成的评价结果发送消息通过通信接口 61和因特网 3发送到客户端设备。
在评价结果存储部分81没有存储与包含在评价结果获取请求中 的广播节目内容(要搜索其评价)的识别信息相对应的评价结果的情 况下,服务器设备7对该广播节目内容执行评价搜索处理,并将作为 评价搜索处理结果而获得的评价结果发送到客户端设备。此时获得的 评价结果也存储在评价结果存储部分81。
图13示出记录和再现设备1的示例性硬件结构,其是根据第二 实施例的客户端设备的实例。
如上所述,根据第二实施例的记录和再现设备l不包括上文针对 第一实施例描述的评价搜索部分30和评价搜索用词典40 二者,替换 的是,记录和再现设备l包括评价结果获取请求部分90,该评价结果 获取请求部分90是作为作出评价搜索请求的客户端设备的功能模块。
在本实施例中,评价结果获取请求部分90包括评价结果获取请 求生成部分91、评价结果接收部分92和评价结果显示信息生成部分 93。例如,当控制部分10接收到对从记录内容的显示列表中选择的 记录内容的评价进行搜索的指令时,控制部分10激活评价结果获取 请求部分卯。
当评价结果获取请求部分90被激活时,首先,在允许选择的记 录内容的识别信息(例如标题信息)被包含在评价搜索请求中后,评 价结果获取请求生成部分』1将对于从记录内容的显示列表中选择的 记录内容的评价搜索请求通过通信接口 31和因特网3发送到节目评 价搜索存储服务器设备7。请注意,因特网3上的节目评价搜索存储 服务器设备7的URL预先已经登记和存储在记录和再现设备1中。
如上所述,响应对于该记录内容的评价搜索请求,服务器设备7
将该记录内容的评价结果发送到记录和再现设备1。因此,评价结果
接收部分92通过通信接口 31接收评价结果,并将接收到的评价结果 传送到评价结果显示信息生成部分93。
评价结果显示信息生成部分93接收评价结果并由其生成关于上 述评价结果的显示信息,并将生成的显示信息通过监视器输出接口 24 供给到监视设备2。
这样,如图10中所示的记录内容的评价结果显示在监视设备2 的显示器上,从而将评价结果呈现给用户。
在第二实施例中,服务器设备7预先搜索广播节目内容的评价结 果并将评价结果存储在评价结果存储部分81中。因此, 一旦从客户 端设备接收到评价结果获取请求,作为对该获取请求的响应,服务器 设备7就能够立即将存储在评价结果存储部分81中的评价结果发送 到客户端设备。因此,用户能够快速地看到记录内容的评价结果。
请注意,根据第二实施例的服务器设备7不需要通过因特网连接 客户端设备。或者,虽然服务器设备7连接到因特网,但是服务器设 备7可以通过LAN连接客户端设备。其它实施例或变形例
在上述实施例中,搜索记录内容的评价。但是,例如,也可以搜 索当前正在广播的广播节目内容的评价。例如,当电视广播节目接收 设备被配置为允许用户基于EPG从节目时间表中指定广播节目以便 搜索其评价时,实现该搜索。
在这种电视广播节目接收设备应用于第一实施例的情况下,该电 视广播节目接收设备被配置为从EPG数据中提取要搜索其评价的广 播节目的标题和相关信息,然后从其中提取搜索关键字,并且使用提 取的搜索关键字执行上述评价搜索操作。
请注意,不仅可以在选择和接收实时广播节目时应用本发明,而 且也可以在接收和再现通过视频点播(Video on Demand)提供的内 容时应用本发明。本发明也可以应用于这种情况广播节目首先存储 在服务器上,用户从存储在服务器上的广播节目中选择期望的广播节目以接收它,如服务器类型(server-type)的广播节目的情况一样。
在前面的描述中,假定评价搜索的对象是广播节目内容,但是评 价搜索的对象并不局限于广播节目内容。本发明也可以应用于搜索多 种其它类型的内容例如音乐内容、电子书内容和视频游戏内容的评 价。
从第二实施例的描述中显然可知,根据本发明的信息处理设备不 是必须对搜索其评价的内容进行再现或解码,而是仅仅需要具有能够 搜索内容评价并将评价结果呈现给用户的能力即可。
本领域技术人员应该理解,根据设计要求和其它因素,可以进行 各种修改、组合、子组合和替换,只要它们在所附权利要求或其等同 形式的范围内即可。
权利要求
1.一种信息处理设备,包括获取部分,该获取部分被配置为获取内容相关信息,该内容相关信息包含内容的标题和描述该内容的内容的信息;关键字提取部分,该关键字提取部分被配置为从由所述获取部分获取的内容相关信息中提取搜索关键字;站点搜索部分,该站点搜索部分被配置为通过因特网搜索具有包含由所述关键字提取部分提取的搜索关键字的网页的网站,并获取关于作为搜索结果而被找到的多个网站的信息;第一站点选择部分,该第一站点选择部分被配置为从作为由所述站点搜索部分执行的搜索的结果而被找到的多个网站中选择前N个网站,N为预定的大于1的整数;第二站点选择部分,该第二站点选择部分被配置为访问由所述第一站点选择部分选择的N个网站中的每一个,以便从该N个网站中的每一个的网页中提取文章;并且选择该N个网站中的两个或更多个作为种子站点,从每一个种子站点提取的文章包含个数超过预定阀值的搜索关键字的例子;以及评价结果获取部分,该评价结果获取部分被配置为从由所述第二站点选择部分选择的两个或更多个种子站点和链接到这些种子站点的下级网站中收集文章,并从收集到的文章中获取所述内容的评价结果。
2. 根据权利要求1所述的信息处理设备,还包括存储部分,该存储部分被配置为存储由所述评价结果获取部分获取的多个内容的评价结果,从而使得每一种评价结果都与用于识别所 述内容中的对应的一个内容的信息相关联;以及评价结果发送部分,该评价结果发送部分被配置为当通过网络 接收到用于获取评价结果的获取请求时,从存储在所述存储部分中的 多个内容的评价结果中读取由包含在获取请求中的用于识别内容的 信息所识别的内容的评价结果,其中,该获取请求包含用于识别内容的信息;并且通过网络将读取的评价结果发送到该获取请求的发送 者。
3. —种信息处理设备,包括获取部分,该获取部分被配置为获取内容相关信息,该内容相关 信息包含内容的标题和描述该内容的内容的信息;关键字提取部分,该关键字提取部分被配置为从由所述获取部分 获取的内容相关信息中提取搜索关键字;站点搜索请求部分,该站点搜索请求部分被配置为请求因特网 上的搜索站点搜索具有包含由所述关键字提取部分提取的搜索关键 字的网页的网站;并且获取关于作为搜索结果而被找到的多个网站的 信息;第一站点选择部分,该第一站点选择部分被配置为从作为由搜索 站点执行的搜索的结果而被找到的多个网站中选择前N个网站,N为 预定的大于1的整数;第二站点选择部分,该第二站点选择部分被配置为访问由所述 第一站点选择部分选择的N个网站中的每一个,以便从该N个网站 中的每一个的网页中提取文章;并且选择该N个网站中的两个或更多 个作为种子站点,从每一个种子站点提取的文章包含个数超过预定阀 值的搜索关键字的例子;以及评价结果获取部分,该评价结果获取部分被配置为从由所述第 二站点选择部分选择的两个或更多个种子站点和链接到这些种子站 点的下级网站中收集文章;并且从收集到的文章中获取所述内容的评 价结果。
4. 根据权利要求1所述的信息处理设备,还包括 关键字接收部分,该关键字接收部分被配置为接收附加搜索关键字的输入,其中,所述站点搜索部分请求因特网上的搜索站点搜索除了由所述关 键字提取部分提取的搜索关键字之外还包含由所述关键字接收部分 接收的搜索关键字的网站,并且获取关于作为搜索结果而被找到的多 个网站的信息。
5. 根据权利要求1所述的信息处理设备,其中,所述第一站点 选择部分包括被配置为使用收缩条件对关于从搜索站点获取的作为 搜索结果而被找到的多个网站的信息进行搜索以从作为搜索结果而 被找到的所述多个网站中选择更小数目的网站的部分。
6. 根据权利要求5所述的信息处理设备,其中, 由所述站点搜索部分接收的关于所述多个网站的信息是统一资源定位符,即URL,并且由所述第一站点选择部分使用的收缩条件是包含在URL中的特定词。
7. 根据权利要求1所述的信息处理设备,其中, 在由所述第二站点选择部分执行的对种子站点的选择中, 对提取的文章进行词素分析,并且,基于每一个文章的搜索关键字含量来选择种子站点,并且在对搜索关键字内容的计算中,至少根据搜索关键字是从内容的 标题中提取的还是从描述该内容的内容的信息中提取的,将不同的权 重分配给搜索关键字。
8. 根据权利要求1所述的信息处理设备,其中,所述评价结果 获取部分从每一个种子站点进入到逐渐降低级别的下级网站,直到进 入比该种子站点的级别低预先指定的级别数的级别,并且从每一个种 子站点和下级网站的网页中提取和收集文章。
9. 根据权利要求1所述的信息处理设备,还包括 评价规则词典,该评价规则词典包含评价表达和评估值,每一个评估值与评价表达中的对应的一种评价表达相关联,其中,所述评价结果获取部分从收集到的文章中检测多个评价表达,通并且将所获取的检测到"评价表达的评估值的总和计^为内容的评 估结果。
10. 根据权利要求9所述的信息处理设备,其中,根据所述对应 的评价表达表示肯定的观点还是表示否定的观点,所述评价规则词典 中的评价表达的每一个评估值具有正值或负值。
11. 根据权利要求9所述的信息处理设备,其中, 所述评价规则词典还包含用于修饰评价表达的程度表达和用于评价表达的评估值的加权因数,每一种程度表达与加权因数中的对应 的一个加权因数相关联,并且在所述评价结果获取部分中,如果通过程度表达修饰评价表达, 那么,当计算内容的评估结果时,评价表达的评估值乘以程度表达的 加权因数被用作评估值。
12. 根据权利要求9所述的信息处理设备,其中,在所述评价结 果获取部分中,对收集到的文章进行词素分析,从而找到评价表达, 并且,对收集到的文章进行句法分析,从而检测到与找到的评价表达 在语法上相关的单词,并且,如果检测到的单词是搜索关键字,那么 将找到的评价表达的评估值作为内容的评估结果加上。
13. 根据权利要求12所述的信息处理设备,还包括 同义词词典,用于检测与搜索关键字相关的单词,其中, 对收集到的文章进行词素分析,从而找到评价表达,并且对收集到的文章进行句法分析,从而检测到与找到的评价表达在语法上相关 的单词,并且,如果检测到的单词是与由所述同义词词典检测到的搜 索关键字相关的单词,那么将找到的评价表达的评估值作为内容的评 估结果加上。
14. 根据权利要求13所述的信息处理设备,其中,根据检测到 的单词是否为搜索关键字或者检测到的单词是否为与由所述同义词 词典检测到的搜索关键字相关的单词,使找到的评价表达的评估值乘 以不同的加权因数,并且,将找到的评价表达的评估值乘以加权因数 后作为内容的评估结果加上。
15. 根据权利要求12所述的信息处理设备,还包括 下述部分,该部分被配置为确定文章,其中,与找到的评价表达在语法上相关的单词是要作为描述内容评价的文章的搜索关键字; 存储这些文章作为评价代表候补句子;并且将从所存储的评价代表候 补句子中选择的句子作为评价代表句子呈现给用户。
16. 根据权利要求15所述的信息处理设备,还包括 下述部分,该部分被配置为确定文章,其中,与找到的评价表达在语法上相关的平wj疋与关rF刀狗还w谷w"r^人;的双界天傻 字相关的单词;存储这些文章作为评价代表候补句子;并且将从所存
17. —种由信息处理设备使用的用于搜索内容的评价的方法,该 方法包括以下步骤获取包含内容的标题和描述该内容的内容的信息的内容相关信息;从在所述的获取步骤中获取的内容相关信息中提取搜索关键字; 通过因特网搜索具有包含在所述的提取步骤中提取的搜索关键字的网页的网站,并且获取关于作为搜索结果而被找到的多个网站的信息;从在所述的选择步骤中作为搜索结果而被找到的多个网站中选 择前n个网站,n为预定的大于l的整数;以及访问在所述的选择步骤中选择的n个网站中的每一个,以便从 该n个网站中的每一个的网页中提取文章,并选择该n个网站中的 两个或更多个作为种子站点,从每一个种子站点中提取的文章包含个 数超过预定阀值的搜索关键字的例子。
18. 根据权利要求17所述的方法,还包括以下步骤 从在所述的选择步骤中选择的两个或更多个种子站点和链接到这些种子站点的下级网站中收集文章,并从收集到的文章中获取内容 的评价结果。
19. 根据权利要求18所述的方法,还包括以下步骤 将在所述的获取步骤中获取的多个内容的评价结果存储到存储部分中,从而使得每一种评价结果都与用于识别所述内容中的对应的 一个内容的信息相关联;以及当通过网络接收到用于获取评价结果的获取请求时,从在所述的 存储步骤中存储的多个内容的评价结果中读取由包含在获取请求中 的、用于识别内容的信息所识别的内容的评价结果,并将读取的评价 结果通过网络发送到该获取请求的发送者,其中,该获取请求包含用
20. —种用于搜索内容的评价的系统,该系统包括服务器设备;网络;以及通过所述网络连接到所述服务器设备的客户端设备,其中 所述服务器设备包括获取部分,该获取部分被配置为获取包含内容的标题和描述 该内容的内容的信息的内容相关信息;关键字提取部分,该关键字提取部分被配置为从由所述获取 部分获取的内容相关信息中提取搜索关键字;站点搜索部分,该站点搜索部分被配置为通过因特网搜索获取关于作为搜索结果而被找到的多个网站的信息;第一站点选择部分,该第一站点选择部分被配置为从作为由 站点搜索部分执行的搜索的结果而被找到的多个网站中选择前N个 网站,N为预定的大于l的整数;第二站点选择部分,该第二站点选择部分被配置为访问由 第一站点选择部分选择的N个网站中的每一个,以便从该N个网站 中的每一个的网页中提取文章,并选择该N个网站中的两个或更多个 作为种子站点,从每一个种承站点中提取的文章包含个数超过预定阀 值的搜索关键字的例子;评价结果获取部分,该评价结果获取部分被配置为从由第二 站点选择部分选择的两个或更多个种子站点和链接到这些种子站点 的下级网站中收集文章,并从收集到的文章中获取内容的评价结果; 存储部分,该存储部分被配置为存储由评价结果获取部分获 取的多个内容的评价结果,从而使得每一种评价结果都与用于识别内容中的对应的一个内容的信息相关联;以及评价结果发送部分,该评价结果发送部分被配置为当通过从在存储部分中存储的多个内容的评价结果中读取由包含在获取请 求中的用于识别内容的信息所识别的内容的评价结果,并将读取的评 价结果通过网络发送到该获取请求的发送者,其中,该获取请求包含 用于识别内容的信息,并且 所述客户端设备包括被配置为将用于获取评价结果的获取请求通过所述网络发 送到所述服务器设备的部分,所述获取请求包含用于识别内容的信 息,以及被配置为从所述服务器设备接收内容的评价结果并将评价 结果通知用户的部分。
全文摘要
本发明提供信息处理设备以及用于搜索内容评价的方法和系统。该信息处理设备包括被配置为获取内容相关信息的获取部分;被配置为从内容相关信息中提取搜索关键字的关键字提取部分;被配置为通过因特网搜索具有网页的网站并获取关于这些网站的信息的站点搜索部分;被配置为从这些网站中选择前N个网站的第一站点选择部分;被配置为访问N个站点中的每一个以便从该N个网站中的每一个的网页中提取文章并选择该N个网站中的两个或多个作为种子站点的第二站点选择部分;以及被配置为从种子站点和链接到种子站点的下级网站中收集文章并从收集到的文章中提取内容的评价结果的评价结果获取部分。
文档编号G06F17/30GK101339564SQ20081012810
公开日2009年1月7日 申请日期2008年7月2日 优先权日2007年7月2日
发明者角川元辉 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1