用于处理信息的设备以及方法

文档序号:6612801阅读:136来源:国知局
专利名称:用于处理信息的设备以及方法
技术领域
本发明涉及用于当接收指定文档数据的指示时处理用于决定待执行处理的信息的设 备以及方法。
背景技术
在计算机例如个人计算机(PC)向用户呈现信息之后,图形用户接口 (GUI)通常已 广泛的用作用于接收响应呈现的信息的动作输入的技术。
GUI经常使用一方法,其中当用户利用指示装置例如鼠标指向屏幕上的物体时,GUI 显示菜单屏幕,其上列出希望对物体进行的动作,然后从列在菜单屏幕上的动作中接收用 户选择。例如,根据一技术,所谓的GUI中的上下文菜单,GUI显示一菜单屏幕,其上仅 按照由用户指定的对象的数据格式显示可选择的动作。因此,从用户向对象输入动作可以 被简化。
在用于接收用户输入动作的技术的另一实例中,用于看电子邮件(e-mails)的应用程 序通过一种技术自动地转换写入电子邮件的统一资源定位器(URL)或者确定为通讯地址 的部分为超链接并且呈现该超链接,从而随时可接收利用指示装置在超链接部分点击或者 双击指示的输入。
根据这样的技术,根据各待指示对象的数据格式或者该文档中的各字的格式,可用的 动作被限制。然而,动作仅按照待指示对象的数据格式被判定,并且可用的动作的限制未 被基于对象意思或者内容。
所以,用于通过识别对象意思或者内容縮减合适的动作的技术被提议。例如,根据 JP-A2006-65754 (公报),当用户通过使用注解呈现可选择的动作到显示的文档数据上时, 基于由注解以及输入注解的类型指定的字内容,待显示的动作通过识别用户意图被縮减。
为实现这样的处理,在JP-A2006-65754 (公报)中公开的技术包括用于字的词典。通 过使用该词典,包含在文档内的字被添加预先指示字意思的属性信息。基于添加的属性信 息,当注解的输入被用户接收时,由注解指定的字内容可以被分析,以致动作可以限于合 适的动作,然后限制的合适的动作可以被显示。
然而,JP-A2006-65754 (公报)中公开的技术不能准备包含在显示的文档内的生词, 例如用于新技术的术语或者新产品的名字,预先在词典中。因此,字不能被给于合适的属 性信息。由于这个原因,当字被选择时,用户的意图不能被精确识别。以这种方法, JP-A2006-65754 (公报)中公开的技术有问题,当注解输入被接收时,没有字的属性信息 不能呈现适合于标记注解的可应用范围的处理。

发明内容
根据本发明的一个方面,信息处理设备包括存储文档数据的存储器;基于文档数据内 容识别指示文档使用的文档种类的文档种类标识单元;显示文档数据的显示单元;接收由 显示单元显示的至少一部分文档数据的输入指示的输入接收单元;识别输入指示的指示形 式的形式标识单元;指定输入指示的可应用范围的范围指定单元;以及基于指示形式以及 文档种类处理可应用范围的处理单元。
根据本发明的另一方面,信息处理方法包括在存储器中存储文档数据;基于文档数据 内容识别指示文档使用的文档种类;通过显示单元显示文档数据;接收由显示单元显示的 至少一部分文档数据的指示输入;识别输入指示的指示形式;指定输入指示的可应用范围; 以及基于指示形式以及文档种类处理可应用范围。


图1是根据本发明第一实施例的内容浏览设备的功能方块图; 图2是用于解释由图1所示文件输入单元收到的输入文件数据实例的示意图; 图3是用于解释图1所示字属性关联词典的数据结构的实例的示意图; 图4是用于解释图1所示模式存储单元中的数据结构实例的示意图; 图5是用于解释输入文件数据实例的示意图,其中图1所示属性添加单元嵌入指示字 属性的标签;
图6是用于解释输入文件数据实例的示意图,其中图1所示文件属性添加单元嵌入指 示文档属性的标签;
图7是用于解释图1所示文档类型识别知识存储单元中的数据结构的实例的示意图; 图8是用于解释输入文件数据实例的示意图,其中通过图1所示文档类型标识单元识 别的文件类型被嵌入;
图9是用于解释屏幕实例的示意图,其上由图1所示文档类型显示处理单元显示文档 类型以及输入文件数据;图10是用于解释当用户按压图9所示的设置按钮时显示的菜单屏幕实例的示意图;图11是用于解释存在于图1所示意图识别知识存储单元中的意图识别知识信息的数 据结构的实例的示意图;图12是用于解释由图1所示意图显示处理单元以及字属性显示处理单元显示的上下 文菜单实例的示意图;图13是用于解释由意图显示处理单元以及字属性显示处理单元显示的上下文菜单的 另一实例的示意图;图14是用于解释当图1所示动作决定单元向用户呈现多个动作知识信息时实例的示 意图;图15A是用于解释图1所示动作存储单元中的数据结构的第一实例的示意图;图15B是用于解释动作存储单元中的数据结构的第二实例的示意图;图16A是用于解释存在于图1所示历史存储单元中的数据结构实例的示意图;图16B是用于解释存在于添加有查看信息的历史存储单元中的数据实例的示意图;图17是用于解释显示屏幕实例的示意图,其上图1所示书签管理单元呈现书签信息;图18是用于解释存在于图1所示书签存储单元中的书签信息的数据结构的示意图;图19是用于解释在一个记录被另外寄存至图18所示的书签信息之后书签信息实例的 示意图;图20是一示意图,用于解释显示屏幕实例,其上书签管理单元呈现书签信息,在添 加图19所示的书签信息之后;图21是用于解释用于编辑书签的屏幕实例的示意图;图22是从添加文档类型到由内容浏览设备收到的输入文件数据直至存储输入文件数 据在图1所示文档数据存储单元的处理的流程图;图23是由属性添加单元进行的添加字属性至包含在输入文件数据内的字的处理的流 程图;图24A是由文档属性添加单元进行的添加指示输入文件数据的文档结构的文档结构的 属性的第一处理的流程图;图24B是由文档属性添加单元进行的添加文档结构的属性的第二处理的流程图25A是由文档类型标识单元进行的识别输入文件数据文档类型的处理的流程图; 图25B是由文档类型标识单元进行的识别输入文件数据文档类型的处理的流程图; 图26是从接收注解直至执行对输入文件数据的动作的由内容浏览设备进行的处理的 流程图;图27是用于解释当用户在包含在由图1所示显示处理单元显示的呈现信息内的字 "Tozai-Denki"下划线时屏幕实例的示意图;图28是用于解释当用户附上包含在由显示处理单元显示的呈现信息内的部分"事件 地点TozaiDenki (省去)2006年4月7日星期五"时屏幕的实例的示意图;图29是从接收注解的输入直至识别注解的由图1所示注解识别单元进行的处理的流 程图;图30A是用于解释由图1所示注解输入接收单元检测的注解信息的实例的示意图;图30B是用于解释由注解输入接收单元检测的注解信息的另一实例的示意图;图31是用于解释当图27所示的注解被写时由注解识别单元获得的注解信息的标识结果的实例的示意图;图32是由图1所示意图提取单元进行的意图标识的处理的流程图;图33是用于解释由意图提取单元提取的意图识别知识信息基于作为搜索关键字的字属性"公司名"和注解"下划线"提取的实例的示意图;图34是用于解释当意图提取单元重排图33所示意图识别知识信息时意图识别知识信息的实例的示意图;图35是用于解释当输入注解是附件时由意图提取单元提取的意图识别知识信息的实 例的示意图;图36是一处理的流程图,根据其,图1所示执行单元执行对应于从用户接收的动作 知识信息的选择的处理;图37是用于解释当被附加的在输入文件数据中没有字属性的"VOIP"被加下划线时 屏幕的实例的示意图;图38是用于解释当被附加的在输入文件数据中没有字属性的"VOIP"被加下划线时 用于修正文档类型的屏幕的实例的示意图;图39是用于解释其上显示不同于图9的输入文件数据的屏幕的实例的示意图;图40是用于解释当文件类型,字属性,和用户意图全部未知时显示的用户接口的实
例的示意图;图41是用于解释向用户呈现由动作决定单元创建的动作知识信息的窗口的实例的示 意图;图42是用于解释用于接收例如站名的信息向由动作决定单元创建的动作知识信息的 登记的窗口的实例的示意图;图43是用于解释如图42所示添加的动作知识信息的实例的示意图;图44是用于解释当新动作知识信息如图42和43所示被寄存时由动作决定单元显示 的上下文菜单的实例的示意图;图45是用于解释当设置菜单上的项目"编辑搜索方法"被选择时由图1所示意图识 别知识修正单元呈现的搜索方法列表的屏幕的示意图;图46是用于解释当用户选择图45所示的意图识别知识信息并按压改变按钮时将要显 示的窗口的实例的示意图;图47是用于解释用于设置意图识别知识信息以及动作知识信息的显示命令的窗口的 实例的示意图;图48是用于解释用于设置环境作为内容浏览设备的初始设定的屏幕的实例的示意图; 图49是用于解释用于自定义作为内容浏览设备的初始设定的屏幕的实例的示意图; 图50是用于解释当按压图37所示的搜索按钮时将要显示的窗口的实例的示意图; 图51是用于解释存在于根据第一修改例的内容浏览设备的意图识别知识存储单元中 的意图识别知识信息的数据结构的实例的示意图;图52是由根据第一修改例的意图提取单元进行的意图识别的处理的流程图; 图53是用于解释由意图显示处理单元显示的窗口的实例的示意图;以及 图54是用于解释内容浏览设备的硬件配置的示意图。
具体实施方式
参照附图详细地在下面解释本发明的示例性实施例。如图1所示,根据第一实施例的内容浏览设备100包括文档输入单元101,属性添加 单元102,文档属性添加单元103,文档类型识别单元104,文档类型显示单元105,文档 类型修正单元106,文档数据存储单元107,显示处理单元108,注解输入接收单元109, 注解识别单元IIO,文档类型识别知识存储单元lll,字属性显示处理单元112,字属性修
正单元U3,意图显示处理单元114,意图选择接收单元115,意图提取单元116,动作决 定单元117,意图识别知识存储单元118,意图识别知识修正单元119,动作存储单元120, 执行单元121,历史存储单元122,书签管理单元123,书签存储单元124,以及动作修正 单元125。根据本发明第一实施例的内容浏览设备IOO在下面被解释,关于因特网内容可以利用 该设备被浏览的实例。例如,内容浏览设备IOO可以显示以超文本标记语言(HTML)描 述的因特网上的内容。内容浏览设备100可以将用于参照内容的应用软件安装入个人计算机(PC)。另外, 由内容浏览设备IOO使用的PC可以是任何形式,例如,笔记本计算机。此外,内容浏览 设备100可以通过使用另一硬件装置,例如,书写板PC,或者个人数字助理(PDA)被制 造。此外,内容浏览设备100包括未显示的液晶显示器(LCD)。透明书写板被重叠在LCD 的屏幕上。因此,用户可以利用指示装置,例如电子笔输入坐标到显示屏上。换句话说, 当在LCD上显示输入文件数据时,当用户利用笔输入注解到LCD上之时,内容浏览设备 100可以接收注解向输入文件数据的输入。内容浏览设备100包括书写板,其允许用户利用笔输入,以及注解功能。因此,内容 浏览设备100可以按照由笔输入指定的注解执行用于显示的文档的动作。注解功能是通过用笔输入写到数据上的功能,例如由内容浏览设备IOO显示的文档数 据。任何内容可以被写,例如,下划线,附件,字符,字符串,符号,以及符号串。此外,内容浏览设备100可以包括图1所示功能结构,以存在的应用软件的形式,例 如,网页浏览器。内容浏览设备100还可以被配置以通过将插入软件或者附加软件并入网 页浏览器实现图1所示各功能。因此,当用户启动内容浏览设备100时,它可以接收操作,例如显示网页或者书签, 和从显示的网页追踪连接,类似于存在的网页浏览器应用软件。作为这样的操作的结果, 内容浏览设备IOO可以接收文档数据的输入,和显示文档数据。文件输入单元101接收文档数据输入。文档数据可以以各种格式,例如以超文本标记 语言(HTML)格式的文档数据,以可扩展标记语言(XML)格式的文档数据,和通过已 知的光学字符识别(OCR)技术从纸型文献转变成电子数据的文档数据。文档数据被通过 各种线路输入内容浏览设备100,例如来自记录介质,或者经由网络。接收的输入文件数
据被输出到属性添加单元102和文档属性添加单元103。如图2所示,在HTML格式文档数据被使用的情况下第一实施例被在下面解释。 返回图l,属性添加单元102包括词典添加单元131,模式添加单元132,字属性关联词典133,和模式存储单元134。属性添加单元102判定包含在输入文件数据内的字是否被寄存在字属性关联词典信息中,并添加识别的字属性至字被写入输入文件数据的部分。字属性关联词典信息是字与其字属性相关联的词典信息。字属性是指示字意思的属性。属性添加单元102以关联的方式将字属性嵌入包含在输入文件数据内的字中。这样,当读取文档数据时,例如内容浏览设备100的装置可以理解被写的字的意思。如图3所示,字属性关联词典133以关联方式在其中存储表达该字的字符串,以及字 属性。例如,在图3所示的字属性关联词典133中的记录301中,字符串"Sato"与字属 性"人名"相关联。如图4所示,模式存储单元134以关联方式在其中存储用于识别字符串以及字属性的 模式。例如,在图4所示的模式存储单元134中的记录401中,模式"([A-Z\-]+)Inc"与字 属性"公司名"相关联。在另一实例中,在模式存储单元134中的记录402中,模式 "$companyname$\ "([A-ZV]+)\""与字属性"产品名"相关联。在图4所示的实例中,以用于实际的摘要以及报告(笔)语言的正式的表达式描述模 式。在模式中,将要添加字属性的各部分被用小括号指定。记录401指示紧接字符串"Inc." 之前有一个或更多连续字符的字符串与字属性"公司名"相关联。记录402指示跟随附加字属性"公司名"的另一字符串的双引号包围的字符串与字属 性"产品名"相关联。当写入输入文件数据的字符串对应于寄存在模式存储单元134中的条件时,模式添加 单元132添加通过模式存储单元134与字符串相关联的字属性信息至字符串。例如,如果输入文件数据包括字符串"<SPAN class= "company name" > Tozai Inc </SPAN> "GB21"",模式添加单元132判定它对应于模式存储单元134中的记录402 的模式。在这种情况下,模式添加单元132判定"GB21"是将要赋予字属性的字符串。与 模式相关联的字属性是"product name",以致模式添加单元132在字符串"GB2"前插入 标记〈SPAN class = "product name" >,并且在字符串"GB21"之后插入标记々SPAN〉。用这样的方式,预先确定由属性添加单元102以及模式添加单元132识别的字属性。
尽管"人名","公司名","产品名",以及"地名"在第一实施例中被显示为实例, 任何其它属性可以被预定。如图5所示,标记〈SPAN〉用于嵌入字属性,并且字属性在标记中被定义在"class"。 标签501至506由属性添加单元102赋予。由于标签,内容浏览设备100可以识别标签包 围的字符串的意思。由属性添加单元102进行的详细处理将说明于后。文档属性添加单元103识别包含在输入文件数据内的文档结构元件,例如页头标题, 逐条记载,体,头部,以及页脚,并且添加指示文档结构的属性信息到输入文件数据里。如图6所示,标记〈SPAN〉用于嵌入文档结构的属性,并且文档结构的属性在标记中 被定义在"class"。标签601至608由文档属性添加单元103嵌入。通过添加这样的标签, 内容浏览设备IOO可以识别输入文件数据的文档结构。由文档属性添加单元103进行的详 细处理将说明于后。文档类型识别单元104基于由属性添加单元102添加的字属性信息以及由文档属性添 加单元103添加的文档结构的属性信息从预定文件类型中识别输入文件数据文档类型。文 件类型指示输入文件数据的使用,例如,新文章,时事短评,产品目录,或者销售信息。 当识别输入文件数据的文件类型时文档类型识别单元104使用文档类型识别知识存储单元 111。在识别文件类型之后,文档类型识别单元104然后添加文件类型至输入文件数据。如图7所示,文档类型识别知识存储单元lll以关联方式在其中存储字符串模式,字 属性,结构说明,文档类型,以及标记。文档类型识别单元104基于文档类型识别知识存 储单元111通过评估嵌入字的属性或者包含在输入文件数据内的标记将文件类型识别为标 记。详细处理将说明于后。在图8所示的输入文件数据中,元标记801包括文档类型。换句话说,它指示图8所 示的输入文件数据被确定为事件信息。文档类型显示单元105与输入文件数据一起显示识别的文件类型。在图9所示的屏幕 实例中,文件类型被显示作为页面类型。页面类型如下拉菜单901所示。通过使用下拉菜 单901,用户可以从菜单选择合适的页面类型。另外,用户可以用笔输入注解到图9中的显示屏上的显示区域902上。在这种情况下 处理类似于通过显示处理单元108进行的处理,其将说明于后,所以,对于它的解释在这 里从略。文档类型修正单元106修正由文档类型识别单元104识别的文件类型。例如,当图9
所示的屏幕被显示时,如果用户判定下拉菜单901中显示的文件类型是错误的,用户可以 从下拉菜单901选择另一页面类型(文件类型)。'例如,如果用户用笔在下拉菜单901轻拍,页面类型(文件类型)列表被显示作为选择。然后用户从该选择选择用户视为合适的文档类型,因此,文档类型修正单元106修正将要添加入输入文件数据的文件类型为选择 的文件类型。因此,如果由文档类型识别单元104识别的文件类型是错误的,它可以被修 正至合适的文件类型。随后的处理将通过使用修正的文件类型被进行。在处理被完成之后,文档类型识别单元104进行处理以将嵌入文件类型的输入文件数 据写入文档数据存储单元107。文档数据存储单元107在其中存储输入文件数据,其中字属性,文档结构的属性,以 及文件类型根据如上所述的处理被嵌入。另外,文档数据存储单元107在其中临时存储输 入文件数据用于内容浏览设备100显示它,例如,随机存取存储器(RAM)被用作该存储 单元。显示处理单元108显示输入文件数据,其中字属性,文档结构的属性,以及文件类型 被嵌入。屏幕实例与图9中的相同。当显示处理单元108显示输入文件数据时,注解或者 其它指示的输入可以被接收。这样,用户可以查看输入文件数据。下拉菜单901显示存在于输入文件数据的文件类型作为页面类型。显示区902显示输 入文件数据,并且接收注解的输入。另外,显示区902可以类似于上面解释的情况改变页 面类型。区域903显示当前正在被显示的输入文件数据的地址。在作为图9中的空白的区域904 中,字符串,例如用输入注解说明的输入文件数据中的字,将被显示。搜索按钮905用于 选择对区域904中显示的字符串的动作。细节将被随后说明。设置按钮906用于调用窗口以执行内容浏览设备100的初始设定。当用户按压设置按钮906时,用户从显示在图10所示的菜单屏幕上的项目选择项目, 然后各种处理可以被进行。详细将说明于后。返回图9,复选框907是为了指示或者在当前显示的窗口中显示或者在另一窗口中显 示,当不同于显示区902中显示的输入文件数据的输入文件数据将被显示时。例如,当进行搜索时,如果用户需要当前显示的输入文件数据保留,并且搜索结果显 示在新建窗口中,用户标记复选框907。复选框908是为了指示注解的输入是否将被接收至显示区902中显示的输入文件数据。例如,如果向普通HTML或者嵌入输入文件数据的脚本的操作与注解的输入冲突,用 户删除复选框908中的标记,并且使得注解的输入无效。因此,仅向普通HTML或者嵌入 输入文件数据的脚本的操作可以被精确地辨认。返回图l,注解输入接收单元109接收用 户用笔操作或者另一中间的输入接口进行的注解输入至通过显示处理单元108显示的输入 文件数据。注解是画到显示屏上的轨迹的组合,其可以是,例如,下划线,附件,字符, 字符串,符号,以及符号串。注解识别单元110识别从注解输入接收单元109接收的注解类型,并且在显示的输入 文件数据中识别对其应用注解的可应用范围。换句话说,注解识别单元110等价于包括识 别注解类型(形式)的形式识别单元,以及指定注解的可应用范围的范围指定单元的单元。意图提取单元116基于至少下列之一提取操作内容浏览设备100的用户的意图由注 解识别单元110获得的识别结果(例如,注解的类型以及用于注解的可应用范围);字属性,文档结构的属性,或者包含在显示的输入文件数据内的文件类型;以及预存储在意图识别知识存储单元118中的意图识别知识信息。如果字属性被加至包含在注解识别结果中的可应用范围内的字中,意图提取单元116 使用字属性作为用于识别用户意图的条件。另外,意图提取单元116可以使用被加到输入 文件数据的文档结构的属性作为用于识别用户意图的条件,尽管文档结构的属性的使用与 第一实施例不同。如图11所示,在意图识别知识信息中,意图标签,字属性条件,文档类型条件,以 及注解条件互相关联。如图11所示,意图识别知识存储单元118在其中预存储用户意图 的种类。用户意图的种类可以是,例如,修剪包含在注解的可应用范围内的信息的意图, 基于包含在注解的可应用范围内的信息查看地图信息的意图,基于包含在注解的可应用范 围内的信息搜索关于产品名誉的信息的意图,等等。此外,通过参照意图识别知识信息,意图提取单元116可以提取指示用户意图的意图 标签,基于注解的识别结果,输入文件数据的文件类型,以及包含在可应用范围内的字的 字属性。详细处理将说明于后。如果多个用户的意图通过意图提取单元116提取,意图显示处理单元114显示用户意 图到新创建的上下文菜单上。因此,用户可以确认意图识别结果,根据需要进行菜单上的 操作,以及选择合适的意图。
此外,意图显示处理单元114显示从意图识别知识存储单元118提取的意图标签作为 用户意图。这样,当提取用户的多个意图时,合适的意图可以被选择。当意图显示处理单元114显示用户意图时,字属性显示处理单元112显示包含在注解 的可应用范围内的字的字属性到同一上下文菜单上。如果用户从由字属性显示处理单元112显示的上下文菜单选择字属性,字属性修正单 元113修正包含在输入文件数据中的注解的可应用范围内的字的字属性为选择的字属性。图12描述当用户输入注解1201时上下文菜单的实例。字属性显示处理单元112在窗 口 1202中显示被加到包含在注解的可应用范围内的字"Tozai-Denki"的字属性 "Companyname (公司名)"。因此,它可以确认字属性被用作用于意图提取的条件。此 外,意图显示处理单元114在窗口 1203中显示提取的意图。换句话说,图12所示的实例 呈现用户的意图是进行Map (地图),Stockprice (股票价格),Company profile (公司概 况)等等的搜索。在对应于用注解标记的Tozai-Denki的字属性仅是"公司名"的情况下,该实例在上 面被解释。然而,有一些情况下多个属性被添加至字。如图13中的上下文菜单的另一实例所示,如果字属性显示处理单元112基于包含在 可应用范围内的字获得多个字属性,字属性显示处理单元112在窗口 1301中显示获得的 字属性。然后如果用户选择图13所示的字属性的任一,字属性修正单元113作出修正以致选 择的字属性用于提取该意图。因此,意图提取单元116通过使用该字属性再次判定用户意 图。这样,确定为合适的用户意图的意图标签被显示。返回图1,意图选择接收单元115接收用户事实上希望从显示的用户意图中进行处理 的意图的选择。当图12所示的上下文菜单被显示时,意图选择接收单元115接收搜索主 题的选择,用户事实上希望从窗口 1203中显示的搜索主题,也就是Map(地图),Company profile (公司概况),以及Stockprice (股票价格)中搜索。这样,处理可以基于用户的合 适的意图被进行。动作决定单元117从由意图提取单元116识别的用户的意图标签中选择对应于由意图 选择接收单元115选择的意图标签的动作。将要由动作决定单元117选择的动作被预定。对应于用户意图的指定的动作的执行方 法信息称为动作知识信息。动作知识信息的实例是被并入以进行对应于用户意图的处理的脚本程序。动作知识信息存在于动作存储单元120,其将说明于后。动作决定单元117可 以通过阅读脚本程序执行对应于用户意图信息的动作。此外,如果多个动作知识信息对应于用户意图信息,动作决定单元117可以通过向用 户呈现所述多个动作知识信息从用户接收动作知识信息的选择。例如,当动作决定单元117接收用户具有基于包含在用注解指定的可应用范围内的字 査看地图信息的意图的选择时,如果可得到多个用于提供地图信息(动作知识信息)的服 务,动作决定单元117呈现对用户的服务。如图14所示,当用户输入注解例如下划线,到显示的输入文件数据上时,意图显示 处理单元114显示上下文菜单。上下文菜单向用户呈现动作知识信息作为上下文菜单1401。如上下文菜单1401所示,动作决定单元117向用户呈现动作知识信息。动作知识信 息的呈现便于用户要求的合适的动作的选择。这样,内容浏览设备100与用户作出相互作 用,并基于相互作用内容执行动作。在图14所示的上下文菜单的实例中,类似于图13,内容浏览设备IOO还可以引导用 户首先选择字属性。内容浏览设备100然后引导用户选择对应于选择的字属性(用户意图) 的搜索主题。在选择搜索主题之后,动作决定单元117引导用户从适用于搜索主题的网址 选择选择特定地用于搜索信息的网站的动作。以这种方法,当向用户显示上下文菜单时,字属性显示处理单元112,意图显示处理 单元114,以及动作决定单元117不需要被分离作为个别的接口 。如图15A以及15B所示,动作存储单元120包括表结构,其中意图标签,动作标签, 以及执行方法互相关联。动作决定单元117可以通过用意图标签作为搜索关键字进行搜索 指定动作。在图14所示的实例中,动作决定单元I17显示动作标签作为动作知识信息。返回图l,执行单元121执行动作决定单元117选择的动作。在第一实施例中,执行 单元121按照与动作存储单元120中的选择的动作相关联的执行方法进行处理。通过使用信息,例如存在于历史存储单元122的历史信息,意图识别知识修正单元119 作出修正,例如改变,删除,或者加入存在于意图识别知识存储单元118的意图识别知识 信息,其将说明于后。历史存储单元122在其中存储关于当内容浏览设备100引用作为历史信息的内容时进 行的处理的信息,例如,关于参照由文件输入单元101收到的输入文件数据的参考信息, 关于用户经由意图选择接收单元115选择的意图的意图信息,关于用户经由动作决定单元117选择的动作的动作知识信息。如图16A所示,历史存储单元122在其中以关联方式存储文档类型,字属性,文档结 构,意图标签,动作标签,以及査看目标。以这种方法,显示的输入文件数据的文件类型, 对应于用户用注解标记的HTML —部分的字属性,文档结构的属性,用户选择的意图标签, 以及用户选择的动作标签以关联方式被存储在历史存储单元122中。例如,如果执行的动作的动作类型是网页搜索,在根据动作的搜索过程之后,作为搜 索结果显示的网址被连接地存储在历史存储单元122中的字段1601中。可接受的将要记 录的査看目标数目可以被预定。例如,可接受的将要记录的查看目标数目可以是三个。返回图1,书签管理单元123基于存在于历史存储单元122的历史信息管理书签。此 外,书签管理单元123到积累在书签存储单元124中的参考信息上进行加入,删除,或者 改变的处理,其将说明于后,以及用于挑选出参考信息的树状结构。此外,如果从图IO所示的菜单接收项目"Displaybookmark (显示书签)"1001的选 择,书签管理单元123读出存在于书签存储单元124的书签,并且向用户呈现它们。书签信息存在于图17所示的显示屏上的区域1701。区域1704显示输入文件数据,例如,基于提取结果呈现的数据。此外,如果某一项 目是从书签中选出来的,对应于选择的项目的输入文件数据被显示在区域1704中。页面 类型1702显示对于区域1704中显示的输入文件数据识别的文件类型。文件类型经由文档 类型显示单元105的接口被显示。另外,当用户按压设置按钮1703时,图10所示的菜单被显示。如果项目"Add to bookmark (添加到书签)"1002是从菜单中选出来的,书签管理单元123进行处理以将区 域1704中显示的输入文件数据寄存入书签存储单元124作为书签。在第一实施例中,书签存储单元124在其中以树状结构存储书签。如图18所示,书 签信息以关联方式包括种类l,种类2,标题,地点标签,以及URL。寄存书签的过程被在下面解释。例如,历史存储单元122在其中存储图16B所示的记 录4601作为历史信息。书签管理单元123将指示搜索主题的"评论"从意图标签"搜索 主题评论"替代为书签信息中的种类1,并且将显示的输入文件数据的文件类型"时事 短评"替代为书签信息中的种类2。此外,书签管理单元123将图17所示的输入文件数据的标题替代为书签信息中的标 题。此外,书签管理单元123将图17所示的指示输入文件数据的获得源的参考信息替代 为书签信息中的URL。此外,如果图16B所示的历史信息中的动作标签包括用于指定某一网址的信息,书签 管理单元123将关于网址的信息替代为书签信息中的地点标签。另外,当显示书签信息时, 用户可以通过显示地点标签辨认搜索目的。在记录4601所示的历史信息情况下,动作标 签是"网址无指定搜索",以致书签信息中的地点标签为空。书签存储单元124通过用户在其中存储因特网内容的参考信息,例如,参考信息以树 状结构风格被排序。通过以这种方法积累参考信息,用户可以容易地查看因特网内容。通过使用书签信息中的种类1以及种类2,书签可以以树状结构被分类。地点标签被 显示,例如,在图17所示的书签中的括号里面作为指示文档的标题。以这种方法,当添加书签时,书签管理单元123寄存相关信息作为呈现书签的树状结 构中的节点,通过使用存在于历史存储单元122的信息,以及通过文档类型识别单元104 用输入文件数据书签识别的文件类型。图19所示的记录1901呈现关于显示在图17中的区域1704中的输入文件数据的书签 信息。这样,每当书签被寄存时,书签信息被添加。在图20所示的项目2003中可以确认指示输入文件数据的添加的书签被寄存。以这种方法,如果存在于书签存储单元124的书签信息被更新,书签管理单元123从 书签存储单元124读出该书签信息,并且基于读出的书签信息更新显示屏。另外,图20所示的书签可以被编辑。例如,用户选择任意的书签,并且按压删除按 钮2001,以致书签管理单元123从书签存储单元124删除关于选择的书签的信息。当用户选择任意的书签,并且按压编辑按钮2002时,用于编辑书签的用户接口被显示。在图21所示的示例性编辑屏幕上,用户可以编辑作为选择的书签信息关联的各信息。用户可以改变在图21所示的示例性编辑屏幕中显示的项目,就是地点标签,标题, URL,等等,为任意值。另外,种类l以及种类2可以通过从存在于下拉菜单2101以及 下拉菜单2102的多个值挑选合适的值被设置。返回图1,动作修正单元125可以在存在于动作存储单元120的动作知识信息上作出 修正,例如加入,校正,以及删除。动作被添加的情况被在下面解释。首先,在图9所示的屏幕被显示的情况下,如果用户按压设置按钮906,图10所示的 设置菜单被显示。如果项目"Add this cite to search destination (添加此地点以搜索目的地 址)"是从设置菜单中选出来的,动作修正单元125添加信息,例如在图9中的区域902 中显示的输入文件数据的地址,至动作存储单元120作为将要搜索目的地址知识信息动作。 详细处理将说明于后。参照图22,在下面解释通过内容浏览设备IOO进行的从添加文件类型到接收的输入文 件数据直至存储它为文档数据存储单元107的处理。首先,文件输入单元101接收输入文件数据(步骤S2201)。文件输入单元101然后 传递接收的输入文件数据至属性添加单元102。属性添加单元102然后对该字附加包括指示包含在接收的输入文件数据内的字的字属 性的标记(步骤S2202)。详细如图23所示。接着,文档属性添加单元103通过分析输入文件数据附加包括文档结构的属性的标记 (步骤S2203)。详细如图24A以及24B所示。接着,文档类型识别单元104基于附加的标签识别输入文件数据的文件类型(步骤 S2204)。细节如图25所示。文档类型显示单元105然后显示该文件类型(步骤S2205)。这样,用户可以确认显 示的文件类型是否是合适的。接下来,文档类型识别单元104按照用户操作输入判定文件类型是否是合适的(步骤 S2206)。如果文档类型识别单元104判定文件类型是合适的(在步骤S2206是),在文件类型 上不再特别地进行处理。相反,如果文档类型识别单元104判定文件类型不是合适的(在步骤S2206否),文 档类型修正单元106按照用户操作作出修正判定文件类型(步骤S2207)。文档类型识别单元104然后存储输入文件数据,其中判定文件类型是嵌入为文档数据 存储单元107 (步骤S2208)。根据该处理,文件类型以及字属性被嵌入输入文件数据。当显示输入文件数据时,当 注解输入被接收,按照用户意图的动作可以由使用嵌入的信息指定,例如文件类型。向包含在显示在图22中步骤S2202的输入文件数据内的字添加字属性的处理,参照 图23被在下面解释。为实现属性添加单元102,例如,特性表达式提取法(Yumi Ichimura,及其他,"问 题与回答,以及日本特性表达式以及特性表达式系统的提取之间的关系的考虑",日本信
息处理学会研究报告,NL-161-3, 2004),其是公开地已知的,可以被使用。在该处理中, 图2所示的HTML格式输入文件数据受到处理。词典添加单元131获得一记录,其中表面字符串与字属性关联词典133的字属性相关 联(步骤S2301)。词典添加单元131然后搜索跨过通过获得的记录中的表面字符串经受处理的输入文件 数据,并确认字符串是否出现(步骤S2302)。例如,如果词典添加单元131获得图3所 示的记录301,其中表面字符串"Sato"与字属性"人名"相关联,从字属性关联词典133, 词典添加单元131以表面字符串"Sato"作为搜索关键字搜索输入文件数据。如果词典添 加单元131确认字符串不出现(在步骤S2302否),词典添加单元131不使用输入文件数 据上的记录301进行处理。相反,如果词典添加单元131确认字符串出现在输入文件数据中(在步骤S2302是), 词典添加单元131插入标记,指示字属性用以在输入文件数据中的外观位置前后关联表面 字符串(步骤S2303)。例如,在记录301中,因为对应于表面字符串"Sato"的字属性是"人名",如果输 入文件数据包括字符串"Sato",词典添加单元131在字符串以前插入标记〈SPAN class ="personal name" >,并且在字符串之后插入标记々SPAN、此外,如果词典添加单元131在输入文件数据中检出多个与寄存在字属性关联词典133 中的相同的表面字符串,词典添加单元131插入标签至检测的表面字符串的所有的位置。词典添加单元131然后判定该处理是否己被在存在于字属性关联词典133的所有记录 上进行(步骤S2304)。如果词典添加单元131判定该处理尚未在所有记录上进行(在步 骤S2304否),词典添加单元131再次开始从字属性关联词典133获得记录的处理(步骤 S2301)。以这种方法,步骤S2301到S2304的处理被重复直至所有记录在步骤S2301被 从字属性关联词典133取出。模式添加单元132然后获得一记录,其中模式从模式存储单元134与字属性相关联(步 骤S2305)。模式添加单元132然后直至步骤S2304对于作为处理结果的输入文件数据搜索对应于 获得的记录的模式的部分,并且确认对应的字符串是否出现(步骤S2306)。如果模式添 加单元132确认模式不出现(在步骤S2306否),模式添加单元132不使用输入文件数据 上的模式进行处理。
相反,如果模式添加单元132确认对应于该模式的字符串出现在输入文件数据中(在 步骤S2306是),模式添加单元132在该字符串前后插入指示与该模式相关联的字属性的 标签(步骤S2307)。例如,如果模式添加单元132获得图4所示的记录401作为模式,模式添加单元132 判定图2所示的输入文件数据中的字符串"Tozai-DenkiCo., Ltd."对应于该模式。模式添 加单元132然后确定添加字属性至字符串"Tozai-Denki"。根据记录401中的该模式,关 联的字属性是"公司名"。因此,模式添加单元132在输入文件数据中的字符串"Tozai-Denki"以前插入标记〈SPAN class = "company name"〉, 并且在字符串"Tozai-Denki"之后插入标记〈/SPAN〉。模式添加单元132然后判定该处理是否已被在存在于模式存储单元134的所有记录上 完成(步骤S2308)。如果模式添加单元132判定该处理尚未在所有记录上完成(在步骤 S2308否),模式添加单元132再次开始从模式存储单元134获得记录的处理(步骤S2305)。 以这种方法,步骤S2305到S2308的处理被重复直至所有记录在步骤S2305被从模式存储 单元134取出。通过进行如上所述处理,属性添加单元102可以添加字属性至输入文件数据中的字。 属性添加单元102进行的处理结果如图5所示。在图22所示的步骤S2203描述的添加文档结构的属性的处理参照图24A以及24B在 下面解释。假定将要由文档属性添加单元103识别的文件结构属性被预定。在下列说明中,假定 预定的属性包括头部,页头标题,逐条记载,体,以及页脚。首先,文档属性添加单元103接收从属性添加单元102添加有指示字属性的标签的输 入文件数据(步骤S2401)。在该处理中,假定文档属性添加单元103接收图5所示的输 入文件数据。文档属性添加单元103然后跨过输入文件数据搜索标记〈Hn〉以及标记々Hn、并且确 认在输入文件数据中是否出现任何标记<1111>以及任何标记</1111>(步骤S2402)。标记〈Hi^ 意指标记< 1>,标记〈H2、等等。如果文档属性添加单元103确认标记〈Hn〉以及标记〈/Hn〉的出现(在步骤S2402是), 文档属性添加单元103—个个获得随附上标签的部分的HTML的一条(步骤S2403)。文档属性添加单元103然后判定获得的部分的HTML片是否被定位在从顶的整体输入 文件数据的10%之内,并且排列属性的值是正确的(步骤S2404)。如果文档属性添加单元103判定获得的部分的HTML片被定位在从顶的整体输入文件 数据的10%之内,并且排列属性的值是正确的(步骤S2404是),文档属性添加单元103 判定该部分的HTML是头部(步骤S2405)。文档属性添加单元103然后紧接该部分的 HTML之前插入标记〈SPAN class = "header" >,并且紧接在该部分的HTML之后插入标 记〈/SPAN〉。相反,如果文档属性添加单元103判定该部分的HTML未被定位在从顶的整体输入文 件数据的10%之内,或者排列属性值不是正确的(在步骤S2404否),文档属性添加单元 103然后判定该部分的HTML是否被定位在从尾的整体输入文件数据的10%之内,并且排 列属性值是正确的(步骤S2406)。如果文档属性添加单元103判定获得的部分的HTML片被定位在从结束的整体输入文 件数据的10%之内,并且排列属性的值是正确的(步骤S2406是),文档属性添加单元103 判定该部分的HTML是页脚(步骤S2407)。文档属性添加单元103然后紧接该部分的 HTML之前插入标记〈SPAN class = "footer" >,并且紧接在该部分的HTML之后插入标 记〈/SPAN〉。相反,如果文档属性添加单元103判定该部分的HTML被定位在从尾端的整体输入文 件数据的10%之内,并且排列属性值不是正确的(在步骤S2406否),该部分的HTML 被确定为页头标题(步骤S2408)。文档属性添加单元103然后紧接该部分的HTML之前 插入标记〈SPAN class = "headline" >,并且紧接在该部分的HTML之后插入标记 </SPAN>。文档属性添加单元103然后判定步骤S2403至S2408的处理是否己被在所有包含在在 步骤S2402 (步骤S2409)检测的部分的HTML片内的标签〈Hn〉上进行。如果文档属性添 加单元103判定该处理尚未在所有标签<1&>上进行(在步骤S2409否),文档属性添加单 元103再次从步骤S2403进行该处理。相反,如果文档属性添加单元103判定该处理在所 有标签<1111>上完成,文档属性添加单元103走至步骤S2410。文档属性添加单元103然后横过输入文件数据搜索标记〈TD〉以及标记々TD、并且确 认在输入文件数据中是否出现任何标记〈TD〉以及任何标记々TD〉(步骤S2410)。如果文档属性添加单元103确认标记〈TD〉以及标记々TD〉的出现(在步骤S2410是), 文档属性添加单元103逐个获得随附上标签的部分的HTML的一片(步骤S2411)。
文档属性添加单元103然后判定获得的部分的HTML片是否被定位在从顶的整体输入 文件数据的10%之内,并且排列属性的值是正确的(步骤S2412)。如果文档属性添加单元103判定获得的部分的HTML片被定位在从顶的整体输入文件 数据的10%之内,并且排列属性的值是正确的(步骤S2412是),文档属性添加单元103 判定该部分的HTML是头部(步骤S2413)。文档属性添加单元103然后紧接该部分的 HTML之前插入标记〈SPAN class = "header" >,并且紧接在该部分的HTML之后插入标 记々SPAN〉。相反,如果文档属性添加单元103判定该部分的HTML被定位在从顶的整体输入文件 数据的10%之内,并且排列属性值不是正确的(在步骤S2412否),文档属性添加单元103 然后判定该部分的HTML是否被定位在从尾端的整体输入文件数据的10%之内,并且该排 列属性值是正确的(步骤S2414)。如果文档属性添加单元103判定获得的部分的HTML片被定位在从结束的整体输入文 件数据的10%之内,并且排列属性的值是正确的(步骤S2414是),文档属性添加单元103 判定该部分的HTML是页脚(步骤S2415)。文档属性添加单元103然后紧接该部分的 HTML之前插入标记〈SPAN class = "footer" >,并且紧接在该部分的HTML之后插入标 记〈/SPAN〉。相反,如果文档属性添加单元103判定该部分的HTML片被定位在从结束的整体输入 文件数据的10%之内,并且排列属性的值不是正确的(在步骤S2414否),文档属性添加 单元103不进行特定的处理。文档属性添加单元103然后对在步骤S2410检测的所有的部分的HTML片逐一进行步 骤S2411至S2415的处理(步骤S2416)。移到图24B,文档属性添加单元103确认标记〈LI、标记〈DT〉,或者标记〈DD〉是否 在输入文件数据(步骤S2417)中出现。如果文档属性添加单元103不能确认标记XLI、 标记〈DT、或者标记〈DD〉的出现(在步骤S2417否),文档属性添加单元103不进行处 理并且走至步骤S2421。相反,如果文档属性添加单元103确认标记〈LI、标记〈DT〉或者标记〈DD〉的出现(在 步骤S2417是),文档属性添加单元103逐一获得用标签指定的部分的HTML的一片(步 骤S2418)。文档属性添加单元103然后判定获得的部分的HTML是逐条记载(步骤S2419)。文
档属性添加单元103然后紧接该部分的HTML之前插入标记〈SPAN class ="itemization" >,并且紧接在该部分的HTML之后插入标记々SPAN〉。文档属性添加单元103然后对在步骤S2417检测的所有的部分的HTML片逐一进行步 骤S2418至S2419的处理(步骤S2420)。文档属性添加单元103然后横过输入文件数据搜索标记〈P〉以及标记々P、并且确认 在输入文件数据中是否出现任何标记〈P〉以及任何标记々P〉(步骤S2421)。如果文档属性 添加单元103不能确认任何标记< >以及任何标记</ >的出现(在步骤S2421否),文档 属性添加单元103不再进行处理,并且终止处理。相反,如果文档属性添加单元103确认标记〈P〉的出现(在步骤S2421是),文档属 性添加单元103逐一获得随附上标签的部分的HTML的一片(步骤S2422)。文档属性添加单元103确认是否没有处理中确定为的头部的部分的HTML存在在获得 的输入文件数据中的部分的HTML片之后,并且没有处理中确定为的页脚的部分的HTML 存在在获得的HTML以前(步骤S2423)。如果文档属性添加单元103确认没有部分的HTML如上所述存在(在步骤S2423否), 文档属性添加单元103判定获得的部分的HTML是主体(步骤S2424)。文档属性添加单 元103然后紧接该部分的HTML之前插入标记〈SPAN class = "body" >,并且紧接在该部 分的HTML之后插入标记々SPAN、文档属性添加单元103然后对在步骤S2421检测的所有的部分的HTML片逐一进行步 骤S2422至S2423的处理(步骤S2425)。以这种方法,文档属性添加单元103分析输入文件数据的文件结构,并且添加文件结 构信息至输入文件数据,根据图24A以及24B所示的处理。根据以上处理,文档属性添加 单元103创建,例如,图6所示输入文件数据。在图22所示的步骤S2206由文档类型识别单元104进行的识别输入文件数据的文件 类型的处理,参照图25A以及25B在下面解释。假定将要由文档类型识别单元104识别的输入文件数据的文件类型是预定的。在该处 理中,文档类型识别单元104从时事短评,事件信息,以及新闻稿中判定文件类型的情况, 被在下面解释作为实例。为解释,假定文档类型识别单元104使用图7所示的文档类型识 别知识存储单元lll。首先,文档类型识别单元104获得输入文件数据,其具有由文档属性添加单元103添
加的文档结构的属性(步骤S2501)。获得的输入文件数据包括添加的字属性以及添加的 文档结构的属性。文档类型识别单元104然后初始化与各预定的文件类型相关联的各数字类型变量(步 骤S2502)。文档类型识别单元104然后获得存在于文档类型识别知识存储单元111的文档类型识 别知识信息的记录(步骤S2503)。文档类型识别单元104然后判定字符串模式是否存在于获得的记录(步骤S2504)。如果文档类型识别单元104判定字符串模式存在于获得的记录(在步骤S2504是), 文档类型识别单元104然后搜索输入文件数据,并且判定字符串模式是否在输入文件数据 中出现(步骤S2505)。如果文档类型识别单元104判定字符串模式不在输入文件数据中 出现(在步骤S2505否),文档类型识别单元104不特别地进行处理。相反,如果文档类型识别单元104判定字符串模式在输入文件数据中出现(在步骤 S2505是),文档类型识别单元104逐一获得出现字符串模式的位置(步骤S2506)。文档类型识别单元104然后确认与字符串相关联的结构说明在获得的记录中是否是 ALL (步骤S2507)。如果该结构说明被说明为ALL (步骤S2507是),文档类型识别单 元104不特别地进行处理。相反,如果文档类型识别单元104确认结构说明不是ALL (步骤S2507否),该文档 类型识别单元104获得在出现的位置添加的文档结构的属性(步骤S2508)。文档类型识别单元104将获得的文档结构的属性与结构说明比较(步骤S2509)。如 果文档类型识别单元104判定获得的文档结构的属性不对应于结构说明(在步骤S2509 否),文档类型识别单元104不特别地进行处理。相反,如果文档类型识别单元104判定获得的文档结构的属性对应于结构说明(步骤 S2509是),文档类型识别单元104读出文档类型识别知识信息中的记录的结构说明关联 的文档类型(步骤S2510)。此外,文档类型识别单元104读出记录中关联的标记(步骤52511) 。文档类型识别单元104然后添加读出的标记至对应于读出的文件类型的变量(步骤52512) 。以这种方法,文档类型识别单元104在步骤S2503检测的所有的位置上逐一进行步骤 S2506至S2512的处理(步骤S2513)。
如果文档类型识别单元104判定字符串模式不存在于获得的记录(步骤S2504否), 文档类型识别单元104判定字属性是否存在于获得的记录(步骤S2514)。如果文档类型识别单元104判定字属性存在于记录(在步骤S2514是),如图25B所 示,文档类型识别单元104对于输入文件数据搜索字属性,并且判定字属性是否在输入文 件数据中出现(步骤S2515)。如果文档类型识别单元104判定字属性不在输入文件数据 中出现(在步骤S2515否),文档类型识别单元104不特别地进行处理。相反,如果文档类型识别单元104判定字属性在输入文件数据中出现(在步骤S2515 是),文档类型识别单元104逐一获得出现字属性的位置(步骤S2516)。文档类型识别单元104然后确认与字属性相关联的结构说明在获得的记录中是否是 ALL (步骤S2517)。如果文档类型识别单元104确认结构说明是ALL (步骤S2517是), 文档类型识别单元104不特别地进行处理。相反,如果文档类型识别单元104确认结构说明不是ALL (步骤S2517否),该文档 类型识别单元104读出覆盖出现字属性的位置的文档结构的属性(步骤S2518)。文档类 型识别单元104比较读出的文档结构的属性与文档类型识别知识信息中描述的结构说明 (步骤S2519)。如果文档类型识别单元104判定读出的文件结构不对应于结构说明(在 步骤S2519否),文档类型识别单元104不特别地进行处理。相反,如果文档类型识别单元104判定读出的文件结构对应于结构说明(步骤S2519 是),文档类型识别单元104读出与记录中的结构说明相关联的文档类型(步骤S2520)。 文档类型识别单元104然后读出与记录中的结构说明相关联的标记(步骤S2521)。文档类型识别单元104然后添加获得标记至对应于获得的文件类型的变量(步骤 S2522)。以这种方法,文档类型识别单元104在步骤S2515检测的所有的位置上逐一进行步骤 S2516至S2522的处理(步骤S2523)。此外,文档类型识别单元104对存在于文档类型识别知识信息的所有记录进行步骤 S2503至S2523的处理(步骤S2524)。最后,文档类型识别单元104比较每个对应于各文件类型的变量值,并输出具有最大 值作为识别结果的文档类型(步骤S2525)。这样,文件类型可以通过进行第一实施例中的这样的处理被识别。另外,如果在步骤 S2525所有值是零,文档类型识别单元104输出识别结果是"未知的"。 以这种方法由文档类型识别单元104识别文档类型的输入文件数据实例如图8所示。 在图8所示的实例中,假定文档类型识别单元104识别文件类型是事件信息。文档类型识 别单元104然后将识别的文件类型插入如图8所示的元标记801。在完成以上处理之后,文档类型识别单元104将输入文件数据存储入文档数据存储单 元107。替代地,显示处理单元108可以直接显示输入文件数据,不通过文档类型识别单 元104将它存储入文档数据存储单元107。通过进行这样的处理,可以创建其中嵌入文件类型的输入文件数据。在第一实施例中, 显示处理单元108显示该输入文件数据。当注解被输入到附加有文件类型的输入文件数据上时执行由内容浏览设备100进行的 动作的处理参照图26在下面解释。首先,显示处理单元108显示存在于文档数据存储单元107的输入文件数据(步骤 S2601)。在这种情况下,如图9所示的屏幕被显示。注解输入接收单元109然后从用户接收注解的输入(步骤S2602)。例如,如果查看 图9所示的屏幕的用户具有向呈现的信息的内容执行动作的意图,用户在呈现的信息之上 用笔进行写操作。内容浏览设备100接收写操作的输入作为注解。输入下划线然后经由注 解输入接收单元109被传输到注解识别单元110。在图27所示的屏幕实例中,以为用户进行输入,例如关于关键字"Tozai-Denki"画 下划线用于检查Tozai-Denki,因为用户不知道Tozai-Denki是什么公司。如果注解的路径是连续的,或者即使当路径是间断的,如果它们之间的时间间隔短于 预置时间,注解输入接收单元109接收输入作为注解。以这种方法,注解输入接收单元109 辨别各注解,并且检测信息,例如每一输入注解的起始点(用笔写的开始)以及终点(写 的结束),写的顺序,线(路径长度)的方向以及长度,以及位置,构成屏幕的每一像素, 相对于屏幕的左下角落作为底。在图28所示的屏幕实例中,以为用户进行输入,例如附入字符串,因为用户想要相 对于文件类型的每一个修剪附入的字符串。返回图26,注解识别单元IIO基于起始点以及终点坐标以及接收的注解的路径的长度 识别可应用范围以及输入文件数据中的各注解的类型(步骤S2603)。详细处理将说明于 后。基于由注解识别单元110获得的识别结果,字属性,文档结构的属性,或者包含在显
示的输入文件数据内的文档类型,以及预存储在意图识别知识存储单元118中的意图识别 知识信息(步骤S2604),意图提取单元116然后提取将要显示的指示用户意图的意图标 签,。例如,当"Tozai-Denki"被下划线时,因为"Tozai-Denki"预先被附加有字属性"公 司名",并且注解条件是下划线,意图提取单元116从图11所示的意图识别知识信息中提取意图标签"搜索主题地图","搜索主题股票价格",以及"搜索主题公司概 况"作为可应用标签。细节处理将被随后说明。意图显示处理单元114然后显示确定的意图标签(步骤S2605)。意图标签被显示在 屏幕上,例如,如图12或者图13所示。此外,意图显示处理单元114优先地显示与对应 于显示的输入文档数据的文档类型的图11所示的意图识别知识信息中的文档类型相关联 的意图标签。意图选择接收单元115然后接收从显示的意图标签中接收相应于用户要求的意图的意 图标签的选择(步骤S2606)。例如,在图12所示的屏幕实例中,意图选择接收单元115 接收用户希望从地图,公司概况,以及Tozai-Denki的股票价格中知道的选择。动作决定单元117然后选择对应于选择的意图标签的动作(步骤S2607)。动作决定 单元117使用动作存储单元120以选择对应于意图标签的动作。这样,对应于意图标签的 动作可以被指定。如果多个动作相应于意图标签,则所述动作出现在用户面前,然后来自 所述动作的选择被接收是可接受的。图14所示的屏幕实例是用于接收用户动作的选择的 屏幕。执行单元121然后执行由动作决定单元117选择的动作(步骤S2608)。 通过进行如上所述的处理,假定作为用户意图的意图标签按照输入注解被呈现,并且 所述动作可以通过接收意图标签的选择被进行。此外,当给出意图标签时,意图标签通过 使用文档类型以优先的次序被显示。这样,用户可以容易地指定相应于用户意图的意图标 签。通过注解识别单元110进行的识别接收的注解的处理参考图29在下面被解释。 首先,假定可识别的注解的类型在注解识别单元110中被预定。注解识别单元110从多个预定类型中识别接收的注解属于哪个类型。在第一实施例中,假定待由注解识别单元IIO识别的可识别的注解可以被分类为下划线,附件,等。在下面描述中,注解下划线引用图27所示的注解,并且注解附件引用图28所示的注解。首先,注解识别单元110从注解输入接收部分109读入注解信息(步骤S2901)。当图27所示的注解被接收时,注解识别单元110读入由注解输入接收部分109检测 出的(图30A所示的)注解信息。当图28所示的注解被接收时,注解识别单元110读入由注解输入接收部分109检出 的(图30B所示的)注解信息。在图30A以及30B所示的注解信息中,分别地,startX以及startY表示注解的起始点 的横坐标以及纵坐标,并且endX以及endY表示注解的结尾点的横坐标以及纵坐标。另外, 注解信息中的长度表示注解的路径长度作为从起始点直到结尾点的距离。坐标以及单元的 每个的基点可以按处理系统被定义。例如在图30A以及30B中,基点在屏幕的左下的角, 并且形成屏幕的每个像素是一单元。回到图29,注解识别单元IIO从读入的注解信息检出在输入文档数据中用注解标记的 位置(步骤S2902)。例如,基于输入文档数据上的平面坐标以及包括在接收的注解信息内的注解的坐标, 注解识别单元IIO指定一区域,其中注解被输入在显示的输入文档数据中作为注解的可适 用的范围。注解识别单元no从指定的可适用的范围中识别在输入文档数据中哪个字符串被指 定。此外,注解识别单元110检出被加到指定的字符串的字属性以及文档结构属性。例如,在图27所示的屏幕实例中,注解识别单元110识别字符串"Tozai-Denki"被 用注解指定。在图28所示的屏幕实例中,注解识别单元110识别从"place"直到"Friday, April7, 2006"的字符串被指定。此外,注解识别单元110获得识别的字符串作为包括在 图8所示的HTML文档内的字符串,举例来说。通过使用包括在读入注解信息内的各个值确定,就是起始点的startX以及startY,结 尾点的endX以及endY,以及输入文档数据上的路径长度,注解识别单元110然后确定注 解的类型。细节条件描述如下。注解识别单元IIO确定注解是否满足下列情况起始点的横坐标以及结尾点的横坐标 之间的差大于第一阈值(举例来说,10);起始点的纵坐标以及结尾点的纵坐标之间的差小于第二阈值(举例来说,5);以及起始点以及结尾点之间的距离长于路径(长度)的长度乘以第三预定值(举例来说,0.8)的值(步骤S2903)。
如果所述条件被满足(步骤S2903是),则注解识别单元110判定注解是下划线(步 骤S2904)。举例来说,在图27所示的注解情况下,图30A所示的注解信息被读入。读入注解信 息被用于在步骤S2903说明的条件。在这种情况下,起始点在startX-101,以及startY=52; 结尾点在endX423,以及endY=54;并且路径长度是长度=26。换句话说,在图30A所示的注解信息中,lendX-startXI是22,其大于第一阈值(举例 来说,10);并且lendY-startYI是2,其小于第二阈值(举例来说,5)。另夕卜,(endX-startX)2+(endY-startY)2是488,因此(length".8)2变成432.64,所以起始 点和结尾点之间的距离长于路径(长度)乘以第三预定值(举例来说,0.8)的长度。换句话说,可以证实图30A所示的注解满足下划线的条件。这样,注解可以被证实作 为下划线。举例来说,在图28所示的注解情况下,图30B所示的注解信息被读入。读入注解信 息被用于在步骤S2903说明的条件。在这种情况下,起始点在startX=14,以及startY二43; 结尾点在endX44,以及endY-42;并且路径长度是长度=221 。在图30B所示的注解信息 中,lendX-startXI是0,其小于第一阈值(举例来说,10)。换句话说,图30B所示的注解 不满足被识别作为下划线的条件。如果注解识别单元110判定注解不满足下划线的条件(步骤S2903否),注解识别单 元110确定注解是否满足用于是附件的条件。注解识别单元IIO确定注解是否满足下列情况起始点的横坐标以及结尾点的横坐标 之间的差大于第四阈值(举例来说,5);起始点的纵坐标以及结尾点的纵坐标之间的差 小于第五阈值(举例来说,5);以及起始点以及结尾点之间的距离短于路径(长度)的 长度乘以第六预定值(举例来说,0.5)的值(步骤S2905)。如果所述条件被满足(步骤S2905是),则注解识别单元110判定注解是附件(步骤 S2906)。举例来说,在图28所示的注解情况下,图30B所示的注解信息被读入。读入注解信 息被用于在步骤S2905说明的条件。在这种情况下,lendX-startXI是0,其小于第四阈值(举 例来说,5);并且lendY-startYI是1,其小于第五阈值(举例来说,5)。另 夕卜,(endX-startX)2+(endY-startY)2是1,因此(长度*0.5)2变成12210.25,所以起始点和结尾 点之间的距离长于路径(长度)乘以第六预定值(举例来说,0.5)的长度。这样,读入注
解信息满足是附件的条件,所以注解识别单元iio判定注解的类型是附件。如果注解不满足是附件的条件(步骤S2905否),注解识别单元110判定注解的类型 是其它(步骤S2907)。确定为其它的注解可以以任何方式被处理,举例来说, 一些字符串或符号可以通过使 用已知的字符识别技术(特别地,关于输入冲击脉冲进行实时字符识别的在线字符识别技 术)被检出。如果以这种方法检出字符串或者符号, 一种检测(举例来说, 一种写字符, 或者符号)可以和识别结果一起被输出。注解识别单元110然后输出识别结果(举例来说,注解的类型,可适用的范围,识别 的字符串,等等)(步骤S2908)。如图31所示,注解识别单元110可以证实当图27所示的注解被写时,注解类型被确 定为下划线。在图26所示的步骤S2604由意图提取单元116进行的对输入文档数据识别用户意图 的处理参考图32在下面被解释。首先,意图提取单元116接收每一处理结果(步骤S3201)。处理结果包括由注解识 别单元110获得的识别结果和由显示处理单元108显示的输入文档数据。输入文档数据已 经被增添字属性,文档结构属性,和文档类型,所以输入文档数据的接收意思指意图提取 单元116接收由属性添加单元102,文档属性添加单元103,和文档类型识别单元104获 得的处理结果。意图提取单元116然后从输入文档数据析取关于由注解识别单元110 (步骤S3202) 指定的注解的可适用的范围的信息。在这种情况下,包括在注解的可适用的范围内的字属 性和文档结构属性也被析取。举例来说,如果图27所示的注解被接收,图28所示的输入文档数据中的对应部分是 字符串"Tozai-Denki"。意图提取单元116检出包括字符串的标记。如果在析取的标记中 定义属性,意图提取单元116析取所述属性。举例来说,在图28所示的HTML文档情况 下,意图提取单元116析取字属性"公司名"和文档结构属性"逐条记载"。意图提取单元116然后比较由注解识别单元110获得的识别结果中的注解类型与存在 于意图识别知识存储单元118中的意图识别知识信息中的注解条件以确定它们之间的一 致,并且析取包括对应注解条件的意图识别知识信息的记录(步骤S3203)。意图提取单元116然后确定字属性是否从输入文档数据中利用注解指定的部件提取(步骤S3204)。如果意图提取单元116判定没有析取任一字属性(步骤S3204是),推 断所述部分的字属性未明,意图提取单元116然后确定输入文档数据的文档类型是否未明 (步骤S3205)。如果意图提取单元116判定文档类型未明(步骤S3205是),推断用户意图没有被识 别,意图提取单元116然后输出"未明"(步骤S3206)。相反,如果意图提取单元116判定文档类型不是未明(步骤S3205否),意图提取单 元116从意图识别知识存储单元118析取包括文档类型条件中识别的文档类型的意图识别 知识信息的记录(步骤S3207)。如果意图提取单元116判定字属性被析取(步骤S3204否),意图提取单元116从意 图识别知识存储单元118析取意图识别知识信息的记录,所述记录包括设置作为字属性条 件的析取的字属性(步骤S3208)。例如,如果图27所示的注解被接收,对应于包括在可适用的范围内的字 "Tozai-Denki"的字属性"公司名"被析取。在这种情况下,因为意图提取单元116判定 字属性被析取,意图提取单元116用析取的作为字属性条件的字属性搜索意图识别知识存 储单元118。另外,当析取意图识别知识信息时,注解条件被设置作为搜索状态。如图33所示,如果意图提取单元116用字属性"公司名"以及注解下划线对意图识 别知识信息进行析取,意图标签"搜索主题地图","搜索主题股票价格",以及"搜 索主题公司概况"被检出。意图提取单元116然后重排意图识别知识信息的析取的记录以排列意图识别知识信息的记录,其中从输入文档数据提取的文档类型被设置作为更高级的文档类型条件(步骤S3209)。如图34所示,意图提取单元116可以证实包括文档类型条件中的"事件信息"的意 图识别知识信息的记录被重排在更高级。另外,如果输入注解是附件,意图提取单元116析取如图35所示意图识别知识信息 记录。图35中的析取记录程序将被随后说明。意图提取单元116然后输出析取的意图识别知识信息记录作为识别结果(步骤S3210)。响应于来源于用户的动作知识信息选择由执行单元121在图26中的步骤S2608执行 的处理参考图36被解释。首先,执行单元121接收动作知识信息(步骤S3601)。
例如,假定用户有意图研究"Tozai-Denki"是什么公司,在选择"公司概况"作为图 14中的搜索主题之后,用户选择选项利用E搜索作为动作进行搜索。在这种情况下,显示 在图15A中的动作知识信息1504的动作知识信息被输入执行单元121。执行单元121然后读入包括在动作知识信息内的执行方法(步骤S3602)。 执行单元121然后确定动作类型是否是网页搜索(步骤S3603)。 当读入动作知识信息1504中的执行方法时,执行单元121可以证实"动作类型网 页搜索"的定义。所以,当输入动作知识信息1504时,字属性显示处理单元112判定选 择动作是网页搜索。如果执行单元121确定动作知识信息作为网页搜索(步骤S3603是),执行单元121 用包括在注解的可适用的范围内的字符串替换动作知识信息中的执行方法中说明的字符 串"$keyword$"(步骤S3604)。在图14所示的实例中,"$keyword$"被替换为 "Tozai-Denki"。换句话说,字符串"Tozai-Denki"将被用作搜索关键字。执行单元121然后用用于预定的Web搜索引擎的URL (例如,http:〃search.foobar.jp/) 替换所述执行方法中说明的"$search_url$ "(步骤S3605)。执行单元121然后按照超文本传输协议(HTTP)的GET程序将创建的URL传送至预 定的Web搜索引擎,并且用搜索关键字"Tozai-Denki"执行Web搜索(步骤S3606)。如果执行单元121判定动作类型不是Web搜索(步骤S3603否),执行单元121确定 动作类型是否是本地搜索(步骤S3607)。如果执行单元121判定动作类型是本地搜索(步骤S3607是),执行单元121用包括 在注解的可适用的范围内的字符串替换所述执行方法中说明的字符串"$keywOTd$"(步 骤S3608)。以这种方法,执行单元121创建用于进行本地搜索的脚本。执行单元121然后开始用于执行本地搜索的计算机程序,输出创建的脚本至启动的计 算机程序,并且执行所述搜索(步骤S3609)。如果执行单元121判定动作类型不是本地搜索(步骤S3607否),执行单元121确定 动作类型是否是数据库(DB)注册(步骤S3610)。如果执行单元121判定动作类型是DB注册(步骤S3610是),则执行单元121执行 用于注册DB的脚本(例如,以结构化査询语言(SQL)描述的)作为外部计算机程序(步 骤S3611)。相反,如果执行单元121判定动作类型不是DB注册(步骤S3610否),执行单元121
不特别地进行处理,并且终止该处理。内容浏览设备IOO可以对各种的输入文档数据执行动作。注解的可适用的范围中的字 不增添字属性的输入文档数据的情况在下面被解释。以下解释是用于当用户将在不同位置的注解输入到与图9所示的屏幕实例相同的输入 文档数据上时的实例。如图37所示,用户在字"VoIP"下面划线。然而,没有字属性被 添加给图5所示的HTML文档中的字"VoIP"。所以,意图提取单元116基于文档类型而 不是字属性析取意图识别知识信息。在图32所示的处理中,不设置任一字属性(步骤S3204 是),并且文档类型不是未明(步骤S3205否),所以意图提取单元116基于文档类型"Event Information (事件信息)"析取意图识别知识信息。结果,意图显示处理单元114显示与文档类型相关联的意思(字属性)以及意图。动 作决定单元117给出与选择的意图相关联的要求的动作。以这种方法,即使属性添加单元102不能识别字"VoIP"的字属性,基于由文档类型 识别单元104获得的识别结果析取的选项可以出现在用户面前。这样,用户选择意图以及 动作的时间以及努力可以被减少。在图38所示的实例中,即使当不带字属性的"VOIP"被加下划线,用户意图基于文 档类型被析取,另外文档类型的修正在这种情况下可以被接收。换句话说,如果预定时间 逝去,同时用户已经放置光标在上下文菜单上,文档类型显示单元105显示用于Page type (页面类型)的列表菜单3801。文档类型修订单元106通过从列表菜单3801选择页面类 型修正文档类型。内容浏览设备100被配置以用图38所示的接口进行这样的修正。通过 使用该接口,用户可以以与对意图选择接收单元115或者动作决定单元117的操作无差别 的方式执行对文档类型修订单元106的操作。另外,在图37以及38所示的情况中,属性添加单元102不能分析的字属性可以用上 述接口出现在用户面前。因此,如果用户从给出的字选择字,图3所示的字属性关联词典 133可以以关联方式在其中存储字以及字属性。如果相同的字被归入输入文档数据,属性 添加单元102适当地添加字的字属性。例如,如果用户从图38所示的屏幕选择动作"Search without specifying (不指定(网 址)的搜索)",来自内容浏览设备100的搜索结果列表被呈现。假定用户从给出的搜索 结果列表选择搜索结果,然后图17中的区域所示的屏幕被呈现。在这种情况下,历史存 储单元122在其中注册如图20所示信息"What VoIP is (VoIP是什么)"作为历史信息。
显示不同于图9的另一个输入文档数据的实例在下面解释。在图39所示的屏幕实例 中显示的输入文档数据中,文档类型识别单元104不能识别文档类型并输出作为 "UNKNOW (未明)"。此外,属性添加单元102不能识别用户加下划线的字"SNS"的字属性。结果,意图 提取单元116不能析取用户意图。因此,意图提取单元116进行到图32所示的流程图中 的步骤S3206,并输出"未明"作为意图识别结果。在待显示的图40所示的用户界面上如果字属性以及用户意图全部未明,用户选择文 档类型,并从字属性选择适当的字属性;意图提取单元116基于选择的文档类型以及选择 的字属性识别用户的意图标签;所以意图显示处理单元114可以显示排列的用户界面。在以上解释中,输入注解是下划线的情况被解释。可以设想该意图可以用除以上实例 之外的条件被识别。作为另一个实例,附件被作为注解输入的情况在下面被解释。在第一实施例中,如果 附件被检出作为注解,包括在注解的可适用的范围内的字符串按照文档类型以及字属性被 注册成为不同的数据库。当附件作为注解被输入时的屏幕实例同图28所示的。首先,识别注解附件的意图的情况在下面参考图32被解释。意图提取单元116析取 "公司名","地名",以及"日期"作为包括在步骤S3202注解的可适用的范围内的字 属性。因为注解是附件,意图提取单元116然后在步骤S3203从图11所示的意图识别知识 存储单元118析取每个中注解条件是附件的意图识别知识信息的记录。从图11所示的意 图识别知识信息,记录1101到1104被析取。在步骤S3204,因为意图提取单元116已经从输入文档数据析取字属性,意图提取单 元116进行至步骤S3208。意图提取单元116用从输入文档数据提取的字属性比较析取的 意图识别知识信息记录的字属性条件,然后析取仅包括对应字属性条件的意图识别知识信 息记录。然而,其中字属性条件是ALL的意图识别知识信息记录被析取,与在步骤S3202 析取的字属性无关。另外,存在一些情况,多个字属性被从输入文档数据提取,并且多个字属性被定义为 字属性条件。在此情况下,任一方法可以用于用字属性条件比较从输入文档数据提取的字 属性的处理。在第一实施例中,假定意图识别知识信息记录将被析取,如果设置作为记录 中的字属性条件的字属性包括至少一个从输入文档数据信息提取的字属性。因此,在步骤 S3208通过意图提取单元116析取的记录是记录1101以及1104。图35是通过意图提取单元116析取的意图识别知识信息的实例,当注解附件被输入 时。如图35所示,意图标签是"DB注册剪辑"以及"DB注册日程表",所以随附 上注解的字符串将按照文档类型被注册成为DB。意图提取单元116然后在步骤S3209重排基于文档类型析取的意图识别知识信息记 录。在该实例中,析取的文档类型是"事件信息";析取的记录1101的文档类型条件是 ALL;并且记录1104的文档类型是"事件信息";所以两者相配,所以意图提取单元116 不进行重排。以这种方法,当注解是附件时意图提取单元116输出识别结果。如上所述,因为意图 识别结果是多个的,意图显示处理单元114显示意图识别结果,并且意图选择接收单元115 将接收适当的意图识别知识信息的选择。意图显示处理单元114然后在上下文菜单上显示意图识别知识信息记录中的意图标 签。意图选择接收单元115然后从显示的意图标签中接收选择。其中该选择被接收的意图 标签是"DB注册剪辑"或者"DB注册日程表"。在这种情况下,动作决定单元117也析取对应于意图标签的动作知识信息。如果动作 决定单元117析取动作知识信息的多个记录,动作决定单元117向用户给出析取的动作知 识信息记录,并且让用户选择适当的动作知识信息。如果动作决定单元117接收意图标签"DB注册日程表"的选择,动作决定单元117 析取图15B所示的动作知识信息的记录1502以及1503。动作决定单元in然后在类似于图14所示的那些的窗口中向用户给出析取的动作知 识信息。假定用户选择动作标签"DB:日程表书"。在这种情况下,选择的动作知识信息1503被输出到执行单元121。执行单元121然后 按照图36所示的处理对数据库进行注册。因为选择的动作知识信息1503的动作类型是"DB注册",执行单元121从步骤S3610 进行到步骤S3611。执行单元121然后通过调用外部计算机程序执行动作知识信息1503中 的脚本。动作知识信息中的脚本SregionS用包括在输入文档数据上的注解的可适用的范围内的 字符串被转换。在增添参数"-add"之后执行单元121然后经过其中字符串被转换为外部 计算机程序"日程表"的脚本。外部计算机程序"日程表"是用于管理日程表信息的应用
程序,并且细节的解释从略。另外,注册入DB不被限制在可适用的范围中描述的字符串,例如,整体输入文档数 据可以作为参数被传递至外部计算机程序。在这种情况下,用于执行这样的处理的脚本在 动作知识信息中被描述。这样,配有注解附件的区域中的字属性条件以及用户意图基于文档类型条件被识别, 并且动作被执行。虽然意图识别知识信息包括字属性条件以及文档类型条件两者的情况在 这里被解释,用户意图可以,例如,仅基于文档类型条件被识别。在这种情况下,意图提取单元116通过文档类型"事件信息"作为关于图28所示的 注解的搜索关键字从图11所示的意图识别知识信息析取记录1101, 1102,以及1104。意 图显示处理单元114然后显示析取的记录的意图标签。随后,意图选择接收单元115将从 显示的意图标签中接收适当的意图标签的选择。在下面,由内容浏览设备100进行的其它的操作被解释。首先,增添动作知识信息的情况在下面被详细地解释。在图17所示的屏幕上,当设 置按钮1703被按下时,图IO所示的设置按钮的菜单被显示。通过选择"Add this cite to search destination (添加此地点以搜索目的地址)",动作知识信息的记录然后被添加。特别地,当图n所示的屏幕被显示时,动作决定单元in通过作为搜索关键字的存在于图16A所示的历史存储单元122的历史信息中的记录1602的意图标签以及动作标签 检出动作知识信息的记录(在图15A所示的情况中,记录1501)。动作决定单元117然后 创建动作知识信息的搜索记录的副本。动作决定单元117然后从显示的输入文档数据的参考信息(URL)析取关于该地点的 域信息。动作决定单元117然后添加析取的域信息至预定格式的动作知识信息的副本记录 的脚本。在图17所示的屏幕实例中,动作决定单元117以格式"&site=yougo.foo.jp"添加字符 串"yougo.foo.jp",其指示域信息,至图16B所示的记录4601的脚本结尾。在图41所示的窗口的实例中,Search subject (搜索主题),Site name (站名),以及 Script (脚本)被向用户显示。用户可以按照需要修订该信息。在图42所示的窗口的实例中,用户指定用户注册的站点的站名。当用户按下注册按 钮4801时,动作知识信息的新记录被注册。例如,图43所示的动作知识信息的记录以与存在于历史信息的意图标签关联的方式 被添加给图15A以及15B所示的动作存储单元120。在由动作决定单元117显示的上下文菜单上,如图44所示,可以证实项目5001被增添。如在图44中显示为项目5001,当动作决定单元117更新并且显示用户界面时,用户 可以选择新注册的站点作为动作。此外,在内容浏览设备100中,意图识别知识信息以及动作知识信息可以被编辑。例如,当内容浏览设备100接收用户在某一位置下按压图9所示的设置按钮906时, 内容浏览设备100显示图10所示的设置菜单。如果设置菜单的项目"Edit searchmethod(编 辑搜索方法)"1004被选择,内容浏览设备100可以编辑存在于意图识别知识存储单元 118的意图识别知识信息,以及存在于动作存储单元120的动作知识信息。如图45所示,如果设置菜单的项目"Edit search method (编辑搜索方法)"1004被选 择,意图识别知识修订单元119显示如图11所示的意图识别知识信息列表。用户然后选择意图识别知识信息记录并且按改变按钮4101,以致用于修订意图识别知 识信息以及动作知识信息的窗口被显示。在图46所示的屏幕上,在修正意图识别知识信息之后,用户按压OK按钮4202,以 致屏幕返回图45所示的。在图45所示的屏幕上,用户进一步地按压OK按钮4106,以致 改变内容被输出到意图识别知识修正单元119以及动作决定单元117。意图识别知识修正 单元119然后按照修正内容修正存在于意图识别知识存储单元118的意图识别知识信息, 并且动作决定单元117修正存在于动作存储单元120的动作知识信息。特定地,字属性,文档类型,注解类型,以及搜索主题的变化被输出到意图识别知识 修正单元119。搜索主题以及添加的关键字的变化被输出到动作决定单元117。添加的关 键字按照预定格式被反映在动作知识信息中的执行方法中的脚本中。另外,如果图45所示的添加按钮4104被按下,用于添加图42所示的地址的屏幕被 显示。因此,指定地址的条件可以被加至动作知识信息。图45所示的删除按钮4102用于删除由用户指定的意图识别知识信息中的记录。拷贝 按钮4103用于拷贝由用户指定的意图识别知识信息中的记录。另外,如果用户按压添加 按钮4104,内容浏览设备100创建意图识别知识信息记录以及动作知识信息记录,各具有 预定的默认属性值,显示图46所示的窗口,并且鼓励用户输入该窗口中的各属性值。在接
信息被改变之后,如果对OK按钮4106的按压被接收,意图识别知识修正单元119以及动 作决定单元117分别地将所述改变反映到意图识别知识信息以及动作知识信息上。另外,如果对显示顺序设置按钮4105的按压被接收,意图识别知识修正单元119以 及动作决定单元117显示用于设置显示顺序的屏幕。当文档类型(页面类型)在图47所示的窗口上被选择时,与选择作为文档类型条件 的文档类型相关联的搜索主题属性(意图标签),以及与动作知识信息中的意图标签相关 联的地址属性被显示。此外,当字属性被选择时同样地,与选择作为字属性条件的字相关 联的搜索主题属性(意图标签),以及与动作知识信息中的意图标签相关联的地址属性被 显示。用户然后在窗口下按压箭头按钮(例如,按钮4301或者4302),以致意图识别知识信息以及动作知识信息可以按照选择的属性被重排。在重排之后,用户按压OK按钮4303,以致意图识别知识修正单元119以及动作决定单元117反映改变的显示顺序到意图识别知识信息以及注解信息上。这样,注解识别单元110接收注解的输入,并且按照当显示所述 菜单时的顺序显示属性。此外,用户可以通过按下图9所示的设置按钮906以及从图10所示的设置菜单选择 项目"Initial Setting (初始化设置)"改变内容浏览设备100的初始化设置。图48所示的用于设置环境的屏幕实例上的复选框4401用于指定是否通过更新已经显 示的屏幕显示搜索结果列表,或者通过创建另一新建窗口显示搜索结果列表,当执行Web 搜索或者本地搜索作为动作时。项目4402是用于当显示意图识别结果或者例如图14所示的上下文菜单1401的菜单 中的文档类型识别结果时指定将要出现于栏中的项目最大数目的选择器。如果将要显示的 意图识别结果或者文档类型识别结果的项目数目超过项目4402中的指定值,多余的项目 不显示。作为替代,类似于图37所示的窗口,在上下文菜单中的各栏结尾显示"在列表 中显示"。当用户选择"在列表中显示"之时,内容浏览设备100显示列表中的所有选择 的项目。这样,用户可以选择要求的项目。项目4403是用于当执行Web搜索作为动作类型时指定将要用于执行单元121的Web 搜索引擎的URL的选择器。特定地,用包含在动作知识信息中的脚本内的"$SearCh_Uri$" 替换项目4403中的选择的URL。此外,用于当执行剪辑时指定将要用于本地搜索的搜索引擎或者将要创建的文件的存
储目录的用户界面可以被准备。图49所示的个人设置的屏幕实例上的字段4501用于指定将要设置作为搜索中的优先 的搜索条件的站。字段4502用于指定在搜索中将要设置作为优先的搜索条件的城市,病 房,城镇,或者乡村。例如,用户在字段4501中指定最接近的站为其中用户工作的办公室的情况被在下面 解释。在内容浏览设备100中,当输入文档数据的文档类型是"事件信息"时,用户划线 于最接近事件地点的站的名字之下,并且在上下文菜单中通过Web搜索选择动作以搜索火 车传送指南信息。因此,内容浏览设备100可以通过设置预先指定的最接近办公室的站作 为传送引导的开始站,并且设置注解的可应用范围中描述的最接近事件地点的站作为目的 地站进行搜索传送引导。另外,在执行动作之后,用户可以通过按下图9所示的搜索按钮905容易地选择相对 于同一关键字不同的动作。例如,如果用户如图37所示划线于字VoIP之下,注解的可应用范围中的字被显示在 字段3701中。当用户接着从上下文菜单选择动作(例如,进行Web搜索)之时,另一输 入文档数据被显示。在这种情况下,先前加下划线的字"VoIP"按照原样被显示在字段 3701中。当在以上情形下按下图37所示的搜索按钮时,图50所示的窗口被显示,并且当字 "VoIP"被加下划线时呈现的意图识别知识信息以及动作知识信息再次出现于窗口 。这样,在执行用于字"VoIP"的动作之后,用户可以执行关于同一字的另一动作。可 以设想,例如,在搜索词义之后,"Books (书)"被指定作为搜索主题以寻找相关的书, 并动作被选择和执行。操作不局限于以上描述的实施例,并且在下面例示的修改例也是可得到的。在第一实施例中,如果注解被输入到输入文档数据上,当显示上下文菜单时,基于字 属性条件提取的意图标签被显示。然而,当显示意图标签时,不局限于基于字属性条件的 提取。作为第一修改例,上下文菜单通过基于文档类型条件而不是字属性条件提取意图标 签被显示的情况。根据第一修改例的内容浏览设备100的构造与根据第一实施例的内容浏览设备100相 同,并且被分配与在第一实施例中的相同的参考标号,所以解释从略。在下面,仅解释不 同的处理。
如图51所示,在出现于意图识别知识存储单元118的意图识别知识信息中,意图标 签,文档类型,以及注解条件互相关联。换句话说,意图提取单元116基于文档类型条件 以及注解条件提取意图标签。对于由意图提取单元116进行的输入文档数据识别用户意图的处理参照图52被在下 面解释。首先,意图提取单元116获得其中注解条件对应于输入注解类型的意图识别知识信息 记录(步骤S5301至S5303)。意图提取单元116然后判定输入文档数据的文档类型是否是未知的(步骤S5304)。 如果意图提取单元116判定文档类型是未知的(步骤S5304是),意图提取单元116当用 户意图未被识别之时输出"未知的"(步骤S5306)。相反,如果意图提取单元116判定文档类型不是未知的(步骤S5304否),意图提取 单元116提取意图识别知识信息的记录,每个包括从意图识别知识存储单元118识别的文 档类型条件中的文档类型(步骤S5305)。意图提取单元116然后输出提取的意图识别知识信息的记录作为识别结果(步骤 S5307)。如图53中的窗口的实例所示,意图显示处理单元114显示对应于文档类型的各个条 件的意图标签。在第一修改例中其它处理类似于第一实施例,所以对于它的解释从略。可以认为在第一修改例中字属性以及文档结构的属性被预先添加到输入文档数据上 以指定输入文档数据的文档类型。然而,可以基于包含在输入文档数据内的信息而不必添 加属性,指定文档类型。第一实施例不将可识别的注解限制于"下划线","附件",以及"其它",并且各 种注解能用作可识别的注解。如上所述,当注解被输入到显示的输入文档数据上时,内容浏览设备100可以基于注 解类型以及文档类型决定由用户要求的意图或者与意图相关联的动作。因此,在可应用范 围上用于决定将要由用户进行的处理的操作被减小,因此,用户上的工作负荷被减少。此 外,用户可以用简单操作获得合适的处理结果。此外,在第一实施例中,因为内容浏览设备100基于注解的可应用范围之内的字的字 属性识别用户意图,更合适的识别结果可以被获得。 此外,如果注解的可应用范围之内的字的字属性是未知的,内容浏览设备100可以基 于文档类型识别用户意图。因此,在更多情况下可以获得以上效果。另外,通过梳理由用户选择的动作的历史以及文档类型的至少之一创建书签,以致出 现于书签的输入文档数据内容可以以用户容易理解的格式被显示。因此,用户可以通过参 照所述书签容易地再使用有用信息。此外,因为内容浏览设备100通过基于文档类型识别用户意图呈现动作,将要执行的 意图或者动作的识别可以向用户呈现,而不必频繁的更新其中字与字属性相关联的词典, 以致用于词典的维持成本可以被减少。另外,用户能够向字注册字属性,以致管理员进行 的词典更新工作被减小,因此,维护成本可以被减少。如图54所示,内容浏览设备100包括只读存储器(ROM) 5502,中央处理单元 (CPU)5501,随机存取存储器(RAM) 5503,通信接口 (I/F) 5505,显示单元5506,输入 接口 (I/F) 5504,以及总线5507作为硬件配置。ROM5502在其中存储计算机程序,例如 用于査看内容浏览设备100中的内容的程序。CPU5501按照出现于ROM5502的计算机程 序控制内容浏览设备100中的各单元。RAM在其中存储控制内容浏览设备100需要的各 种数据。通信I/F通过连接内容浏览设备至网络进行通信。显示单元5506显示从由内容浏 览设备100进行的处理获得的结果。输入I/F5504被对于用户配置以输入处理的请求。总 线5507在各单元之间连接。此外,内容浏览设备100可以被应用于包括如上所述构造的 通用计算机。将要根据第一实施例在内容浏览设备100中执行的内容浏览程序以可安装或者可执行 文件格式被记录并配备在计算机可读记录介质例如只读光盘存储器(CD-ROM),软盘 (FD),可记录的光盘(CD-R),或者数字多用途的磁盘(DVD)上。在这种情况下,内容浏览程序被设计成能从所述计算机可读记录介质被读出并在内容 浏览设备100上被执行,以致所述计算机程序被装载到内容浏览设备100中的主存储器上 并且如图1所述的各单元被创建在主存储器上。替代地,内容浏览程序可以从在其中存储内容浏览程序的计算机被配备并且连接至网 络,例如因特网,通过经由网络下载。另外内容浏览程序可以通过网络例如因特网被配备 或者分布。此外,内容浏览程序可以以被预先并入ROM的形式被配备。内容浏览程序具有包括如上所述各单元的模块构造。当CPU从记录介质读出内容浏览
程序,并且执行所述程序之时,作为实际的硬件,每一单元被配置以被装载并且创建在主 存储器上。这样,用于根据本发明的实施例处理信息的设备以及方法作为当从用户接收注解输入 时执行用户要求的处理的技术是有用的。
权利要求
1.一种信息处理设备,其特征在于,包含存储文档数据的存储器;基于文档数据内容识别指示文档使用的文档种类的文档种类识别单元;显示文档数据的显示单元;接收对于由显示单元显示的至少一部分文档数据的输入指示的输入接收单元;识别输入指示的指示形式的形式识别单元;指定输入指示的可应用范围的范围指定单元;以及基于指示形式以及文档种类处理可应用范围的处理单元。
2.如权利要求1所述的设备,其特征在于,所述文档种类识别单元基于添加到保留在 文档数据中的字中的字属性,从多个预定文档种类中识别文档数据的文档种类。
3.如权利要求2所述的设备,其特征在于,进一步包含基于包含在保留在文档数据中 的字内的字符串,将指示字内容的字属性添加至所述字的属性添加单元。
4.如权利要求3所述的设备,其特征在于,进一步包含基于指示形式、添加到包含在可应用范围内的字中的字属性、以及文档种类中的至少 ,提取处理可应用范围的处理提取单元; 显示所述处理的处理显示单元;以及接收由处理显示单元显示的处理的选择的处理选择接收单元,其中 所述处理单元处理接收到的选择。
5.如权利要求4所述的设备,其特征在于,所述显示单元基于文档种类以预定顺序显 示所述处理。
6.如权利要求3所述的设备,其特征在于,进一步包含 显示包含在可应用范围内的字的字属性的字属性显示单元;以及按照用户的输入,修正由所述字属性显示单元显示的字属性的字属性修正单元,其中 基于指示形式、由字属性修正单元修正的字属性、以及文档种类中的至少一个,提取 将要应用于可应用范围的处理的处理提取单元。
7. 如权利要求1的设备,其特征在于,进一步包含向文档数据添加指示文档数据之内的数据排布的文档结构属性的文档属性添加单元,其中文档种类识别单元基于文档结构属性,从多个预定文档种类中识别文档数据的文档种类。
8. 如权利要求1的设备,其特征在于,进一步包含存储处理关联信息的存储单元,其中指示形式信息、文档种类信息、以及将要应用于 可应用范围的处理信息互相关联,其中处理单元处理的可应用范围是与处理关联信息中分别对应于指示形式以及文档种类 的指示形式信息以及文档种类信息相关联的处理信息。
9. 如权利要求1所述的设备,其特征在于,进一步包含书签管理单元,管理指示文档 数据以及关于每一文档种类的文档数据源中任意一个的链接信息。
10. 如权利要求IO所述的设备,其特征在于,进一步包含显示标题信息的书签显示单 元,所述标题信息指示由书签管理单元管理的文档数据、以及关于每一文档种类的文档数 据源中的任意一个。
11. 如权利要求l的设备,其特征在于,进一步包含 显示文档种类的文档种类显示单元;以及按照用户的输入,修正由文档种类显示单元显示的文档种类的文档种类修正单元,其中处理单元基于指示形式以及由文档种类修正单元修正的文档种类,处理可应用范围。
12. 如权利要求1所述的设备,其特征在于所述输入接收单元接收在由显示单元显示的文档数据上,表示为由指示装置绘制的轨 迹或者轨迹组合的注解的输入,所述形式识别单元识别注解的形式,并且 所述范围指定单元指定注解的可应用范围。
13. 如权利要求13所述的设备,其特征在于,所述输入接收单元从下划线、附件、字 符,字符串,符号以及符号串中接收至少一个注解。
14. 如权利要求1所述的设备,其特征在于,进一步包含接收文档数据的输入的文档输 入单元,其中所述文档种类识别单元基于由文件输入单元输入的接收的文档数据内容识别文档种类。
15.如权利要求1所述的设备,其特征在于,基于识别的指示形式以及识别的文档种类, 处理以执行搜索以及包含在可应用范围内的字符串作为搜索关键字的处理单元。
16.—种信息处理方法,其特征在于,包含 在存储器中存储文档数据;基于文档数据内容识别指示文档使用的文档种类; 通过显示单元显示文档数据;接收对于由所述显示单元显示的至少一部分文档数据的指示的输入; 识别所述输入指示的指示形式; 指定所述输入指示的可应用范围;以及 基于指示形式以及文档种类,处理可应用范围。
全文摘要
信息处理设备包括存储文档数据的存储器;基于文档数据内容识别指示文档使用的文档种类的文档种类标识单元;显示文档数据的显示单元;接收对于由显示单元显示的至少一部分文档数据的输入指示的输入接收单元;识别输入指示的指示形式的形式标识单元;指定输入指示的可应用范围的范围指定单元;以及基于指示形式以及文档种类处理可应用范围的处理单元。
文档编号G06F17/30GK101154238SQ200710162618
公开日2008年4月2日 申请日期2007年9月26日 优先权日2006年9月26日
发明者布目光生, 石谷康人, 铃木优 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1