信息处理装置、信息处理方法及存储介质的制作方法

文档序号：2823589阅读：229来源：国知局

专利名称：信息处理装置、信息处理方法及存储介质的制作方法
技术领域：
本发明有关信息处理装置、信息处理方法及存储介质。特别涉及声音输入和GUI并用进行信息处理的装置及其方法。
背景技术：
随着声音识别、合成技术的进步，利用声音的信息输入装置被实用化。利用声音与其他装置组合的信息输入装置也开始被使用了。在这样的装置中，能够弥补各装置的欠缺，灵活利用各装置的优点。
我们熟知了作为其中之一的组合了声音输入和GUI的接口装置。它通过灵活利用声音输入及GUI的优点进行输入，弥补了各自的缺点。
即，声音是人与外界的自然交流手段，具有能够容易地进行输入、输出的优点。但作为输出装置有着缺乏直观性的缺点。另一方面，由于GUI作为输出装置具有直观性，所以例如作为一览显示输入项目(输入字段)的输入装置，如果有菜单供选择的话，就具有了能够容易地输入的优点。但是，自由输入具有处理麻烦的缺点(特别地，利用数字键输入和手写输入的情况下上述缺点更加显著)。
例如，以具有图8所示的接口的音乐检索系统为例进行说明，它能够通过艺术名、曲名、该曲使用的CM名称中的任一个检索曲目。输出作为GUI(画面显示)，以各输入项目的输入作为声音。
这种情况下，由于将信息显示在画面上，能够通过艺术名、曲名、该曲使用的CM名称中的任一个进行检索，所以能够使使用者容易理解。另外，因为能够利用声音在各输入字段中进行输入，输入操作也很容易。
在此，识别输入到各输入字段中的声音，是使用各自不同的文法进行的。例如，识别艺术名使用艺术名的文法，识别曲名使用曲名的文法，识别CM名使用CM名的文法。
但是，在声音输入和GUI并用的情况下，如图8所示存在多个输入字段，则在有声音输入的情况下，就有必要判断它是针对哪一个输入字段的声音输入。
作为该方法，并不同时使用所有的输入字段的文法进行声音识别，可以考虑对得到的识别结果原来是输入到哪个输入字段的进行判断。
在图8的例子中，同时使用艺术名、曲名、CM名的文法进行声音识别，如果识别结果是CM名，就可以判断为是针对CM名输入字段的输入。
在此就产生了问题，一般文法越大则声音识别的识别率就越低。所以，在同时使用多个输入字段的文法时，就产生了对声音输入的识别率低下的问题。

发明内容
本发明鉴于上述问题，其目的是即使在有多个输入字段的情况下，也能够使得用于声音识别的文法的规模不变大，提高对声音输入的识别率。
为达到上述目的，本发明的信息处理装置具有以下结构即输入具有多个输入项目的文件的输入装置；根据上述文件的显示状态，从上述多个输入项目中判别出有效输入项目的判别装置；选择与上述判别装置判别为有效的输入项目相对应的特定的文法的选择装置。
另外，为达到上述目的，根据本发明的其他实施例的信息处理装置具有以下结构即输入具有多个输入项目的文件的输入装置；在上述文件中，对应于该文件的显示状态判断是否有选择特定文法的指令的判断装置；对应于上述判断结果控制文法选择的控制装置。
另外，为达到上述目的，本发明的信息处理方法包括下列步骤输入具有多个输入项目的文件；根据上述文件的显示状态，从上述多个输入项目中判别出有效输入项目；选择与上述判别步骤中判别为有效的输入项目相对应的特定的文法。
为达到上述目的，本发明的信息处理方法还具有输入具有多个输入项目的文件的输入步骤；在上述文件中，对应于该文件的显示状态判断是否有选择特定文法的指令的判断步骤；对应于上述判断结果控制文法选择的控制步骤。
另外，根据本发明，还提供在计算机上实现上述信息处理方法的控制程序、存储有该控制程序的计算机可读介质及计算机程序产品。

图1是显示本发明的第1实施例的声音接口装置的基本结构的框图。
图2是显示第1实施例的声音接口装置的具体硬件结构的框图。
图3是显示第1实施例的处理步骤概要的流程图。
图4是显示字段信息保存部件的数据结构例子的图。
图5是表示文法保存部件的数据的结构例子的图。
图6是表示第2实施例相关的声音接口装置的基本结构的框图。
图7是表示第2实施例的处理步骤概要的流程图。
图8是表示输入画面的具体例子的图。
图9是说明输入画面的显示部分和非显示部分的图。
图10是表示超文本文件的表现例子的图。
图11是表示图10所示的超文本文件的输入画面的具体显示例子的图。
图12是表示输入画面的具体显示例子的图。
图13是表示在使用如图10所示的超文本文件的情况下的第2实施例的处理步骤概要的流程图。
具体实施例方式
(第1实施例)以下，参照附图对本发明进行详细说明。
图1是表示本发明的信息输入装置、信息输入方法及存储介质的第1实施例相关的装置的基本结构的框图。
在图1中，101是显示信息的信息显示部件。在信息显示部件101中，也显示输入字段(输入项目)的信息。102是从显示在信息显示部件101中的输入字段中选择一个的字段选择部件。103是对是否有表示通过字段选择部件102已经选择了输入字段的信号输入进行检测的输入检测部件。
104是根据字段选择部件102发出的经由输入检测部件103传送来的选择信号、判断哪个输入字段被选择了的字段判断部件。之后，将通过字段选择部件102选择的输入字段称为激活字段。
105是根据判断部件104的判断切换激活字段的字段切换部件。106是保存有关现在正在显示的内容中的所有字段的信息的字段信息保存部件。字段信息保存部件106的内容如图4所示。
即如图4所示给各输入字段赋予编号，保存输入字段的编号、它的值(初始状态时值未被设置)、识别该输入字段的声音时使用的文法的ID。
107是保存激活字段的激活字段保存部件。108是根据字段判断部件105的判断切换文法的文法切换字段。之后，将通过文法切换部件108选择的文法称为激活文法。
109是针对现在正在显示在信息显示部件101中的内容，保存用于声音输入的所有文法的文法保存部件。文法保存部件109的内容如图5所示，由文法ID、各文法的描述组成。有关使用哪个文法的信息被记载在正在显示的内容中(有关这一点将参照图10在后面叙述)。另外，文法自身可以从盘装置(未图示)和网络上的服务器(未图示)取得。
110是保存激活文法的ID的激活文法保存部件。111是输入声音的声音输入部件。112是利用保存在激活文法保存部件110中的文法，对从声音输入部件111输入的声音进行识别的声音识别部件。113是保存声音识别部件112的识别结果的识别结果保存部件。
图2是表示本实施例的声音输入装置的具体硬件结构的框图。
在图2中，201是CPU，依据实现后述步骤的程序进行动作。202是存储器，提供字段信息保存部件106、激活字段保存部件107、文法保存部件109、激活文法保存部件110、识别结果保存部件113，以及实现上述程序的动作所必要的存储区域。
203是控制存储器，存储实现后述步骤的程序。204是位置指示装置，构成上述的字段选择部件102。205是显示器，构成信息显示部件101。206是麦克风，构成声音输入部件111。207是连接各构成要素的总线。
下面，参照图3所示的流程图，说明本实施例的装置的动作。在以下的说明中，以使用鼠标作为选择设备204的情况为例进行说明。
在某内容被显示的时刻，把用于识别该内容的各输入字段的声音的全部文法读入文法保存部件109，在字段信息保存部件106中保存输入文法与文法ID的对应关系。
在最初的步骤S301，通过输入检测部件103对是否有鼠标的输入进行调查。对鼠标输入的检测，可以通过检测鼠标的点击，或检测鼠标光标在某目标上停留规定时间来实现。循环该步骤直到有输入为止。若有输入了的话就前进到步骤S302。
在步骤S302，调查在步骤S301检测的输入是否是选择输入字段的输入。然后，在调查结果不是选择输入字段的情况下，返回步骤S301。在是选择输入字段的情况下，前进到步骤S303。
在步骤S303，通过字段判断部件104调查哪个输入字段被选择了。然后，通过字段切换部件105将选择的输入字段保存在激活字段保存部件107中。
在步骤S304，通过文法切换部件108，将激活文法保存在激活文法保存部件110中。激活文法就是在保存在文法保存部件109中的文法中与保存在激活字段保存部件107中的输入字段相对应的文法。通过字段信息保存部件106调查与现在的激活字段对应的文法ID，从文法保存部件109中读出与该文法ID相对应的文法。
在步骤S305，调查是否从声音输入部件111输入了声音。循环该步骤直到声音被输入，若声音被输入了的话前进到步骤S306。
在步骤S306，利用保存在激活文法保存部件110中的文法，通过声音识别部件112对在步骤S305输入的声音进行识别处理。声音识别的结果被保存在识别结果保存部件113中。
在步骤S307，将保存在识别结果保存部件113中的结果保存到字段信息保存部件106中。即在图4中，将识别结果保存到对应于激活字段的“值”栏中。
在步骤S308，在信息显示部件101中将保存在识别结果保存部件113中的结果显示在保存在激活字段保存部件107中的输入字段中。结束上述处理。
下面，以图8的内容为例，具体说明处理的内容。在图8中，第1输入字段801的编号为1，第2输入字段802的编号为2，第3输入字段803的编号为3。
另外，艺术名的文法为第1文法A，曲名的文法为第2文法B，CM名的文法为文法C，则字段信息保存部件109的内容成为如图4所示那样。在利用现有技术对输入声音进行识别的情况下，使用第1文法A、第2文法B及第3文法C的全部三个文法。
而在本实施例中，利用鼠标，例如如果选择了第1输入字段801，则只使用与第1输入字段1对应的第1文法A对输入声音进行识别。由此，为了识别输入声音而使用的文法的规模与现有技术相比能够相对较小。所以能够大幅提高输入声音的识别率。
同样地，如果利用鼠标输入了第2输入字段802，则使用与第2输入字段2对应的第2文法B对输入声音进行识别。如果选择了第3输入字段803，则只使用与第3输入字段3对应的第3文法C对输入声音进行识别。
另外，在上述实施例中，对使用鼠标来构成字段选择部件102的情况进行了说明，但使用其他装置也可以。例如，也可以用信息显示部件101的显示器作为触摸屏，用笔或手指指定希望的字段。
另外，也可以利用数字键指定第n个输入字段(任意的输入字段)。即，用数值输入的形式指定希望的字段也可以。另外，也可以利用视线输入装置，通过视线的方向指定输入字段。
另外，也可以与输入字段一一对应地显示声音输入用对象(按钮、图标、图象等)，通过选择这些对象来选择输入字段。
另外，在上述实施例中，是在输入字段被选择的时刻切换声音识别用的文法的，但也可以在声音被输入的时刻判断激活的输入字段，进行文法的切换。
还有，在上述实施例中，也可以通过输入字段的选择操作，来指定声音输入的开始和结束。例如，可以以输入字段被选择的时刻作为声音输入的开始时间，而以输入字段选择结束的时刻作为声音输入的结束时间。例如，还可以在通过鼠标操作将鼠标指针放在输入字段上的期间中，获取声音输入。
在上述实施例中，使用GUI作为输出装置，使用声音输入作为输入装置，但并不限于此，也可以在输入装置中并用GUI，在输出装置中并用声音。
(第2实施例)以下参照附图详细说明本发明的第2实施例。
图6是展示与本发明的第2实施例相关的装置的基本结构的框图。
在图6中，601是显示信息的信息显示部件。该信息显示部件601也显示输入字段的信息。
602是将实际显示在信息显示部件601上的内容保存起来的显示内容保存部件。603是切换显示在信息显示部件601上的信息的显示信息切换部件。特别在信息显示部件的尺寸较小的情况下，通过显示信息的切换操作可以使剩下的内容依次被显示出来。例如，该操作可以进行页切换、滚屏等操作。
604是对实际显示在信息显示部件601上的输入字段进行判断的字段判断部件。我们将显示在信息显示部件601上的输入字段称为激活字段。在本实施例的场合，与第1实施例不同，假设有不止一个激活字段的情况。
605是根据字段判断部件604的判断切换激活字段的字段切换部件。606是将与现在正在显示的内容中的所有输入字段相关的信息保存起来的字段信息保存部件。字段信息保存部件606的内容可以是例如图4所示的那样。
即，给各输入字段标上编号，保存输入字段的编号、它的值(初始状态下则值未被设定)、在识别该输入字段的声音时使用的文法的ID。
607是保存激活字段的激活字段保存部件。608是根据字段判断部件604的判断切换文法的文法切换部件。我们将通过文法切换部件608选择的文法称为激活文法。609是针对现在显示在信息显示部件601中的内容，保存能够用来识别输入声音的所有的文法文法保存部件。如图5所示，文法显示部件609的内容由文法ID、对各文法的描述构成。有关使用的文法的信息在显示的内容中被描述。另外，可以从盘装置(未图示)和网络上的服务器(未图示)取得文法。
610是保存激活文法的ID的激活文法保存部件。611是输入声音的声音输入部件。612是使用保存在激活文法保存部件610中的文法对从声音输入部件611输入的声音进行识别的声音识别部件。613是保存声音识别部件612的识别结果的识别结果保存部件。
由于第2实施例的声音输入装置的结构与上述第1实施例中图2所示的结构相同，所以通过实施例1的图2进行说明。
在图2中，201是CPU，它依据实现后述步骤的程序进行动作。202是存储器，提供显示内容保存部件602、字段信息保存部件606、激活字段保存部件607、激活文法保存部件610、识别结果保存部件613和上述程序的动作所必要的存储区域。
203是控制存储器，保存实现后述步骤的程序。204是位置指示装置，实现显示内容切换部件603。205是显示器，实现信息显示部件601。206是麦克风，实现声音输入部件611。207是连接各构成要素的总线。
下面，参照图7所示的流程图，说明第2实施例的信息输入装置的动作。
在某内容被显示的时刻，从文法保存部件609中读出用来识别该内容的各输入字段的声音的所有文法，并将输入字段与文法ID的对应关系保存在字段信息保存部件606中。
在最初的步骤S701中，调查是否从声音输入部件611输入了声音。循环执行该步骤S701直到有声音输入。输入了声音则前进到步骤S702。
在步骤S702，根据显示内容保存部件602的内容，调查现在哪个输入字段实际正在被显示。
在步骤S703通过字段切换部件605，将现在显示的输入字段保存到激活字段保存部件607中。
在步骤S704通过文法切换部件608，将激活文法保存到激活文法保存部件610中。在此，激活文法就是在保存在文法保存部件609中的文法中的与保存在激活字段保存部件607中的输入字段对应的文法。即，在字段信息保存部件606中调查与现在的激活字段对应的文法ID，并从文法保存部件609中读出与该文法ID对应的文法。
在步骤S705，在声音识别部件612中使用保存在激活文法保存部件610中的文法对在步骤S701输入的声音进行识别处理。识别处理返回识别结果和识别使用的文法ID。即，虽然使用与多个种类的文法ID对应的文法，但取得对每个文法ID的识别结果，将一致性最高的候补与该文法ID一起输出。识别结果被保存在识别结果保存部件613中。
在步骤S706，根据在步骤S705取得的文法ID判断是针对哪个输入字段输入的。由于文法ID与输入字段的对应关系被保存在字段信息保存部件606中，所以可以参照。例如，字段信息保存部件606的内容如图4所示的那样，则激活字段为“1”和“3”。因此，若返回的是识别结果和作为文法ID的第3文法C，则由此可以知道该输入是针对与第3文法C对应的第3输入字段3的输入。
在步骤S707将保存在识别结果保存部件613中的结果保存到字段信息保存部件606中。即在图4中，将识别结果保存到与被输出的文法ID对应的“值”栏中。在步骤S708，将保存在识别结果保存部件613中的结果显示到在步骤S706判断出的信息显示部件601的输入字段中。按以上的步骤，处理结束。
下面，以图8的内容为例，具体说明处理内容。
图8的内容如图9那样被显示出来。在该图中，标记了符号904的部分表示实际正在被显示的部分，而标记了符号905的部分表示未被显示的部分。
输入字段901的编号为1，输入字段902的编号为2，输入字段903的编号为3。若艺术名的文法为第1文法A，曲名的文法为第2文法B，CM名的文法为第3文法，则字段信息保存部件609的内容如图4所示。
在通过现有技术对输入声音进行识别的情况下，会使用第1文法A、第2文法B、第3文法C三个文法。而在本实施例，由于实际被显示的输入字段只有901，所以只使用与输入字段1对应的文法A进行输入声音的识别。由此，使用的文法规模与现有技术相比变小了，所以能够提高识别率。
另外，在显示了多个输入字段的情况下，由于用于声音识别的文法被局限于与显示的输入字段对应的文法，所以能够保持识别精度。另外，识别结果被适用于多个激活字段的任一个，根据声音识别使用的文法来决定适用于哪个输入字段。因此，即使多个输入字段被显示，也能够自动、恰当地设定输入字段的值(声音识别结果)，提高了可操作性。
(第3实施例)以下，参照附图详细说明本发明的第3实施例。
第3实施例相关的装置的基本结构及硬件结构与上述第2实施例中的图6及图2的结构相同，所以省略详细说明。
第3实施例与第2实施例的主要不同是在第2实施例中是用超文本来描述内容的，以及对该内容的处理。以下，参照图10～图13详细进行说明。
图10是利用超文本文件表现内容的一个例子。该超文本文件被保存在显示内容保存部件602中，并如图11那样通过信息显示部件601被显示出来。
图10的101所示的标记是用来指定文法的显示联动与否，即是否对应显示画面的切换对文法进行切换的标记。在该标记被设定了的情况下，与显示联动地切换文法，而在该标记未被设定的情况下，不与显示联动地切换文法。详细的说明用图13所示的流程图进行。
102描述的是输入到输入字段的“艺术名”中的数据的类型、该输入字段的大小、该输入字段所使用的文法的所在位置信息(“http//temp/art.grm”)。103、104、105、106也一样，描述的是与各输入字段相关的信息和对应各输入字段存储的文法的所在位置信息。
图11是展示图10所示的超文本通过信息显示部件601显示出来的状态的图。
图11的内容由4个输入字段(1001、1002、1003、1004)组成。在显示画面足够大的情况下，4个输入字段可以全部显示在一个画面中。但在显示画面较小的情况下，如图12所示只能显示4个输入字段的一部分。在该图中显示了1002、1003二个字段。在这种情况下，可以通过用滚动条上下移动画面、变换画面显示状态，来确认未被显示的部分。
下面，参照图13所示的流程图，说明本实施例的信息输入装置的动作。
在步骤S801，如图10所示读入超文本。在步骤S802对在步骤S801读入的超文本进行解析，并根据解析结果显示图11所示的GUI。根据该解析结果检测出文法的位置，如“http//temp/art.grm”。另外，在标记中，也解析在<form>标记内是否设置了“grmselect＝“display””等。
在步骤S803读入在步骤S802根据文法位置信息检测出来的文法，并将与艺术名、曲名、CM名、序列名对应的4个文法保存到文法保存部件609中。另外，在步骤S804，根据步骤S802的解析结果，将字段信息即输入字段与文法的对应关系保存到字段信息保存部件606中。本实施例的场合，是将以下对应地进行保存的输入字段1001对应文法“http//temp/art.grm”，输入字段1002对应文法“http//temp/kyoku.grm”，输入字段1003对应文法“http//temp/cm.grm”，输入字段1004对应文法“http//temp/rank.grm”。
在步骤S805进行声音输入的检测，检测出来的情况下前进到步骤S806。在步骤S806，根据步骤S802的解析结果，判断<form>标记中是否设置了“grmselect＝“display””，即判断是否与显示联动地切换使用的文法。设置了的情况下，前进到步骤S808，未设置的情况下，前进到步骤S807。
在未设置的情况下，在步骤S807设定所有的文法为激活文法。即，将4个文法都保存到激活文法保存部件610中，前进到步骤S811的声音识别处理。
在设置了的情况下，在步骤S808调查实际现在哪个字段正在被显示。在步骤S809，将现在正在显示的输入字段保存到激活字段保存部件607中。在步骤S810，将在步骤S803保存了的4个文法中的与保存在激活字段保存部件607中的输入字段对应的文法作为激活文法保存到激活文法保存部件610中。在图12的情况下，4个字段中的1002及1003二个输入字段被显示出来。与该二个输入字段对应的文法是“http//temp/kyoku.grm”，及“http//temp/cm.grm”，将该二个文法作为激活文法保存。
在步骤S811，使用在步骤S807或步骤S810中作为激活文法保存起来的文法，对输入的声音进行识别处理。识别处理返回识别结果和识别所使用的文法的ID。该识别结果和识别所使用的文法的ID被保存到识别结果保存部件613中。
在步骤S812，根据在步骤S811取得的文法ID，判断是针对哪个输入字段的输入。由于文法ID与输入字段的对应关系被保存在字段信息保存部件606中，所以可以参照。
在步骤S813，将保存在识别结果保存部件613中的识别结果保存到字段信息保存部件606中。具体的就是将识别结果保存到图4的值栏中。
在步骤S814，将保存在识别结果保存部件613中的结果显示到在步骤S812判断出的信息显示部件的输入字段中。
然后，在通过检索按钮等指示了发送显示在输入字段中的识别结果的情况下，将识别结果发送到应用程序，而应用程序就依据识别结果进行动作。
例如，在图8的艺术名栏801中显示了艺术名(识别结果)的状态下，在按下了检索按钮的情况下，将显示的艺术名等传送到应用程序，就能够根据该艺术名得到检索结果了。
以上处理结束。
在图10的超文本中设置了“grmselect＝“display””，而如图11那样显示的情况下，4个输入字段都可以进行输入。而在图12的情况下，则只有二个输入字段可以进行输入。另外，在未设置的情况下，与该输入字段是否被显示无关，可以向4个输入栏中进行输入。
根据本实施例，在显示的输入项目中有复杂的文法项目的情况下，通过控制不显示该项目，能够控制输入字段，提高识别率。
另外，根据本实施例，由于只使用与实际显示的输入字段对应的文法进行声音识别处理，所以能够减小文法的规模，其结果是能够提高对输入声音的识别率。
根据本实施例，对应于表示是否与显示画面的切换对应地进行文法切换的标记的有无，控制输入字段，但并限于此。例如，也可以根据标记内的描述内容控制输入字段。具体地说就是，可以在标记中设置了“grmselect＝“none””的情况下，使用所有的文法，而在设置了“grmselect＝“display””的情况下，与显示器的显示联动地控制文法。在该情况下，可以在未设置标记时，不进行识别。
根据本实施例，将现在正在显示的输入字段作为激活字段处理。并不限于此，在使用了HTML文件的帧页的情况下，或使用了多个窗口的情况下，可以将存在于现在激活的帧页(由于帧页是浏览页中被划分的区域，所以能够在每个这样的区域滚动文件)或窗口中的输入字段作为激活字段处理。
根据本实施例，将GUI作为输出装置，将声音作为输入装置，但并不限于此，可以并用GUI作为输入装置，并用声音作为输出装置。
另外，在表示是否对应于显示画面的切换进行文法的切换的标记被设置了的情况下，可以将其通知给用户。具体地说就是可以考虑设置GUI上的指示器等。由此，用户能够事前知道是选择了输入字段的所有文法、还是选择了被显示的输入字段的特定文法，能够提高本信息处理装置的操作性。
上述各实施例可以被适用于由多个机器构成的系统中，也可以被适用于由一个机器构成的装置中。
另外，作为存储实现上述各实施例的功能的控制程序的程序代码的存储介质，可以使用例如软盘、硬盘、光盘、光磁盘、CD-ROM、磁带、非易失存储卡、ROM等。
另外，在上述控制程序的程序代码与中央处理装置2中运行的OS(操作系统)或其他应用软件等的共同作用下实现上述实施例所示的功能的情况下，其程序代码当然也包含在本发明的实施例中。
本发明还包括下列情况在将上述控制程序的程序代码存储到功能扩展板和功能扩展单元具备的存储器中后，根据该程序代码的指令由该功能扩展板和功能扩展单元具备的CPU等进行实际处理的一部分或全部，通过该处理实现上述实施例的功能。
如上所述，根据本发明，由于能够与输入项目的显示状态对应地进行声音识别，所以能够提高对输入声音的识别率。
权利要求
1.一种信息处理装置，其特征在于包括输入具有多个输入项目的文件的输入装置；对应于上述文件的显示状态，从上述多个输入项目中判断出有效的输入项目的判断装置；以及选择与上述判断装置判断为有效的输入项目相对应的特定文法的选择装置。
2.根据权利要求1所述的信息处理装置，其特征在于上述判断装置将显示在显示画面上的输入项目判别为有效的输入项目。
3.根据权利要求1所述的信息处理装置，其特征在于还包括输入声音的声音输入装置；以及使用通过上述选择装置选择的文法，对通过上述声音输入装置输入的声音进行识别的识别装置。
4.根据权利要求3所述的信息处理装置，其特征在于还包括判断应该输入上述声音识别装置的识别结果的输入项目的判断装置；以及进行控制以便将上述识别结果输入到由上述判断装置确定的输入项目中的控制装置。
5.根据权利要求1所述的信息处理装置，其特征在于还包括切换显示画面上的显示内容的显示切换装置；其中在通过上述显示切换装置切换了显示内容的情况下，通过上述判断装置将显示在显示画面上的输入项目判别为有效的输入项目。
6.根据权利要求5所述的信息处理装置，其特征在于上述显示切换装置使显示画面滚动。
7.根据权利要求5所述的信息处理装置，其特征在于上述显示切换装置切换帧页。
8.一种信息处理装置，其特征在于包括输入具有多个输入项目的文件的输入装置；在上述文书中，对应于上述文件的显示状态，判断是否指定了进行选择特定的文法的判断装置；以及对应于上述判断结果控制文法的选择的控制装置。
9.根据权利要求8所述的信息处理装置，其特征在于在通过上述判断装置判断出指定了根据文件的显示状态选择特定的文法的情况下，上述控制装置选择与显示画面上显示的输入项目对应的特定的文法。
10.根据权利要求8所述的信息处理装置，其特征在于在通过上述判断装置判断出未指定根据文件的显示状态选择特定的文法的情况下，上述控制装置选择与上述文件中的输入项目对应的所有的文法。
11.根据权利要求8所述的信息处理装置，其特征在于还包括输入声音的声音输入装置；使用通过上述控制装置选择的文法，对通过上述声音输入装置输入的声音进行识别的声音识别装置。
12.根据权利要求11所述的信息处理装置，其特征在于还包括判断应该输入上述声音识别装置的识别结果的输入项目的判断装置；以及进行控制以便将上述识别结果输入到由上述判断装置确定的输入项目中的控制装置。
13.根据权利要求8所述的信息处理装置，其特征在于在上述文件中，在通过上述判断装置判断出指定了根据该文件的显示状态选择特定的文法的情况下，提示该信息的提示装置。
14.一种信息处理方法，其特征在于包括输入具有多个输入项目的文件的输入步骤；对应于上述文件的显示状态，从上述多个输入项目中判断出有效的输入项目的判断步骤；以及选择与在上述判断步骤判断为有效的输入项目相对应的特定文法的选择步骤。
15.根据权利要求14所述的信息处理方法，其特征在于上述判断步骤将显示在显示画面上的输入项目判别为有效的输入项目。
16.根据权利要求14所述的信息处理方法，其特征在于还包括输入声音的声音输入步骤；以及使用在所述选择步骤选择的文法、对在上述声音输入步骤输入的声音进行识别的识别装置。
17.根据权利要求16所述的信息处理方法，其特征在于还包括判断应该输入上述声音识别步骤的识别结果的输入项目的判断步骤；以及进行控制以便将识别结果输入到在上述判断步骤确定的输入项目中的控制步骤。
18.根据权利要求14所述的信息处理方法，其特征在于还包括切换显示画面上的显示内容的显示切换步骤；其中在上述显示切换步骤切换了显示内容的情况下，通过上述判断步骤将显示在显示画面上的输入项目判别为有效的输入项目。
19.根据权利要求18所述的信息处理方法，其特征在于上述显示切换步骤使显示画面滚动。
20.根据权利要求18所述的信息处理方法，其特征在于上述显示切换步骤切换帧页。
21.一种信息处理方法，其特征在于包括输入具有多个输入项目的文件的输入步骤；判断在上述文书中、对应于该文件的显示状态是否指定了进行选择特定的文法的判断步骤；以及对应于上述判断结果控制文法的选择的控制步骤。
22.根据权利要求21所述的信息处理方法，其特征在于在通过上述判断步骤判断出指定了根据文件的显示状态选择特定的文法的情况下，上述控制步骤选择与显示画面上显示的输入项目对应的特定的文法。
23.根据权利要求21所述的信息处理方法，其特征在于在通过上述判断步骤判断出未指定根据文件的显示状态选择特定的文法的情况下，上述控制步骤选择与上述文件中的输入项目对应的所有的文法。
24.根据权利要求21所述的信息处理方法，其特征在于还包括输入声音的声音输入步骤；使用在上述控制步骤选择的文法，对在上述声音输入步骤中输入的声音进行识别的声音识别步骤。
25.根据权利要求24所述的信息处理装置，其特征在于还包括判断应该输入上述声音识别步骤的识别结果的输入项目的判断步骤；以及进行控制以便将识别结果输入到在上述判断步骤确定的输入项目中的控制步骤。
26.根据权利要求21所述的信息处理方法，其特征在于还包括在上述文件中，在通过上述判断步骤判断出指定了根据该文件的显示状态选择特定的文法的情况下，提示该信息的提示步骤。
27.一种存储用于使计算机进行信息处理的控制程序的计算机可读介质，其特征在于，该控制程序包括输入具有多个输入项目的文件的输入步骤的代码；对应于上述文件的显示状态，从上述多个输入项目中判断出有效的输入项目的判断步骤的代码；以及选择与上述判断步骤判断为有效的输入项目相对应的特定文法的选择步骤的代码。
28.一种存储用于使计算机进行信息处理的控制程序的计算机可读介质，其特征在于，该控制程序包括输入具有多个输入项目的文件的输入步骤的代码；判断在上述文书中、对应于该文件的显示状态是否指定了进行选择特定的文法的判断步骤的代码；以及对应于上述判断结果控制文法的选择的控制步骤的代码。
29.一种用于使计算机进行信息处理的控制程序，其特征在于包括输入具有多个输入项目的文件的输入步骤的代码；对应于上述文件的显示状态，从上述多个输入项目中判断出有效的输入项目的判断步骤的代码；以及选择与上述判断步骤判断为有效的输入项目相对应的特定文法的选择步骤的代码。
30.一种用于使计算机进行信息处理的控制程序，其特征在于包括输入具有多个输入项目的文件的输入步骤的代码；判断在上述文书中、对应于该文件的显示状态是否指定了进行选择特定的文法的判断步骤的代码；以及对应于上述判断结果控制文法的选择的控制步骤的代码。
全文摘要
本发明的信息处理装置及方法、以及存储介质的特征在于输入具有多个输入项目的文件，并通过信息显示部件(101)将其显示出来。根据该文件的显示状态，从多个输入项目中判别出有效的输入项目。从保存有多种文法的文法保存部件(109)中，选择与被判别为有效的输入项目对应的特定的文法，并将选择的文法用于声音识别处理。
文档编号G10L15/18GK1470015SQ01817263
公开日2004年1月21日申请日期2001年10月11日优先权日2000年10月11日
发明者小板哲夫, 上田隆也, 也, 伊藤史朗, 朗, 山本宽树, 树, 池田裕治, 治申请人:佳能株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：小坂哲夫;上田隆也;伊藤史朗;山本宽树;池田裕治
技术所有人：佳能株式会社
我是此专利的发明人

上一篇：在感知上改善的声信号编码的制作方法
上一篇：基于语音的不受语言限制的搜索系统的制作方法