语音设备、语音控制程序以及语音控制方法

文档序号:2823091阅读:244来源:国知局
专利名称:语音设备、语音控制程序以及语音控制方法
技术领域
本发明涉及一种语音设备、一种语音控制程序、以及一种语音控制方法。更具体 地,本发明涉及一种具有话音合成功能的语音设备、以及一种在该语音设备中执行的语音 控制程序和语音控制方法。
背景技术
近来出现了一种具备话音合成功能的导航设备。话音合成功能是将文本转换成话 音或语音的功能,被称作TTS(文本至语音)。同时,还存在两种说出数值字符串的方法一 种方法是将数值说成各个单独的数字,另一种方法是将数值说成整体数字(full number) 0 在使导航设备说出数值字符串的情况下,关键是使其用哪种方法说出该数值。例如,优选地 将电话号码说成各个单独的数字,而优选地将距离说成整体数字。日本专利申请待审公开 No. 09-006379公开了一种话音规则合成设备,该设备确定是否存在指示了包含数值的字符 串表示电话号码的表达,如果存在,则该设备执行话音合成,使得逐一说出数值的各个单独 数字。利用该传统话音规则合成设备,导航设备仅将电话号码说成单独的数字,而将其 他数值字符串(例如,地址、道路编号等)全部都说成整体数字。得到的话音输出对于驾驶 员而言很难理解。[专利文献1]日本专利申请待审公开No.09-006379。

发明内容
本发明要解决的技术问题为解决上述问题,实现了本发明,本发明的目的是提供一种能够以用户容易理解 的方式来说出数值的语音设备。本发明的另一目的是提供一种允许以用户容易理解的方式说出数值的语音控制 程序。本发明的另一目的是提供一种允许以用于容易理解的方式说出数信的语音控制 方法。解决问题的手段为了实现上述目的,根据本发明的一个方面,一种语音设备,包括语音装置,用 于在给定字符串包括由多个数字组成的数值的情况下,用第一语音方法或第二语音方法说 出数值,在第一语音方法中,逐一朗读数值的各个单独数字,在第二语音方法中,将数值作 为整体数字朗读;关联装置,用于将字符串的类型与第一语音方法或第二语音方法相关联; 处理执行装置,用于执行预定处理,以输出数据;以及语音控制装置,用于基于所输出的数 据产生字符串,并且使语音装置用第一和第二语音方法中与输出数据的类型相关联的那个 语音方法说出所产生的字符串。根据该方面,字符串的类型与第一语音方法或第二语音方法相关联。字符串是基
4于在执行预定处理时输出的数据而产生的,并且用与输出数据的类型相关联的语音方法来 说出所述字符串。这样,使用针对数据的类型而预定的语音方法来说出字符串。因此可以 提供能够以用户容易理解的方式说出数值的语音设备。优选地,语音设备还包括话音获取装置用于获取话音;话音识别装置,用于识 别所获取的话音,以输出字符串;以及语音方法区别装置,用于在输出字符串包括数值的情 况下,区别第一和第二语音方法中的一个;其中,处理执行装置执行基于正被输出的字符串 的处理,并且关联装置包括登记装置,用于将正被输出的字符串的类型与语音方法区别 装置的区别结果相关联,其中所述字符串的类型是基于处理执行装置所执行的处理而确定 的。根据该方面,在通过识别所获取的语音而输出的字符串包括数值的情况下,区别 第一或第二语音方法,并且将根据所述基于正被输出的字符串的处理而确定的字符串的类 型与所区别的语音方法相关联。这允许用与输入话音的语音方法相同的语音方法来说出与 输入话音中所包括的类型相同的类型的字符串。根据本发明的另一方面,一种语音设备,包括语音装置,用于在给定字符串包括 由多个数字组成的数值的情况下,用第一语音方法或第二语音方法来说出数值,在第一语 音方法中,逐一朗读数值的各个单独数字,在第二语音方法中,将数值作为整体数字朗读; 确定装置,用于基于字符串中包括的数值中数字的个数来确定第一和第二语音方法中的一 个;以及语音控制装置,用于使语音装置用所确定的第一和第二语音方法中的一个来说出 数值。根据该方面,在字符串包括由多个数字组成的数值的情况下,基于字符串中包括 的数值中数字的个数,来确定第一和第二语音方法中的一个,并且使用确定的语音方法来 说出字符串。语音方法是根据数值中数字的个数来确定的。因此,可以提供能够以用户容 易理解的方式来说出数值的语音设备。根据本发明的另一方面,一种语音控制程序,使计算机执行以下步骤将第一语音 方法或第二语音方法与字符串的类型相关联,在第一语音方法中,将由多个数字组成的数 值作为各个单独数字朗读,在第二语音方法中,将由多个数字组成的数值作为整体数字朗 读;通过执行预定处理输出数据;基于输出的数据产生字符串;以及用第一和第二语音方 法中与输出的数据的类型相关联的一个语音方法来说出所产生的字符串。根据该方面,可以提供允许以用户容易理解的方式说出数值的语音控制程序。根据本发明的又一方面,一种语音控制程序,使计算机执行以下步骤用第一语音 方法说出由多个数字组成的数值,在第一语音方法中,逐一朗读数值的各个单独数字;用第 二语音方法说出由多个数字组成的数值,在第二语音方法中,将数值作为整体数字朗读;基 于字符串中包括的数值中数字的个数,来确定第一和第二语音方法中的一个;在给定字符 串包括由多个数字组成的数值的情况下,使得用所确定的第一和第二语音方法中的一个来 说出字符串。根据本发明的另一方面,一种语音控制方法,包括以下步骤将第一语音方法或第 二语音方法与字符串的类型相关联,在第一语音方法中,将由多个数字组成的数值作为各 个单独数字朗读,在第二语音方法中,将由多个数字组成的数值作为整体数字朗读;通过执 行预定处理来输出数据;基于输出的数据产生字符串;以及用第一和第二语音方法中与输出数据的类型相关联的一个语音方法来说出所产生的字符串。根据该方面,可以提供允许以用户容易理解的方式说出数值的语音控制方法。根据本发明的又一方面,一种语音控制方法,包括以下步骤用第一语音方法说出 由多个数字组成的数值,在第一语音方法中,逐一朗读数值的各个单独数字;用第二语音方 法说出由多个数字组成的数值,在第二语音方法中,将数值作为整体数字朗读;基于字符串 中包括的数值中数字的个数,来确定第一和第二语音方法中的一个;以及在给定字符串包 括由多个数字组成的数值的情况下,使得用确定的第一和第二语音方法中的一个,来说出 字符串。


图1是示出了根据本发明实施例的示例导航设备的硬件配置的框图。图2是示出了包括在示例导航设备中的CPU的功能的功能框图。图3A示出了用户定义表的示例。图3B示出了关联表的示例。图3C示出了地域表的示例。图3D示出了数字个数表的示例。图4是示出了示例语音控制处理流程的流程图。图5是示出了示例关联表更新处理流程的流程图。附图标记的说明1 导航设备;11 =CPU ;13 :GPS接收机;15 陀螺仪;17 车速传感器;19 存储器I/ F ; 19A 存储卡;21 串行通信I/F ;23 显示控制部;25 =LCD ;27 触摸屏;29 麦克风;31 扬声器;33 =ROM ;35 =RAM ;37 =EEPROM ;39 操作键;51 语音控制部;53 处理执行部;55 话音合成部;57 话音输出部;59 位置获取部;61 字符串产生部;63 语音方法确定部; 71 话音获取部;73 话音识别部;75 语音方法区别部;77 登记部;81 用户定义表;83 关联表;85 地域表;以及87 数字个数表。
具体实施例方式现在参照附图描述本发明的实施例。在以下描述中,类似的参考符号表示具有类 似名称和功能的类似的元件,并因此不重复这些类似元件的详细描述。图1是作为示例示出了根据本发明实施例的导航设备的硬件配置的框图。参照图 1,导航设备1包括中央处理单元(CPU) 11,负责导航设备1的总体控制;GPS接收机13 ; 陀螺仪15 ;车速传感器17 ;存储器接口(I/F) 19 ;串行通信I/F 21 ;显示控制部23 ;液晶显 示器(IXD)25 ;触摸屏27 ;麦克风29 ;扬声器31 ;只读存储器(ROM) 33,用于存储要由CPU 11执行的程序等;随机存取存储器(RAM) 35,用作针对CPU 11的工作区;电可擦除可编程 ROM(EEPROM) 37,以非易失性方式存储数据;以及操作键39。GPS接收机13接收来自全球定位系统(GPS)的GPS卫星的无线电波,以测量地图 上的当前位置。GPS接收机13向CPU 11输出所测量的位置。陀螺仪15检测安装了导航设备1的车辆的方位,并向CPU 11输出检测到的方位。 车速传感器17检测安装了导航设备的车辆的速度,并且向CPU 11输出检测到的速度。应
6注意,车速传感器17可以被安装在车辆上,在这种情况下,CPU 11接收来自安装在车辆上 的车速传感器17的车速。显示控制部23控制IXD 25,以使IXD 25显示图像。IXD 25是薄膜晶体管(TFT) 类型的,并且受显示控制部23的控制,来显示从显示控制部23输出的图像。应注意,可以 用有机电致发光(EL)显示器来代替IXD 25。触摸屏27由透明组件组成,并被设置在IXD 25的显示表示上。触摸屏27检测IXD 25的显示表面上由用户用手指或其他类似物所指定的位置,并且向CPU 11输出检测到的 位置。CPU 11在IXD 25上显示各种按钮,并且根据与触摸屏所检测到的指定位置的结合, 来接受各种操作。由CPU 11在IXD 25上显示的操作屏幕包括用于操作导航设备1的操作 屏幕。操作键39是按钮开关,其包括用于开启/关闭主电源的电源键。存储器I/F 19是与可拆卸的存储卡19A —起安装的。CPU 11读取在存储卡19A 中存储的地图数据,并且在IXD 25上显示地像,在该地像上标记了从GPS接收机 13输入的当前位置以及由陀螺仪15检测到的方位。此外,基于分别从车速传感器17和陀 螺仪15输入的车速和方位,CPU 11在LCD 25上显示其上的标记的位置随着车辆的移动而 移动的地像。尽管这里认为要由CPU 11执行的程序存储在ROM 33中,但是程序也可以存储在 存储卡19A中,并且可以从存储卡19A中被读出以由CPU 11来执行。用于存储程序的记录 介质不限于存储卡19A。记录介质可以是软盘、盒式磁带、光盘(压缩盘-ROM(CD-ROM)、磁 光盘(M0)、迷你盘(MD)、数字万能盘(DVD))、IC卡(包括存储卡)、光卡、或半导体存储器 (例如,掩模 ROM、EPROM、EEPROM 等)。备选地,可以从连接至串行通信I/F 21的计算机中读取要由CPUll执行的程序。 如这里所使用的,“程序”不仅包括由CPU 11直接可执行的程序,而且还包括源程序、压缩程 序、加密程序、以及其他。图2是作为示例示出了包括在导航设备中的CPU 11的功能的功能框图。参照图 2, CPU 11包括执行处理的处理执行部53 ;合成话音的话音合成部55 ;控制话音合成部55 的语音控制部51 ;输出合成后的话音的话音输出部57 ;获取当前位置的位置获取部59 ;获 取话音的话音获取部71 ;识别所获取的话音以输出文本的话音识别部73 ;基于输出文本对 语音方法进行区别的语音方法区别部75 ;以及登记区别后的语音方法的登记部77。处理执行部53执行导航处理。具体地,处理执行部53执行支持路线导向以便驾 驶员驾驶车辆的处理、朗读在EEPROM 37中存储的地图信息的处理等等。支持路线导向的 处理包括例如搜索从当前位置到目的地的路线并将搜索到的路线显示在地图上的处理、以 及显示行驶方向直到车辆到达目的地的处理。处理执行部53输出所执行的处理的结果。该结果由数据本身和数据的类型的集 合组成。类型包括地址、电话号码、道路信息以及距离。例如,在输出EEPROM 37中存储的 设施信息的情况下,处理执行部53输出设施的地址的和类型“地址”的集合,并且还输出设 施的电话号码和类型“电话号码”的集合。在输出当前位置的情况下,处理执行部53输出 类型“地址”和当前位置的地址的集合。在输出搜索到的路线的情况下,处理执行部53输 出类型“道路信息”和指示路线中包括的道路的道路名称的集合。位置获取部59基于GPS接收机13从卫星接收的信号,来获取当前位置。位置获取部59向语音控制部51输出所获取的当前位置。当前位置包括例如纬度和经度。尽管位 置获取部59可以根据GPS接收机13从卫星接收到的信号来计算纬度和经度,但是也可以 提供连接至诸如互联网之类的网络的无线电通信电路,在这种情况下,可以将从GPS接收 机13输出的信号传输至连接至互联网的服务器,并且可以接收到从服务器返回的纬度和经度。语音控制部51包括字符串产生部61和语音方法确定部63。字符串产生部61 基于从处理执行部53输入的数据,来产生字符串,并且向话音合成部55输出所产生的字 符串。例如,在从处理执行部53输入指示了当前位置的地址和类型“地址”的集合的情 况下,产生字符串“当前位置在00(城镇名称)的XX(门牌号)附近”。在从处理执行部 35输入设施的电话号码以及类型“电话号码”的集合的情况下,产生字符串“电话号码是
xx-xxxx-xxxx”。语音方法确定部63基于从处理执行部53输入的类型,来确定语音方法,并且向话 音合成部55输出所确定的语音方法。具体地,语音方法确定部63参照存储在EEPROM 37中 的参考表,来确定参考表中对应于从处理执行部53输入的类型而定义的语音方法。参考表 包括用户定义表81、关联表83、地域表85、以及数字个数表87。现在描述用户定义表81、 关联表83、地域表85、以及数字个数表87。图3A到3D示出了参考表的示例。图3A示出了用户定义表的示例,图3B示出了关 联表的示例,图3C示出了地域表的示例,以及图3D示出了数字个数表的示例。参照图3A, 用户定义表81包括由导航设备1的用户已经预先设定的用户定义记录。用户定义记录包 括“类型”和“语音方法”字段。例如,针对类型“邮政编码”定义了语音方法“ 1 ”,针对类型 “地址”定义了语音方法“2”。语音方法“1”是指将数值作为各个单独的数字来朗读的语音 方法。语音方法“2”是指将数值作为整体数字来朗读的语音方法。在图3A所示的用户定 义表中,针对类型“邮政编码”,设定了将数值作为各个单独数字来朗读的语音方法,并且针 对类型“地址”设定了将数值作为整体数字来朗读的语音方法。参照图3B,关联表包括将类型与语音方法相关联的关联记录。关联记录包括“类 型”和“语音方法”字段。如稍后所描述的,当用户将话音数据输入到导航设备1中时,产生 关联记录,并且将该关联记录添加至关联表。例如,将语音方法“1”与类型“电话号码”相关 联,并且将语音方法“2”与类型“距离”相关联。此外,在关联记录中,将“局域受限(locally restricted) ”与字符串的类型相关联,对于该字符串类型,其语音方法是局域受限的。更具 体地,将“局域受限”的语音方法与类型“道路信息”相关联。这允许将语音方法的地域差 异反映到针对类型“道路信息”的语音方法。参照图3C,地域表85包括地域记录,在地域记录中,针对局域受限的类型,将地域 和语音方法彼此相关联。这里图3B所示的关联表83定义了类型“道路信息”是局域受限 的。因此,在地域表85中,定义了在特定地域中要用于说出道路信息的语音方法。地域记 录包括“地域”和“语音方法”字段。例如,语音方法“ 1 ”与地域“A”相关联,语音方法“2” 与地域“B”相关联,无方法与“其他”地域相关联。参照图3D,数字个数表87包括数字个数记录,将数字个数与语音方法相关联。数 字个数记录包括“数字的个数”和“语音方法”字段。例如,语音方法“1”与“三个或三个以 上”的数字个数相关联,语音方法“2”与“小于三个”的数字个数相关联。因此,具有三个或三个以上数字的数值与将数值作为各个单独数字朗读的语音方法相关联,而具有小于三个 数字的数值与将数值作为整体数字朗读的语音方法相关联。返回图2,语音方法确定部63确定在用户定义表中是否已经定义了与从处理执行 部53输入的类型相对应的语音方法。如果在用户定义表中已经定义了该语音方法,则语音 方法确定部63确定语音方法为所定义的语音方法。在用户定义表81中没有定义与从处理 执行部53输入的类型相对应的语音方法的情况下,语音方法确定部63确定在关联表83中 是否已经定义了该语音方法。如果在关联表83中已经定义了从处理执行部53输入的类型, 则语音方法确定部63确定该语音方法为所定义的语音方法。在从处理执行部53输入的类 型是“道路信息”的情况下,语音方法确定部63参照地域表85。在这种情况下,语音方法确 定部63基于从位置获取部59输入的当前位置,确定包括当前位置的地域。然后,语音方法确定部63确定语音方法为与地域表中确定的地域相关联的那个 语音方法。在地域表85不包括任何包括所确定的地域的地域记录的情况下,语音方法确定 部63不确定语音方法。在参照地域表85未确定语音方法的情况下,语音方法确定部63参 照数字个数表87。语音方法确定部63确定语音方法为数字个数表中与字符串所表达的数 值中数字的个数相关联的那个语音方法。当数值具有三个或更多个数字时,语音方法确定 部63确定语音方法为逐一朗读各个单独数字的语音方法,而当数值具有小于三个数字时, 语音方法确定部63确定语音方法为将数值作为整体数字朗读的语音方法。语音方法确定 部63向话音合成部55输出所确定的语音方法。话音合成部15根据从字符串产生部61输入的字符串,来合成话音,并向话音输出 部57输出话音数据。在从字符串产生部61输入的字符串包括数值的情况下,话音合成部 55根据从语音方法确定部63输入的语音方法,来合成话音。话音输出部57向扬声器31输出从话音合成部55输入的话音数据。结果,从扬声 器31输出由话音合成部55合成的话音数据。话音获取部71与麦克风29相连接,并获取麦克风29所收集和输出的话音数据。 话音获取部71向话音识别部73输出所获取的话音数据。话音识别部73分析输入的话音 数据,并将话音数据转换成字符串。话音识别部73向处理执行部53和语音方法区别部75 输出从话音数据获取的字符串。在处理执行部53中,输入的字符串用于执行处理。例如,在字符串指示了命令的情况下,处理执行部53根据该命令执行处理。在处 理执行部53执行登记数据的处理的情况下,处理执行部53将输入字符串添加至在登记目 的地处的数据,以进行存储。此时,用户可以通过经由麦克风29输入作为话音的命令或者 通过使用操作键39,来指定登记目的地。处理执行部53向登记部77输出根据正被执行的 处理而确定的类型。例如,在处理执行部53执行设置目的地的处理的情况下,作为目的地 而输入的字符串应当是地址。因此,处理执行部53输出“地址”作为类型。在目的地由道 路信息表达的情况下,处理执行部53输出“道路信息”作为类型。在处理执行部53执行登 记设施信息的处理的情况下,可以输入设施名称、地址、以及电话号码。当输入地址时,处理 执行部53输出类型“地址”,并且当输入电话号码时,输出类型“电话号码”。登记部77产生关联记录,在关联记录中从处理执行部53输入的类型与从语音方 法区别部75输入的语音方法相关联,并且登记部77将所产生的记录添加至关联表以进行 存储。这样,当导航设备1的用户执行执行向导航设备1输入话音命令或数据的操作时,产生新的关联记录并被存储在关联表83中。即使用户没有新产生用户定义表81,也将关联记 录存储在关联表83中。例如,这消除了要求用户对操作键39进行操作以便产生用户定义 表81的需要。图4是作为示例示出了语音控制处理的流程的流程图。当CPU 11执行语音控制程 序时,语音控制处理由CPU 11执行。参照图4,CPU 11确定是否已经出现了要作为话音输 出的数据(步骤S01)。在出现这样的数据之前,CPU 11处于待机模式(步骤SOl中的否), 并且一旦出现了数据,处理前进至步骤S02。在步骤S02中,CPU 11基于出现的数据产生要 作为话音输出的字符串。然后,CPU 11确定所产生的字符串是否包括数值(步骤S03)。如 果字符串包括数值,则处理前进至步骤S04 ;否则,处理前进至步骤S17。在步骤S04中,获取数据的类型。与在步骤SOl中出现的数据一起,基于产生数据 的处理,获取该数据的类型。具体地,当处理用于输出地址时,获取类型“地址”,并且当处理 用于输出电话号码时,获取类型“电话号码”。当处理用于输出道路信息时,获取类型“道路 信息”,并且当处理用于输出距离时,获取类型“距离”。在接下来的步骤S05中,参照在EEPROM 37中存储的用户定义表81。确定用户定 义表81中的用户定义记录是否包括在“类型”字段中设定有在步骤S04中获取的类型的用 户定义记录(步骤S06)。如果存在这样的用户定义记录,处理前进至步骤S07;否则,处理 前进至步骤S08。在步骤S07中,根据包括在步骤S04中获取的类型在内的用户定义记录, 获取与该类型相关联的语音方法,并且将所获取的语音方法设定为用于说出字符串的语音 方法。处理然后前进至步骤S 17。在步骤S 17中,用所设定的语音方法说出字符串。用用 户所定义的语音方法来说出与用户定义的类型相对应的数值,从而可以以用户容易理解的 方式来说出数值。另一方面,在步骤S08中,参照存储在EEPROM 37中的关联表83。具体地,从包括 在关联表83中的关联记录中提取在“类型”字段中设定有在步骤S04中获取的类型的关联 记录。然后确定语音方法是否是局域受限的(步骤S09)。确定在所提取的关联记录中“语 音方法”字段中是否已经设置了 “局域受限”。如果已经设置了 “局域受限”,则处理前进至 步骤Sll ;否则处理前进至S10。在步骤SlO中,将在步骤S08中所提取的关联记录中的“语音方法”字段中设置的 语音方法设置为用于说出字符串的语音方法,并且处理前进至步骤S17。在步骤S17中,用 设置的语音方法来说出字符串。如后续所述,当用户将语音输入到导航设备1中时,基于用 户所使用的语音方法来产生在关联表83中包括的关联记录。相应地,可以用与在说出字符 串时用户所使用的语音方法相同的语音方法来说出字符串。这确保了以用户容易理解的方 式来说出字符串。在步骤Sll中,获取当前位置,并获取当前位置所属的地域。然后,参照存储在 EEPROM 37中的地域表85 (步骤S12)。确定语音方法是否已经与步骤Sll中所获取的地域 相关联(步骤S13)。具体地,确定地域表85中的地域记录是否包括包含在步骤Sll中所获 取的地域的地域记录。如果存在这样的地域记录,则确定语音方法已被关联,并且处理前进 至步骤S14 ;否则,处理前进至步骤S15。在步骤S14中,将与地域相关联的语音方法设定为 用于说出字符串的语音方法,并且处理前进至步骤S17。在步骤S17中,用设定的语音方法 来说出字符串。包括在地域表85中的地域记录定义了对于该地域特定的语音方法,使得以
10根据当前位置所属的地域的方式来说出数值。这允许用户知道对于该地域特定的唯一读取 方式。在步骤S15中,参照存储在EEPROM 37中的数字个数表87。从包括在数字个数表 87中的数字个数记录中,提取已经在“数字的个数”字段中设定了包括在步骤S02中产生的 字符串中的数值的数字个数的数字个数记录,并且获取在所提取的数字个数记录中“语音 方法”字段中设置的语音方法。将与数字的个数相关联的语音方法设置为用于说出字符串 的语音方法(步骤S16),并且处理前进至步骤S17。在步骤S17中,用设置的语音方法说出 字符串。在包括在数字个数表87中的数字个数记录中,具有三个或更多个数字的数值与将 该数值作为各个单独数字朗读的语音方法相关联,而具有小于三个数字的数值与将该数值 作为整体数字朗读的语音方法相关联。相应地,将具有三个或多个数字的数值作为各个单 独数字朗读,而将具有小于三个数字的数值作为整体数字朗读。相应地,将具有三个或多个 数字的数值作为各个单独的数字来朗读,而将具有小于三个数字的数值作为整体数字来朗 读。这确保了以用户容易理解的方式来说出数值。当在步骤S17中完成了语音时,处理前进至步骤S18。在步骤S18中,确定是否已 经接受了结束指令。如果已经接受了结束指令,则终止语音控制处理;否则,处理返回至步 骤 SOl。图5是作为示例示出了关联表更新处理的流程的流程图。当CPUll执行语音控制 程序时,关联表更新处理由CPU 11来执行。参照图5,CPU 11确定是否已经输入了话音数 据。在输入话音数据之前,CPU 11处于待机状态(S21中的否),并且一旦输入了话音数据, 处理就前进至步骤S22。在步骤S22,对输入的话音数据进行话音识别,以便将输入的话音数据转换成作为 文本数据的字符串。在随后的步骤S23中,区别语音方法。例如,不管话音数据输入是“一 零零”还是“一百”,都将其转换成字符串“100”。然而,根据话音数据“一零零”,区别出将数 值作为各个单独数字说出的语音方法,而根据话音数据“一百”,区别处将数值作为整体数 字说出的语音方法。在步骤S24中,基于根据在步骤S22中语音识别的字符串而执行的处理,获取与该 字符串相对应的类型。例如,在要执行将字符串作为“地址”存储的处理的情况下,获取类 型“地址”。当要执行将字符串作为电话号码存储的处理时,获取类型“电话号码”。当要执 行将字符串作为道路信息存储的处理时,获取类型“道路信息”。当要执行将字符串作为两 个点之间的距离存储的处理时,获取类型“距离”。在步骤S25中,产生其中在步骤S24中获取的类型与步骤S23中区别的语音方法 相关联的关联记录。附加地,将所产生的关联纪录存储在EEPROM 37中存储的关联表83中 (步骤S26)。在用户输入用于数据登记的话音时,与话音输入的字符串的类型相关联地,将用 户用于说出字符串的语音方法进行存储。这允许与用户已经使用的语音方法相同的语音方 法来说出与用户所说的字符串相同类型的字符串。因此,可以以用户容易理解的方式来说 出字符串。如上所述,根据本发明的导航设备1预先将用户定义表81、关联表83、以及地域表 85存储在EEPROM 37中。基于从处理执行部53在执行处理时输出的数据和该数据的类型的集合,产生要作为话音输出的字符串。并且用与用户定义表81、关联表83、或地域表85 中的数据的类型相关联的语音方法,来说出所产生的字符串。因此,用针对数据类型而预定 的语音方法来说出字符串,从而可以以用户容易理解的方式来说出数值。在用户输入数据作为用于数据登记或其他目的的话音的情况下,识别话音,并且 区别出该话音的语音方法。然后产生关联记录,在该关联记录中,将根据要基于所识别的字 符串执行的处理而确定的类型与所区别的语音方法相关联,并且附加地将所产生的关联记 录存储在关联表83中。因此,可以用与用户所使用的语音方法相同的语音方法,来说出与 用户说出的字符串类型相同的字符串。尽管在上述实施例中描述了导航设备1作为语音设备的示例,但是语音设备可以 是具有话音合成功能的任何设备,可以是移动电话、诸如个人数字助理(PDA)等移动通信 终端、或个人计算机。此外,本发明当然可以被理解为用于使导航设备1执行图4或5所示的处理的语 音控制方法,或者用于使计算机执行语音控制方法的语音控制节目。应理解,这里公开的实施例是示意性的,并且在每个方面是非限制性的。本发明的 范围由权利要求项目来限定,而不是由上述说明书来限定,并且意在包括范围内的以及与 权利要求项目意义等同的任何修改。附录(1)根据权利要求1所述的语音设备,其中,所述处理执行装置执行导航处理。
权利要求
一种语音设备,包括语音装置,用于在给定字符串包括由多个数字组成的数值的情况下,用第一语音方法或第二语音方法说出所述数值,在所述第一语音方法中,逐一朗读所述数值的各个单独数字,在所述第二语音方法中,将所述数值作为整体数字朗读;关联装置,用于将字符串的类型与所述第一语音方法或所述第二语音方法相关联;处理执行装置,用于执行预定处理,以输出数据;以及语音控制装置,用于基于所输出的数据产生字符串,并且使所述语音装置用第一和第二语音方法中与所输出的数据的类型相关联的一个语音方法说出所产生的字符串。
2.根据权利要求1所述的语音设备,还包括 话音获取装置,用于获取话音;话音识别装置,用于识别获取的话音,以输出字符串;以及语音方法区别装置,用于在输出的字符串包括数值的情况下,区别第一和第二语音方 法中的一个;其中,所述处理执行装置执行基于正被输出的所述字符串的处理,以及 所述关联装置包括登记装置,用于将基于所述处理执行装置所执行的处理而确定的 所述字符串的类型与所述语音方法区别装置的区别结果相关联。
3.根据权利要求1所述的语音设备,其中,所述处理执行装置执行导航处理。
4.一种语音设备,包括语音装置,用于在给定字符串包括由多个数字组成的数值的情况下,用第一语音方法 或第二语音方法来说出数值,在所述第一语音方法中,逐一朗读所述数值的各个单独数字, 在所述第二语音方法中,将所述数值作为整体数字朗读;确定装置,用于基于字符串中包括的数值中数字的个数,来确定第一和第二语音方法 中的一个;以及语音控制装置,用于使所述语音装置用所确定的第一和第二语音方法中的一个来说出 所述数值。
5.一种存储有语音控制程序的计算机可读记录介质,所述程序使计算机执行以下步骤将第一语音方法或第二语音方法与字符串的类型相关联,在所述第一语音方法中,将 由多个数字组成的数值作为各个单独数字朗读,在第二语音方法中,将由多个数字组成的 数值作为整体数字朗读;通过执行预定处理,输出数据; 基于输出的数据产生字符串;以及用第一和第二语音方法中与输出的数据的类型相关联的一个语音方法来说出产生的 字符串。
6.根据权利要求5所述的存储有语音控制程序的计算机可读记录介质,其中,所述程 序使计算机还执行以下步骤获取话音;识别获取的话音,以输出字符串;以及在输出的字符串包括数值的情况下,区别第一和第二语音方法中的一个;其中,所述输出数据的步骤包括步骤执行基于正被输出的所述字符串的处理,以及 所述关联的步骤包括步骤将基于在所述输出数据的步骤中执行的处理而确定的所述 字符串的类型与在所述区别的步骤中的区别结果相关联。
7.根据权利要求5所述的存储有语音控制程序的计算机可读记录介质,其中,所述输 出数据的步骤包括执行导航处理的步骤。
8.一种存储有语音控制程序的计算机可读记录介质,所述程序使计算机执行以下步骤用第一语音方法说出由多个数字组成的数值,在第一语音方法中,逐一朗读所述数值 的各个单独数字;用第二语音方法说出由多个数字组成的数值,在第二语音方法中,将所述数值作为整 体数字朗读;基于字符串中包括的数值中数字的个数,来确定第一和第二语音方法中的一个;以及 在给定字符串包括由多个数字组成的数值的情况下,使得用所确定的第一和第二语音 方法中的一个来说出所述字符串。
9.一种语音控制方法,包括如下步骤将第一语音方法或第二语音方法与字符串的类型相关联,在所述第一语音方法中,将 由多个数字组成的数值作为各个单独数字朗读,在所述第二语音方法中,将由多个数字组 成的数值作为整体数字朗读;通过执行预定处理来输出数据; 基于输出的数据产生字符串;以及用第一和第二语音方法中与所输出的数据的类型相关联的一个语音方法来说出产生 的字符串。
10.根据权利要求9所述的语音控制方法,使计算机还执行以下步骤获取话音;识别获取的话音,以输出字符串;以及在输出的字符串包括数值的情况下,区别第一和第二语音方法中的一个; 其中,所述输出数据的步骤包括步骤执行基于正被输出的所述字符串的处理,以及 所述关联的步骤包括步骤将基于在所述输出数据的步骤中执行的处理而确定的所述 字符串的类型与所述区别的步骤中的区别结果相关联。
11.根据权利要求9所述的语音控制方法,其中,所述输出数据的步骤包括执行导航处 理的步骤。
12.—种语音控制方法,包括以下步骤用第一语音方法说出由多个数字组成的数值,在所述第一语音方法中,逐一朗读所述 数值的各个单独数字;用第二语音方法说出由多个数字组成的数值,在所述第二语音方法中,将所述数值作 为整体数字朗读;基于字符串中包括的数值中数字的个数,来确定第一和第二语音方法中的一个;以及 在给定字符串包括由多个数字组成的数值的情况下,使得用确定的第一和第二语音方 法中的一个,来说出所述字符串。
全文摘要
为了以用户容易理解的方式说出数值,一种语音设备包括话音合成部55,在给定字符串包括由多个数字组成的数值的情况下,用第一语音方法或第二语音方法说出数值,在第一语音方法中,逐一朗读数值的各个单独数字,在第二语音方法中,将数值作为整体数字朗读;用户定义表81、地域表84和数字个数表87,将字符串的类型与第一语音方法或第二语音方法相关联;处理执行部53,执行处理,以输出数据;以及语音控制部51,基于所输出数据产生字符串,并且使话音合成部55用第一和第二语音方法中的与所输出数据的类型相关联的语音说出所产生的字符串。
文档编号G10L13/08GK101981613SQ20098011085
公开日2011年2月23日 申请日期2009年2月4日 优先权日2008年3月31日
发明者大谷欣也, 广濑直树 申请人:三洋电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1