基于自然语音识别的导航方法和系统的制作方法

文档序号:7714745阅读:198来源:国知局
专利名称:基于自然语音识别的导航方法和系统的制作方法
技术领域
本发明涉及通信领域,尤其涉及一种基于自然语音识别的导航方法和系统。
背景技术
在现有技术中,用户一般采用手动控制的方法进行导航操作,例如用户手动点击导航设备的显示屏幕或者按键,通过显示屏幕或者按键输入导航目的地址,通过导航系统获取当前位置到导航目的地址的导航路线信息。然而,在用户驾驶车辆的过程中,手动操作需要转移视线到导航终端上,会分散用户的精力,使得用户驾驶车辆的危险性大大增强。为解决上述技术问题,现有技术公开了一些语音导航技术,对于不同的语言,语音导航技术所采用的语音识别方法各不相同,例如对于英文而言,句中的单词均由26个字母表中的字母构成,在进行语音导航服务时,语音导航系统需要对语句中的字母以及句子的语法结构进行识别,才能识别出语音信息对应的文本信息,从而根据该识别出的文本信息进行相关的导航服务操作。中文与英文最大的区别在于,中文汉字数量较大,目前,汉字的总数已经超过了 8 万,其中常用汉字大约有3500字左右,面对如此庞大的中文汉字库,传统的中文语音导航技术采用基于关键词的语音识别方法进行语音识别。语音导航系统需要将用户发送的语音内容从头到尾按字/词的方式与词表中预先存储的文本内容进行逐一匹配,只有语音内容与词表中存储的某条文本内容完全匹配时,语音导航系统才能识别出用户发送的语音内容的含义,成功进行语音识别,并根据识别出的内容进行相关的导航服务,否则,语音识别失败,语音导航系统无法为用户提供导航服务。然而,在实际的生活中,中文语言表述形式是多种多样的,对于同一事物每个人或者同一人在不同时期的表述各不相同,例如导航到“天安门广场”就有如下几种表述方式 请问到天安门广场怎么走;我想去天安门广场;从这里驾车到天安门怎么走;带我去天安门广场等等。为了提高语音导航系统的语音识别成功率与准确率,语音导航系统需要尽可能地将同一事物的所有表述形式均存储到词表中,这使得词表规模非常庞大,维护不方便, 并且由于词表规模庞大,使得语音导航系统进行语音识别的速度较慢,从而使得语音导航服务延迟较大,用户进行语音导航服务的服务体验较差。另外,由于人们的语言表述形式千差万别,随着时代的发展,语言表达方式也在不断更新,无法在词表中穷尽同一事物的所有表述形式,使得采用关键词方式进行语音识别的成功率较低,进而使得语音导航系统无法为用户提供正常的导航服务。在申请号为CN00130067. 9、CN03123123. 3以及CN03138149. 9等中国专利中公开
了与语音识别相关的技术方案,然而上述技术方案只能进行语音合成或者将语音转换成文字,而无法实现对语音转换成文字信息的识别,使得以上技术方案无法应用在语音导航技术中,实现语音导航服务;并且,上述技术方案是针对英文语音识别设计的,根据以上分析可知,英文语言和中文语言从词语数量以及语法特点上大不相同,使得上述技术方案即使应用在语音导航服务中也无法对中文进行有效的识别,语音识别的成功率较低;在申请号为CN99813093. 1的中国专利中,公开了一种采用语音识别和自然语言处理的交互式用户界面,虽然能够实现对语音转换成文字信息的识别,然而该技术方案也是针对英文语言设计的,在进行语音识别的过程中需要考虑语法等因素的影响,仍然无法有效地应用在中文语音导航服务中。

发明内容
为解决上述技术问题,本发明的实施例提供一种基于自然语音识别的导航方法和系统,能够提高中文语音识别速度,以及语音识别的成功率,进而提高语音导航服务的可靠性以及用户使用语音导航服务的服务体验。一种基于自然语音识别的导航系统,包括一键式控制装置、终端设备以及云计算平台服务器;所述一键式控制装置,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与所述终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与所述云计算平台服务器建立连接;所述终端设备,用于与所述一键式控制装置建立连接以后,通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立连接,接收用户发送的导航位置语音信息,将所述导航位置语音信息发送给所述云计算平台服务器,接收所述云计算平台服务器返回的包含导航目的地址的自动导航控制信息,根据该自动导航控制信息启动导航功能,与导航服务器建立连接,从所述导航服务器获取所述导航目的地址的导航结果,将该导航结果显示给所述用户;所述云计算平台服务器,位于网络侧,包括非特定人语音识别模块,用于对所述终端设备发送的导航位置语音信息进行识别、解析,获取该导航位置语音信息对应的文字信息;自然语音识别模块,用于采用预先设置的词典对所述非特定人语音识别模块获取的文字信息进行分词处理,获取所述文字信息包含的词语,根据所述文字信息包含的词语查找兴趣点POI数据库,获取与所述文字信息包含的词语匹配度最高的目标POI信息,其中,所述词典用于存储待进行语音识别的目标词语;通信模块,用于获取自然语音识别模块获取的目标POI信息对应的导航目的地址,将所述导航目的地址携带在自动导航控制信息中发送给所述终端设备。一种基于自然语音识别的导航方法,包括在用户按下一键式控制装置的启动按键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,所述一键式控制装置设置在车辆的固定部位上,直接或者通过短距离通信方式驱动所述终端设备与网络侧的云计算平台服务器建立连接;所述终端设备通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立语音会话连接;所述终端设备接收所述用户发送的导航位置语音信息,将所述导航位置语音信息发送给所述云计算平台服务器;所述云计算平台服务器采用非特定人语音识别技术对所述导航位置语音信息进行识别、解析,获取所述导航位置语音信息对应的文字信息;所述云计算平台服务器采用预先设置的词典对所述文字信息进行分词处理,获取所述文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;所述云计算平台服务器根据所述文字信息包含的词语查找POI数据库,从所述POI数据库中获取与所述文字信息包含的词语匹配度最高的目标POI信息;所述云计算平台服务器获取所述目标POI信息对应的导航目的地址,将该导航目的地址携带在自动导航控制信息中发送给所述终端设备;所述终端设备根据所述自动导航控制信息启动导航功能,与导航服务器建立连接,从所述导航服务器获取所述导航目的地址的导航结果, 将该结果显示给所述用户。本发明实施例提供的基于自然语音识别的导航方法和系统,用户按下设置在车辆方向盘上的一键式控制装置的启动键后,终端设备与云计算平台服务器建立语音会话连接,系统进行自动语音导航状态。当用户通过终端设备向云计算平台服务器发送导航位置语音信息时,云计算平台服务器可以先采用非特定人语音识别技术对导航位置语音信息进行识别解析,获取对应的文本信息,然后采用文字信息包含的词语进行信息匹配,将POI数据库中与文字信息包含的词语匹配度最高的POI信息作为对导航位置语音信息识别得到的目标POI信息,云计算平台服务器不需要对用户发送的导航位置语音信息进行完全匹配即可获得目标POI信息,提高了中文语音识别的成功率,进而提高了语音导航服务的可靠性以及用户使用语音导航服务的服务体验。解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低,致使语音导航服务的可靠性差,用户使用语音导航服务的服务体验不好的问题,由于本发明实施例提供的技术方案中云计算平台服务器采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在POI数据库中存储标准POI信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和POI数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢,致使语音导航服务系统延迟较大的问题。本发明实施例提供的技术方案中云计算平台服务器采用的自然语音识别技术不同于英文语音识别技术,该自然语音识别技术针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用对语句分词,并根据词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的基于自然语音识别的导航系统结构示意图一;图2为本发明实施例提供的基于自然语音识别的导航系统结构示意图二 ;图3为本发明实施例提供的基于自然语音识别的导航方法流程图一;图4为图3所示的本发明实施例提供的基于自然语音识别的导航方法步骤306的流程图一;图5为图3所示的本发明实施例提供的基于自然语音识别的导航方法步骤306的
流程图二 ;图6为本发明实施例提供的基于自然语音识别的导航方法流程图二。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为了解决现有技术的中文语音导航服务系统语音识别成功率较低的问题,本发明实施例提供一种基于自然语音识别的导航方法和系统。如图1所示,本发明实施例提供的基于自然语音识别的导航系统,包括一键式控制装置101、终端设备102以及云计算平台服务器103 ;—键式控制装置101,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与终端设备102建立连接,并通过直接或短距离通信方式驱动终端设备102与云计算平台服务器103建立连接;终端设备102,用于与一键式控制装置101建立连接以后,通过语音电话交换网络或多种无线数据网络与云计算平台服务器103建立连接,接收用户发送的导航位置语音信息,将导航位置语音信息发送给云计算平台服务器103,接收云计算平台服务器103返回的包含导航目的地址的自动导航控制信息,根据该自动导航控制信息启动导航功能,与导航服务器建立连接,从导航服务器获取所述导航目的地址的导航结果,将该导航结果显示给用户;云计算平台服务器103,位于网络侧,包括非特定人语音识别模块1031,用于对终端设备102发送的导航位置语音信息进行识别、解析,获取该导航位置语音信息对应的文字信息;自然语音识别模块1032,用于采用预先设置的词典对非特定人语音识别模块 1031获取的文字信息进行分词处理,获取该文字信息包含的词语,根据文字信息包含的词语查找兴趣点(Point of Interest, P0I)数据库,获取与文字信息包含的词语匹配度最高的目标POI信息,其中,词典用于存储待进行语音识别的目标词语;在本实施例中,词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地, 可以从POI数据库中存储的POI信息获取目标词语并形成词典。需要说明的是,不论是广义范围的词语还是狭义范围的词语,词典中的目标词语均是唯一的,各个目标词语之间不重复。为了减小词典中目标词语的冗余量,节省存储空间,提高语音识别的速度,本发明实施例优选地将词典中的目标词语设置为根据POI数据库设置的狭义范围词语,但不限于上述设置方式,本领域技术人员公知的是,对于该识别技术所应用的每个行业领域,所述行业的技术人员均可根据其行业特点,进行合理设置其POI数据库。在本实施例中,自然语音识别模块1032可以根据非特定人语音识别模块1031获取的文字信息查找词典,将文字信息中的字按照出现顺序与词典中包含的目标词语进行匹配,当查找到与目标词语完全匹配的词语时,将该词语从文字信息中分割出来,继续循环上述查找的动作,直到文字信息中的最后一个字为止,从而实现对文字信息的分词处理。需要说明的是,为了提高调用数据的速度,加快语音识别速度,优选地,在本实施例中,POI数据库以及词典均存储在云计算平台服务器103中(图1未示出)。进一步地,在本实施例中,自然语音识别模块1032可以通过两种方式从POI数据库中获取与文字信息包含的词语匹配度最高的目标POI信息,下面对这两种方式进行分别介绍1、权重系数判决法自然语音识别模块1032,具体用于如果词典还用于存储目标词语对应的权重等级 η以及权重等级范围N,根据词典获取文字信息包含的每个词语对应的权重等级,根据文字信息包含的词语查找POI数据库,从POI信息数据库中获取与文字信息包含的任意一个或多个词语匹配的POI信息组成的POI信息集合,根据文字信息包含的每个词语对应的权重等级,对POI信息集合中的每条POI信息分别进行处理,获取每条POI信息的权重系数,从 POI信息集合中选取权重系数最高的POI信息为目标POI信息,其中,η、Ν均为整数,N > 2, η e [1,N],第η级的目标词语在所述文字信息中的重要性要比第n+1级得目标词语在所述文字信息中的重要性大,当然,其重要性与权重等级η的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例。在本实施例中,自然语音识别模块1032可以采用加权平均算法获取每条信息的权重系数,当然也可以采用其他算法获取每条信息的权重信息,此处不作一一赘述。需要说明的是,为了保证自然语音识别模块1032获取的目标POI信息的准确性, 提高语音识别质量,在本实施例中,自然语音识别模块1032对文字信息分词之后的词语中应包含至少一个权重等级为1的词语,如果经分词处理以后,文字信息包含的词语中不存在权重等级为1的词语,则自然语音识别模块1032,还用于重新对文字信息进行分词处理, 获取至少一个权重等级为1的词语。进一步地,自然语音识别模块1032,还用于将上述获取的至少一个权重等级为1 的词语添加到词典中。需要说明的是,本发明实施例对权重等级高低的划分进行具体的举例,在实际的使用过程中还可以通过其他规则设置权重等级的高低属性,例如当权重等级范围为3时, 可以设置权重等级为3最高,权重等级为1最低,以上方法是本领域技术人员能够在不付出创造性劳动的前提下轻易联想到的,此处不再一一赘述。2、嵌套查找法自然语音识别模块1032,具体用于对文字信息包含的词语进行排序,按照排序的结果,从文字信息包含的词语中获取第一个待查找词语,从POI信息数据库中获取与第一个待查找词语匹配的POI信息,从文字信息包含的词语中获取第二个待查找词语,从与第一个待查找词语匹配的POI信息组成的POI信息集合中获取与第二个待查找词语匹配的 POI信息,以此类推,从文字信息包含的词语中获取最后一个待查找词语,从与所述最后一个待查找词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与最后一个待查找词语匹配的目标POI信息。在本实施例中,自然语音识别模块1032可以将词语按照在文字信息中出现的先后顺序进行排序,优选地,为了提高查找速度,自然语音识别模块1032可以先获取文字信息包含的词语中的关键词,然后将文字信息包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序。其中,关键词是具有专有指代意义的词语,后辅助词是文字信息中位于关键词之后的词语,前辅助词是文字信息中位于关键词之前的词语。在本实施例中,云计算平台服务器103(具体为自然语音识别模块103 可以预先设置关键词表,该关键词表可以根据POI数据库中存储的信息设置,自然语音识别模块 1032在获取文字信息包含的词语后,对所包含的每个词语分别查找关键词表,获取与关键词表中存储的关键词匹配的词语为文字信息包含的关键词。需要说明的是,如果经查找后获知文字信息包含的词语中不存在关键词,则自然语音识别模块1032按照词语在文字信息中出现的先后顺序进行排序;进一步地,如果经查找后获知文字信息中包含两个以上关键词,则后辅助词为文字信息包含的词语中第一个关键词以后的非关键词,自然语音识别模块1032仍然按照关键词、后辅助词以及前辅助词的顺序进行排序。自然语音识别模块1032通过将文字信息包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序,使得后续按照词语顺序进行查找匹配时,重点信息突出,能够大幅度的缩短词语查找匹配的时间,进行提高语音识别的速度。需要说明的是,如果自然语音识别模块1032未查找到与当前待查找词语匹配的信息,则可以将当前待查找词语的匹配信息设置为与该当前待查找词语相邻的上一个待查找词语匹配的信息,如果,当前待查找词语为第一个待查找词语,则该第一个待查找词语匹配的信息为整个POI数据库中包含的POI信息。为了使本领域技术人员能够对以上所述的嵌套查找法有更深刻的认识,下面通过具体的例子对嵌套查找法的具体实现进行说明例如当用户输入的导航位置语音信息经识别解析后获得的文字信息为北京石景山区八角东路小肥羊火锅店时,自然语音识别模块1032分词处理后获得的文字信息包含的词语可以为北京,石景山区,八角,东路,小肥羊,火锅店,如果小肥羊是关键词,则按照关键词、后辅助词和前辅助词排序为小肥羊;火锅店,北京,石景山区,八角,东路,当 POI数据库包括北京小肥羊超市,石景山区古城路小肥羊火锅店,北京东来顺火锅店,北京八角北路东来顺火锅店,北京八角小肥羊火锅店等信息时,按照上述嵌套查找法,首先, 自然语音识别模块1032从POI数据库中获取与“小肥羊”匹配的POI信息,形成第一 POI信息库,该第一 POI信息库包括北京小肥羊超市,石景山区古城路小肥羊火锅店,北京八角小肥羊火锅店,然后,从第一 POI信息库中获取与“火锅店”匹配的POI信息,形成第二 POI 信息库,该第二 POI信息库包括石景山区古城路小肥羊火锅店,北京八角小肥羊火锅店, 第三,从第二 POI信息库中获取与“北京”匹配的POI信息,形成第三POI信息库,该第三POI 信息库包括北京八角小肥羊火锅店;第四,从第三POI信息库中获取与“八角”匹配的POI 信息,形成第四POI信息库,该第四POI信息库包括北京八角小肥羊火锅店,第五,从第四 POI信息库中获取与“东路”匹配的目标POI信息,由于第四POI信息库中没有与“东路”匹配的POI信息,所以目标POI信息为第四POI信息库中包含的POI信息,即北京八角小肥羊火锅店。通过以上所述的权重系数判决法以及嵌套查找法,自然语音识别模块1032能够准确地查找到与文本信息包含的词语匹配度最高的目标POI信息,实现对用户输入的语音信息的识别。当然,在实际的使用过程中,自然语音识别模块1032还可以采用其他方式获取与文本信息包含的词语匹配度最高的目标POI信息,此处不作一一赘述。通信模块1033,用于获取自然语音识别模块1032获取的目标POI信息对应的导航目的地址,将该导航目的地址携带在自动导航控制信息中发送给终端设备102。进一步地,如果自然语音识别模块1032选取了两条以上目标POI信息,为了提高语音识别的准确定,如图1所示,终端设备102,还可以用于接收云计算平台服务器103发送的两条以上目标POI信息,将该两条以上目标POI信息显示给用户,接收用户根据所述两条以上目标POI信息发送的POI信息选取指示,将POI信息选取指示发送给云计算平台服务器 103 ;具体地,终端设备102可以接收用户通过语音或者按键或者文字输入等方式发送的POI信息选取指示。需要说明的是,如果用户通过语音方式发送POI信息选取指示,则云计算平台服务器103需要采用非特定人语音识别模块1031对该POI信息选取指示进行识别、解析,获取对应的控制指令。云计算平台服务器103,还可以用于如果自然语音识别模块1032查找到两条以上目标POI信息,所述通信模块将所述两条以上目标POI信息发送给终端设备102,接收终端设备102返回的POI信息选取指示,根据该POI信息选取指示从两条以上目标POI信息中选取优选目标POI信息,并获取该优选目标POI信息对应的导航目的地址。或者,如图2所示,云计算平台服务器103,还包括统计模块1034,用于导航数据进行统计,保存导航数据统计结果;在本实施例中,统计模块1034可以对用户每次进行语音识别的POI信息进行统计,该统计可以是针对特定用户个人的,也可以是针对特定用户群体的。进一步地,该语音识别统计数据可以是对用户的一个或者多个目标POI信息进行语音识别的次数或者频率统计的结果,也可以是对多个用户最后一次进行语音识别的目标POI信息的统计结果,当然还可以为其他与语音识别相关的统计结果,此处不作一一赘述。通信模块1033,还可以用于如果自然语音识别模块1032查找到两条以上目标POI 信息,从统计模块1034获取导航数据统计结果,根据该导航数据统计结果从两条以上目标 POI信息中选取优选目标POI信息,并获取该优选目标POI信息对应的导航目的地址。例如当导航数据统计结果为对用户的多个目标POI信息进行语音识别的次数进行统计的结果时,如果用户输入的导航位置语音信息对应的文本信息为小肥羊火锅店,自然语音识别模块1032获取了 3条目标POI信息,包括海淀区小肥羊火锅店,海淀区中关村小肥羊火锅店,石景山八角东路小肥羊火锅店时,通信模块1033可以获取所述3条目标 POI信息对应的语音识别统计数据导航数据统计结果,如“海淀区小肥羊火锅店”进行语音识别3次,“海淀区中关村小肥羊火锅店”进行语音识别5次,“石景山八角东路小肥羊火锅店”进行语音识别40次,则通信模块1033可以根据统计结果,从3条目标POI信息中选取 “石景山八角东路小肥羊火锅店”为优选目标POI信息。可选地,为了进一步缩短语音识别的时间,提高语音识别速度,在本实施例中,自然语音识别模块1032,还可以用于根据文字信息包含的词语查找口语词库,根据查找结果, 从文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,口语词中不包括涉及到用户输入的导航位置语音信息中具有实质性含义的文字信息。在本实施例中,可以采用统计的方法预先设置口语词库,该口语词库中可以包括人们日常使用的口语词,例如“我想去”、“我想要”、“请问”、“是不是”、“对不对”、“可不可以”以及“怎么”等等,此处不对口语词库中包含的口语词进行一一赘述。本发明实施例提供的基于自然语音识别的导航系统,用户按下设置在车辆方向盘上的一键式控制装置的启动键后,终端设备与云计算平台服务器建立语音会话连接,系统进行自动语音导航状态。当用户通过终端设备向云计算平台服务器发送导航位置语音信息时,云计算平台服务器可以先采用非特定人语音识别技术对导航位置语音信息进行识别解析,获取对应的文本信息,然后采用文字信息包含的词语进行信息匹配,将POI数据库中与文字信息包含的词语匹配度最高的POI信息作为对导航位置语音信息识别得到的目标POI 信息,云计算平台服务器不需要对用户发送的导航位置语音信息进行完全匹配即可获得目标POI信息,提高了中文语音识别的成功率,进而提高了语音导航服务的可靠性以及用户使用语音导航服务的服务体验。解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低,致使语音导航服务的可靠性差,用户使用语音导航服务的服务体验不好的问题,由于本发明实施例提供的技术方案中云计算平台服务器采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在POI数据库中存储标准POI信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和POI数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢,致使语音导航服务系统延迟较大的问题。本发明实施例提供的技术方案中云计算平台服务器采用的自然语音识别技术不同于英文语音识别技术,该自然语音识别技术针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用对语句分词,并根据词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高
如图3所示,本发明实施例还提供一种基于自然语音识别的导航方法,包括步骤301,在用户按下一键式控制装置的启动按键以后,一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,一键式控制装置设置在车辆的固定部位上, 直接或者通过短距离通信方式驱动终端设备与网络侧的云计算平台服务器建立连接;步骤302,终端设备通过语音电话交换网络或多种无线数据网络与云计算平台服务器建立语音会话连接;步骤303,终端设备接收用户发送的导航位置语音信息,将导航位置语音信息发送给云计算平台服务器;步骤304,云计算平台服务器采用非特定人语音识别技术对导航位置语音信息进行识别、解析,获取导航位置语音信息对应的文字信息;步骤305,云计算平台服务器采用预先设置的词典对文字信息进行分词处理,获取文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;步骤306,云计算平台服务器根据文字信息包含的词语查找POI数据库,从POI数据库中获取与文字信息包含的词语匹配度最高的目标POI信息;步骤307,云计算平台服务器获取目标POI信息对应的导航目的地址,将该导航目的地址携带在自动导航控制信息中发送给终端设备;步骤308,终端设备根据自动导航控制信息启动导航功能,与导航服务器建立连接,从导航服务器获取导航目的地址的导航结果,将该结果显示给用户。进一步地,本发明实施例提供的基于自然语音识别的导航方法还可以包括如果词典还用于存储目标词语对应的权重等级η以及权重等级范围N,云计算平台服务器根据所述词典获取文字信息包含的每个词语对应的权重等级,其中,n、N均为整数,N ^ 2, η e [1,N],第η级的目标词语在所述文字信息中的重要性要比第n+1级得目标词语在文字信息中的重要性大;则如图4所示,步骤306可以包括步骤3061,云计算平台服务器根据文字信息包含的词语查找POI数据库,从POI数据库中获取与文字信息包含的任意一个或多个词语匹配的POI信息组成的POI信息集合;步骤3062,云计算平台服务器根据文字信息包含的每个词语对应的权重等级,对 POI信息集合中的每条POI信息分别进行处理,获取每条POI信息的权重系数;步骤3063,云计算平台服务器从POI信息集合中选取权重系数最高的POI信息为目标POI信息。进一步地,为了提高语音识别的准确性,本发明实施例提供的基于自然语音识别的导航方法还可以包括如果文字信息包含的词语中不存在权重等级为1的词语,云计算平台服务器重新对文字信息进行分词处理,获取至少一个权重等级为1的词语。在此基础上,本发明实施例提供的基于自然语音识别的导航方法还可以包括云计算平台服务器将至少一个权重等级为1的词语添加到词典中。进一步地,如图5所示,步骤306可以包括步骤3064,云计算平台服务器对,文字信息包含的词语进行排序;具体地,步骤3064可以包括云计算平台服务器获取文字信息包含的词语中的关键词;云计算平台服务器将文字信息包含的词语按照关键词、后辅助词以及前辅助词的顺序进行排序;其中,后辅助词为所述文字信息中位于关键词之后的词语,前辅助词为所述文字信息中位于关键词之前的词语。需要说明的是,如果文字信息包含的词语中有两个以上关键词,后辅助词为文字信息包含的词语中第一个关键词以后的非关键词。步骤3065,云计算平台服务器按照排序的结果,从文字信息包含的词语中获取第一个待查找词语,从POI数据库中获取与第一个待查找词语匹配的POI信息;步骤3066,云计算平台服务器从,文字信息包含的词语中获取第二个待查找词语, 从与第一个待查找词语匹配的POI信息组成的POI信息集合中获取与第二个待查找词语匹配的POI信息;以此类推,步骤3067,云计算平台服务器从文字信息包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与最后一个待查找词语匹配的目标POI信息。进一步地,如果在步骤306中云计算平台服务器查找到两条以上目标POI信息,本发明实施例提供的基于自然语音识别的导航方法还可以包括云计算平台服务器向终端设备发送两条以上目标POI信息;终端设备将两条以上目标POI信息显示给用户,接收用户根据两条以上目标POI信息发送的POI信息选取指示;终端设备将POI信息选取指示发送给云计算平台服务器;云计算平台服务器根据POI信息选取指示从两条以上目标POI信息中选取优选目标POI信息,并获取该优选目标POI信息对应的导航目的地址。或者,本发明实施例提供的基于自然语音识别的导航方法还可以包括云计算平台服务器获取导航数据统计结果;云计算平台服务器根据导航数据统计结果从所述两条以上目标POI信息中选取优选目标POI信息。可选地,为了进一步提高云计算平台服务器进行语音识别的速度,如图6所示,在步骤305之后,步骤306之前,还可以包括步骤309,云计算平台服务器根据文字信息包含的词语查找口语词库,根据查找结果,从文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,口语词中不包括涉及到所述用户输入的语音信息中具有实质性含义的文字信息。本发明实施例提供的基于自然语音识别的导航方法的具体实现过程可以参见本发明实施例提供的基于自然语音识别的导航系统所述,此处不再赘述。本发明实施例提供的基于自然语音识别的导航方法,用户按下设置在车辆方向盘上的一键式控制装置的启动键后,终端设备与云计算平台服务器建立语音会话连接,系统进行自动语音导航状态。当用户通过终端设备向云计算平台服务器发送导航位置语音信息时,云计算平台服务器可以先采用非特定人语音识别技术对导航位置语音信息进行识别解析,获取对应的文本信息,然后采用文字信息包含的词语进行信息匹配,将POI数据库中与文字信息包含的词语匹配度最高的POI信息作为对导航位置语音信息识别得到的目标POI 信息,云计算平台服务器不需要对用户发送的导航位置语音信息进行完全匹配即可获得目标POI信息,提高了中文语音识别的成功率,进而提高了语音导航服务的可靠性以及用户使用语音导航服务的服务体验。解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低,致使语音导航服务的可靠性差,用户使用语音导航服务的服务体验不好的问题,由于本发明实施例提供的技术方案中云计算平台服务器采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在POI数据库中存储标准POI信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和POI数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢,致使语音导航服务系统延迟较大的问题。本发明实施例提供的技术方案中云计算平台服务器采用的自然语音识别技术不同于英文语音识别技术,该自然语音识别技术针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用对语句分词,并根据词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高。本发明实施例提供的基于自然语音识别的导航方法和系统,可以应用在导航领域中。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种基于自然语音识别的导航系统,其特征在于,包括一键式控制装置、终端设备以及云计算平台服务器;所述一键式控制装置,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与所述终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与所述云计算平台服务器建立连接;所述终端设备,用于与所述一键式控制装置建立连接以后,通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立连接,接收用户发送的导航位置语音信息,将所述导航位置语音信息发送给所述云计算平台服务器,接收所述云计算平台服务器返回的包含导航目的地址的自动导航控制信息,根据该自动导航控制信息启动导航功能, 与导航服务器建立连接,从所述导航服务器获取所述导航目的地址的导航结果,将该导航结果显示给所述用户;所述云计算平台服务器,位于网络侧,包括非特定人语音识别模块,用于对所述终端设备发送的导航位置语音信息进行识别、解析,获取该导航位置语音信息对应的文字信息;自然语音识别模块,用于采用预先设置的词典对所述非特定人语音识别模块获取的文字信息进行分词处理,获取所述文字信息包含的词语,根据所述文字信息包含的词语查找兴趣点POI数据库,获取与所述文字信息包含的词语匹配度最高的目标POI信息,其中,所述词典用于存储待进行语音识别的目标词语;通信模块,用于获取自然语音识别模块获取的目标POI信息对应的导航目的地址,将所述导航目的地址携带在自动导航控制信息中发送给所述终端设备。
2.根据权利要求1所述的系统,其特征在于,所述自然语音识别模块,具体用于如果所述词典还用于存储所述目标词语对应的权重等级η以及权重等级范围N,根据所述词典获取所述文字信息包含的每个词语对应的权重等级,根据所述文字信息包含的词语查找POI 数据库,从所述POI信息数据库中获取与所述文字信息包含的任意一个或多个词语匹配的 POI信息组成的POI信息集合,根据所述文字信息包含的每个词语对应的权重等级,对所述 POI信息集合中的每条POI信息分别进行处理,获取每条POI信息的权重系数,从所述POI 信息集合中选取权重系数最高的POI信息为目标POI信息,其中,n、N均为整数,N ^ 2, η e [1,N],第η级的目标词语在所述文字信息中的重要性要比第n+1级得目标词语在所述文字信息中的重要性大。
3.根据权利要求2所述的系统,其特征在于,所述自然语音识别模块,还用于如果所述文字信息包含的词语中不存在权重等级为1的词语,重新对所述文字信息进行分词处理, 获取至少一个权重等级为1的词语。
4.根据权利要求3所述的系统,其特征在于,所述自然语音识别模块,还用于将所述至少一个权重等级为1的词语添加到所述词典中。
5.根据权利要求1所述的系统,其特征在于,所述自然语音识别模块,具体用于对所述文字信息包含的词语进行排序,按照所述排序的结果,从所述文字信息包含的词语中获取第一个待查找词语,从所述POI信息数据库中获取与所述第一个待查找词语匹配的POI信息,从所述文字信息包含的词语中获取第二个待查找词语,从所述与第一个待查找词语匹配的POI信息组成的POI信息集合中获取与所述第二个待查找词语匹配的POI信息,以此类推,从所述文字信息包含的词语中获取最后一个待查找词语,从与所述最后一个待查找词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与所述最后一个待查找词语匹配的目标POI信息。
6.根据权利要求5所述的系统,其特征在于,所述自然语音识别模块,具体用于获取所述文字信息包含的词语中的关键词,将所述文字信息包含的词语按照关键词、后辅助词以及前辅助词的顺序进行排序,其中,后辅助词为所述文字信息中位于关键词之后的词语,前辅助词为所述文字信息中位于关键词之前的词语。
7.根据权利要求1所述的系统,其特征在于,所述自然语音识别模块,还用于根据所述文字信息包含的词语查找口语词库,根据查找结果,从所述文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,所述口语词中不包括涉及到所述用户输入的导航位置语音信息中具有实质性含义的文字信息。
8.根据权利要求1所述的系统,其特征在于,所述终端设备,还用于接收所述云计算平台服务器发送的两条以上目标POI信息,将所述两条以上目标POI信息显示给所述用户,接收用户根据所述两条以上目标POI信息发送的POI信息选取指示,将所述POI信息选取指示发送给所述云计算平台服务器;所述云计算平台服务器,还用于如果自然语音识别模块查找到两条以上目标POI信息,所述通信模块将所述两条以上目标POI信息发送给所述终端设备,接收所述终端设备返回的POI信息选取指示,根据该POI信息选取指示从所述两条以上目标POI信息中选取优选目标POI信息,并获取该优选目标POI信息对应的导航目的地址。
9.根据权利要求1所述的系统,其特征在于,所述云计算平台服务器,还包括 统计模块,用于导航数据进行统计,保存导航数据统计结果;所述通信模块,还用于如果所述自然语音识别模块查找到两条以上目标POI信息,从所述统计模块获取导航数据统计结果,根据该导航数据统计结果从所述两条以上目标POI 信息中选取优选目标POI信息,并获取该优选目标POI信息对应的导航目的地址。
10.一种基于自然语音识别的导航方法,其特征在于,包括在用户按下一键式控制装置的启动按键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,所述一键式控制装置设置在车辆的固定部位上,直接或者通过短距离通信方式驱动所述终端设备与网络侧的云计算平台服务器建立连接;所述终端设备通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立语音会话连接;所述终端设备接收所述用户发送的导航位置语音信息,将所述导航位置语音信息发送给所述云计算平台服务器;所述云计算平台服务器采用非特定人语音识别技术对所述导航位置语音信息进行识别、解析,获取所述导航位置语音信息对应的文字信息;所述云计算平台服务器采用预先设置的词典对所述文字信息进行分词处理,获取所述文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;所述云计算平台服务器根据所述文字信息包含的词语查找POI数据库,从所述POI数据库中获取与所述文字信息包含的词语匹配度最高的目标POI信息;所述云计算平台服务器获取所述目标POI信息对应的导航目的地址,将该导航目的地址携带在自动导航控制信息中发送给所述终端设备;所述终端设备根据所述自动导航控制信息启动导航功能,与导航服务器建立连接,从所述导航服务器获取所述导航目的地址的导航结果,将该结果显示给所述用户。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括如果所述词典还用于存储所述目标词语对应的权重等级η以及权重等级范围N,所述云计算平台服务器根据所述词典获取所述文字信息包含的每个词语对应的权重等级,其中,n、N均为整数,N彡2,η e [1,N],第η级的目标词语在所述文字信息中的重要性要比第η+1级得目标词语在所述文字信息中的重要性大;则所述云计算平台服务器根据所述文字信息包含的词语查找POI数据库,从所述POI 数据库中获取与所述文字信息包含的词语匹配度最高的目标POI信息包括所述云计算平台服务器根据所述文字信息包含的词语查找POI数据库,从所述POI数据库中获取与所述文字信息包含的任意一个或多个词语匹配的POI信息组成的POI信息集合;所述云计算平台服务器根据所述文字信息包含的每个词语对应的权重等级,对所述 POI信息集合中的每条POI信息分别进行处理,获取每条POI信息的权重系数;所述云计算平台服务器从所述POI信息集合中选取权重系数最高的POI信息为目标 POI信息。
12.根据权利要求11所述的方法,其特征在,所述方法还包括如果所述文字信息包含的词语中不存在权重等级为1的词语,所述云计算平台服务器重新对所述文字信息进行分词处理,获取至少一个权重等级为1的词语。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括所述云计算平台服务器将所述至少一个权重等级为1的词语添加到所述词典中。
14.根据权利要求10所述的方法,其特征在于,所述云计算平台服务器根据所述文字信息包含的词语查找POI数据库,从所述POI数据库中获取与所述文字信息包含的词语匹配度最高的目标POI信息包括所述云计算平台服务器对所述文字信息包含的词语进行排序; 所述云计算平台服务器按照所述排序的结果,从所述文字信息包含的词语中获取第一个待查找词语,从所述POI数据库中获取与所述第一个待查找词语匹配的POI信息;所述云计算平台服务器从所述文字信息包含的词语中获取第二个待查找词语,从所述与第一个待查找词语匹配的POI信息组成的POI信息集合中获取与所述第二个待查找词语匹配的POI信息;以此类推,所述云计算平台服务器从所述文字信息包含的词语中获取最后一个待查找词语,从与所述最后一个待查找词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与所述最后一个待查找词语匹配的目标POI信息。
15.根据权利要求14所述的方法,其特征在于,所述云计算平台服务器对所述文字信息包含的词语进行排序包括所述云计算平台服务器获取所述文字信息包含的词语中的关键词; 所述云计算平台服务器将所述文字信息包含的词语按照关键词、后辅助词以及前辅助词的顺序进行排序;其中,后辅助词为所述文字信息中位于关键词之后的词语,前辅助词为所述文字信息中位于关键词之前的词语。
16.根据权利要求15所述的方法,其特征在于,如果所述文字信息包含的词语中有两个以上关键词,所述后辅助词为所述文字信息包含的词语中第一个关键词以后的非关键词。
17.根据权利要求10所述的方法,其特征在于,所述方法还包括所述云计算平台服务器根据所述文字信息包含的词语查找口语词库,根据查找结果, 从所述文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,所述口语词中不包括涉及到所述用户输入的导航位置语音信息中具有实质性含义的文字信息。
18.根据权利要求10所述的方法,其特征在于,所述方法还包括如果所述云计算平台服务器查找到两条以上目标POI信息,所述云计算平台服务器向所述终端设备发送所述两条以上目标POI信息;所述终端设备将所述两条以上目标POI信息显示给所述用户,接收所述用户根据所述两条以上目标POI信息发送的POI信息选取指示;所述终端设备将所述POI信息选取指示发送给所述云计算平台服务器;所述云计算平台服务器根据所述POI信息选取指示从所述两条以上目标POI信息中选取优选目标POI信息,并获取该优选目标POI信息对应的导航目的地址。
19.根据权利要求10所述的方法,其特征在于,所述方法还包括如果所述云计算平台服务器查找到两条以上目标POI信息,所述云计算平台服务器获取导航数据统计结果;所述云计算平台服务器根据所述导航数据统计结果从所述两条以上目标POI信息中选取优选目标POI信息。
全文摘要
本发明公开一种基于自然语音识别的导航方法和系统,涉及通信领域。只需按动一键,便可以通过终端设备连接到网络侧的云计算平台服务器,通过云计算平台服务器进行语音导航。其中,云计算平台服务器采用非特定人语音识别技术以及自然语音识别技术对用户输入的导航位置语音信息进行语音识别,获取用户进行导航的目的地址,并将该导航目的地址通过自动导航控制信息发送给终端设备,以使得终端设备根据该自动导航控制信息自动启动导航功能,从导航服务器获取导航目的地址的导航结果,并将该结果显示给用户。本发明实施例提供的技术方案可以应用在语音导航系统中。
文档编号H04L29/08GK102322866SQ201110185490
公开日2012年1月18日 申请日期2011年7月4日 优先权日2011年7月4日
发明者庞泽耀, 沈嘉鑫, 王力劭, 王力勃, 许军 申请人:深圳市子栋科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1