语音识别方法和装置的制作方法

文档序号:6373363阅读:231来源:国知局
专利名称:语音识别方法和装置的制作方法
技术领域
本发明涉及语音识别技术,尤其涉及一种语音识别方法和装置。
背景技术
随着计算机与信息技术的持续发展,语音交互已经成为人机交互的必要手段。作为语音交互的重要技术之一,语音识别技术经过近半个世纪的发展,已日趋成熟,并得到广泛的应用。由于中文汉字和词汇的数量较大,为了提高汉语语音识别系统的准确率,传统的语音识别系统需要将用户发送的语音内容从头到尾按字/词的方式与文本库中预先存储的文本内容进行逐一匹配,只有语音内容与文本库中存储的某条文本内容完全匹配时,语音识别系统才能识别出用户发送的语音内容的含义,成功进行语音识别,否则,语音识别失败。然而,在实际的生活中,语言表述形式是多种多样的,对于同一事物每个人或者同一人在不同时期的表述各不相同,以问路为例,问路的表述方式既可以为“请问西直门怎么走”,也可以为“请问到西直门怎么走”,还可以为“西直门怎么走”、“怎么去西直门”等。为了提高语音识别的成功率与准确率,需要尽可能地将不同事物的所有表述形式均存储到语音识别系统的文本库中,这使得语音识别系统的文本库规模非常庞大,维护不方便;并且由于文本库规模庞大,使得语音识别系统进行语音识别的速度较慢
发明内容

为解决上述技术问题,本发明实施例提供一种语音识别方法和装置,能够提高语音识别的速度。一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的文字信息;采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,所述目标信息数据库用于存储待进行语音识别的信息,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标信息确定所述语音信息的内容。另一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的文字信息;采用预设的词典和负载库对所述文字信息进行分词处理,获取所述词典对应的目标词语,所述词典用于存储待进行语音识别的词语,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息,所述目标信息数据库用于存储待进行语音识别的信息;根据所述目标信息确定所述语音信息的内容。又一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的拼音;采用预设的目标信息数据库和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息;根据所述词语拼音串从所述目标信息数据库中获取对应的目标信息;根据所述目标信息确定所述语音信息的内容。再一方面,提供一种语音识别方法,包括获取用户输入的语音信息对应的拼音;采用预设的词典和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息;根据所述词语拼音串从所述词典中获取对应的目标词语;根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;根据所述目标信息确定所述语音信息的内容。 一方面,提供一种语音识别装置,包括文字获取单元,用于获取用户输入的语音信息对应的文字信息;分词单元,用于采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。另一方面,提供一种语音识别装置,包括文字获取单元,用于获取用户输入的语音信息对应的文字信息;分词单元,用于采用预设的词典和负载库对所述文字信息进行分词处理,获取所词典对应的目标词语;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息;目标信息获取单元,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息,所述目标信息数据库用于存储待进行语音识别的信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。又一方面,提供一种语音识别装置,包括拼音获取单元,用于获取用户输入的语音信息对应的拼音;分词单元,用于采用预设的目标信息数据库和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息;目标信息获取单元,用于根据所述词语拼音串从所述目标信息数据库中获取对应的目标信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。再一方面,提供一种语音识别装置,包括拼音获取单元,用于获取用户输入的语音信息对应的拼音;分词单元,用于采用预设的词典和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息;目标词语获取单元,用于根据所述词语拼音串从所述词典中获取对应的目标词语;目标信息获取单元,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;内容确定单元,用于根据所述目标信息确定所述语音信息的内容。
本发明实施例提供的语音识别方法和装置,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本发明实施例一提供的语音识别方法的流程图;图2为本发明实施例二提供的语音识别方法的流程图;图3为本发明实施例三提供的语音识别方法的流程图;图4为本发明实施例四提供的语音识别方法的流程图;图5为本发明实施例五提供的语音识别方法的流程图;图6为本发明实施例六提供的语音识别方法的流程图;图7为本发明实施例七提供的语音识别装置的结构示意图一;图8为图7所示的语音识别装置中分词单元的结构示意图;图9为图7所示的语音识别装置的结构示意图二 ;图10为本发明实施例八提供的语音识别装置的结构示意图;图11为本发明实施例九提供的语音识别装置的结构示意图;图12为本发明实施例十提供的语音识别装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为了解决现有技术语音识别速度慢的问题,本发明实施例提供一种语音识别方法和装置。实施例一
如图I所示,本发明实施例提供的语音识别方法,包括步骤101,获取用户输入的语音信息对应的文字信息。为了使本发明实施例提供的语音识别方法适用范围更广,能够识别出不同地域、不同口音的用户语音信息,在本实施例中,步骤101可以采用非特定人语音识别技术对用户输入的语音信息进行识别、解析,获取该语音信息对应的文字信息。步骤102,采用预设的目标信息数据库和负载库对文字信息进行分词处理,获取目标信息数据库对应的目标信息。在本实施例中,步骤102中预设的目标信息数据库用于存储待进行语音识别的信息,可以包括地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如如果本发明实 施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。在本实施例中,步骤102中负载库用于存储除具有实质含义的词语外的信息。具体的,可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不再对负载库中包含的除具有实质含义的词语外的信息进行一一赘述。在本实施例中,步骤102采用预设的目标信息数据库和负载库对文字信息进行分词处理,具体可以将步骤101获取的文字信息与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库中的信息完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。还可以通过其他方式对文字信息进行分词处理,在此不再一一赘述。步骤103,根据该目标信息确定语音信息的内容。可选的,为了使本发明实施例提供的语音识别方法可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例二 如图2所示,本发明实施例提供的语音识别方法,包括步骤201,获取用户输入的语音信息对应的文字信息;具体信息与图I所示的步骤101相似,在此不再—赘述。步骤202,将文字信息中分别与目标信息数据库和负载库中包含的信息进行匹配。在本实施例中,步骤202可以将文字信息中的字按照先后顺序分别与目标信息数据库和负载库中包含的信息进行匹配;也可以将文字信息中的字按照从后往前的顺序分别与目标信息数据库和负载库中包含的信息进行匹配;还可以通过其他方式分别与目标信息 数据库和负载库中的信息进行匹配,在此不再一一赘述。可选的,为了缩小匹配范围、提高匹配速度,步骤202还可以包括将文字信息中的字按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合;将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。其中,句式库用于存储由负载库中的信息组成的句式。在本实施例中,根据预设句式库获取第一匹配信息的关联信息集合的具体过程可以包括根据第一匹配信息查找句式库,从该句式库中获取第一匹配信息对应的句式集合;根据该句式集合获取相应的关联信息集合。还可以通过其他方式根据预设的句式库获取第一匹配信息的关联信息集合,在此不再赘述。在本实施例中,句式库中存储的句式可以是广义范围的句式,具体的,可以从日常生活和工作中能够接触到的信息中获取句式并形成句式库,例如可以从每天的新闻报道的信息中提取句式,形成句式库。由于语音识别技术一般是在特定领域中使用的,例如应用在导航、影音娱乐等领域,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将句式库中存储的句式设置为狭义范围的句式,例如如果本发明提供的语音识别方法应用在导航领域中,句式库可以具体用于存储导航相关的句式,并且负载库用于存储句式库中的信息。句式库不限于上述设置方式,本领域技术人员公知的是,对于该语音识别技术所应用的每个行业领域,所属行业的技术人员均可以根据其行业特点进行合理设置其句式。在本实施例中,步骤202中预设的目标信息数据库用于存储待进行语音识别的信息,可以包括地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。在本实施例中,步骤202中负载库用于存储除具有实质含义的词语外的信息。可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不对负载库中包含的除具有实质含义的词语外的信息进行赘述。特别的,步骤202可以包括获取目标信息数据库和负载库中包含的信息的使用频率;根据该使用频率将目标信息数据库和负载库中包含的信息进行排列;将文字信息分别与排列后的信息依次进行匹配。通过上述过程将分词处理过程与用户使用频率联系起来,可以增加识别结果和用户意图之间的对应概率。步骤203,获取与目标信息数据库中的信息完全匹配的匹配信息。在本实施例中,通过步骤203获取的匹配信息,可以为一个,也可以为多个,在此不作限制。步骤204,将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信
肩、O步骤205,根据目标信息确定语音信息的内容;与图I所示的步骤103相似,再次
不再一一赘述。在本实施例中,通过句式库首先确定关联信息集合后再进行匹配,可以使匹配信息后的字无需对整个负载库和目标信息数据库进行匹配,从而缩小匹配范围,提高匹配速度和准确率。在本实施例中,通过句式库确定关联信息集合并匹配后,可以直接获取对应的目标信息后,根据该目标信息确定语音信息的内容;为了更准确的确定语音信息的内容,也可以在获取对应的目标信息后,根据该目标信息和相应的句式确定语音信息的内容。可选的,为了使本发明实施例提供的语音识别方法可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例三如图3所示,本发明实施例提供的语音识别方法,包括步骤301至步骤302,获取语音信息对应的文字信息包含的词语,并获取对应的目标信息;具体过程与图I所示的步骤101至步骤102相似,在此不再一一赘述。步骤303,如果获取到至少两条目标信息,获取目标信息之间的连接词语。步骤304,根据目标信息和连接词语确定语音信息的内容。可选的,为了使本发明实施例提供的语音识别方法可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的 目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例四如图4所示,本发明实施例提供的语音识别方法,包括步骤401,获取对应的文字信息;具体过程与图I所示的步骤101相似,在此不再
--赘述。步骤402,采用预设的词典和负载库对文字信息进行分词处理,获取词典对应的目标词语。在本实施例中,词典用于存储待进行语音识别的词语,该词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地,可以从目标信息数据库中存储的信息获取目标词语并形成词典。需要说明的是,不论是广义范围的词语还是狭义范围的词语,词典中的目标词语均是唯一的,各个目标词语之间不重复。由于语音识别技术一般是在特定领域中使用的,例如应用在导航、点歌或者查找联系人等领域,为了减小词典中目标词语的冗余量,节省存储空间,提高语音识别的速度,本发明实施例优选地将词典中的目标词语设置为根据目标信息数据库设置的狭义范围词语,但不限于上述设置方式,本领域技术人员公知的是,对于该识别技术所应用的每个行业领域,所属行业的技术人员均可根据其行业特点,进行合理设置其目标信息数据库。在本实施例中,步骤402中负载库用于存储除具有实质含义的词语外的信息。可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不对负载库中包含的语音信息中除具有实质含义的词语外的信息进行一一赘述。特别的,采用预设的词典和负载库对文字信息进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。步骤403,根据目标词语查找目标信息数据库,从该目标信息数据库中获取与目标词语匹配度最高的目标信息。
在本实施例中,步骤403可以通过两种方法从目标信息数据库中获取与目标词语匹配度最高的目标信息,下面对这两种方法进行分别介绍I、权重系数判决法在本实施例中,如果词典还用于存储目标词语中包含的词语对应的权重等级n以及权重等级范围N,n、N均为整数,N彡2,n G [1,扣,第11级的目标词语在文字信息中的重要性要比第n+1级的目标词语在文字信息中的重要性大,当然,其重要性与权重等级n的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例,则步骤403之前,还包括根据词典获取目标词语包含的每个词语对应的权重等级的步骤。具体地,可以预先设置词典中词语的权重等级范围N,以及每个词语的权重等级n,例如可以将词典包含的目标词语的权重等级范围设置为3,其中,权重等级为I最高,权重等级为3最低,然后按照目标词语的专有性以及广泛性设置每个目标词语的权重等级, 如,目标词语是地名时,权重等级设置为3,目标词语是非地理位置的专有指代名词(如小月巴羊)时,权重等级设置为1,当然,领域技术人员可根据其他设置规则对上述目标词语进行权重等级划分,此处并不对每种情况进行一一赘述。在步骤402获取词典对应的目标词语之后,根据词典获取目标词语包含的每个词语对应的权重等级。在本实施例中,步骤403从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括首先根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合;然后根据目标词语包含的每个词语对应的权重等级,对信息集合中的每条信息分别进行处理,获取每条信息的权重系数;最后从信息集合中选取权重系数最高的信息为目标信息。2、嵌套查找法在本实施例中,步骤403从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括首先对获取的目标词语包含的词语进行排序;然后按照排序结果,从目标词语包含的词语中获取第一个待查找词语,从目标信息数据库中获取与第一个待查找词语匹配的信息;从目标词语包含的词语中获取第二个待查找词语,从与第一个待查找词语匹配的信息组成的信息集合中获取与第二个待查找词语匹配的信息;以此类推,从目标词语包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与最后一个待查找词语匹配的目标信息。其中,对获取的目标词语包含的词语进行排序,可以将词语按照在文字信息中出现的先后顺序进行排序,优选地,为了提高查找速度,可以先获取目标词语包含的词语中的关键词,然后将目标词语包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序。在本实施例中,预设的目标信息数据库用于存储待进行语音识别的信息,包括地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。步骤404,根据目标信息确定语音信息的内容。在本实施例中,步骤402获取词典对应的目标词语的过程,可以与图I所示的步骤102获取目标信息数据库对应的目标信息的过程相似,在此不再一一赘述。该过程也可以包括将文字信息分别与词典和负载库中包含的信息进行匹配;获取与词典中的词语完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到词典对应的目标词语。为了提高语音识别的速度,将文字信息分别与词典和负载库中包含的信息进行匹配,可以包括将文字信息中的字按照出现顺序分别与词典和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取词典对应的目标词语,在此不再一一赘述。在本实施例中,如果通过步骤403获取到至少两条目标信息,可以获取目标信息之间的连接词语,从而可以根据目标信息和该连接词语更准确的确定语音信息的内容。本发明实施例提供的语音识别方法,采用词典和负载库对文字信息进行分词,获取词典对应的目标词语并获取与目标词语匹配度最高的目标信息,进而根据目标信息确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据句式库确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例五如图5所示,本发明实施例提供的语音识别方法,该方法与图I所示的语音识别方法相似,区别在于,步骤501为,获取用户输入的语音信息对应的拼音。相应的,步骤502具体为,采用预设的目标信息数据库和负载库对拼音进行分词处理,获取分词后的词语拼音串。步骤503具体为,根据词语拼音串从目标数据库中获取对应的目标信息。在本实施例中,步骤502获取分词后的词语拼音串的过程,可以与图I所示的步骤102的过程相似,在此不再一一赘述。该过程也可以包括将拼音分别与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与目标信息数据库和负载库中包含的信息进行匹配,可以包括将拼音按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。特别的,采用预设的目标信息数据库和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。在本实施例中,步骤503根据词语拼音串从目标数据库中获取对应的目标信息的过程可以包括首先从词语拼音串包含的拼音中获取与目标信息数据库对应的目标拼音串;然后从目标信息数据库中查找目标拼音串对应的目标信息。步骤503还可以通过其他方式根据词语拼音串从目标信息数据库中获取对应的目标信息,在此不再一一赘述。本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以 更准确的从目标信息数据库中获取对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例六如图6所示,本发明实施例七提供的语音识别方法,该方法与图4所示的语音识别方法相似,区别在于,步骤601为,获取用户输入的语音信息对应的拼音。步骤602具体为,采用预设的词典和负载库对拼音进行分词处理,获取分词后的词语拼音串。步骤603具体为,根据词语拼音串从词典中获取对应的待识别的目标词语。在本实施例中,步骤602获取分词后的词语拼音串的过程,可以与图4所示的步骤402的过程相似,在此不再一一赘述。该过程也可以包括将拼音分别与词库和负载库中包含的信息进行匹配;获取与词库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与词库和负载库中包含的信息进行匹配,可以包括将拼音按照出现顺序分别与词库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。特别的,采用预设的词典和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。在本实施例中,步骤603根据词语拼音串从词典中获取对应的待识别的目标词语的过程可以包括首先从词语拼音串包含的拼音中获取与词典对应的目标拼音串;然后从词典中查找目标拼音串对应的目标词语。步骤603还可以通过其他方式根据词语拼音串从词典中获取对应的待识别的目标词语,在此不再一一赘述。本发明实施例提供的语音识别方法,采用词典和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定拼音中无实质含义的信息,从而可以更准确的确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例七如图7所示,本发明实施例提供的语音识别装置,包括文字获取单元701,用于获取用户输入的语音信息对应的文字信息。为了使本发明实施例提供的语音识别方法适用范围更广,能够识别出不同地域、不同口音的用户语音信息,在本实施例中,文字获取单元701可以采用非特定人语音识别 技术对用户输入的语音信息进行识别、解析,获取该语音信息对应的文字信息。分词单元702,用于采用预设的目标信息数据库和负载库对文字信息进行分词处理,获取目标信息数据库对应的目标信息;目标信息数据库用于存储待进行语音识别的信息;负载库用于存储除具有实质含义的词语外的信息。在本实施例中,分词单元702中预设的目标信息数据库用于存储待进行语音识别的信息,可以包括地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。在本实施例中,分词单元702中负载库用于存储除具有实质含义的词语外的信息。具体的,可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不再对负载库中包含的除具有实质含义的词语外的信息进行一一赘述。在本实施例中,分词单元702采用预设的目标信息数据库和负载库对文字信息进行分词处理,具体可以将文字获取单元701获取的文字信息与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库中的信息完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。还可以通过其他方式对文字信息进行分词处理,在此不再一一赘述。内容确定单元703,用于根据目标信息确定语音信息的内容。进一步的,如图8所示,本实施例中分词单元702,包括匹配模块7021,用于将文字信息分别与目标信息数据库和负载库中包含的信息进行匹配。在本实施例中,匹配模块7021可以将文字信息中的字按照先后顺序分别与目标信息数据库和负载库中包含的信息进行匹配;也可以将文字信息中的字按照从后往前的顺序分别与目标信息数据库和负载库中包含的信息进行匹配;还可以通过其他方式分别与目标信息数据库和负载库中的信息进行匹配,在此不再一一赘述。可选的,为了缩小匹配范围、提高匹配速度,匹配模块7021还可以包括第一匹配子模块,用于将文字信息中的字按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;集合获取子模块,用于如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;第二匹配子模块,用于将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。其中,句式库用于存储由负载库中的信息组成的句式。在本实施例中,根据预设句式库获取第一匹配信息的关联信息集合的具体过程可以包括根据第一匹配信息查找句式库,从该句式库中获取第一匹配信息对应的句式集合;根据该句式集合获取相应的关联信息集合。还可以通过其他方式根据预设的句式库获取第一匹配信息的关联信息集合,在此不再赘述。在本实施例中,句式库中存储的句式可以是广义范围的句式,具体的,可以从日常 生活和工作中能够接触到的信息中获取句式并形成句式库,例如可以从每天的新闻报道的信息中提取句式,形成句式库。由于语音识别技术一般是在特定领域中使用的,例如应用在导航、影音娱乐等领域,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将句式库中存储的句式设置为狭义范围的句式,例如如果本发明提供的语音识别方法应用在导航领域中,句式库可以具体用于存储导航相关的句式,并且负载库用于存储句式库中的信息。句式库不限于上述设置方式,本领域技术人员公知的是,对于该语音识别技术所应用的每个行业领域,所属行业的技术人员均可以根据其行业特点进行合理设置其句式。特别的,该匹配模块,还可以包括频率获取子模块,用于获取目标信息数据库和负载库中包含的信息的使用频率;频率排列子模块,用于根据使用频率将目标信息数据库和负载库中包含的信息进行排列;频率匹配子模块,用于将文字信息分别与排列后的信息依次进行匹配。通过上述过程将分词处理过程与使用频率联系起来,可以增加识别结果和用户意图之间的对应概率。匹配信息获取模块7022,用于获取与目标信息数据库中的信息完全匹配的匹配信肩、O在本实施例中,通过匹配信息获取模块7022获取的匹配信息,可以为一个,也可以为多个,在此不作限制。分割模块7023,用于将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。在本实施例中,通过句式库首先确定关联信息集合后再进行匹配,可以使匹配信息后的字无需对整个负载库和目标信息数据库进行匹配,从而缩小匹配范围,提高匹配速度和准确率。在本实施例中,通过句式库确定关联信息集合并匹配后,可以直接获取对应的目标信息后,根据该目标信息确定语音信息的内容;为了更准确的确定语音信息的内容,也可以在获取对应的目标信息后,根据该目标信息和相应的句式确定语音信息的内容。进一步的,如图9所示,本实施例提供的语音识别装置,还可以包括连接词语获取单元704,用于如果获取到至少两条目标信息,获取目标信息之间的连接词语。此时,内容确定单元703,具体用于根据目标信息和连接词语确定语音信息的内容。可选的,为了使本发明实施例提供的语音识别装置可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。本发明实施例提供的语音识别装置,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信 息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例八如图10所示,本发明实施例提供的语音识别装置,包括文字获取单元1001,用于获取用户输入的语音信息对应的文字信息;该装置与图7所示的文字获取单元701相似,在此不再一一赘述。分词单元1002,用于采用预设的词典和负载库对文字信息进行分词处理,获取所词典对应的目标词语;词典用于存储待进行语音识别的词语;负载库用于存储除具有实质含义的词语外的信息。在本实施例中,词典用于存储待进行语音识别的词语,该词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地,可以从目标信息数据库中存储的信息获取目标词语并形成词典。需要说明的是,不论是广义范围的词语还是狭义范围的词语,词典中的目标词语均是唯一的,各个目标词语之间不重复。由于语音识别技术一般是在特定领域中使用的,例如应用在导航、点歌或者查找联系人等领域,为了减小词典中目标词语的冗余量,节省存储空间,提高语音识别的速度,本发明实施例优选地将词典中的目标词语设置为根据目标信息数据库设置的狭义范围词语,但不限于上述设置方式,本领域技术人员公知的是,对于该识别技术所应用的每个行业领域,所属行业的技术人员均可根据其行业特点,进行合理设置其目标信息数据库。在本实施例中,分词单元1002中负载库用于存储除具有实质含义的词语外的信息。可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不对负载库中包含的语音信息中除具有实质含义的词语外的信息进行一一赘述。
特别的,采用预设的词典和负载库对文字信息进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。目标信息获取单元1003,用于根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语匹配度最高的目 标信息,目标信息数据库用于存储待进行语音识别的信息。在本实施例中,目标信息获取单元1003可以通过两种方法从目标信息数据库中获取与目标词语匹配度最高的目标信息,下面对这两种方法进行分别介绍I、权重系数判决法在本实施例中,如果词典还用于存储目标词语中包含的词语对应的权重等级n以及权重等级范围N,n、N均为整数,N彡2,n G [1,扣,第11级的目标词语在文字信息中的重要性要比第n+1级的目标词语在文字信息中的重要性大,当然,其重要性与权重等级n的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例,则目标信息获取单元1003之前,还包括根据词典获取目标词语包含的每个词语对应的权重等级的步骤。具体地,可以预先设置词典中词语的权重等级范围N,以及每个词语的权重等级n,例如可以将词典包含的目标词语的权重等级范围设置为3,其中,权重等级为I最高,权重等级为3最低,然后按照目标词语的专有性以及广泛性设置每个目标词语的权重等级,如,目标词语是地名时,权重等级设置为3,目标词语是非地理位置的专有指代名词(如小月巴羊)时,权重等级设置为1,当然,领域技术人员可根据其他设置规则对上述目标词语进行权重等级划分,此处并不对每种情况进行一一赘述。在分词单元1002获取词典对应的目标词语之后,,根据词典获取目标词语包含的每个词语对应的权重等级。在本实施例中,目标信息获取单元1003从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括首先根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合;然后根据目标词语包含的每个词语对应的权重等级,对信息集合中的每条信息分别进行处理,获取每条信息的权重系数;最后从信息集合中选取权重系数最高的信息为目标信息。此时,语音识别装置,除包括上述模块外,还可以包括权重获取模块,用于如果词典还用于存储目标词语中包含的词语对应的权重等级n以及权重等级范围N,根据词典获取目标词语包含的每个词语对应的权重等级,其中,n、N均为整数,N彡2,n G [1,N],第n级的目标词语在文字信息中的重要性要比第n+1级的目标词语在文字信息中的重要性大;目标信息获取模块,包括集合获取子模块,用于根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合;系数获取子模块,用于根据目标词语包含的每个词语对应的权重等级,对信息集合中的每条信息分别进行处理,获取每条信息的权重系数;目标信息选取子模块,用于从信息集合中选取权重系数最高的信息为目标信息。2、嵌套查找法在本实施例中,目标信息获取单元1003从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括首先对获取的目标词语包含的词语进行排序;然后按照排序结果,从目标词语包含的词语中获取第一个待查找词语,从目标信息数据库中获取与第一个待查找词语匹配的信息;从目标词语包含的词语中获取第二个待查找词语,从与第一个待查找词语匹配的信息组成的信息集合中获取与第二个待查找词语匹配的信息;以此类推,从目标词语包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的信 息组成的信息集合中获取与最后一个待查找词语匹配的目标信息。其中,对获取的目标词语包含的词语进行排序,可以将词语按照在文字信息中出现的先后顺序进行排序,优选地,为了提高查找速度,可以先获取目标词语包含的词语中的关键词,然后将目标词语包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序。在本实施例中,预设的目标信息数据库用于存储待进行语音识别的信息,包括地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。内容确定单元1004,用于根据目标信息确定语音信息的内容。在本实施例中,分词单元1002获取词典对应的目标词语的过程,可以与图7所示的分词单元701获取目标信息数据库对应的目标信息的过程相似,在此不再一一赘述。该过程也可以包括将文字信息分别与词典和负载库中包含的信息进行匹配;获取与词典中的词语完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到词典对应的目标词语。为了提高语音识别的速度,将文字信息分别与词典和负载库中包含的信息进行匹配,可以包括将文字信息中的字按照出现顺序分别与词典和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取词典对应的目标词语,在此不再一一赘述。在本实施例中,如果通过目标信息获取单元1003获取到至少两条目标信息,可以获取目标信息之间的连接词语,从而可以根据目标信息和该连接词语更准确的确定语音信息的内容。本发明实施例提供的语音识别装置,采用词典和负载库对文字信息进行分词,获取词典对应的目标词语并获取与目标词语匹配度最高的目标信息,进而根据目标信息确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据句式库确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例九如图11所示,本发明实施例提供的语音识别装置,该装置与图7所示的语音识别装置相似,区别在于,拼音获取单元1101,用于获取用户输入的语音信息对应的拼音。相应的,分词单元1102,用于采用预设的目标信息数据库和负载库对拼音进行分词处理,获取分词后的词语拼音串;目标信息数据库用于存储待进行语音识别的信息;负载库用于存储除具有实质含义的词语外的信息;目标信息获取单元1103,用于根据词语拼音串从目标信息数据库中获取对应的目标信息。内容确定单元1104,用于根据目标信息确定语音信息的内容。在本实施例中,分词单元1102获取分词后的词语拼音串的过程,可以与图7所示的分词单元702的过程相似,在此不再一一赘述。该过程也可以包括将拼音分别与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与目标信息数据库和负载库中包含的信息进行匹配,可以包括将拼音按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。 特别的,采用预设的目标信息数据库和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。在本实施例中,目标信息获取单元1103根据词语拼音串从目标数据库中获取对应的目标信息的过程可以包括首先从词语拼音串包含的拼音中获取与目标信息数据库对应的目标拼音串;然后从目标信息数据库中查找目标拼音串对应的目标信息。目标信息获取单元1103还可以通过其他方式根据词语拼音串从目标信息数据库中获取对应的目标信息,在此不再一一赘述。本发明实施例提供的语音识别装置,采用目标信息数据库和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的从目标信息数据库中获取对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。实施例十如图12所示,本发明实施例提供的语音识别装置,该装置与图10所示的语音识别装置相似,区别在于,拼音获取单元1201,用于获取用户输入的语音信息对应的拼音。
分词单元1202,用于采用预设的词典和负载库对拼音进行分词处理,获取分词后的词语拼音串;词典用于存储待进行语音识别的词语;负载库用于存储除具有实质含义的词语外的信息。目标词语获取单元1203,用于根据词语拼音串从词典中获取对应的目标词语。目标信息获取单元1204,用于根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语匹配度最高的目标信息;目标信息数据库用于存储待进行语音识别的信息。内容确定单元1205,用于根据目标信息确定语音信息的内容。在本实施例中,分词单元1202获取分词后的词语拼音串的过程,可以与图10所示的分词单元1002的过程相似,在此不再一一赘述。该过程也可以包括将拼音分别与词库 和负载库中包含的信息进行匹配;获取与词库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与词库和负载库中包含的信息进行匹配,可以包括将拼音按照出现顺序分别与词库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。特别的,采用预设的词典和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。在本实施例中,目标词语获取单元1203根据词语拼音串从词典中获取对应的待识别的目标词语的过程可以包括首先从词语拼音串包含的拼音中获取与词典对应的目标拼音串;然后从词典中查找目标拼音串对应的目标词语。目标词语获取单元1203还可以通过其他方式根据词语拼音串从词典中获取对应的待识别的目标词语,在此不再一一赘述。本发明实施例提供的语音识别装置,采用词典和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定拼音中无实质含义的信息,从而可以更准确的确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。本发明实施例提供的语音识别方法和装置可以应用在如导航、点歌以及联系人查询等信息服务系统中。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种语音识别方法,其特征在于,包括 获取用户输入的语音信息对应的文字信息; 采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,所述目标信息数据库用于存储待进行语音识别的信息,所述负载库用于存储除具有实质含义的词语外的信息; 根据所述目标信息确定所述语音信息的内容。
2.根据权利要求I所述的语音识别方法,其特征在于,所述采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,包括 将所述文字信息分别与所述目标信息数据库和所述负载库中包含的信息进行匹配; 获取与所述目标信息数据库中的信息完全匹配的匹配信息; 将所述匹配信息从所述文字信息中分割出来,得到所述目标信息数据库对应的目标信肩、O
3.根据权利要求2所述的语音识别方法,其特征在于,所述将所述文字信息分别与所述目标信息数据库和所述负载库中包含的信息进行匹配,包括 获取所述目标信息数据库和所述负载库中包含的信息的使用频率; 根据所述使用频率将所述目标信息数据库和所述负载库中包含的信息进行排列; 将所述文字信息分别与所述排列后的信息依次进行匹配。
4.根据权利要求2所述的语音识别方法,其特征在于,所述将所述文字信息分别与所述目标信息数据库和负载库中包含的信息进行匹配,包括 将所述文字信息中的字按照出现顺序分别与所述目标信息数据库和负载库中包含的信息进行匹配; 如果查找到完全匹配的第一匹配信息,根据预设句式库获取所述第一匹配信息的关联信息集合,所述句式库用于存储由所述负载库中的信息组成的句式; 将所述文字信息中第一匹配信息后的字按照出现顺序与所述关联信息集合中的信息进行匹配。
5.根据权利要求I所述的语音识别方法,其特征在于,所述方法还包括 如果获取到至少两条目标信息,获取目标信息之间的连接词语; 所述根据所述目标信息确定所述语音信息的内容具体包括根据所述目标信息和所述连接词语确定所述语音信息的内容。
6.一种语音识别方法,其特征在于,包括 获取用户输入的语音信息对应的文字信息; 采用预设的词典和负载库对所述文字信息进行分词处理,获取所述词典对应的目标词语,所述词典用于存储待进行语音识别的词语,所述负载库用于存储除具有实质含义的词语外的息; 根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息,所述目标信息数据库用于存储待进行语音识别的信息; 根据所述目标信息确定所述语音信息的内容。
7.根据权利要求6所述的语音识别方法,其特征在于,还包括 如果所述词典还用于存储所述目标词语中包含的词语对应的权重等级n以及权重等级范围N,根据所述词典获取所述目标词语包含的每个词语对应的权重等级,其中,n、N均为整数,N彡2,n e [1,N],第n级的目标词语在所述文字信息中的重要性要比第n+1级的目标词语在所述文字信息中的重要性大; 则所述根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息包括 根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合; 根据目标词语包含的每个词语对应的权重等级,对所述信息集合中的每条信息分别进行处理,获取每条信息的权重系数; 从所述信息集合中选取权重系数最高的信息为目标信息。
8.一种语音识别方法,其特征在于,包括 获取用户输入的语音信息对应的拼音; 采用预设的目标信息数据库和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息; 根据所述词语拼音串从所述目标信息数据库中获取对应的目标信息; 根据所述目标信息确定所述语音信息的内容。
9.一种语音识别方法,其特征在于,包括 获取用户输入的语音信息对应的拼音; 采用预设的词典和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息; 根据所述词语拼音串从所述词典中获取对应的目标词语; 根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息;所述目标信息数据库用于存储待进行语音识别的信息; 根据所述目标信息确定所述语音信息的内容。
10.一种语音识别装置,其特征在于,包括 文字获取单元,用于获取用户输入的语音信息对应的文字信息; 分词单元,用于采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息; 内容确定单元,用于根据所述目标信息确定所述语音信息的内容。
11.根据权利要求10所述的语音识别装置,其特征在于,所述分词单元,包括 匹配模块,用于将所述文字信息分别与所述目标信息数据库和所述负载库中包含的信息进行匹配; 匹配信息获取模块,用于获取与所述目标信息数据库中的信息完全匹配的匹配信息;分割模块,用于将所述匹配信息从所述文字信息中分割出来,得到所述目标信息数据库对应的目标信息。
12.根据权利要求11所述的语音识别装置,其特征在于,所述匹配模块,包括频率获取子模块,用于获取所述目标信息数据库和所述负载库中包含的信息的使用频率; 频率排列子模块,用于根据所述使用频率将所述目标信息数据库和所述负载库中包含的信息进行排列; 频率匹配子模块,用于将所述文字信息分别与所述排列后的信息依次进行匹配。
13.根据权利要求11所述的语音识别装置,其特征在于,所述匹配模块,包括 第一匹配子模块,用于将所述文字信息中的字按照出现顺序分别与所述目标信息数据库和负载库中包含的信息进行匹配; 集合获取子模块,用于如果查找到完全匹配的第一匹配信息,根据预设句式库获取所 述第一匹配信息的关联信息集合,所述句式库用于存储由所述负载库中的信息组成的句式; 第二匹配子模块,用于将所述文字信息中第一匹配信息后的字按照出现顺序与所述关联信息集合中的信息进行匹配。
14.根据权利要求10所述的语音识别装置,其特征在于,还包括 连接词语获取单元,用于如果获取到至少两条目标信息,获取目标信息之间的连接词语; 所述内容确定单元,具体用于根据所述目标信息和所述连接词语确定所述语音信息的内容。
15.一种语音识别装置,其特征在于,包括 文字获取单元,用于获取用户输入的语音信息对应的文字信息; 分词单元,用于采用预设的词典和负载库对所述文字信息进行分词处理,获取所词典对应的目标词语;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息; 目标信息获取单元,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息,所述目标信息数据库用于存储待进行语首识别的彳目息; 内容确定单元,用于根据所述目标信息确定所述语音信息的内容。
16.根据权利要求15所述的语音识别装置,其特征在于,还包括 权重获取模块,用于如果所述词典还用于存储所述目标词语中包含的词语对应的权重等级n以及权重等级范围N,根据所述词典获取所述目标词语包含的每个词语对应的权重等级,其中,n、N均为整数,N彡2,n G [I,N],第n级的目标词语在所述文字信息中的重要性要比第n+1级的目标词语在所述文字信息中的重要性大; 则所述目标信息获取模块,包括 集合获取子模块,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合; 系数获取子模块,用于根据目标词语包含的每个词语对应的权重等级,对所述信息集合中的每条信息分别进行处理,获取每条信息的权重系数; 目标信息选取子模块,用于从所述信息集合中选取权重系数最高的信息为目标信息。
17.一种语音识别装置,其特征在于,包括拼音获取单元,用于获取用户输入的语音信息对应的拼音; 分词单元,用于采用预设的目标信息数据库和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述目标信息数据库用于存储待进行语音识别的信息;所述负载库用于存储除具有实质含义的词语外的信息; 目标信息获取单元,用于根据所述词语拼音串从所述目标信息数据库中获取对应的目标信息; 内容确定单元,用于根据所述目标信息确定所述语音信息的内容。
18.一种语音识别装置,其特征在于,包括 拼音获取单元,用于获取用户输入的语音信息对应的拼音; 分词单元,用于采用预设的词典和负载库对所述拼音进行分词处理,获取分词后的词语拼音串;所述词典用于存储待进行语音识别的词语;所述负载库用于存储除具有实质含义的词语外的信息; 目标词语获取单元,用于根据所述词语拼音串从所述词典中获取对应的目标词语; 目标信息获取单元,用于根据所述目标词语查找目标信息数据库,从所述目标信息数据库中获取与所述目标词语匹配度最高的目标信息;所述目标信息数据库用于存储待进行语首识别的彳目息; 内容确定单元,用于根据所述目标信息确定所述语音信息的内容。
全文摘要
本发明公开了一种语音识别方法和装置,涉及语音识别技术。为解决现有技术语音识别速度慢的问题而发明。本发明实施例提供的技术方案包括获取用户输入的语音信息对应的文字信息;采用预设的目标信息数据库和负载库对所述文字信息进行分词处理,获取目标信息数据库对应的目标信息,所述目标信息数据库用于存储待进行语音识别的信息,所述负载库用于存储除具有实质含义的词语外的信息;根据所述目标信息确定所述语音信息的内容。本发明实施例可以应用在如导航、点歌以及联系人查询等信息服务系统中。
文档编号G06F17/30GK102750949SQ20121024571
公开日2012年10月24日 申请日期2012年7月16日 优先权日2012年7月16日
发明者庞泽耀, 王力劭, 王钢, 许军, 邵颖 申请人:深圳市车音网科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1