语音查询方法及系统的制作方法

文档序号:6386379阅读:253来源:国知局
专利名称:语音查询方法及系统的制作方法
技术领域
本发明涉及信息查询技术领域,具体涉及一种语音查询方法及系统。
背景技术
随着移动通讯设备的飞速发展,手机在人们日常生活中扮演着越来越重要的角色,承担着与亲朋好友、同事伙伴等沟通联系的作用。由于大量联系人的存在,用户往往首先需要根据个人习惯编辑录入联系人信息,随后在需要时通过联系人查询获取对应号码,并实现电话、短信等操作。快速、高效、准确的联系人信息查询是手机应用的必要要求,而离不开音输入是最为自然人性的一种交互方式,在手机等小屏幕设备应用上有着无法比拟的优势,因此如何准确高效地响应用户的语音查询输入是当前手机应用中需要解决的一个重要问题。传统语音查询系统主要采用两种方式,即命令词识别及大词汇量语音识别。其中,命令词识别是由系统预先设定需要识别的关键词,随后在接收到语音信号时逐一和预设的关键词模型比对,选择具有最大相似度的模型为识别结果;连续语音识别是在系统预置的通用解码网络内搜索相应于用户语音输入的最优路径。显然命令词识别只能支持对特定关键词的解码,当用户输入和预设关键词不一致时,往往无法获得正确的结果,因而对用户输入的要求较高。而在大词汇量连续语音识别系统支持下,用户可以以自然随意语音方式输入,但由于系统需要在通用解码网络内搜索最优路径,其解码效率往往较低,且由于混淆字符较多,识别准确率也容易受到一定的影响。进一步的,在查询应用中,基于大词汇量语音识别系统的输出为文本字串,尚需要进一步和查询系统关键词匹配获取相应的关键词条。在对联系人信息查询时,通常采用字串完全匹配或子串匹配的方法。在字串完全匹配方法中,系统在通讯录中查找和用户输入完全一致的查询内容,如对用户输入字串“小明”,系统将在通讯录中查找联系人姓名为完整“小明”的条目,而对“王小明”等条目予以丢弃。在子串匹配方法中,系统在通讯录中查找包含用户输入的条目,即将用户输入作为目标条目的子串进行匹配。相应的,对用户输入“小明”,将获取“王小明”、“李小明”等联系人条目。现有的完全匹配和子串匹配方法简单易行,但难以满足用户多样化的查询需求。特别是随着通讯录长度的迅速增长,联系人信息也因区分性要求而呈现多样化趋势,往往包括姓名、机构、职位等众多信息。联系人构成模式的多样性,使得用户难以准确地记住每一个条目是怎么写的,导致输入的查询名称与通讯录中的条目不完全匹配,甚至不是目标条目的子串。例如通讯录中录入的联系人为“张凯(讯飞)”,而用户输入查询内容是“讯飞张凯”,则不管是完全匹配抑或部分匹配都无法获得正确的联系人信息。又如通讯录中录入的条目为“王智国院长”,而用户输入查询内容是“王院长”,也无法获取对应的结果。显然在用户多样化查询条件下,传统的基于字串匹配的方法无法满足应用需求。

发明内容
本发明提供一种语音查询方法及系统,以提高多样化语音查询的匹配度,满足用户通过语音自由查询的需求。为此,本发明提供如下技术方案:一种语音查询方法,包括:获取用户提供的数据库,所述数据库中包含用户的个性化信息词条;基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,所述基本语法扩展模型用于描述个性化信息的扩展规律;根据所述个性化信息词条和扩展词条构建扩展的解码网络;在接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径;根据所述最优路径得到与所述查询语音信号对应的查询结果。优选地,所述方法还包括:按以下方式构建所述基本语法扩展模型:获取不同用户的个性化信息词条;对所述个性化信息词条进行属性标注,得到属性序列;训练用于描述具体信息与所述属性序列之间的映射关系的标注模型;根据所述属性序列生成用于描述信息结构模式的属性扩展模型。优选地,所述根据所述属性序列生成用于描述信息结构模式的属性扩展模型包括:统计所述属性序列中各种结构模式的频度;根据所述频度选择满足预设条件的结构模式作为用于描述信息结构模式的属性扩展模型。优选地,所述根据所述频度选择满足预设条件的结构模式作为用于描述信息结构模式的属性扩展模型包括:选择频度大于设定的频度阈值的结构模式作为所述属性扩展模型;或者依据频度从高到低选择设定个数的结构模式作为所述属性扩展模型。优选地,所述基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条包括:根据所述标注模型确定所述个性化信息词条的基本要素单元;根据所述属性扩展模型对所述基本要素单元进行扩展,得到与所述个性化信息词条对应的扩展词条。可选地,所述根据所述个性化信息词条和扩展词条构建扩展的解码网络包括:将所述个性化信息词条及其对应的扩展词条作为独立的语义路径构建语义模型;根据预置的声学模型和词典对所述语义模型进行扩展,获得扩展的解码网络。可选地,所述根据所述个性化信息词条和扩展词条构建扩展的解码网络包括:将所有个性化信息词条作为独立的语义路径构建语义模型;根据预置的声学模型及词典对所述语义模型进行扩展,获得基本解码网络;对所述基本解码网络中每条个性化信息词条所在的路径,根据所述个性化词条对应的扩展词条在所述路径上增加新路径,得到扩展的解码网络。可选地,所述根据所述个性化信息词条和扩展词条构建扩展的解码网络包括:将所有个性化信息词条作为独立的语义路径,构建语义模型;根据所述个性化信息词条对应的扩展词条在所述语义模型中的个性化信息词条所在的路径上增加新路径,得到扩展的语义模型;根据预置的声学模型及词典对所述语义模型进行扩展,得到扩展的解码网络。一种语音查询系统,包括:获取模块,用于获取用户提供的数据库,所述数据库中包含用户的个性化信息词条;词条扩展模块,用于基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,所述基本语法扩展模型用于描述个性化信息的扩展规律;解码网络构建模块,用于根据所述个性化信息词条和扩展词条构建扩展的解码网络;接收模块,用于接收用户对所述数据库的查询语音信号;解码模块,用于在所述接收模块接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径;查询结果输出模块,用于根据所述最优路径得到与所述查询语音信号对应的查询结果。优选地,所述系统还包括:扩展模型构建模块,用于构建所述基本语法扩展模型;所述扩展模型构建模块包括:词条获取单元,用于获取不同用户的个性化信息词条;属性标注单元,用于对所述个性化信息词条进行属性标注,得到属性序列;标注模型训练单元,用于训练用于描述具体信息与所述属性序列之间的映射关系的标注模型;属性扩展模型生成单元,用于根据所述属性序列生成用于描述信息结构模式的属性扩展模型。优选地,所述属性扩展模型生成单元包括:统计子单元,用于统计所述属性序列中各种结构模式的频度;选择子单元,用于根据所述频度选择满足预设条件的结构模式作为用于描述信息结构模式的属性扩展模型。优选地,所述选择子单元,具体用于选择频度大于设定的频度阈值的结构模式作为所述属性扩展模型;或者依据频度从高到低选择设定个数的结构模式作为所述属性扩展模型。优选地,所述词条扩展模块包括:确定子单元,用于根据所述标注模型确定个性化信息词条的基本要素单元;扩展子单元,用于根据所述属性扩展模型对所述基本要素单元进行扩展,得到与所述个性化信息词条对应的扩展词条,并由所述个性化信息词条和所述扩展词条组成对应所述个性化信息词条的扩展信息。可选地,所述解码网络构建模块包括:第一语义模型构建单元,用于将所述个性化信息词条及其对应的扩展词条作为独立的语义路径构建语义模型;第一扩展单元,用于根据预置的声学模型和词典对所述语义模型进行扩展,获得扩展的解码网络。可选地,所述解码网络构建模块包括:第二语义模型构建单元,用于将所有个性化信息词条作为独立的语义路径构建语义模型;第二扩展单元,用于根据预置的声学模型及词典对所述语义模型进行扩展,获得基本解码网络;解码网络路径扩展单元,用于对所述基本解码网络中每条个性化信息词条所在的路径,根据所述个性化词条对应的扩展词条在所述路径上增加新路径,得到扩展的解码网络。可选地,所述解码网络构建模块包括:第三语义模型构建单元,用于将所有个性化信息词条作为独立的语义路径构建语义模型;语义模型路径扩展单元,用于根据所述个性化信息词条对应的扩展词条在所述语义模型中的个性化信息词条所在的路径上增加新路径,得到扩展的语义模型;第三扩展单元,用于根据预置的声学模型及词典对所述语义模型进行扩展,得到扩展的解码网络。本发明实施例提供的语音查询方法及系统,预先基于用于描述个性化信息扩展规律的基本语法扩展模型,对用户的个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,使所述扩展词条可以支持对用户个性化信息更多更自由的描述方式。由于扩展的解码网络是基于所述个性化信息词条和扩展词条构建的,因此,对应用户的个性化信息词条的路径可以有多条,在接收到用户输入的查询语音信号后,根据所述扩展的解码网络进行识别,可以避免查询语音信号和用户的个性化信息词条不对应时无法提供查询结果的情况,有效地提高了语音查询的自由度和准确率,更好地满足了用户语音自由查询的需求。


为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本发明实施例语音查询方法的流程图;图2是本发明实施例中基于个性化信息词条和扩展词条构建的语义模型示意图;图3是本发明实施例中扩展的解码网络的示意图;图4是本发明实施例中构建基本语法扩展模型的流程图;图5是本发明实施例中对用户个性化信息词条进行扩展的流程图6是本发明实施例语音查询系统的一种结构示意图;图7是本发明实施例信息查询系统的另一种结构示意图;图8本发明实施例信息查询系统中词条扩展模块的一种结构示意图;图9是本发明实施例中解码网络构建模块的一种结构示意图;图10是本发明实施例中解码网络构建模块的另一种结构示意图;图11是本发明实施例中解码网络构建模块的另一种结构示意图。
具体实施例方式为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。在现有技术中,基本的语音识别方法通常是将语言模型的语义网络通过声学模型及字典等扩展成基于模型状态层的搜索网络,即构建解码网络,然后在对输入语音信号解码时,通过计算输入的每一帧语音信号相对于当前有效扩展路径上的每个声学模型及语言模型的累积历史路径概率获取新的有效扩展路径。随后在搜索完最后一帧语音信号时,通过从具有最大累积历史路径概率的最优节点执行状态回溯得到解码最优路径,得到对应的单词序列。本发明实施例提供的语音查询方法及系统,针对用户通过语音自由查询的需求,对用户提供的数据库中的个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,并基于所述个性化信息词条和所述扩展词条构建扩展的解码网络,这样,在接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径;根据所述最优路径得到与所述查询语音信号对应的查询结果。由于所述扩展的解码网络是基于所述个性化信息词条和扩展词条构建的,因此可以避免查询语音信号和用户的个性化信息词条不对应时无法提供查询结果的情况,有效地提高了语音查询的自由度和准确率,更好地满足了用户语音自由查询的需求。如图1所示,是本发明实施例语音查询方法的流程图,包括以下步骤:步骤101,获取用户提供的数据库,所述数据库中包含用户的个性化信息词条。所述用户个性化信息词条是指用户自己保存的一些具有某种特定属性或特征的一类词条,比如通讯录、用户喜爱的书名目录等。步骤102,基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,所述基本语法扩展模型用于描述个性化信息的扩
展规律。所述基本语法扩展模型用于描述个性化信息的扩展规律,可以采用离线训练的方式,根据大量采集的个性化信息,比如用户联系人信息(比如用户上传的通讯录),预先训练得到,具体构建过程将在后面详细描述。由于用户在保存上述个性化信息词条时,对不同的词条可能会采用不同的格式及组成内容,比如,对于通讯录中的联系人,可以采用以下内容及格式:姓名,姓名+职位,姓+职位,机构+姓名,等等。因此会导致查询时,输入的查询信息无法与所述用户个性化信息词条中的条目相匹配的情况,无法获取对应的查询结果。为此,在本发明实施例中,基于描述个性化信息的扩展规律的基本语法扩展模型,对用户个性化信息词条进行扩展,使扩展得到的词条集合能够更自由地描述原有词条所包含的信息。比如,用户的通讯录中的一条联系人信息为“讯飞王智国院长”,经过上述扩展后可以得到以下新条目:a)王智国;b)讯飞王智国;c)讯飞王院长;d)王院长。具体扩展方式将在后面详细描述。步骤103,根据所述个性化信息词条和扩展词条构建扩展的解码网络。具体地,所述扩展的解码网络的构建可以利用预设的声学模型和语言模型等构建,其中,所述声学模型主要用于模拟字符音特点,具体可以采用语音识别领域常用的基于转移概率和传输概率的HMM(Hidden Markov Model,隐马尔可夫)模型。考虑到在大词汇量连续语音识别中,词汇量的数量过于庞大,若是对每个字符都构建一个HMM模型,则模型数量太多,不利于数据存储及计算。因此,在实际应用中,可以仅对基本的发音单元,如音节或音素单元构建HMM模型。显然声学模型还可以采用其他技术手段,比如神经网络等,对此本发明实施例不做限定。其中,所述语言模型是为了更有效地表征语法及语义等知识,以弥补声学模型的不足,提高识别率。具体可以采用语音识别领域常用统计语言模型,利用统计概率的方式描述词和词之间的关系,即假设某个词wk出现的概率仅和其前n-Ι个词相关,记为P(~丨0(wj K显然语言模型也可以采用其他技术手段,比如字词对等,对此本发明实施例不做限定。在本发明实施例中,基于所述个性化信息词条和扩展词条构建扩展的解码网络可以采用多种不同的方式,比如:(I)首先将所述个性化信息词条及其对应的扩展词条并联,并设置每个词条为独立的语义路径构建语义模型;然后根据预置的声学模型、词典等对所述语义模型进行扩展,获得基于声学模型的解码网络。具体地,获取每个词条所对应的声学模型序列,扩展获得解码网络。比如,对个性化信息词条“科大讯飞王智国院长”的扩展得到“王院长”,“王智国院长”,“智国”,“科大讯飞王院长”,“王院长科大讯飞”等具体扩展词条。基于这些词条构建的语义模型如图2所示。(2)首先将所有个性化信息词条作为独立的语义路径,构建语义模型;然后根据预置的声学模型及词典对所述语义模型进行扩展,获得基本解码网络;最后对所述基本解码网络中每条个性化信息词条所在的路径,根据所述个性化词条对应的扩展词条在所述路径上增加新路径,得到扩展的解码网络。(3)首先将所有个性化信息词条作为独立的语义路径,构建语义模型;然后根据所述个性化信息词条对应的扩展词条在所述语义模型中的个性化信息词条所在的路径上增加新路径,得到扩展的语义模型;最后根据预置的声学模型及词典对所述语义模型进行扩展,得到扩展的解码网络。比如,扩展的解码网络如图3所示。
其中,路径支持“科大讯飞王智国院长”,“王智国院长”,“智国院长”,“院长”,“科大讯飞王院长”,“科大讯飞智国”,甚至“院长科大讯飞”等的词条。显然,路径扩展方式由基本语法模型的结构模式确定,根据各常见结构模式,确定各基本要素单元的连接关系,进而获取路径。步骤104,在接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径。所述查询语音信号可以是联系人查询信息的语音信号,比如,“讯飞张凯”对应的语音信号,当然也可以是其他查询信息的语音信号。步骤105,根据所述最优路径得到与所述查询语音信号对应的查询结果。所述查询结果可以是用户提供的数据库中的原有词条对应的链接,比如电话号码,或者是用户提供的数据库中的原有词条以及该词条对应的链接,由用户判断是否正确,或者是扩展词条及对应的链接等,对此本发明实施例不做限定。可见,与现有技术相比,由于本发明实施例的语音查询方法所使用的扩展的解码网络是基于用户的个性化信息词条和对应所述个性化信息词条的扩展词条构建的,而所述扩展词条能够更自由地描述原有词条所包含的信息,因而可以有效地提高语音查询自由度和准确率,更好地满足用户语音自由查询的需求。需要说明的是,本发明实施例的语音查询方法不仅可以应用于用户联系人的查询环境,还可以应用于其他个性化信息的查询环境中,对此本发明实施例不做限定。在实际应用中,所述基本语法扩展模型的构建可以采用离线训练的方式在大量采集的用户个性化信息比如联系人信息上,预先训练得到。如图4所示,是本发明实施例中构建基本语法扩展模型的流程图,包括以下步骤:步骤401,获取用户的个性化信息词条。步骤402,对所述个性化信息词条进行属性标注,得到属性序列。需要标注的属性可以根据用户个性化信息的特点来确定,比如,对于用户通讯录中的联系人信息,用户在录入时既有很大的随意性也有一定的规律可循。一般来说用户联系人条目中通常包含有要素:姓、名、称谓(如“爸”)、公司名(如“讯飞”)、职位或头衔(如“经理”)、职业(如“装修”)、关系(如“同事”)、区分词(如“新”)、数词(如“ 2,,)、其他相关事物(如“煤气公司”)等等。为此,可以根据预设的联系人常见属性,如“姓”,“名”,“公司”等对具体词条进行属性标注。同样,对于其他个性化信息,也可以预先设定其对应的常见属性,然后根据这些属性对每个具体词条进行属性标注。这样,对应每个词条,即可得到一个属性序列。步骤403,训练用于描述具体信息与所述属性序列之间的映射关系的标注模型。具体地,可以采用统计模型,比如CRF (Conditional Random Field,条件随机场)模型、HMM(Hidden Markov Model,隐马尔可夫模型)等,对该映射关系进行描述,并在上述标注词条上训练得到模型参数,包括跳转频率以及各状态的概率等,具体训练过程与传统的训练过程类似,在此不再详细描述。步骤404,根据所述属性序列生成用于描述信息结构模式的属性扩展模型。从采集的大量用户个性化信息词条对应的属性序列的训练数据中,统计得到各种结构模式的频度,并选择满足系统预设条件的多个结构模式生成用于描述信息结构模式的属性扩展模型。所述系统预设条件用于控制所述多个结构的规模,可以采用设定结构个数、或者结构频度大于预设阈值的方法控制。比如,对于联系人信息,通常的结构模式举例如下表I所示。表I
权利要求
1.一种语音查询方法,其特征在于,包括: 获取用户提供的数据库,所述数据库中包含用户的个性化信息词条; 基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,所述基本语法扩展模型用于描述个性化信息的扩展规律; 根据所述个性化信息词条和扩展词条构建扩展的解码网络; 在接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径; 根据所述最优路径得到与所述查询语音信号对应的查询结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:按以下方式构建所述基本语法扩展模型: 获取不同用户的个性化信息词条; 对所述个性化信息词条进行属性标注,得到属性序列; 训练用于描述具体信息与所述属性序列之间的映射关系的标注模型; 根据所述属性序列生成用于描述信息结构模式的属性扩展模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述属性序列生成用于描述信息结构模式的属性扩展模型包括: 统计所述属性序列中各种结构模式的频度; 根据所述频度选择满足预设条件的结构模式作为用于描述信息结构模式的属性扩展模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述频度选择满足预设条件的结构模式作为用于描述信息结构模式的属性扩展模型包括: 选择频度大于设定的频度阈值的结构模式作为所述属性扩展模型;或者 依据频度从高到低选择设定个数的结构模式作为所述属性扩展模型。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条包括: 根据所述标注模型确定所述个性化信息词条的基本要素单元; 根据所述属性扩展模型对所述基本要素单元进行扩展,得到与所述个性化信息词条对应的扩展词条。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述个性化信息词条和扩展词条构建扩展的解码网络包括: 将所述个性化信息词条及其对应的扩展词条作为独立的语义路径构建语义模型; 根据预置的声学模型和词典对所述语义模型进行扩展,获得扩展的解码网络。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述个性化信息词条和扩展词条构建扩展的解码网络包括: 将所有个性化信息词条作为独立的语义路径构建语义模型; 根据预置的声学模型及词典对所述语义模型进行扩展,获得基本解码网络; 对所述基本解码网络中每条个性化信息词条所在的路径,根据所述个性化词条对应的扩展词条在所述路径上增加新路径,得到扩展的解码网络。
8.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述个性化信息词条和扩展词条构建扩展的解码网络包括: 将所有个性化信息词条作为独立的语义路径,构建语义模型; 根据所述个性化信息词条对应的扩展词条在所述语义模型中的个性化信息词条所在的路径上增加新路径,得到扩展的语义模型; 根据预置的声学模型及词典对所述语义模型进行扩展,得到扩展的解码网络。
9.一种语音查询系统,其特征在于,包括: 获取模块,用于获取用户提供的数据库,所述数据库中包含用户的个性化信息词条;词条扩展模块,用于基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,所述基本语法扩展模型用于描述个性化信息的扩展规律; 解码网络构建模块,用于根据所述个性化信息词条和扩展词条构建扩展的解码网络; 接收模块,用于接收用户对所述数据库的查询语音信号; 解码模块,用于在所述接收模块接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径; 查询结果输出模块,用于根据所述最优路径得到与所述查询语音信号对应的查询结果O
10.根据权利要求9所述的系统,其特征在于,所述系统还包括: 扩展模型构建模块,用于构建所述基本语法扩展模型;所述扩展模型构建模块包括: 词条获取单元,用于获取不同用户的个性化信息词条; 属性标注单元,用于对所述个性化信息词条进行属性标注,得到属性序列; 标注模型训练单元,用于训练用于描述具体信息与所述属性序列之间的映射关系的标注模型; 属性扩展模型生成单元,用于根据所述属性序列生成用于描述信息结构模式的属性扩展模型。
11.根据权利要求10所述的系统,其特征在于,所述属性扩展模型生成单元包括: 统计子单元,用于统计所述属性序列中各种结构模式的频度; 选择子单元,用于根据所述频度选择满足预设条件的结构模式作为用于描述信息结构模式的属性扩展模型。
12.根据权利要求11所述的系统,其特征在于, 所述选择子单元,具体用于选择频度大于设定的频度阈值的结构模式作为所述属性扩展模型;或者依据频度从高到低选择设定个数的结构模式作为所述属性扩展模型。
13.根据权利要求10至12任一项所述的系统,其特征在于,所述词条扩展模块包括: 确定子单元,用于根据所述标注模型确定个性化信息词条的基本要素单元; 扩展子单元,用于根据所述属性扩展模型对所述基本要素单元进行扩展,得到与所述个性化信息词条对应的扩展词条,并由所述个性化信息词条和所述扩展词条组成对应所述个性化信息词条的扩展信息。
14.根据权利要求9至12任 一项所述的系统,其特征在于,所述解码网络构建模块包括:第一语义模型构建单元,用于将所述个性化信息词条及其对应的扩展词条作为独立的语义路径构建语义模型; 第一扩展单元,用于根据预置的声学模型和词典对所述语义模型进行扩展,获得扩展的解码网络。
15.根据权利要求9至12任一项所述的系统,其特征在于,所述解码网络构建模块包括: 第二语义模型构建单元,用于将所有个性化信息词条作为独立的语义路径构建语义模型; 第二扩展单元,用于根据预置的声学模型及词典对所述语义模型进行扩展,获得基本解码网络; 解码网络路径扩展单元,用于对所述基本解码网络中每条个性化信息词条所在的路径,根据所述个性化词条对应的扩展词条在所述路径上增加新路径,得到扩展的解码网络。
16.根据权利要求9至12任一项所述的系统,其特征在于,所述解码网络构建模块包括: 第三语义模型构建单元,用于将所有个性化信息词条作为独立的语义路径构建语义模型; 语义模型路径扩展单元,用 于根据所述个性化信息词条对应的扩展词条在所述语义模型中的个性化信息词条所在的路径上增加新路径,得到扩展的语义模型; 第三扩展单元,用于根据预置的声学模型及词典对所述语义模型进行扩展,得到扩展的解码网络。
全文摘要
本发明涉及信息查询技术领域,公开了一种语音查询方法及系统。该方法包括获取用户提供的数据库,所述数据库中包含用户的个性化信息词条;基于预先构建的基本语法扩展模型对所述个性化信息词条进行扩展,得到对应所述个性化信息词条的扩展词条,所述基本语法扩展模型用于描述个性化信息的扩展规律;根据所述个性化信息词条和扩展词条构建扩展的解码网络;在接收到用户对所述数据库的查询语音信号后,在所述扩展的解码网络内搜索最优路径;根据所述最优路径得到与所述查询语音信号对应的查询结果。利用本发明,可以提高多样化语音查询的匹配度,满足用户通过语音自由查询的需求。
文档编号G06F17/30GK103092928SQ20121059097
公开日2013年5月8日 申请日期2012年12月31日 优先权日2012年12月31日
发明者李剑峰, 何婷婷, 胡国平, 胡郁, 刘庆峰 申请人:安徽科大讯飞信息科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1