一种获取语音识别业务信息认可度的方法和装置制造方法

文档序号：2826519阅读：169来源：国知局

一种获取语音识别业务信息认可度的方法和装置制造方法
【专利摘要】本发明提供一种获取语音识别业务信息的认可度的方法和装置，涉及语音识别【技术领域】，能够提高处理交互信息的效率。所述方法包括：采集用户的语音信息；获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；向所述用户呈现所述语音识别业务信息；搜集所述用户对所述语音识别业务信息的反应信息；根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。本发明用于移动终端技术。
【专利说明】一种获取语音识别业务信息认可度的方法和装置
【技术领域】
[0001]本发明涉及语音识别【技术领域】，尤其涉及一种获取语音识别业务信息认可度的方法和装置。
【背景技术】
[0002]语音识别技术在移动终端上的运用能够为用户提供易于体验的人机交互服务。由于语音识别技术尚未成熟，在运用过程中，语音识别系统需要搜集移动终端用户对于语音识别的准确率或满意度的评价反馈，并根据用户的评价反馈进行优化调整，以提高语音识别的准确率。
[0003]移动终端的语音识别系统包括语音助手、语音输入法等。在语音助手运行时，常常采用复述确认的方式，为用户提供一个最优的识别结果，提示用户对该识别结果进行确认或取消；在语音输入法运行时，常常将多个识别结果呈现给用户，提示用户选择最满意的结果。在用户进行确认、取消或选择等反馈之后，根据用户的反馈，确定用户对于识别结果的满意度。
[0004]由于用户发音不标准、用户语音信息不明确或者识别能力有限等原因，无论是语音助手还是语音输入法都常常无法唯一地识别出用户所表达的内容，因此，这时需要给用户提供两个以上的识别结果，并且让用户从中按照自身意愿主动选择其期望的结果。但是，使用这种需要用户选择的交互方式来处理交互信息的效率较低。

【发明内容】

[0005]本发明的实施例提供一种获取语音识别业务信息的认可度的方法和装置，能够提高处理交互信息的效率。
[0006]为达到上述目的，本发明的实施例采用如下技术方案:
[0007]第一方面，提供一种获取语音识别业务信息的认可度的方法，包括:
[0008]采集用户的语音信息；
[0009]获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；
[0010]向所述用户呈现所述语音识别业务信息；
[0011]搜集所述用户对所述语音识别业务信息的反应信息；
[0012]根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。
[0013]结合第一方面，在第一方面的第一种可能的实现方式中，在所述获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板之前，所述方法还包括:
[0014]向服务器上传所述用户的语音信息，以使所述服务器根据所述语音信息确定所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板；
[0015]所述获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板包括:
[0016]接收所述服务器发送的所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板。
[0017]结合第一方面或第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述信息搜集模板还包括用户对所述业务信息的反应信息与业务信息的认可度的对应关系；
[0018]所述根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度包括:
[0019]根据搜集的所述反应信息和所述信息搜集模板中用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系，确定所述用户对所述语音识别业务信息的认可度。
[0020]结合第一方面的第一种可能的实现方式，在第一方面的第三种可能的实现方式中，所述根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度包括:
[0021]向所述服务器上传搜集的所述反应信息，以使所述服务器根据自身保存的用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系确定所述用户对所述语音识别业务信息的认可度；
[0022]接收所述服务器发送的所述用户对所述语音识别业务信息的认可度。
[0023]结合第一方面，在第一方面的第四种可能的实现方式中，在所述获取所述用户对所述语音识别业务信息的认可度之后，所述方法还包括:
[0024]根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化；
[0025]或者，向所述服务器上传所述用户对所述语音识别业务信息的认可度，以使所述服务器根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化。
[0026]结合第一方面，在第一方面的第五种可能的实现方式中，在所述获取所述用户对所述语音识别业务信息的认可度之后，所述方法还包括:
[0027]向所述用户显示所述认可度；
[0028]获取所述用户对所述认可度进行修改后的语音识别业务信息的实际认可度；
[0029]根据所述实际认可度，统计语音识别的准确率。
[0030]第二方面，提供一种获取语音识别业务信息的认可度的装置，包括:
[0031]获取单元，用于采集用户的语音信息；
[0032]所述获取单元还用于:获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；
[0033]输出单元，用于向所述用户呈现所述获取单元获取的所述语音识别业务信息；
[0034]所述获取单元还用于:搜集所述用户对所述语音识别业务信息的反应信息；
[0035]处理单元，用于根据所述获取单元搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。
[0036]结合第二方面，在第二方面的第一种可能的实现方式中，所述装置还包括:
[0037]发送单元，用于向服务器上传所述获取单元采集的所述用户的语音信息，以使所述服务器根据所述语音信息确定所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板；
[0038]所述获取单元具体用于:
[0039]接收所述服务器发送的所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板。
[0040]结合第二方面或第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，所述信息搜集模板还包括用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系；
[0041]所述处理单元具体用于:
[0042]根据所述获取单元搜集的所述反应信息和所述获取单元获取的所述信息搜集模板中用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系，确定所述用户对所述语音识别业务信息的认可度。
[0043]结合第二方面的第一种可能的实现方式，在第二方面的第三种可能的实现方式中，所述处理单元具体用于:
[0044]向所述服务器上传所述获取单元搜集的所述反应信息，以使所述服务器根据自身保存的用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系确定所述用户对所述语音识别业务信息的认可度；
[0045]接收所述服务器发送的所述用户对所述语音识别业务信息的认可度。
[0046]结合第二方面，在第二方面的第四种可能的实现方式中，所述处理单元还用于:
[0047]根据所述获取单元获取的所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化；
[0048]或者，向所述服务器上传所述获取单元获取的所述用户对所述语音识别业务信息的认可度，以使所述服务器根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化。
[0049]结合第二方面，在第二方面的第五种可能的实现方式中，所述输出单元还用于:向所述用户显示所述处理单元获取的所述认可度；
[0050]所述获取单元还用于:获取所述用户对所述认可度进行修改后的所述语音识别业务信息的实际认可度；
[0051]所述处理单元还用于:根据所述获取单元获取的所述实际认可度，统计语音识别的准确率。
[0052]根据本发明的实施例提供的获取语音识别业务信息的认可度的方法和装置，在采集用户的语音信息之后，获取对所述语音信息进行语音识别之后的语音识别业务信息。然后，向用户显示呈现所述语音识别业务信息，并搜集用户对所述语音识别业务信息的反应信息。由于用户是否认可所述语音识别业务信息的态度隐含在所述反应信息中，因此，结合所述反应信息和预先获取的所述业务信息对应的信息搜集模板，能够获取所述用户对所述语音识别业务信息的认可度。相对于现有技术中可能为用户提供两个以上的识别结果并且提示用户从中选择符合期望的结果而导致处理交互信息的效率较低，本发明实施例提供的获取语音识别业务信息认可度的方法和装置无需用户的主动介入即能获取用户对所述语音识别业务信息的认可度，因此，能够提高处理交互信息的效率。
【专利附图】

【附图说明】
[0053]图1为本发明获取语音识别业务信息的认可度的方法的一实施例的流程图；
[0054]图2为本发明获取语音识别业务信息的认可度的方法的另一实施例的流程图；
[0055]图3为本发明获取语音识别业务信息的认可度的方法的又一实施例的流程图；
[0056]图4为本发明获取语音识别业务信息的认可度的方法的一具体实施例的流程图；
[0057]图5A为本发明获取语音识别业务信息的认可度的装置的一实施例的结构图；
[0058]图5B为本发明获取语音识别业务信息的认可度的装置的另一实施例的结构图；
[0059]图6为本发明获取语音识别业务信息的认可度的装置的又一实施例的结构图。
【具体实施方式】
[0060]下面结合附图对本发明实施例的技术方案进行清楚地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0061]本发明实施例提供的方法可以由具有语音识别系统的移动终端来实施，所述移动终端举例而言可以为手机、平板电脑等。所述移动终端也可以连接网络，在服务器的语音引擎的支持下工作。
[0062]图1是本发明获取语音识别业务信息认可度的方法的一实施例的流程图。为了简便，语音识别业务信息可以称为业务信息。如图1所示，本发明实施例提供的获取语音识别业务信息的认可度的方法包括:
[0063]11，采集用户的语音信息。
[0064]在移动终端启动语音识别服务后，移动终端采集用户的语音信息。所述语音信息举例而言可以为:命令移动终端执行某项操作，命令移动终端根据用户的话音自动输入文字，命令移动终端回答用户提出的问题等。
[0065]12，获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合。
[0066]在具体应用中，移动终端可以自身确定或从服务器获取所述操作指令、所述业务信息和所述信息搜集模板。即，在采集到语音信息之后，移动终端可以对该语音信息进行语首识别获得操作指令、业务?目息，并确定?目息搜集模板；或者，在米集到语首?目息之后，移动终端也可以将该语音信息发送服务器，由服务器对该语音信息进行语音识别获得操作指令、业务信息并确定信息搜集模板，然后移动终端再由服务器获取业务信息和信息搜集模板。
[0067]其中，操作指令是通过对语音信息进行语音识别和语义分析得到的。通过执行操作指令，可以调用各种形式的业务信息。所述业务信息可以是各种媒体形式的，例如文字、声音、图像、动画等；可以是移动终端从本地存储中调用的，也可以是移动终端从网络中获取的；可以是开始调用某个程序时呈现给用户的各种媒体信息，也可以是程序运行中呈现给用户的各种媒体信息。具体地，通过语音识别，得到与该语音信息相应的文字。在某些应用中，例如语音输入法中，可以将文字作为业务信息。一般情况下，还可以对文字进行语义分析，经过语义分析之后得到与文字语义相应的操作指令，即与语音信息相应的操作指令。然后，通过执行操作指令，得到语音信息对应的业务信息。
[0068]确定与业务信息对应的信息搜集模板过程具体为:根据业务信息确定该业务信息指向的应用场景(例如，打电话，查看地图等)。然后，可以根据所判断出的应用场景，从包括众多应用场景所对应的信息搜集模板的数据库中选择与所判断的应用场景对应的信息搜集模板。信息搜集模板可以包括用户对业务信息的多种反应信息的集合。例如，在用户向移动终端发出语音信息“请为我读短信”的场景下，服务器判断出应用场景是播报短信。在该应用场景下，服务器产生的信息搜集模板可以包含:搜集到用户双击主页键来打断短信播报，没有搜集到用户双击主页键来打断短信播报，搜集到用户说出其他命令，或没有搜集到用户说出其他命令等。
[0069]13，向所述用户呈现所述业务信息。
[0070]在此步骤中，所述移动终端可以直接各种媒体形式的业务信息呈现给用户。
[0071]14，搜集所述用户对所述业务信息的反应信息。
[0072]移动终端可以从向用户显示业务信息开始，或者从采集用户的语音信息开始，搜集用户对该业务信息的反应信息。在此过程中，所述移动终端并未明确提示用户对所述业务信息是否准确进行评价，即，所述反应信息无需用户主动介入，移动终端即可获取。其中，用户的反应信息举例而言可以为用户在所述移动终端上进行的按键操作、触屏操作、语音输入操作等。
[0073]15，根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述业务信息的认可度。
[0074]在此步骤中，在移动终端自身确定信息搜集模板的情况下，若该信息搜集模板还包括用户对业务信息的反应信息与业务信息的认可度的对应关系，则移动终端能够直接根据搜集的反应信息以及信息搜集模板，确定该用户对该业务信息的认可度；若信息搜集模板不包括所述对应关系，则所述移动终端可以在搜集所述反应信息之后，再根据本地存储中的所述对应关系确定所述认可度。
[0075]在移动终端从服务器获取信息搜集模板的情况下，若信息搜集模板包括用户对业务信息的反应信息与业务信息的认可度的对应关系，则移动终端能够直接根据搜集的反应信息以及所述信息搜集模板，确定用户对业务信息的认可度；若所述信息搜集模板不包括所述对应关系，则移动终端可以将反应信息发送给服务器，由服务器根据自身存储的所述对应关系确定所述认可度，该服务器在确定所述认可度之后，将所述认可度发送给移动终端。
[0076]用户对语音识别业务信息的认可度，也即用户对业务信息的认可度，是指用户认为业务信息与用户的语音信息相符合的程度。由于用户对业务信息的反应信息包含用户对业务信息的反馈信息，例如包含用户是否认可该业务信息的态度，因此，虽然用户没有直接明确地提供对所述业务信息的认可度，但是移动终端和服务器能够通过分析用户对业务信息的反应信息而得到用户对业务信息的认可度。而且，由于移动终端或服务器判断用户对业务信息的认可度所采用的准则统一且客观，能够减小因用户不同而导致的判断误差，因此，相比于用户自身直接给出认可度，根据本发明提供的方法判断出来的认可度更具有客观性。
[0077]例如，在用户要求移动终端为其查询交通状况的情况下，在移动终端为用户展示电子地图时，若该移动终端在预定时间内(例如30秒)没有接收到用户的指令，则可以确定出一个反应信息(即预定时间内没有接收到用户的指令)。虽然用户没有明确回答是否认可本次查询，但是，用户认可本次查询的信息已经隐含该反应信息中，因此，移动终端能够根据该反应信息判断用户认可了本次查询。可见，用户的反应可以是非动作的。又例如，在移动终端接收到用户的拨打电话命令的情况下，移动终端在识别出用户的命令之后，并没有询问“你要给张三打电话吗？确认或者取消”，而是直接给张三打电话。移动终端若没有搜集到用户立即挂断电话的反应，则可以判断用户认可本次语音识别。
[0078]在此步骤中，由于搜集的用户对业务信息的反应信息可能很多，因此，需要结合预先获取的信息搜集模板，确定包含于该信息搜集模板中的用户对业务信息的反应信息，从而实现用户对业务信息的认可度的获取。
[0079]上述实施例是对一次语音识别的描述，其中，移动终端对用户对业务信息的反应信息的搜集过程可以以用户发出语音信息为起点，到显示业务信息完成为止；也可以以开始显示业务信息为起点，到显示业务信息完成为止。另外，在前一次语音识别及显示业务信息尚未结束，后一次语音识别已经开始的情况下，移动终端可以将搜集的用户的反应信息作为用户对后一次语音识别的反应信息。当然，在特殊情况下，例如用户输入语音信息触发后一次语音识别的动作本质上是对前一次业务信息的反应，则用户输入语音信息触发后一次语音识别的动作信息需作为前一次语音识别的反应信息。
[0080]本发明实施例中，移动终端采集用户的语音信息，还获取对该语音信息进行语音识别之后的业务信息。然后，移动终端向用户呈现该业务信息，并搜集用户对所述业务信息的反应信息。由于用户是否认可所述业务信息的态度包含在所述反应信息中，因此，结合所述反应信息和预先获取的所述业务信息对应的信息搜集模板，能够获取所述用户对所述业务信息的认可度。因此，相对于现有技术中可能为用户提供两个以上的识别结果并提示用户从中选择符合期望的结果，导致处理交互信息的效率较低且增加用户的操作负担和引发用户的反感，根据本发明实施例提供的获取语音识别业务信息认可度的方法，通过自动搜集用户对语音识别的业务信息的反应信息和所述信息搜集模板，在无需用户主动介入的情况下，就能够获取用户对业务信息的认可度，因此，能够提高处理交互信息的效率。
[0081]图2是本发明获取语音识别业务信息认可度的方法的另一实施例的流程图。本实施例应用于移动终端从服务器获取操作指令、业务信息和信息搜集模板的场景。如图2所示，本发明实施例提供的获取语音识别认可度的方法包括:
[0082]21，移动终端采集用户的语音信息并将该语音信息发送给服务器。
[0083]在启动语音识别服务后，移动终端可以以录音的方式采集用户的语音信息。在录音完成后，移动终端可以将该语音信息发送给服务器。
[0084]22，服务器对语音信息进行语音识别得到该语音信息对应的操作指令并将该操作指令发送给移动终端。[0085]具体地，服务器(包括其上的语音引擎)在接收到移动终端发送的语音信息之后，可以对该语音信息进行语音识别，得到语音识别的可能结果。所述可能结果为与该语音信息相应的文字。由于语音识别的能力有限，可能结果可能为多个。若语音识别的可能结果为多个，则服务器可以从多个的语音识别的可能结果中，选择出最优的结果，即与语音信息最符合的结果。而且，服务器还可以进一步对所述文字进行语义分析并得到与所述文字语义相应的操作指令。然后，服务器将该操作指令发送给移动终端。
[0086]23，移动终端接收并执行操作指令以从服务器获取业务信息和该业务信息对应的信息搜集模板。
[0087]移动终端通过执行与语音信息对应的操作指令以从服务器获取与该操作指令对应的业务信息。其中，移动终端在执行操作指令时不同于现有技术会产生多个需要用户进行选择的结果，而是单独的一个执行结果。这样，能够简化用户的操作，优化用户的体验。业务信息可以运用于语音控制系统或智能对话查询系统中。其中，语音控制系统是指用语音信息来控制设备的运行的系统。智能对话查询系统是指根据用户的语音信息进行操作，为用户提供自然、友好的数据库检索服务的系统。
[0088]在确定业务信息之后，服务器还需进一步确定与该业务信息对应的信息搜集模板，其过程可参照步骤12中描述的确定与业务信息对应的信息搜集模板的过程。
[0089]24，服务器将业务信息和信息搜集模板发送给移动终端，移动终端将该业务信息呈现给用户。
[0090]在本步骤中，移动终端接收服务器发送的业务信息和信息搜集模板，并将业务信息呈现给用户。
[0091]例如，若用户对移动终端说出“附近的交通状况怎么样？ ”的语音信息，服务器可以识别出该语音信息所对应的文字是“附近交通状况”，并分析出文字对应的语义是查询交通状况，地点是用户当前所在位置附近。然后，服务器控制移动终端启动电子地图，为用户展示一幅带有实时交通信息的地图，并把用户当前所在位置显示在中心。
[0092]25，移动终端搜集用户对业务信息的反应信息。
[0093]在此步骤中，移动终端例如可以以监控用户的对移动终端的操作的方式，监控和搜集用户的反应信息。
[0094]举例而言，在本发明运用于语音控制系统或智能对话查询系统时，若移动终端呈现给用户的业务信息与用户的语音信息相符，且用户对业务信息的反应是认可的，例如用户不打断业务信息继续呈现等，则移动终端搜集到用户对业务信息的反应信息即是用户不打断业务信息继续呈现。若移动终端若业务信息与用户的语音信息不符，且用户对业务信息的反应是不认可的，例如用户打断业务信息的呈现等，则移动终端搜集到用户对业务信息的反应信息即是用户打断业务信息的呈现。
[0095]26,移动终端确定包含于信息搜集模板中的用户对业务信息的反应信息。
[0096]根据上文所述，在确定业务信息之后，服务器可以进一步确定与该业务信息对应的信息搜集模板，并将该信息搜集模板发送给移动终端。这样，在获取到用户对业务信息的信息之后，移动终端可以结合预先获取的信息搜集模板，确定包含于信息搜集模板中的用户对业务信息的反应信息，从而实现用户对业务信息认可度的获取。
[0097]此外，由于用户所做的反应不一定都与用户对业务信息认可度相关，因此，在搜集用户的反应信息完成之后，可以利用信息搜集模板对反应信息进行筛选，选择出能够确定用户对业务信息的认可度的反应信息。
[0098]27，移动终端根据包含于信息搜集模板中的用户对业务信息的反应信息的集合、用户对业务信息的反应信息与业务信息的认可度的对应关系，确定用户对业务信息的认可度。
[0099]用户对业务信息的反应信息与业务信息的认可度的对应关系可以包含于信息搜集模板中。所述对应关系可以作为判断用户是否认可语音识别业务信息的准则。例如，在上述播报短信的例子中，所述对应关系可以为:用户没有双击主页键来打断对应用户的认可度高；用户没有说出其他命令对应用户的认可度高；用户双击主页键来打断对应用户的认可度很低；用户说出其他命令对应用户的认可度很低。
[0100]在确定包含于信息搜集模板中的用户对业务信息的反应信息后，结合所述对应关系能够判断用户对业务信息的认可度。
[0101]另外，移动终端在根据上述的方式判断出用户对业务信息的认可度之后，可以将该认可度发送给服务器。或者，移动终端不进行认可度的判断，而是将用户对业务信息的反应信息或包含于信息搜集模板中的用户对业务信息的反应信息发送给服务器，以使服务器根据自身保存的用户对业务信息的反应信息与业务信息的认可度的对应关系判断用户对业务信息的认可度。在判断出所述认可度之后，服务器可以向移动终端返回该认可度。
[0102]服务器在获取所述用户对所述业务信息的认可度之后，可以根据所述认可度对语音识别算法进行优化，即算法再增强。算法再增强是指服务器根据多次获取的用户对业务信息的认可度，对该认可度进行统计分析等处理，得出对于某一确定的语音信息，多个的语音识别可能结果的认可度高低顺序。这样，在以后的识别中，对于同一个语音信息，倾向于为用户提供认可度最高的识别结果。
[0103]28，移动终端向用户显示所述认可度，并获取用户对所述认可度进行修改后的业务信息的实际认可度。
[0104]在确定用户对业务信息的认可度之后，移动终端还可以向用户显示所述认可度。举例而言，可以在移动终端上显示一个认可度的图标。这样，用户能够通过查看该图标获知移动终端或服务器自动判别的认可度。而且，用户可以将所述认可度修改为用户对业务信息的实际认可度。移动终端还可以获取该实际认可度，进而统计多次语音识别的准确率。根据该准确率，能够优化判别规则和语音识别算法。
[0105]相对于现有技术中可能为用户提供两个以上的识别结果，并且提示用户从中选择其期望的结果，导致处理交互信息的效率较低且增加用户的操作负担和引发用户的反感，根据本发明实施例提供的获取语音识别业务信息认可度的方法，通过自动搜集用户对语音识别的业务信息的反应信息和信息搜集模板，能够在无需用户主动介入的情况下，就能够自动获取用户对业务信息的认可度，因此，能够提高处理交互信息的效率。
[0106]图3是本发明获取语音识别业务信息认可度的方法的又一实施例的流程图。本实施例应用于移动终端自身确定操作指令、业务信息和信息搜集模板的场景。如图3所示，本发明实施例提供的获取语音识别业务信息认可度的方法包括:
[0107]31，移动终端采集用户的语音信息。
[0108]32，移动终端识别语音信息得到该语音信息对应的操作指令。[0109]参照步骤12的说明，在获取到语音信息之后，移动终端可以对该语音信息进行语音识别和语义分析，得到该语音信息对应的文字，并产生从文字数据库中提取所述文字的操作指令。
[0110]33，移动终端执行操作指令得到该操作指令对应的业务信息，并确定该业务信息对应的信息搜集模板。
[0111]在用户欲通过语音输入系统输入文字的情况下，移动终端执行操作指令从文字数据库中提取相应的文字作为业务信息。而且，移动终端还需确定业务信息对应的信息搜集模板。
[0112]34，移动终端向用户显示业务信息。
[0113]在得到文字形式的业务信息之后，移动终端可以在显示屏上直接显示用户欲输入的文字内容。
[0114]35，移动终端搜集用户对业务信息的反应信息。
[0115]在本步骤中，若移动终端向用户显示的文字与用户的语音信息相符，且用户对所述文字的反应是认可的，例如用户可以保留所述文字，输入后续文字等，则移动终端搜集到用户对业务信息的反应信息即是用户保留所述文字，输入后续文字。若所述文字与语音信息不符，用户对所述文字的反应是不认可的，例如用户可以删除所述文字，重新输入文字等，则移动终端搜集到用户对业务信息的反应信息即是用户删除所述文字，重新输入文字等。移动终端能够从用户开始输入语音信息开始，以监控用户的操作命令的方式，对用户对业务信息的反应信息进行监控和搜集。
[0116]36，移动终端根据反应信息和信息搜集模板确定用户对业务信息的认可度。
[0117]37，移动终端向用户显示所述认可度，并获取用户对所述认可度进行修改后的业务信息的实际认可度。
[0118]移动终端在确定用户对业务信息的认可度之后，可以根据所述认可度对语音识别算法进行优化，具体过程可参照步骤27和28的描述。
[0119]相对于现有技术中可能为用户提供两个以上的识别结果，并且提示用户从中选择符合期望的结果，导致处理交互信息的效率较低且增加用户的操作负担和引发用户的反感，本发明实施例提供的获取语音识别业务信息认可度的方法无需用户主动介入，就能够自动获取用户对业务信息的认可度和提高处理交互信息的效率。
[0120]为更好地理解本发明，下面再以几个具体实施例为例来对本发明进行进一步说明。亦须注意，以下所列举的实施例只是本发明的一部分实施例，本领域技术人员由本发明所述内容，可易于想到其他实施例，它们都在本发明的范围内。
[0121]图4是本发明获取语音识别业务信息认可度的方法的一具体实施例的流程图。在本具体实施例中，以移动终端是手机为例进行说明。服务器上具有语音识别功能的语音引擎。为了简便，将与作为移动终端的手机相对的一侧统称为服务器(包括语音引擎)。如图4所示，本发明具体实施例提供的获取语音识别业务信息认可度的方法包括:
[0122]41，手机对用户查询天气的语音信息进行录音，并将录音后的语音信息发送给服务器。
[0123]在手机开启语音识别服务的应用程序(例如可以为语音助手)后，用户向手机发出语音信息。例如，用户说出“这两天上海天气咋样”。然后，手机对用户所说的话进行录音。在录音完成后，手机可以将通过录音得到的录音片段/录音流发送给服务器。
[0124]42，服务器对语音信息进行语音识别和语义分析，得到查询天气的操作指令并选择与该操作指令对应的信息搜集模板。
[0125]例如，服务器识别出来的文字为“两天上海天气”，并分析出相关的语义是查询天气，地点是上海。服务器可以根据所述语义，产生控制手机开启电子地图的操作指令。
[0126]此外，服务器还根据所分析出的语义，判断语音信息指向的应用场景(例如，打电话，查看地图等)。然后，可以根据所判断出的应用场景，从包括众多应用场景所对应的信息搜集模板的数据库中选择与该应用场景对应的信息搜集模板。例如，在上述查询天气的情况下，信息搜集模板可以包括:在手机播报天气信息时，用户听了完结果，或用户听了完结果少于10%，或用户点击了结果中的链接等。在用户要求手机为其查询其所在位置附近的交通情况或地图信息的情况下，信息搜集模板可以包括:在手机为所用户展示一副地图时，用户无动作时间超过30S，或用户没有滑动手势等。
[0127]43，服务器将操作指令和信息搜集模板发送给手机，手机接收并执行该操作指令，获取天气信息并向用户播报该天气信息。
[0128]手机在接收到操作指令之后可以立即执行并产生执行结果，不需要用户进行确认、取消或选择。还以上述查询上海当天天气为例，服务器在别出语义为“查询天气”时，发送给手机的执行命令不会是“查询上海的天气吗，请确认或取消”，而是不询问用户，直接获取由服务器查询的上海的天气，并将天气信息播报给用户。
[0129]44，手机自动搜集用户对天气信息的反应信息。
[0130]在用户向手机说出“这两天上海天气咋样”的命令的场景下，若手机向用户播报天气信息正是这两天上海的天气情况，则用户可能听了完结果或点击了结果中的链接。此时，手机搜集到用户对天气信息的反应信息即是用户听了完结果，或用户点击了结果中的链接。若手机向用户播报天气信息不是这两天上海的天气情况，则用户可能听了完结果少于10%。此时，手机搜集到用户对天气信息的反应信息即是用户听了完结果少于10%。
[0131]45，手机根据用户对天气信息的反应信息和信息搜集模板，确定包含于该信息搜集模板的用户对该天气信息的反应信息。
[0132]举例而言，在上述用户命令手机为其查询上海天气的场景下，手机中的处理器搜集到用户对天气信息的反应信息可能为:用户听了完结果，用户点击了结果中的链接或用户听了完结果少于10%。手机根据信息搜集模板能够判断上述的反应信息均属于用户对该天气信息的反应信息。除了上述的反应信息之外，手机还可能搜集到用户做了其他动作，例如接听了电话，但是该动作不包含于信息搜集模板中，因此，手机将该动作排除出用户对该天气信息可能的反应信息。这样，能够实现所述认可度的获取。
[0133]46，手机根据包含于信息搜集模板的用户对天气信息的反应信息、用户对天气信息的反应信息与业务信息的认可度的对应关系，确定用户对该天气信息的认可度，并将所述认可度发送给服务器。
[0134]用户对天气信息的认可度可以使用评分或分级的方式，例如很满意、满意、一般、不满意等。用户对天气信息的反应信息与业务信息的认可度的对应关系可以用于判断用户是否认可所述天气信息的准则。例如，在上述查询天气的例子中，所述对应关系可以为:若用户听了完结果，则判断用户识别认可度高；若用户听了完结果少于10%，则判断用户识别认可度很低；若用户点击了结果中的链接，则判断用户识别认可度高。
[0135]相对于现有技术中可能为用户提供两个以上的识别结果，并且提示用户从中选择其期望的结果，导致处理交互信息的效率较低且增加用户的操作负担和引发用户的反感，根据本发明实施例提供的获取语音识别业务信息认可度的方法，通过自动搜集用户对语音识别的业务信息的反应信息和所述信息搜集模板，能够在无需用户主动介入的情况下，就能够自动获取用户对业务信息的认可度，因此，能够提高处理交互信息的效率。
[0136]与本发明实施例提供的一种获取语音识别业务信息认可度的方法相对应，本发明实施例还提供一种获取语音识别业务信息认可度的装置，所述装置具体可以为手机、计算机等。如图5A所示，本发明实施例提供的一种获取语音识别业务信息认可度的装置50包括:
[0137]获取单元51，用于采集用户的语音信息；
[0138]所述获取单元51还用于:获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；
[0139]输出单元52，用于向所述用户呈现所述获取单元51获取的所述语音识别业务信息；
[0140]所述获取单元51还用于:搜集所述用户对所述语音识别业务信息的反应信息；
[0141]处理单元53，用于根据获取单元51搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。
[0142]进一步地，所述信息搜集模板还包括用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系；处理单元53具体用于:根据获取单元51搜集的所述反应信息和和获取单元51获取的所述信息搜集模板中用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系，确定所述用户对所述语音识别业务信息的认可度。
[0143]可选地，处理单元53还用于:根据获取单元51获取的所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化。
[0144]可选地，输出单元52还用于:向所述用户显示处理单元53获取的所述认可度；获取单元51还用于:获取所述用户对所述认可度进行修改后的所述语音识别业务信息的实际认可度；处理单元53还用于:根据获取单元51获取的所述实际认可度，统计业务信息的准确率。
[0145]根据本发明的实施例提供的获取语音识别业务信息认可度的装置，所述装置在采集用户的语音信息之后，获取对所述语音信息进行语音识别之后的业务信息。然后，所述装置向用户显示所述业务信息，并搜集用户对所述业务信息的反应信息。由于用户是否认可所述业务信息的态度包含在所述反应信息中，因此，结合所述反应信息和预先获取的所述业务信息对应的信息搜集模板，能够获取所述用户对所述业务信息的认可度。相对于现有技术中可能为用户提供两个以上的识别结果，并且需要用户从中选择其期望的结果，导致增加用户的操作负担和引发用户的反感，本发明实施例提供的获取语音识别业务信息认可度的装置在无需用户主动介入即能获取用户对所述语音识别业务信息的认可度，因此，能够提高处理交互信息的效率。[0146]如图5B所示，可选地，在本发明获取语音识别业务信息认可度的装置50的另一实施例中，所述装置50还包括:发送单元54，用于向服务器上传获取单元51采集的所述用户的语音信息，以使所述服务器根据所述语音信息确定所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板；获取单元51具体用于:接收所述服务器发送的所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板。
[0147]可选地，处理单元53还用于:向所述服务器上传获取单元51获取的所述用户对所述语音识别业务信息的认可度，以使所述服务器根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化。
[0148]可选地，处理单元53具体用于:向所述服务器上传获取单元51搜集的所述反应信息，以使所述服务器根据自身保存的用户对所述业务信息的语音识别反应信息与语音识别业务信息的认可度的对应关系确定所述用户对所述业务信息的认可度；并且，接收所述服务器发送的所述用户对所述语音识别业务信息的认可度。
[0149]图6为本发明获取语音识别业务信息认可度的装置的又一实施例的结构图。如图
6所示，本实施例的获取语音识别业务信息认可度的装置60包括:至少一个处理器61、存储器62、麦克风63、显示屏和扬声器64、通信接口 65和总线。处理器61、存储器62、麦克风63、显示屏和扬声器64、通信接口 65通过总线连接并完成相互间的通信。所述总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。其中:
[0150]麦克风63用于米集用户的语音信息；
[0151]处理器61用于从存储器62获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；
[0152]显示屏和扬声器64用于向所述用户呈现处理器61获取的所述语音识别业务信息；
[0153]处理器61还用于搜集所述用户对所述语音识别业务信息的反应信息，并根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。
[0154]处理器61可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
[0155]需说明的是，上述处理器61除了具有上述功能之外，还可用于执行上述方法实施例中的其他流程，在此不再赘述。
[0156]存储器62可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
[0157]通信接口 65主要用于实现本实施例的获取语音识别业务信息认可度的装置60与其他设备或装置之间的通信。
[0158]本说明书中的各个实施例已有侧重地进行了描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。
[0159]需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
[0160]以上所述，仅为本发明的【具体实施方式】，但本发明的保护范围并不局限于此，任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。
【权利要求】
1.一种获取语音识别业务信息的认可度的方法，其特征在于，包括:采集用户的语音信息；获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；向所述用户呈现所述语音识别业务信息；搜集所述用户对所述语音识别业务信息的反应信息；根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。
2.根据权利要求1所述的方法，其特征在于，在所述获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板之前，所述方法还包括:向服务器上传所述用户的语音信息，以使所述服务器根据所述语音信息确定所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板；所述获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板包括:接收所述服务器发送的所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板。
3.根据权利要求1或2所述的方法，其特征在于，所述信息搜集模板还包括用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系；所述根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度包括:根据搜集的所述反应信息和所述信息搜集模板中用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系，确定所述用户对所述语音识别业务信息的认可度。
4.根据权利要求2所述的方法，其特征在于，所述根据搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度包括:向所述服务器上传搜集的所述反应信息，以使所述服务器根据自身保存的用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系确定所述用户对所述语音识别业务信息的认可度；接收所述服务器发送的所述用户对所述语音识别业务信息的认可度。
5.根据权利要求1所述的方法，其特征在于，在所述获取所述用户对所述语音识别业务信息的认可度之后，所述方法还包括:根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化；或者，向所述服务器上传所述用户对所述语音识别业务信息的认可度，以使所述服务器根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化。
6.根据权利要求1所述的方法，其特征在于，在所述获取所述用户对所述语音识别业务信息的认可度之后，所述方法还包括:向所述用户显示所述认可度；获取所述用户对所述认可度进行修改后的语音识别业务信息的实际认可度；根据所述实际认可度，统计语音识别的准确率。
7.一种获取语音识别业务信息的认可度的装置，其特征在于，包括: 获取单元，用于采集用户的语音信息；所述获取单元还用于:获取所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板，其中，所述信息搜集模板包括用户对所述语音识别业务信息的反应信息的集合；输出单元，用于向所述用户呈现所述获取单元获取的所述语音识别业务信息；所述获取单元还用于:搜集所述用户对所述语音识别业务信息的反应信息；处理单元，用于根据所述获取单元搜集的所述反应信息以及所述信息搜集模板，获取所述用户对所述语音识别业务信息的认可度。
8.根据权利要求7所述的装置，其特征在于，所述装置还包括: 发送单元，用于向服务器上传所述获取单元采集的所述用户的语音信息，以使所述服务器根据所述语音信息确定所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板；所述获取单元具体用于: 接收所述服务器发送的所述语音信息对应的操作指令、所述操作指令对应的语音识别业务信息和所述语音识别业务信息对应的信息搜集模板。
9.根据权利要求7或8所述的装置，其特征在于，所述信息搜集模板还包括用户对所述业务信息的反应信息与语音识别业务信息的认可度的对应关系；所述处理单元具体用于: 根据所述获取单元搜集的所述反应信息和所述获取单元获取的所述信息搜集模板中用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系，确定所述用户对所述语音识别业务信息的认可度。
10.根据权利要求8所述的装置，其特征在于，所述处理单元具体用于: 向所述服务器上传所述获取单元搜集的所述反应信息，以使所述服务器根据自身保存的用户对所述语音识别业务信息的反应信息与语音识别业务信息的认可度的对应关系确定所述用户对所述语音识别业务信息的认可度；接收所述服务器发送的所述用户对所述语音识别业务信息的认可度。
11.根据权利要求7所述的装置，其特征在于，所述处理单元还用于: 根据所述获取单元获取的所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化；或者，向所述服务器上传所述获取单元获取的所述用户对所述语音识别业务信息的认可度，以使所述服务器根据所述用户对所述语音识别业务信息的认可度对语音识别算法进行优化。
12.根据权利要求 7所述的装置，其特征在于，所述输出单元还用于:向所述用户显示所述处理单元获取的所述认可度；所述获取单元还用于:获取所述用户对所述认可度进行修改后的所述语音识别业务信息的实际认可度；所述处理单元还用于:根据所述获取单元获取的所述实际认可度，统计语音识别的准确率。
【文档编号】G10L15/00GK103646644SQ201310683946
【公开日】2014年3月19日申请日期:2013年12月12日优先权日:2013年12月12日
【发明者】樊艳梅, 蒋洪睿申请人:华为终端有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：樊艳梅;蒋洪睿
技术所有人：华为终端有限公司
我是此专利的发明人

上一篇：一种电子蜂鸣器的制造方法
上一篇：一种音频处理方法、装置及终端设备的制作方法