一种检测语音助手的网站系统、方法、存储介质及服务器与流程

文档序号：29798548发布日期：2022-04-23 19:28阅读：170来源：国知局

1.本发明涉及互联网技术领域，尤其涉及一种检测语音助手的网站系统、方法、存储介质及服务器。

背景技术：

2.近年来，人工智能发展迅速，在语音识别领域的应用越来越广泛，人机对话技术越来越成熟，由此衍生的语音助手已满足生产生活需求，正式进入人们的社会生活。
3.语音助手在应用于任何一个领域之前都需要进行大量的训练，不同的训练材料产生的预期结果都大有不同，因此每个领域的语音助手都需要进行单独的训练。目前市面上的语音助手大多是互联网企业训练的适配app的语音系统，虽然在手机等设备上表现良好，但并不适用于制造业的设备语音交互，特别是需求区别很大的空调系统。为此，不仅需要训练一个适合制造业的语音交互的语音助手系统，最主要是需要一个能对语音助手进行检测的系统，来对训练好的语音助手进行检测。

技术实现要素：

4.为了解决对训练好的语音助手进行检测的技术问题，本发明提供一种检测语音助手的网站系统、方法、存储介质及服务器。
5.第一方面，本发明实施例提供一种检测语音助手的网站系统，包括：
6.交互模块，用于获取用户录入的语音指令；
7.预测模块，用于利用预先训练的预测模型，获取并显示针对所述语音指令的响应，以供用户对所述响应正确与否进行判断；
8.其中，所述预先训练的预测模型用于模拟语音助手。
9.在一些实施方式中，所述网站系统还包括：
10.判断模块，用于获取用户对所述响应正确与否的判断结果的输入操作并显示所述判断结果。
11.在一些实施方式中，所述判断模块还用于：在所述响应不正确的情况下，获取用户输入预期响应的操作并显示所述预期响应。
12.在一些实施方式中，所述网站系统还包括：
13.准确率计算模块，用于基于所述响应正确与否的判断结果，计算所述语音助手的准确率。
14.在一些实施方式中，所述网站系统还包括：
15.数据库模块，用于存储以下信息中的至少一个：
16.所述语音指令；
17.针对所述语音指令的响应；
18.所述对所述响应正确与否的判断结果；
19.所述预期响应；
20.所述语音助手的准确率。
21.在一些实施方式中，所述预先训练的预测模型包括xgboost模型，所述xgboost模型是基于语音指令与目标响应的训练数据训练得到。
22.在一些实施方式中，，所述语音助手包括空调语音助手，所述xgboost模型是基于针对空调的语音指令与目标响应的训练数据训练得到。
23.在一些实施方式中，所述网站系统采用django框架、以python编程语言代码编写网页；
24.所述交互模块使用html5语言描述方式和javascript编程语言实现获取用户的语音指令的功能，以获取用户的语音指令。
25.在一些实施方式中，所述网站系统还包括：
26.预处理模块，用于将所述语音指令转化成文本信息并提取文本特征，输入所述预先训练的预测模型。
27.第二方面，本发明实施例提供一种检测语音助手的方法，基于第一方面所述的检测语音助手的网站系统实现，所述方法包括：
28.获取用户录入的语音指令；
29.利用预先训练的预测模型，获取针对所述语音指令的响应并显示，以供用户对所述响应正确与否进行判断；
30.其中，所述预先训练的预测模型用于模拟语音助手。
31.在一些实施方式中，所述检测语音助手的方法还包括：
32.获取用户对所述响应正确与否的判断结果的输入操作并显示所述判断结果。
33.在一些实施方式中，所述检测语音助手的方法还包括：在所述响应不正确的情况下，获取用户输入预期响应的操作并显示所述预期响应。
34.在一些实施方式中，所述检测语音助手的方法还包括：
35.基于所述响应正确与否的判断结果，计算所述语音助手的准确率。
36.在一些实施方式中，所述利用预先训练的预测模型，获取并显示针对所述语音指令的响应之前，还包括：
37.将所述语音指令转化成文本信息并提取文本特征，输入预先训练的预测模型。
38.第三方面，本发明实施例提供一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被一个或多个处理器执行时，实现如第一方面所述的系统或如第二方面所述的方法。
39.第四方面，本发明实施例提供一种服务器，包括存储器和一个或多个处理器，所述存储器上存储有计算机程序，所述计算机程序被所述一个或多个处理器执行时实现如第一方面所述的系统或如第二方面所述的方法。
40.本发明的一个或多个实施例至少能够带来如下有益效果：
41.本发明提供的检测语音助手的网站系统，包括：交互模块，用于获取用户录入的语音指令；预测模块，用于利用用于模拟语音助手的预先训练的预测模型，获取并显示针对所述语音指令的响应，以供用户对所述响应正确与否进行判断，保证用户有良好的体验，通过网页对话的形式模拟用户使用语音助手的过程，更加形象、有趣、符合现实情况，解决了对训练好的语音助手进行检测的技术问题，实现对语音助手响应情况准确率的智能检测，具
有一定的科学性和先进性。
附图说明
42.为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
43.图1是本发明实施例提供的检测语音助手的网站系统的一种示意图；
44.图2是本发明实施例提供的检测语音助手的网站系统的另一种示意图；
45.图3是本发明实施例提供的检测语音助手的方法的一种流程图；
46.图4是本发明实施例提供的检测语音助手的方法的另一种流程图。
具体实施方式
47.下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
48.实施例一
49.图1示出了一种检测语音助手的网站系统示意图，如图1所示，本实施例提供一种检测语音助手的网站系统100，包括：
50.交互模块101，用于获取用户录入的语音指令；
51.预测模块103，用于利用预先训练的预测模型，获取针对语音指令的响应并显示，以供用户对响应正确与否进行判断；
52.其中，预先训练的预测模型用于模拟语音助手。
53.本实施例中提供了一种检测语音助手的网站系统，用户可以通过交互模块101获取录入语音指令，预测模块103获取并显示预测模型针对语音指令的响应，由于预先训练的预测模型用于模拟语音助手，预测模型针对语音指令的响应，也就是待检测语音助手的响应，由此通过本实施例的网站系统对话，即可完成对待检测语音助手的检测。通过与网站系统对话的形式，直接输出针对待测语音指令的响应，模拟用户使用语音助手的过程，更加形象、有趣、符合现实情况，使用户有良好的体验，十分方便用户进行操作，同时也可以邀请用户采用此方式进行内测体验。
54.图2示出了检测语音助手的网站系统的另一示意图，如图2所示，在一些实现方式中，本实施例的网站系统还包括：
55.预处理模块102，用于将语音指令转化成文本信息并提取文本特征，输入预先训练的预测模型。预处理模块102以语音信号作为输入，实现将用户语音指令转写成文本，并进一步提取相应的文本特征信息，为预测模型做数据准备。预处理模块102还可以用于去除噪音及冗余语气词等，本实施例不做赘述。
56.在预测模块103利用预先训练的预测模型，获取针对语音指令的响应并显示之后，用户可以根据响应，判断当前语音助手的准确性，进一步地，在一些情况下可以将用户对于响应正确与否的判断结果反馈给网站系统，因此，如图2所示，本实施例的网站系统还可以包括：
57.判断模块104，用于获取用户对响应正确与否的判断结果的输入操作并显示判断结果。在一些实现方式中，判断模块104还用于：在响应不正确的情况下，获取用户输入预期响应的操作并显示预期响应。
58.本实施例中，用户通过网站系统的判断模块104输入对响应正确与否的判断结果，能够交互式向网站系统反馈用户的准确性评价，使得网站系统获取统计准确率所需数据。在用户与网站系统之间实现在判断语音助手响应准确性的交互。
59.在实际应用中，用户输入的对响应正确与否的判断结果可以包括：正确、错误。在一些情形中，在响应不正确的情况下，用户还可以通过判断模块104输入预期响应并通过判断模块104显示出来，而在响应正确的情况下，则无需再进一步输入预期响应。
60.在一些实施方式中，还可以根据用户的判断结果，对语音助手的准确率进行计算，以完成对待检测语音助手的准确率检测，例如随着不断地输入语音指令，预测模型给出相应的响应后用户对于每个响应判断其正确与否，根据入语音指令或响应的数量，以及正确的响应数量，便可以计算出语音助手的准确率。因此，检测语音助手的网站系统还包括：
61.准确率计算模块105，用于基于响应正确与否的判断结果，计算语音助手的准确率。
62.在一些实施方式中，检测语音助手的网站系统还包括：
63.数据库模块106，用于存储以下信息中的至少一个：
64.语音指令；
65.针对语音指令的响应；
66.对响应正确与否的判断结果；
67.预期响应；
68.语音助手的准确率。
69.在实际应用中，数据库模块106采用sqlite数据库，通过将预测模型针对语音指令的响应、对响应正确与否的判断结果、用户输入的预期响应和/或语音助手的准确率存储至数据库模块，方便不同信息的管理，并且可以用于形成训练或更新预测模型所需训练数据，存储至数据库模块的信息，同时还反馈到交互界面，应当理解的是，数据库模块106中所存储信息作为训练数据进行预测模型训练时，将预期响应作为目标响应，与语音指令相对应进行模型训练。
70.在一些实施方式中，预先训练的预测模型包括xgboost模型，xgboost模型是基于语音指令与目标响应的训练数据训练得到，利用收集各种用户操作空调语音助手的情景的各种问答内容(指令-响应)形成训练集，从而训练xgboost模型。本实施例中，将xgboost模型应用在模拟语音助手上，能有效发挥该模型在语音识别领域的优势，同时，用户在体验语音助手的同时，网站系统还可以把用户数据作为训练数据保存下来，存至数据库模块，从而进一步优化系统准确率。
71.在一些实施方式中，语音助手包括空调语音助手，xgboost模型是基于针对空调的
语音指令与目标响应的训练数据训练得到。本实施例中，将xgboost模型应用在模拟空调语音助手上，一方面能有效发挥该模型在语音识别领域的优势，另一方面能够对空调控制的语音指令及相应的目标响应进行训练，所得xgboost模型能够智能检测语音助手的准确性，明显提升空调语音助手的准确性，提升用户适用空调的体验，保证空调产品的合格率，降低返修率高或出厂合格率低的问题，使空调语音助手准确率检测变得更加便捷化、智能化和高效化。同时，用户在体验语音助手的同时，网站系统还可以把用户数据作为训练数据保存下来，存至数据库模块，从而进一步优化系统准确率。
72.在一些实现方式中，本实施例的网站系统采用django框架、以python编程语言代码编写网页；进一步地，交互模块使用html5语言描述方式和javascript编程语言实现获取用户的语音指令的功能，以获取用户的语音指令。
73.本实施例中，采用django框架将python代码应用在检测语音助手的网页上，实现网站框架搭建和交互界面设计；使用html5+javascript实现网页录音功能，采集用户输入的语音指令。预处理模块102对用户输入的语音指令进行处理，调用百度平台语音api实现语音指令转写文本的功能，并对文本中特征进行提取，文本特征例如可以是关键词出现次数、总词数、平均每句话长度、是否经常重复某些词、答案与问题是否匹配等，具体提取何种特征，可以根据实际情况确定。
74.在一个应用实例中，用户点开本实施例的网站系统，网站首页会显示使用说明等相关信息以及对语音助手工作方式的介绍，再附加一些提示事项以及可能存在的误差情况，使用户了解如何使用本网站系统进行语音助手的检测。用户在网页上向语音助手提问，发出语音指令，以模拟用户操作空调语音助手，此时，后台调用已训练的xgboost模型，生成语音助手的回复并显示在网页上，以模拟语音助手针对语音指令的响应，用户再判断该回复是否符合用户预期响应，判断响应的正确与否；网站系统根据正确与否的次数，确定语音助手的准确率。
75.以空调语音助手为例，例1：用户的语音指令包括：请将空调调至25度；xgboost模型的回复包括：好的，已为您调至25度；相应的用户判断结果：正确。例2：用户的语音指令包括：空调温度太冷了；xgboost模型的回复包括：已为您关闭空调相应的用户判断结果：错误，此时，用户输入预期结果：调高空调温度，不是直接关闭空调。
76.实施例二
77.本实施例提供一种检测语音助手的方法，基于实施例一的检测语音助手的网站系统实现，如图3所示，本方法包括：
78.步骤s310、获取用户录入的语音指令；
79.步骤s330、利用预先训练的预测模型，获取针对语音指令的响应并显示，以供用户对响应正确与否进行判断；
80.其中，预先训练的预测模型用于模拟语音助手。
81.本实施例中，用户可以通过网站系统的交互模块101获取录入语音指令，预测模块103获取并显示预测模型针对语音指令的响应，由于预先训练的预测模型用于模拟语音助手，预测模型针对语音指令的响应，也就是待检测语音助手的响应，通过与网站系统对话的形式，直接输出针对待测语音指令的响应，模拟用户使用语音助手的过程，即可完成对待检测语音助手的检测，更加形象、有趣、符合现实情况，使用户有良好的体验，十分方便用户进
行操作，同时也可以邀请用户采用此方式进行内测体验。
82.在一些实施方式中，利用预先训练的预测模型，获取并显示针对所述语音指令的响应的步骤s330之前，如图4所示，本方法还包括：
83.步骤s320、将语音指令转化成文本信息并提取文本特征，输入预先训练的预测模型。以语音信号作为输入，实现将用户语音指令转写成文本，并进一步提取相应的文本特征信息，可以为预测模型做数据准备。在一些情形下，还可以去除噪音及冗余语气词等预处理。
84.在利用预先训练的预测模型，获取针对语音指令的响应并显示的步骤s330之后，用户可以根据响应，判断当前语音助手的准确性，进一步地，在一些情况下可以将用户对于响应正确与否的判断结果反馈给网站系统，因此，如图4所示，本方法还可以进一步包括：
85.步骤s340、获取用户对响应正确与否的判断结果的输入操作并显示判断结果。在一些实现方式中，还包括：
86.步骤s350、在响应不正确的情况下，获取用户输入预期响应的操作并显示预期响应。
87.本实施例中，用户通过网站系统的判断模块104输入对响应正确与否的判断结果，能够交互式向网站系统反馈用户的准确性评价，使得网站系统获取统计准确率所需数据。
88.在实际应用中，用户输入的对响应正确与否的判断结果可以包括：正确、错误。在一些情形中，在响应不正确的情况下，用户还可以通过判断模块104输入预期响应并通过判断模块104显示出来，而在响应正确的情况下，则无需再进一步输入预期响应。
89.在一些实施方式中，还可以根据用户的判断结果，对语音助手的准确率进行计算，以完成对待检测语音助手的准确率检测，例如随着不断地输入语音指令，预测模型给出相应的响应后用户对于每个响应判断其正确与否，根据入语音指令或响应的数量，以及正确的响应数量，便可以计算出语音助手的准确率。因此，如图4所示，本方法还可以包括：
90.步骤s360、基于响应正确与否的判断结果，计算语音助手的准确率。
91.在一些实施方式中，本方法还可以包括：
92.步骤s370、存储以下信息中的至少一个：
93.语音指令；
94.针对语音指令的响应；
95.对响应正确与否的判断结果；
96.预期响应；
97.语音助手的准确率。
98.在实际应用中，通过将预测模型针对语音指令的响应、对响应正确与否的判断结果和/或语音助手的准确率存储至数据库模块，方便不同信息的管理，并且可以用于形成训练或更新预测模型所需训练数据，存储至数据库模块的信息，同时还反馈到交互界面。
99.在一些实施方式中，预先训练的预测模型包括xgboost模型，xgboost模型是基于语音指令与目标响应的训练数据训练得到，利用收集各种用户操作空调语音助手的情景的各种问答内容(指令-响应)形成训练集，从而训练xgboost模型。本实施例中，将xgboost模型应用在模拟语音助手上，能有效发挥该模型在语音识别领域的优势，同时，用户在体验语音助手的同时，网站系统还可以把用户数据作为训练数据保存下来，从而进一步优化系统
准确率。
100.在一些实施方式中，语音助手包括空调语音助手，xgboost模型是基于针对空调的语音指令与目标响应的训练数据训练得到。本实施例中，将xgboost模型应用在模拟空调语音助手上，一方面能有效发挥该模型在语音识别领域的优势，另一方面能够对空调控制的语音指令及相应的目标响应进行训练，所得xgboost模型能够智能检测语音助手的准确性，明显提升空调语音助手的准确性，提升用户适用空调的体验，保证空调产品的合格率，降低返修率高或出厂合格率低的问题，使空调语音助手准确率检测变得更加便捷化、智能化和高效化。同时，用户在体验语音助手的同时，网站系统还可以把用户数据作为训练数据保存下来，存至数据库模块，从而进一步优化系统准确率。
101.实施例三
102.本实施例提供一种存储介质，该存储介质上存储有计算机程序，该计算机程序被一个或多个处理器执行时，实现实施例一的系统或实施例二的方法。
103.本实施例中，存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(static random access memory，简称sram)，电可擦除可编程只读存储器(electrically erasable programmable read-only memory，简称eeprom)，可擦除可编程只读存储器(erasable programmable read-only memory，简称eprom)，可编程只读存储器(programmable read-only memory，简称prom)，只读存储器(read-only memory，简称rom)，磁存储器，快闪存储器，磁盘或光盘。装置或方法的内容详见前述实施例，此次不再赘述。
104.实施例四
105.本发明实施例提供一种服务器，包括存储器和一个或多个处理器，该存储器上存储有计算机程序，该计算机程序被所述一个或多个处理器执行时实现实施例一的系统或实施例二的方法。
106.本实施例中，处理器可以是专用集成电路(application specific integrated circuit，简称asic)、数字信号处理器(digital signal processor，简称dsp)、数字信号处理设备(digital signal processing device，简称dspd)、可编程逻辑器件(programmable logic device，简称pld)、现场可编程门阵列(field programmable gate array，简称fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述实施例中的装置或方法。在处理器上运行的计算机程序被执行时所实现的装置或方法可参照本发明前述实施例提供的方法的具体实施例，此处不再赘述。
107.本发明使用的网站系统采用交互形式实现语音助手的检测，用户只需与网站进行对话，便能计算出预测结果，十分方便用户进行操作，同时也可以邀请用户进行内测体验；另外，将xgboost模型应用在语音助手上，能有效发挥该明细在语音识别领域的优势，用户在体验语音助手的同时，系统可以把用户数据作为训练数据保存下来，从而进一步优化系统准确率。
108.在本发明实施例所提供的几个实施例中，应该理解到，所揭露的系统和方法，也可以通过其它的方式实现。以上所描述的系统和方法实施例仅仅是示意性的。
109.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而
且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
110.虽然本发明所揭露的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李宇达唐光远罗琴李润静
技术所有人：珠海联云科技有限公司
我是此专利的发明人