响应时间的确定方法及装置、存储介质及电子装置与流程

文档序号：33167177发布日期：2023-02-04 01:47阅读：110来源：国知局

技术简介：
本专利针对传统人工统计语音交互响应时间精度低、效率差的问题，提出通过设置关键节点自动记录终端交互日志中的时间戳，精准计算响应时间及各阶段耗时，提升统计效率和准确性。
关键词：响应时间,自动统计

1.本技术涉及智慧家庭技术领域，具体而言，涉及一种响应时间的确定方法及装置、存储介质及电子装置。

背景技术：

2.相关技术中，智能语音设备的响应时间是衡量语音交互产品性能的一个重要指标，当用户与语音产品进行交互时，好的体验是既能得到想要的回答又能快速的给予响应，所以提高响应速度一直是语音产品优化的重点目标。
3.但对于统计语音产品的响应时间，目前本领域技术人员仅能通过人工统计方法，即通过秒表计算或通过录音软件录制交互过程，然后统计发话完成到得到语音反馈之间的时间。通过这种人工统计方法只能给出每条语音交互的最终响应时间，对于耗时较长的交互无法知道时间耗费在哪个过程，且人工统计工作量巨大且存在较大误差。
4.针对相关技术中，人工统计语音交互过程的响应时间的精准度不高等问题，尚未提出有效的解决方案。
5.因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

技术实现要素：

6.本发明实施例提供了一种响应时间的确定方法及装置、存储介质及电子装置，以至少解决相关技术中人工统计语音交互过程的响应时间的精准度不高的问题。
7.根据本发明实施例的一方面，提供一种响应时间的确定方法，包括：为语音设备与目标对象的语音交互设置多个关键节点；在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间。
8.在一个示例性的实施例中，为语音设备与目标对象的语音交互设置多个关键节点，包括：接收目标对象的选择操作，并根据所述选择操作在多个第一节点中确定所述多个关键节点，其中，所述多个第一节点用于指示对所述交互语音进行响应的各个响应阶段；通过第一预设算法将所述多个第一节点中的所述多个关键节点进行标记。
9.在一个示例性的实施例中，在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志，包括：确定语音活动检测算法检测到所述交互语音的第一时刻，以及所述语音设备开始播放所述交互语音的响应语音的第二时刻，其中，所述第二时刻为所述交互语音已被所述语音设备响应完成的时刻；获取所述第一时刻至所述第二时刻的时间段内与所述交互语音对应的终端交互日志。
10.在一个示例性的实施例中，获取所述第一时刻至所述第二时刻的时间段内与所述交互语音对应的终端交互日志，包括：在所述语音设备对所述交互语音进行响应的各个响
应阶段中确定与所述多个关键节点对应的多个响应阶段，其中，所述各个响应阶段根据所述第一时刻至所述第二时刻的时间段确定；根据输出算法输出与所述多个响应阶段对应的节点名称和时间戳，以得到所述终端交互日志。
11.在一个示例性的实施例中，通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间，包括：通过第二预设算法在所述多个时间戳中确定用于指示语音活动检测算法检测所述交互语音结束的第三时刻的第一时间戳，以及用于指示所述语音设备播放所述交互语音的响应语音的第二时刻的第二时间戳；将所述第二时间戳与所述第一时间戳的差值作为所述语音设备响应所述交互语音的响应时间。
12.在一个示例性的实施例中，根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间之后，所述方法还包括：依次获取所述多个时间戳中相邻的两个时间戳；计算所述相邻的两个时间戳的差值，以得到多个第二时间，其中，所述多个第二时间分别用于指示所述语音设备响应所述目标对象的交互语音的过程中各个响应阶段的耗时；确定与所述多个第二时间对应的第一阶段标识，其中，所述第一阶段标识用于标识所述语音设备对所述交互语音进行响应的各个响应阶段。
13.在一个示例性的实施例中，确定与所述多个第二时间对应的第一阶段标识之后，所述方法还包括：从所述多个第二时间中确定时间大于预设时间阈值的第三时间；获取与所述第三时间对应的第二阶段标识；将所述第二阶段标识发送给所述目标对象，以指示所述目标对象对与所述第二阶段标识对应的响应阶段进行处理。
14.根据本发明实施例的另一方面，还提供了一种响应时间的确定装置，包括：设置模块，用于为语音设备与目标对象的语音交互设置多个关键节点；得到模块，用于在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；获取模块，用于通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间。
15.根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述响应时间的确定方法。
16.根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述响应时间的确定方法。
17.通过本发明，为语音设备与目标对象的语音交互设置多个关键节点；在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间；采用上述技术方案，解决了相关技术中人工统计语音交互过程的响应时间的精准度不高的问题；实现了精准统计语音交互过程的响应时间的技术效果。
附图说明
18.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
19.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
20.图1是根据本技术实施例的一种可选的响应时间的确定方法的硬件环境示意图；
21.图2是根据本技术实施例的一种可选的响应时间的确定方法的流程图；
22.图3是根据本技术实施例的一种可选的语音交互的响应过程的流程示意图；
23.图4是根据本技术实施例的一种可选的语音交互的测试环境示意图；
24.图5是根据本技术实施例的一种可选的语音交互的响应时间统计图；
25.图6是根据本技术实施例的一种可选的优化后的语音交互的响应时间统计图；
26.图7是根据本技术实施例的一种可选的响应时间的确定装置的结构框图。
具体实施方式
27.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分的实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本技术保护的范围。
28.需要说明的是，本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
29.根据本技术实施例的一个方面，提供了一种响应时间的确定方法。该响应时间的确定方法广泛应用于智慧家庭(smart home)、智能家居、智能家用设备生态、智慧住宅(intelligencehouse)生态等全屋智能数字化控制应用场景。可选地，在本实施例中，上述响应时间的确定方法可以应用于如图1所示的由多个终端设备102和服务器104所构成的硬件环境中。如图1所示，服务器104通过网络与多个终端设备102进行连接，可用于为终端或终端上安装的客户端提供服务(如应用服务等)，可在服务器上或独立于服务器设置数据库，用于为服务器104提供数据存储服务，可在服务器上或独立于服务器配置云计算和/或边缘计算服务，用于为服务器104提供数据运算服务。
30.上述网络可以包括但不限于以下至少之一：有线网络，无线网络。上述有线网络可以包括但不限于以下至少之一：广域网，城域网，局域网，上述无线网络可以包括但不限于以下至少之一：wifi(wireless fidelity，无线保真)，蓝牙。终端设备102可以并不限定于为pc、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智
能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
31.在本实施例中提供了一种响应时间的确定方法，包括但不限于应用于语音交互设备，图2是根据本发明实施例的响应时间的确定方法的流程图，该流程包括如下步骤：
32.步骤s202：为语音设备与目标对象的语音交互设置多个关键节点；
33.需要说明的是，上述多个关键节点由研发人员确定，可以针对当前研发过程中正在优化调整的过程进行打点监控，且上述预先确定的多个关键节点可以由研发人员随时进行调整，以监控语音交互过程中可能出现问题的步骤。
34.步骤s204：在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；
35.需要说明的是，上述终端交互日志为用户与语音产品交互的交互日志的存储在语音产品端的一部分，交互日志还包括存储在云端服务器侧的云端日志，终端交互日志存储的数据为语音产品端在语音交互过程中所进行的操作日志。
36.步骤s206：通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间。
37.通过上述步骤，为语音设备与目标对象的语音交互设置多个关键节点；在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间；采用上述技术方案，解决了相关技术中人工统计语音交互过程的响应时间的精准度不高的问题；实现了精准统计语音交互过程的响应时间的技术效果。
38.可选的，执行上述设置步骤s202：为语音设备与目标对象的语音交互设置多个关键节点，可以通过以下步骤来实现，具体包括：接收目标对象的选择操作，并根据所述选择操作在多个第一节点中确定所述多个关键节点，其中，所述多个第一节点用于指示响应过程中的用于响应所述交互语音的各个响应阶段；通过第一预设算法将所述多个第一节点中的所述多个关键节点进行标记。
39.语音设备对该交互语音的响应过程包括了很多个步骤，每个步骤都包括了一个或多个节点(相当于上述多个第一节点)，即用于指示响应过程中的用于响应交互语音的各个响应节点；可以理解的是，关键节点由研发人员确定(相当于上述目标对象)，研发人员在研发过程中知道哪些过程可能耗时较长，以及想要知道哪些过程耗时较长，因此可以根据需求在多个第一节点中确定需要统计耗时的过程的对应的多个关键节点，并通过第一预设算法将该多个关键节点进行标记，从而使测试人员(相当于上述目标对象)可以从终端交互日志中确定想要的日志数据。
40.可选的，执行上述步骤s204：在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志，可以通过以下步骤来实现，具体包括：确定语音活动检测算法检测到所述交互语音的第一时刻，以及所
述语音设备开始播放所述交互语音的响应语音的第二时刻，其中，所述第二时刻为所述交互语音已被所述语音设备响应完成的时刻；获取所述第一时刻至所述第二时刻的时间段内与所述交互语音对应的终端交互日志。
41.在确定关键节点对应的时间戳之前，需要先获取语音设备与目标对象进行语音交互所生成的终端交互日志，具体包括确定通过语音活动检测算法检测到目标对象发出的交互语音的第一时刻，以及该语音设备开始播放该交互语音的响应语音的第二时刻，当语音设备开始播放该交互语音的响应语音，即代表语音设备对该交互语音的响应已完成；获取记录的第一时刻和第二时刻之间的时间段内与该交互语音对应的终端交互日志。
42.需要说明的是，上述第二时刻是语音设备开始播放交互语音的响应语音的时刻，即语音设备对交互语音进行分析处理完成，已经得到了与该交互语音对应的响应语音，即第二时刻是该交互语音已经被该语音设备分析处理完成的时刻。
43.需要说明的是，上述目标对象可以是语音设备的测试人员，也可以是语音设备的使用者(用户)，本技术对此不作限制。
44.可选的，执行上述获取步骤s206：获取所述第一时刻至所述第二时刻的时间段内与所述交互语音对应的终端交互日志，可以通过以下步骤来实现，具体包括：在所述语音设备对所述交互语音进行响应的各个响应阶段中确定与所述多个关键节点对应的多个响应阶段，其中，所述各个响应阶段根据所述第一时刻至所述第二时刻的时间段确定；根据输出算法输出与所述多个响应阶段对应的节点名称和时间戳，以得到所述终端交互日志。
45.需要先确定响应过程中的多个第一节点中目标对象预先设置好的多个关键节点，具体的，可以通过第一预设算法为该多个关键节点设置的标记来确定该多个关键节点，获取关键节点之后，确定多个关键节点对应的多个响应阶段，并获取与多个响应阶段一一对应的节点名称和时间戳，通过输出算法输出和该多个第一节点对应的节点名称和时间戳，根据得到的节点名称和时间戳生成终端交互日志。
46.需要说明的是，上述终端交互日志至少包括上述节点名称和时间戳，但不限于此，还可以包括每一个响应过程的状态等，本技术对此不作限制。
47.可选的，执行上述获取步骤：通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间，可以通过以下方案来实现：通过第二预设算法在所述多个时间戳中确定用于指示语音活动检测算法检测所述交互语音结束的第三时刻的第一时间戳，以及用于指示所述语音设备播放所述交互语音的响应语音的第二时刻的第二时间戳；将所述第二时间戳与所述第一时间戳的差值作为所述语音设备响应所述交互语音的响应时间。
48.测试部门最主要需要统计的就是每一次语音交互的总体响应时间，以体现出该语音设备的性能，语音交互的总体响应时间越低，用户体验感就越好；因此在获取到了多个关键节点对应的时间戳之后，因为交互的响应时间的计算方式为开始播第一个响应语音片段的时间戳-语音活动检测的结束时间戳；因此可以通过第二预设算法直接获取出用于指示语音活动检测算法检测所述交互语音结束的第三时刻的第一时间戳，以及用于指示所述语音设备播放所述交互语音的响应语音的第二时刻的第二时间戳，并将第二时间戳与第一时间戳的差值作为该语音设备响应目标对象的交互语音的响应时间。
49.进一步的，执行上述步骤s206：根据所述多个时间戳确定所述语音设备响应所述
交互语音的响应时间之后，所述方法还包括：依次获取所述多个时间戳中相邻的两个时间戳；计算所述相邻的两个时间戳的差值，以得到多个第二时间，其中，所述多个第二时间分别用于指示所述语音设备响应所述目标对象的交互语音的过程中各个响应阶段的耗时；确定与所述多个第二时间对应的第一阶段标识，其中，所述第一阶段标识用于标识所述语音设备对所述交互语音进行响应的各个响应阶段。
50.获取到交互语音的响应时间之后，还需要统计响应过程中各个响应阶段的单独耗时，从而研发人员和测试人员可以了解到耗时较长的阶段，从而针对性地对耗时较长的阶段进行测试和优化，因此还需要依次获取统计到的多个时间戳中的两个相邻时间戳，计算它们的差值，从而得到用于指示语音设备响应目标对象的交互语音的过程中各个响应阶段的耗时的多个第二时间，并获取与多个第二时间对应的第一阶段标识，从而让测试人员和研发人员知道各个第二时间对应的响应阶段的名称。
51.基于上述确定步骤，确定与所述多个第二时间对应的第一阶段标识之后，所述方法还包括：从所述多个第二时间中确定时间大于预设时间阈值的第三时间；获取与所述第三时间对应的第二阶段标识；将所述第二阶段标识发送给所述目标对象，以指示所述目标对象对与所述第二阶段标识对应的响应阶段进行处理。
52.确定出与第二时间对应的第一阶段标识之后，还可以直接从该多个第二时间中确定时间大于预设时间阈值的第三时间，即确定出响应时间超出预期时间值的响应阶段，预设时间阈值可以根据需要进行调整，并确定与该第三时间对应的第二阶段标识，将该第二阶段标识发送给目标对象以指示该目标对象对超出预期时间值的响应阶段进行优化。
53.显然，上述所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。为了更好的理解上述响应时间的确定方法，以下结合实施例对上述过程进行说明，但不用于限定本发明实施例的技术方案，具体地：
54.实施例1
55.以下结合图3对实施例1的方案进行描述，图3是根据本技术实施例的一种可选的语音交互的响应过程的流程示意图，如图3所示，具有以下步骤：
56.步骤1：开始进行语音活动检测；
57.步骤2：语音活动检测完成，将检测到的音频送去云端进行处理；
58.步骤3：云端处理完成，返回结果；
59.步骤4：sdk发起tts(texttospeech，从文本到语音)请求；
60.步骤5：tts合成完，开始播报tts生成的语音。
61.通过获取终端侧的每一个执行阶段的时间戳，具体包括语音活动检测开始时间戳、语音活动检测结束时间戳、云端返回结果时间戳、tts开始时间戳、tts开始播第一个片段的时间戳，而语音交互响应时间的定义为语音发话完成到开始播报tts之前的时间，因此每一条交互的响应时间＝tts开始播第一个片段的时间戳-vad(语音活动检测)结束时间戳，且还可以根据上述统计的时间戳精准计算出每一个响应阶段的响应时间，譬如，根据云端返回结果时间戳与语音活动检测结束时间戳的差值计算出云端对音频的处理时间，其中，云端对音频的处理具体包括：asr识别、npl识别、资源请求等一系列处理过程；通过以上步骤，解决了相关技术中人工统计语音交互过程的响应时间的精准度不高的问题；实现了精准统计语音交互过程的响应时间，以及精准统计各个响应阶段的耗时的技术效果。
62.实施例2
63.以下结合图4对实施例2的方案进行描述，图4是根据本技术实施例的一种可选的语音交互的测试环境示意图，具体包括：
64.本技术实施例的技术方案主要应用于语音交互产品的测试，通过本技术实施的方法可以精准地统计出语音交互过程中每一响应过程的响应时间，以及语音交互总的响应时间，从而精准地确定耗时过程的响应阶段，进而可以针对性地对该响应阶段进行优化处理。
65.在一些实施例中，为了保证测试结果的准确性，在对语音交互预料进行测试的过程中，需要保证相同且良好的测试环境，例如保证测试者与语音交互设备保证间隔为3m，周围环境处于低噪声状态，声音强度低于50db，且网络质量良好，在该环境下进行语音交互的测试。
66.为了帮助更好地理解上述技术方案，以下结合表1对本技术进行解释说明，如下表所示：
67.表1
[0068][0069]
表1为通过本发明的技术方案所统计出的语音交互数据，测试者输入了大量交互预料，通过上述方案可以直接地统计出各个响应阶段的耗时，包括语音结束到得到云端反馈时间、解析云端数据时间、客户端tts请求到语音输出时间，以及语音结束到得到反馈结果的时间，如表1所示，其中，表1仅给出部分数据以作示意。
[0070]
而表2则是根据上述表1所统计的数据得出的数据汇总表，如表2所示：
[0071]
表2
[0072]
时间段(秒)数量百分比《2.515587.572.5-3.0179.603.0-3.531.69》3.521.13
[0073]
在上述测试过程中，输入了177条测试预料，响应时间小于2.5秒的有155条，占比
87.57％，响应时间位于2.5-3.0秒之间的有17条，占比9.6％，响应时间位于3.0-3.5秒的有3条，占比1.69％，响应时间大于3.5秒的有2条，占比1.13％；假设将响应时间大于2.5秒的数据作为响应时间超标的响应，需要针对这些语料的响应过程进行优化，因此，只需要查看响应时间大于2.5秒的22条语料的响应时间的详细统计，并进行针对性优化即可。为了便于统计，本技术还针对上述数据绘制了条形统计图，图5是根据上表2所绘制出的条形统计图，如图5所示。
[0074]
基于上述统计数据，研发人员对响应过程进行优化，表3为对语音设备进行优化后的响应时间的统计数据表，如表3所示：
[0075]
表3
[0076][0077]
进行响应时间优化之后，又输入了18条语料进行测试，测试结果如表3所示，而本次响应统计的不是语音结束到得到云端反馈时间等过程的时间，而是进一步细分了响应过程，具体包括云端对检测到的音频进行asr识别、npl解析、资源请求等一系列处理过程；统计每一个处理过程的处理时间，表3中仅给出部分处理过程的时间数据以做示例。
[0078]
表4为根据表3所统计的数据所绘制的统计表，图6则是根据表4所统计的数据所绘制的条形统计图，如表4所示：
[0079]
表4
[0080]
时间段(秒)数量百分比《2.51477.782.5-3.000.003.0-3.5211.11》3.5211.11
[0081]
经过统计，优化后的语音设备对测试语音的响应时间小于2.5秒的有14条数据，占比77.78％；响应时间在2.5-3.0秒之间的为0条，占比0％；响应时间位于3.0-3.5秒之间的为2条，占比11.11％，响应时间大于3.5秒的为2条，占比11.11％。即经过专项优化后，响应时间位于2.5-3.0秒的数据大大减少。
[0082]
通过上述方案，通过为语音交互产品的终端交互日志里打上语音交互流程中的关键节点时间戳，并利用脚本从终端交互日志中自动统计出各个关键节点的时间戳，以及各个响应阶段的响应时间；通过上述装置，解决了相关技术中人工统计语音交互过程的响应时间的精准度不高的问题；实现了精准统计语音交互过程的响应时间，以及精准统计各个响应阶段的耗时的技术效果。
[0083]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例的方法。
[0084]
在本实施例中还提供了一种响应时间的确定装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。
[0085]
图7是根据本发明实施例的一种可选的响应时间的确定装置的结构框图，该装置包括：
[0086]
设置模块72，用于为语音设备与目标对象的语音交互设置多个关键节点；
[0087]
得到模块74，用于在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；
[0088]
获取模块76，用于通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间。
[0089]
通过上述装置，为语音设备与目标对象的语音交互设置多个关键节点；在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间；采用上述技术方案，解决了相关技术中人工统计语音交互过程的响应时间的精准度不高的问题；实现了精准统计语音交互过程的响应时间的技术效果。
[0090]
可选的，设置模块72，还用于接收目标对象的选择操作，并根据所述选择操作在多个第一节点中确定所述多个关键节点，其中，所述多个第一节点用于指示响应过程中的用于响应所述交互语音的各个响应阶段；通过第一预设算法将所述多个第一节点中的所述多个关键节点进行标记。
[0091]
语音设备对该交互语音的响应过程包括了很多个步骤，每个步骤都包括了一个或多个节点(相当于上述多个第一节点)，即用于指示响应过程中的用于响应交互语音的各个
响应节点；可以理解的是，关键节点由研发人员确定(相当于上述目标对象)，研发人员在研发过程中知道哪些过程可能耗时较长，以及想要知道哪些过程耗时较长，因此可以根据需求在多个第一节点中确定需要统计耗时的过程的对应的多个关键节点，并通过第一预设算法将该多个关键节点进行标记，从而使测试人员(相当于上述目标对象)可以从终端交互日志中确定想要的日志数据。
[0092]
可选的，执行上述步骤s204的过程中，得到模块74，还用于确定语音活动检测算法检测到所述交互语音的第一时刻，以及所述语音设备开始播放所述交互语音的响应语音的第二时刻，其中，所述第二时刻为所述交互语音已被所述语音设备响应完成的时刻；获取所述第一时刻至所述第二时刻的时间段内与所述交互语音对应的终端交互日志。
[0093]
在确定关键节点对应的时间戳之前，需要先获取语音设备与目标对象进行语音交互所生成的终端交互日志，具体包括确定通过语音活动检测算法检测到目标对象发出的交互语音的第一时刻，以及该语音设备开始播放该交互语音的响应语音的第二时刻，当语音设备开始播放该交互语音的响应语音，即代表语音设备对该交互语音的响应已完成；获取记录的第一时刻和第二时刻之间的时间段内与该交互语音对应的终端交互日志。
[0094]
可选的，获取模块76，还用于在所述语音设备对所述交互语音进行响应的各个响应阶段中确定与所述多个关键节点对应的多个响应阶段，其中，所述各个响应阶段根据所述第一时刻至所述第二时刻的时间段确定；根据输出算法输出与所述多个响应阶段对应的节点名称和时间戳，以得到所述终端交互日志。
[0095]
需要先确定响应过程中的多个第一节点中目标对象预先设置好的多个关键节点，具体的，可以通过第一预设算法为该多个关键节点设置的标记来确定该多个关键节点，获取关键节点之后，确定多个关键节点对应的多个响应阶段，并获取与多个响应阶段一一对应的节点名称和时间戳，通过输出算法输出和该多个第一节点对应的节点名称和时间戳，根据得到的节点名称和时间戳生成终端交互日志。
[0096]
可选的，获取模块76，还用于通过第二预设算法在所述多个时间戳中确定用于指示语音活动检测算法检测所述交互语音结束的第三时刻的第一时间戳，以及用于指示所述语音设备播放所述交互语音的响应语音的第二时刻的第二时间戳；将所述第二时间戳与所述第一时间戳的差值作为所述语音设备响应所述交互语音的响应时间。
[0097]
测试部门最主要需要统计的就是每一次语音交互的总体响应时间，以体现出该语音设备的性能，语音交互的总体响应时间越低，用户体验感就越好；因此在获取到了多个关键节点对应的时间戳之后，因为交互的响应时间的计算方式为开始播第一个响应语音片段的时间戳-语音活动检测的结束时间戳；因此可以通过第二预设算法直接获取出用于指示语音活动检测算法检测所述交互语音结束的第三时刻的第一时间戳，以及用于指示所述语音设备播放所述交互语音的响应语音的第二时刻的第二时间戳，并将第二时间戳与第一时间戳的差值作为该语音设备响应目标对象的交互语音的响应时间。
[0098]
进一步的，获取模块76，还用于在根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间之后，依次获取所述多个时间戳中相邻的两个时间戳；计算所述相邻的两个时间戳的差值，以得到多个第二时间，其中，所述多个第二时间分别用于指示所述语音设备响应所述目标对象的交互语音的过程中各个响应阶段的耗时；确定与所述多个第二时间对应的第一阶段标识，其中，所述第一阶段标识用于标识所述语音设备对所述交互
语音进行响应的各个响应阶段。
[0099]
获取到交互语音的响应时间之后，还需要统计响应过程中各个响应阶段的单独耗时，从而研发人员和测试人员可以了解到耗时较长的阶段，从而针对性地对耗时较长的阶段进行测试和优化，因此还需要依次获取统计到的多个时间戳中的两个相邻时间戳，计算它们的差值，从而得到用于指示语音设备响应目标对象的交互语音的过程中各个响应阶段的耗时的多个第二时间，并获取与多个第二时间对应的第一阶段标识，从而让测试人员和研发人员知道各个第二时间对应的响应阶段的名称。
[0100]
基于上述步骤，获取模块76，还用于在确定与所述多个第二时间对应的第一阶段标识之后，从所述多个第二时间中确定时间大于预设时间阈值的第三时间；获取与所述第三时间对应的第二阶段标识；将所述第二阶段标识发送给所述目标对象，以指示所述目标对象对与所述第二阶段标识对应的响应阶段进行处理。
[0101]
确定出与第二时间对应的第一阶段标识之后，还可以直接从该多个第二时间中确定时间大于预设时间阈值的第三时间，即确定出响应时间超出预期时间值的响应阶段，预设时间阈值可以根据需要进行调整，并确定与该第三时间对应的第二阶段标识，将该第二阶段标识发送给目标对象以指示该目标对象对超出预期时间值的响应阶段进行优化。
[0102]
本发明的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0103]
可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：
[0104]
s1，为语音设备与目标对象的语音交互设置多个关键节点；
[0105]
s2，在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；
[0106]
s3，通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间。
[0107]
在一个示例性实施例中，上述计算机可读存储介质可以包括但不限于：u盘、只读存储器(read-only memory，简称为rom)、随机存取存储器(random access memory，简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
[0108]
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例，本实施例在此不再赘述。
[0109]
本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0110]
可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：
[0111]
s1，为语音设备与目标对象的语音交互设置多个关键节点；
[0112]
s2，在所述语音设备与所述目标对象进行语音交互的情况下，根据所述语音交互对应的交互语音得到所述语音设备的终端交互日志；
[0113]
s3，通过所述多个关键节点从所述终端交互日志中获取与所述多个关键节点对应的多个时间戳，并根据所述多个时间戳确定所述语音设备响应所述交互语音的响应时间。
[0114]
在一个示例性实施例中，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。
[0115]
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例，本实施例在此不再赘述。
[0116]
显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。
[0117]
以上所述仅是本技术的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张燕范振礼王伟龙
技术所有人：青岛海尔科技有限公司海尔智家股份有限公司
我是此专利的发明人

上一篇：一种用于高清视频会议系统的广角全玻璃镜头的制作方法
下一篇：一种带有夹紧机构的放卷机的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！