语音通信装置、语音通信方法及系统、设备、存储介质与流程

文档序号：16587345发布日期：2019-01-14 18:37阅读：237来源：国知局

本发明涉及快件及物流领域，尤其涉及一种语音通信装置、语音通信方法及系统、设备、存储介质。

背景技术：

随着电子商务以及o2o的高速发展，物流作为其中重要的一环也随之蓬勃发展，为了提高效率，各大快递公司纷纷给小哥配备电子化的终端以便于提高揽收派件效率，比如顺丰的巴抢，巴抢中配置有sim卡，通过巴枪屏幕点击拨打客户电话。

虽然使用了电子化的终端设备，但依旧没能解放快递员的双手，快递员揽收快递以及派送快递的操作依旧比较繁琐，以上门派件为例，快递员需要放下手中的快递，拿出巴枪，打开相关应用，并且扫描快递运单，通过巴枪屏幕点击拨打客户电话，才能呼出客户的电话进行联系。

并且，在一些特殊场景下，快递员为了尽快将快递送至客户手中，有时会在骑行过程中进行接单，转单、联系客户等操作，这些操作均需要与对方进行电话沟通，拨打电话时屏幕点击操作，十分容易造成安全事故。

本发明所述方法基于对公司业务的深入分析，结合收派终端的应用场景，创新性地提出智能语音技术实现语音通信的方法，以提高快递员的快递揽收派送效率，同时搭配带可语音唤醒的智能蓝牙耳机，彻底解放小哥双手，保障快递员的安全。

技术实现要素：

为了解决上述技术问题，本发明的目的在于提供一种语音通信装置、语音通信方法及系统、设备、存储介质。

根据本发明的一个方面，提供了一种语音通信方法，包括：

接收第一语音信号；

基于第一语音信号提取并识别目标信息；

搜索与目标信息匹配的被呼叫端；

向被呼叫端发送语音通信请求。

进一步的，接收第一语音信号之前，还包括：接收蓝牙耳机发送的at指令后触发提示信息。

进一步的，接收第一语音信号包括：检测到第一语音信号后调用录音单元采集音频数据。

进一步的，基于第一语音信号提取目标信息，包括，同时通过多个方式提取目标信息，并判断是否识别到目标信息，若是，则终止对目标信息的提取。

进一步的，所述通过多个方式同时提取目标信息，包括如下：

方式1：向第一服务器发送请求及对应的音频数据，第一服务器接收请求后通过第二服务器的webapi接口提取音频数据的目标信息并返回；

方式2：将所述音频数据写入第二服务器提供的sdk接口，通过第二服务器提取音频数据的目标信息并通过所述sdk接口将目标信息返回；

方式3：调用本地识别引擎msc，通过预配置的本地语法文件识别所述音频数据，提取音频数据的目标信息。

进一步的，终止对目标信息的提取，包括：

终止提取已接收第一语音信号的目标信息并销毁录音线程；

终止向第一服务器发送请求及对应的音频数据和/或终止向第二服务器的sdk接口写入音频数据和/或终止本地识别引擎msc的目标信息提取。

进一步的，提取目标字符包括：识别目标信息的语义槽，根据所述语义槽提取目标字符。

进一步的，所述目标字符包括电话号码和/或运单号。

根据本发明的另一个方面，提供了一种语音通信装置，包括：

通信单元，配置用于接收第一语音信号；

控制单元，配置用于基于第一语音信号提取并识别目标信息；

搜索单元，配置用于搜索与目标信息匹配的被呼叫端；

语音通信单元，配置用于向被呼叫端发送语音通信请求。

进一步的，所述搜索单元、语音通信单元配置于语音通信装置的app中；

和/或

通信单元还配置用于，接收at指令。

进一步的，还包括检测单元，

所述检测单元配置用于检测是否已接收第一语音信号，以供检测到第一语音信号后，控制单元调用录音单元采集音频数据。

进一步的，基于第一语音信号提取目标信息，包括：控制单元同时通过多个方式提取目标信息，并判断是否识别到目标信息，若是，则终止对目标信息的提取。

进一步的，所述通过多个方式同时提取目标信息，包括如下：

方式1：通过通信单元向第一服务器发送请求及对应的音频数据，服务器接收请求后通过第二服务器的webapi接口提取音频数据的目标信息并返回，通信单元接收第一服务器返回的目标信息；

方式2：将所述音频数据写入第二服务器提供的sdk接口，通过第二服务器提取音频数据的目标信息并通过该sdk接口将目标信息返回，通信单元接收第二服务器返回的目标信息；

方式3：调用本地识别引擎msc，通过预配置的本地语法文件识别所述音频数据，提取音频数据的目标信息。

进一步的，终止对目标信息的提取，包括：

终止提取已接收第一语音信号的目标信息并销毁录音线程；

终止通信单元向第一服务器发送请求及对应的音频数据和/或终止向第二服务器sdk接口写入音频数据和/或终止本地识别引擎msc提取目标信息。

进一步的，控制单元还配置用于，识别目标信息的语义槽，根据语义槽提取目标字符。

进一步的，所述目标字符包括电话号码和/或运单号。

根据本发明的另一个方面，提供了一种语音通信系统，包括：蓝牙耳机和上述一项所述的语音通信装置；

蓝牙耳机，用于接收第二语音信号后向语音通信装置发送at指令；

语音通信装置接收at指令后触发提示信息。

进一步的，所述蓝牙耳机配置有语音唤醒装置，蓝牙耳机接收预设的第二语音信号即可被唤醒。

进一步的，还包括第一服务器、第二服务器；

第一服务器配置用于接收语音通信装置发送的请求及对应的音频数据，第一服务器接收请求后通过第二服务器的webapi接口提取音频数据的目标信息并返回；

第二服务器配置用于通过sdk接口获取语音通信装置写入的音频数据，提取音频数据的目标信息并通过所述sdk接口将目标信息返回。

根据本发明的另一个方面，提供了一种设备，包括一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行如上任一项所述的方法。

根据本发明的另一个方面，提供了一种存储有计算机程序的计算机可读存储介质，该程序被处理器执行时实现如上任一项所述的方法。

与现有技术相比，本发明具有以下有益效果：

1、本发明语音通信方法能够解放快递员双手，提高快收派件的效率；提升快递员收派件时处于特殊场景下的用户体验，同时加强骑行时的安全防范，降低交通事故发生率。

2、本发明语音通信装置，能够直接通过用户向语音通信装置输入语音指令，直接向被呼叫端发送语音通信请求，解放快递员双手，提高快收派件的效率；提升快递员收派件时处于特殊场景下的用户体验，同时减少骑行时双手触摸巴枪屏幕，快递员的双手不用离开车把去操作把枪屏幕，降低交通事故发生率。

3、本发明示例的语音通信系统，包括蓝牙耳机和语音通信装置，不会增加快递员的负重，能够直接通过用户向语音通信装置输入语音指令，直接向被呼叫端发送语音通信请求，建立通信后通过蓝牙耳机接听，解放快递员双手，提高快收派件的效率；提升快递员收派件时处于特殊场景下的用户体验，同时减少骑行时双手触摸巴枪屏幕，降低交通事故发生率。

4、本发明示例的设备，通过处理器执行语音通信方法，能够彻底解放小哥双手，保障快递员的安全。

5、本发明示例的可读存储介质，储存有被处理器执行时实现的所述语音通信方法，便于语音通信装置的使用及推广。

附图说明

图1为本发明流程图。

图2为本发明语音通信系统的结构框图。

具体实施方式

为了更好的了解本发明的技术方案，下面结合具体实施例、说明书附图对本发明作进一步说明。

实施例1：

本实施例提供了一种语音通信装置，可以为巴枪。

所述语音通信装置包括：

通信单元，配置用于接收at指令、第一语音信号，向第一服务器发送请求及对应的音频数据；接收服务器返回的目标信息；

检测单元，配置用于检测是否已接收第一语音信号，以供检测到第一语音信号后，控制单元调用录音单元采集音频数据。

控制单元，配置用于基于第一语音信号提取并识别目标信息；识别目标信息的语义槽，根据语义槽提取目标字符。语义槽即从用户说法中提取的关键字，如对应语法为"我要找运单号{waybillnumber}",语义槽就是waybillnumber，如用户说“我要找6587”，目标字符取值为“6587”。

搜索单元，配置用于从当前列表中搜索与目标字符匹配的被呼叫端。

语音通信单元，配置用于向被呼叫端发送语音通信请求，其中，所述搜索单元、语音通信单元配置于语音通信装置的app中。本申请语音通信装置为巴枪，android是巴枪的系统基础，系统录音是android的一部分，通过androidhal层提供的audiorecorder对象采集音频数据。

基于第一语音信号提取并识别目标信息，包括：控制单元同时通过多个方式提取目标信息，并判断是否识别到目标信息，若是，则终止对目标信息的提取。具体通过如下3种方式：

通信单元接收第一服务器、第二服务器返回的目标信息；

方式3：调用本地识别引擎msc，通过预配置的本地语法文件识别所述音频数据，(经适配处理后)提取音频数据的目标信息。适配处理是指数据格式的适配，因为本地语法文件获取到的格式和webapi格式不一致，webapi是json格式，数据字段不一样，要处理为一致，以方便应用app获取所需要的信息。本地msc获取到的结果需要自行拼装成特定的json格式。

方式1、方式2、方式3可同时提取音频数据的目标信息，控制单元还配置用于，判断是否识别到目标信息，若是，则终止对目标信息的提取。具体包括：终止提取已接收第一语音信号的目标信息并销毁录音线程；终止通信单元向服务器发送请求及对应的音频数据和/或终止向第二服务器sdk接口写入音频数据和/或终止本地识别引擎msc提取目标信息。

所述语音通信装置其相应的语音通信方法，包括以下步骤：

s1：接收at指令后触发提示信息，at指令由蓝牙耳机接收第二语音信号后发送；

s2：接收第一语音信号；

s3：基于第一语音信号提取并识别目标信息；

包括：控制单元同时通过多个方式提取目标信息，并判断是否识别到目标信息，若是，则终止对目标信息的提取。具体通过如下3种方式：

方式1：向第一服务器发送请求及对应的音频数据，第一服务器接收请求后通过第二服务器的webapi接口提取音频数据的目标信息并返回；

方式2：将所述音频数据写入第二服务器提供的sdk接口，通过第二服务器提取音频数据的目标信息并通过所述sdk接口将目标信息返回；

通信单元接收第一服务器、第二服务器返回的目标信息；

s4：识别目标信息的语义槽，根据语义槽提取目标字符。

s5：从把枪系统列表中搜索与目标字符匹配的被呼叫端；

s6：向被呼叫端发送语音通信请求。

本实施例提供了一种语音通信系统包括：蓝牙耳机、第一服务器、第二服务器和上述任意一项所述的语音通信装置；

蓝牙耳机配置有语音唤醒装置，蓝牙耳机接收预设的第二语音信号即可唤醒。

蓝牙耳机，接收第二语音信号后被唤醒，向语音通信装置发送at指令；语音通信装置接收at指令后触发提示信息，提醒用户向语音通信装置发送第一语音信号。

第二服务器配置用于通过sdk接口获取语音通信装置写入的音频数据，提取音频数据的目标信息并通过所述sdk接口将目标信息返回。

下述举例对该系统进行说明：

以派件场景拨打客户电话为例，具体地，第一步，使用语音指令(第二语音信号)唤醒蓝牙耳机，步骤如下：

s11:在巴枪系统设置中配对和连接蓝牙耳机

s12:巴枪中的蓝牙装置随巴枪系统启动，并保持后台运行。

s13:通过语音指令(如“魔飞魔飞")唤醒蓝牙耳机。

s14:蓝牙耳机被唤醒后发送at指令到巴枪。

第二步，接收第一语音信号，步骤如下：

s21:巴枪上的蓝牙装置接收到at指令后，通过播报一段提示语“我在，请说”(触发提示信息)，以告知用户此时蓝牙耳机已经被唤醒。

s22:用户听到提示语，可以直接说输入语音(第一语音信号)，如：“打电话，xxxx",其中xxxx为该用户派件列表中的派件单尾号后四位数,该运单号码在快递包裹上可以直接看到。

第三步直接或调用服务器提取目标信息，步骤如下：

s31:巴枪中的蓝牙装置打开蓝牙sco通道，检测到第一语音信号后，调用巴枪的语音识别api，采集pcm格式的音频数据。

s32:分三条提取路线提取目标信息：

s32-1：通过vad检测，获取音频数据，采用http协议发送给第一服务器，第一服务器接收到请求后，通过第二服务器的webapi接口提取音频数据的目标信息，将目标信息返回给巴枪。

s32-2：将采集到的pcm音频数据写入第二服务器sdk接口，通过第二服务器提取音频数据的目标信息并通过所述sdk接口将目标信息，将目标信息返回给巴枪。

s32-3：调用本地识别引擎msc，通过预配置的本地语法文件识别所述音频数据，经适配处理后将音频数据转换为目标信息，保证在弱网和无网环境下也能够将音频数据转换为目标信息。

s33:三条提取路线的策略为：

每一次识别采用最快将音频数据转换为目标信息的路线为准，一旦识别到目标信息，则终止其余提取路线，

第四步，通知相应app作出逻辑动作，步骤如下：

s41:巴枪中的蓝牙装置通过目标信息中的语义槽，提取出四位数运单尾号，以json数据格式传递给app

s42:app收到后四位数字后，从当前用户派件列表中搜索后四位尾号匹配的运单。

s43:找到运单后触发语音提示：正在拨打运单尾号xxxx的电话，播报完成，拨打该运单对应的电话号码。另外，语音提示过程中用户还可以像巴枪发送终止通话的语音，实现语音打断交互。

s44:通话完成之后，巴枪中的蓝牙装置关闭蓝牙sco通道，耳机进入待机状态，监听下一次唤醒。

本实施例提供了一种设备，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行如上任一项所述的方法。

本实施例提供了一种存储有计算机程序的计算机可读存储介质，该程序被处理器执行时实现如上任一项所述的方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王修念;柳旺;常伟;熊思杰
技术所有人：顺丰科技有限公司
我是此专利的发明人

上一篇：基于ABS合金改性材料的高强度耐磨型注塑件的制作方法
上一篇：一种可见光条件下冰箱杀菌材料的制作方法