一种基于权限转移信息的录音权限转移方法及装置与流程

文档序号：17933493发布日期：2019-06-15 01:07阅读：139来源：国知局

本发明涉及一种语音识别技术领域，尤其涉及一种基于权限转移信息的录音权限转移方法及装置。

背景技术：

目前，常规的会议是采用专门的记录人员进行会议记录；较为先进的是现有的会议中报告及记录的方法，通常是利用摄像机、麦克风、录音笔等设备对会议过程中各人员的发言进行录音及录像。会后做会议记录的人员可以查看、回放录音及录像以整理会议记录。然而，通过人工对语音数据进行标注和提取，对使用者来说，费时且极为不便。

并且如果是设置一个控制人去控制整个会议或者点餐过程的话，这样的话会造成会议过程中记录的缺失或者是使得点餐过程中，不能够综合所有参与者的口味，或者会使得单一个人的选择压力过大；因此，设计一种能够使得整个过程控制权转移的方法成为本领域技术人员所要解决的技术问题。

技术实现要素：

为了克服现有技术的不足，本发明的目的之一在于提供一种基于权限转移信息的录音权限转移方法，其能解决录音权限转移的技术问题。

本发明的目的之二在于提供一种电子设备，其能解决录音权限转移的技术问题。

本发明的目的之三在于提供一种计算机可读存储介质，其能解决录音权限转移的技术问题。

本发明的目的之一采用如下技术方案实现：

一种基于权限转移信息的录音权限转移方法，包括以下步骤：

声音采集步骤：通过声音采集设备获取第一用户的声音信息；

判断步骤：判断所述声音信息是否包含有权限转移信息，如果是，则执行权限转移步骤；

权限转移步骤：将当前的录音权限转移至与权限转移信息对应的第二用户处。

进一步地，在声音采集步骤和判断步骤之间还包括语音检测步骤：判断所述声音信号的前一句是否为询问语句，如果是，则执行判断步骤。

进一步地，所述权限转移信息为座位号信息和/或人名信息。

进一步地，当所述权限转移信息为人名信息时，所述权限转移步骤具体包括以下子步骤：

通过图像采集设备获取到所有第二用户的图像信息；

将所有第二用户的图像信息与图像数据库中预存信息进行比对，以得对应的第二用户的人名信息；

将名称信息与第二用户的人名信息进行比对，当比对一致的时候，将当前的录音权限转移至对应的第二用户处。

进一步地，当所述权限转移信息为座位号信息时，所述权限转移步骤具体为：

通过获取到的座位号信息对对应座位的第二用户开启录音权限。

进一步地，当所述权限转移信息为人名信息时，所述权限转移步骤具体包括以下子步骤：

通过名称信息与人名数据库中的信息进行比对，所述人名数据库包括人名信息以及与人名信息对应的声纹信息；

当比对一致的时候，开启第二用户的录音权限。

进一步地，在权限转移步骤之后还包括权限归还步骤：当第二用户所在位置没有声音时，控制开启第一用户的录音权限，同时关闭第二用户的录音权限。

进一步地，在所述权限转移步骤之后还包括声音转换步骤：用于将获取到的声音信息转化为文字信息或者控制指令。

本发明的目的之二采用如下技术方案实现：

一种电子设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明目的之一中任意一项所述的一种基于权限转移信息的录音权限转移方法。

本发明的目的之三采用如下技术方案实现：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如本发明目的之一中任意一项所述的一种基于权限转移信息的录音权限转移方法。

相比现有技术，本发明的有益效果在于：

本发明的基于权限转移信息的录音权限转移方法通过检测对应的权限转移信息来控制是否将录音权限转移至对应的用户；通过这样的方式能够使得整个录音过程更加的有序。

附图说明

图1为实施例一的基于权限转移信息的录音权限转移方法的流程图。

具体实施方式

下面，结合附图以及具体实施方式，对本发明做进一步描述，需要说明的是，在不相冲突的前提下，以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

实施例一

如图1所示，本实施例提供了一种基于权限转移信息的录音权限转移方法，包括以下步骤：

s1：通过声音采集设备获取第一用户的声音信息；所述声音采集设备为环形麦克风。采用环形麦克风阵列以采集当前用户的声音信息；这一步主要是为了获取到对应用户的声音信息，这也是下面所有步骤的基础。通过环形麦克风可以更为高效准确的获取圆桌四周的声音信息，获取到的声音源信息越清晰，那么后期进行语音翻译也就会使得其越准确。在本实施例中，其主要是通过声音采集设备来获取第一用户的声音信息，也就是本实施例中的录音权限转移主要发生在具体的场景中，比如当前处于会议状态中，则该系统正在对会议进行过程中的语音信息进行记录，如果是在点餐过程中，其对点餐指令进行感知，然后发出对应的控制指令。还有这里的第一用户有两种含义，一种是拥有录音权限的用户，这个用户可以是一个人，第二种含义是拥有录音权限的用户组，这个用户组是多个人，也即是第一用户组；是为了与第二用户区分开，第一用户是拥有录音控制权限的用户，第二用户是不具有录音控制权限的用户。

s2：判断所述声音信息是否包含有权限转移信息，如果是，则执行步骤s3；在会议过程中，由于会出现需要不具备录音权限的参与者发声，所以需要获取对应的信息从而来确定是否进行权限转移。在这个过程中，有很多信息都可以作为一种参考，比如“xx你来说”“xx你觉得怎么样？”或者是“xx”等等，在会议过程中这些都是具体的点名回复，需要具体对应的人来回答；所以在这个过程中需要将对应的录音权限转移至对应的用户。

这种是直接在询问句中加入人名信息然后进行具体权限转移，还有一种情况是，在会议过程中直接说出了对应的用户的名称，然后对录音权限进行转移；除了这两种之外，有一种更为通常的做法是，再说出问题之后，没有人回复，这时候需要通过具体说出所要回答的人来进行权限转移，在进行这种方式的实施的时候，需要判断进行语音检测步骤：所述声音信号的前一句是否为询问语句，如果是，才执行步骤s2。语音检测步骤是为了获取当前的拥有录音权限的人物是否需要对应的用户的意见，比如在会议过程中，当讨论到某个具体的问题的时候，需要征求多方的意见，如果会议中只记录有对应的用户的意见，则会产生一定的偏颇，所以需要进行对应的录音权限的转移。例如，在一个实施例中，用户产生的语音数据可以包括非疑问句，诸如“好的”、“是的”等陈述句；也可以包括相关的疑问句，诸如用户在遇到问题时产生的自言自语的疑问句“要如何处理呢？”、“该怎么进行呢？”等等，以征求与会者的对应的意见。当识别到陈述句的时候，也就是会议主持人当前不需要征求其他与会者的意见，而当存在有疑问句的时候，则是需要征求相应的意见。

语音识别单元用于对从语音监测单元获取的所述语音数据进行识别，以确定所述语音数据是否包括疑问句；如果确定所述语音数据包括疑问句，则提取出所述疑问句。如上所述地，由于用户产生的语音数据既可以包括疑问句也可以包括非疑问句，即该语音数据也可能只包括非疑问句，所以需要由语音识别单元首先确定语音数据中是否有疑问句，然后提取出该疑问句，以排除非疑问句的语音数据。

具体地，语音识别单元可以通过识别所述语音数据中是否包括用户语音音调的提升和/或用户语音的较小的音量来确定所述语音数据是否包括疑问句。具体地，可以预先设定用户语音音量的判断参考值。例如，在一个实施例中，可以将用户语音音量的判断参考值设定为40分贝，而用户语音音调的升高可以通过语音数据的声波频率的增高来确定。所以，在此实施例中，如果用户语音数据的声波频率增高并且音量小于40分贝，则语音识别单元可以确定所述语音数据包括疑问句。

此外，语音识别单元还可以通过识别所述语音数据中是否包括疑问词来进一步确定所述语音数据是否包括疑问句。例如，语音识别单元可以通过识别出语音数据中包含诸如“如何”、“怎么”、“什么”等的疑问词来进一步确定该语音数据包含疑问句。在一个实施例中，语音识别单元还可以通过识别语音数据以语气词“吗”、“呢”等结尾来进一步确定该语音数据是否包含疑问句。在进行检测的时候，把所有的这类型的词构建成一个完成的数据库，从而将其都囊括进去，然后再进行分词，找寻对应的词语。例如，如果用户的语音数据为“要如何继续进行这个项目呢？”“鱼香肉丝你觉得怎么样呢？”则语音识别单元可以通过识别出户语音包含疑问词“如何”以及语气词“呢”来确定该语音数据包括疑问句。上述方式为进行询问语句检测的方式，除了上述方式外，还可以通过设置语义分析来进行询问语句的检测，因为在常规的语言交流过程中，有可能会出现这样的情况，就是虽然你说出的话不包括上述特征，但是其还是一种询问语句的方式，比如“鱼香肉丝还是糖醋里脊？”这些隐含问句的方式可以通过语义分析的方式来进行识别得到。这样就可以获取到对应的权限转移对象。

s3：将当前的录音权限转移至与权限转移信息对应的第二用户处。当确定需要进行权限转移的时候，接下来就是需要判断具体的对象是谁，在进行具体判断的时候在本实施例中有以下几种方式去进行实现：

第一种是通过图像的方式来进行实现，由于其已经抽取到对应的权限转移信息，且所述权限转移信息为人名信息，所述步骤s3具体包括以下子步骤：

通过图像采集设备获取到所有第二用户的图像信息；这一步主要是为了获取到对应的识别图像，通过这个图像然后判断得到具体对应的转移对象。

将所有第二用户的图像信息与图像数据库中预存信息进行比对，以得对应的第二用户的人名信息；由于在参会之前已经录入有人物图像信息，并且人物图像信息与人名信息进行对应，在会议过程中，当听到有相应的人名信息的时候，则通过图像搜索找寻到对应的人物信息，这时候只需要将其定位到具体的人物即可。

将名称信息与第二用户的人名信息进行比对，当比对一致的时候，将当前的录音权限转移至对应的第二用户处。由于通过图像检索到对应的人物信息，那么此时只需要将其座位面前的麦克风打开，同时开启相应的录音权限，即可实现权限转移。

第二种是直接通过对应的声音信息以及位置信息进行判断从而实现权限转移。当所述权限转移信息为座位号信息时，所述步骤s3具体为：通过获取到的座位号信息对对应座位的第二用户开启录音权限。这种是在整个会议中没有出现具体的人名称信息，只出现有座位信息，比如在会议进行中，当需要有人回答的问题的时候，其直接通过说“3号来回答”即可完成操作，由于事先已经在服务器端存储有人名信息与座位信息进行对应的关系，所以在最终输出结果的时候，可以直接通过变换将座位号信息转换为名称信息来进行操作即可，就可以输出比较完整的会议记录。同样的，在点餐这样的场景中进行的时候，不需要判断人物名称，只需要直接输出对应的控制指令即可。

第三种方式是通过声纹识别的方式进行操作，当所述权限转移信息为人名信息时，所述权限转移步骤具体包括以下子步骤：

通过名称信息与人名数据库中的信息进行比对，所述人名数据库包括人名信息以及与人名信息对应的声纹信息；由于每个人的声纹都是特有的，这时候如果针对于具体的声纹信息进行权限开放，则具备更高的识别特性，但是这种方式有一个不太方便的地方即是，其需要先对声纹信息进行收集并识别训练得到对应的数据库，这样才能够更方便进行后期识别，但是整个过程要获取到所有的用户数据库并不是特别方便，需要对其进行一个个记录收集，虽然过程中会比较的困难，但是由于其识别的准确性相对来说也更好，具有更高的特异性。

当比对一致的时候，开启第二用户的录音权限。当得到对应的比对名称信息的时候，此时可以直接开始使得第二用户的声纹信息具备对应的录音权限。通过直接的名称以及座位号定位使得整个过程中不需要再通过声源定位技术来对获取到的声音进行定位，其可以直接定位到对应的用户。

在整个实施过程中，如果当有同时出现有第二用户有应答举动或者出现点名操作的时候，两种方式那种优先选取都可以；甚至可以当出现这两种情况的时候，可以再设定一个对应的判断来获取对应的声音，从而判断是让哪个第二用户来进行回答。

s4：当第二用户所在位置没有声音时，控制开启第一用户的录音权限，同时关闭第二用户的录音权限。由于在整个会议或者是点餐的过程中，第二用户是处于一种被动的状态，所以其录音权限并不能够处于常开的状态，这样的话，就会使得原本的控制权限设置没有意义，不如直接开放所有用户的录音权限，所以当该第二用户完成对应的说话的时候，此时可以通过权限归还的方式来结束其权限范围。如果此时，其还具有权限的话，则会产生一定的混乱，所以当其说话结束的时候，可以通过设置将其录音权限关闭。

s5：用于将获取到的声音信息转化为文字信息或者控制指令。这里获取的声音信息可以是来自于第一用户的声音信息，也可以是来自于第二用户的声音信息，转换为文字信息主要是应用于对应的会议记录中，将获取到的声音信息进行翻译。转化为控制指令主要是为了将其应用于点餐系统中，将获取到的声音信息转换为点餐指令从而完成点餐。当场景为会议的时候，通过将所有得到的声音信息转化为对应的文字信息，此时，则可以完成对声音信息的记录，如果此时应用的是点餐系统，那么此时得到的是点餐指令，比如“烧鹅”、“烧鸭”等，则控制发送至服务器完成点餐。

本实施例的录音权限转移主要应用于需要进行录音的场景中，并且在该场景中只存在一个或者不超过参与人数的个数的录音权限；如果所有的人都具备录音权限的话，则不存在有权限转移这样的说法。比如在点餐过程中，如果所有人都拥有录音权限，也就是点餐权限，在自动化的点餐中，会产生一种问题就是点了过多的菜，这样就会使得顾客觉得商家有一种欺骗的行为，并且也不利于系统的长期使用；如果设定好一个固定的点菜人，在点菜过程中对其进行整体的控制，询问以及指令发送，那么就会使得整个点菜的过程更为的可操作。同样的在会议过程中也一样，如果对所有的用户都进行记录，则会使得会议不能够突出重点；通过设定固定的人来进行控场，并通过对其录音权限进行交割，会使得整体的过程能够更加的可控，使得该声音系统更为的稳定。本实施例的基于权限转移信息的录音权限转移的方法，检测对应的权限转移信息来控制是否将录音权限转移至对应的用户；通过这样的方式能够使得整个录音过程更加的有序，从而能够进一步实现声音信息获取的完整性和自动化程度。

实施例二

实施例二公开了一种电子设备，该电子设备包括处理器、存储器以及程序，其中处理器和存储器均可采用一个或多个，程序被存储在存储器中，并且被配置成由处理器执行，处理器执行该程序时，实现实施例一的一种基于权限转移信息的录音权限转移方法。该电子设备可以是手机、电脑、平板电脑等等一系列的电子设备。

实施例三

实施例三公开了一种计算机可读存储介质，该存储介质用于存储程序，并且该程序被处理器执行时，实现实施例一的一种基于权限转移信息的录音权限转移方法。

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、闪存(flash)、硬盘或光盘等，包括若干指令用以使得一台电子设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述基于内容更新通知装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

上述实施方式仅为本发明的优选实施方式，不能以此来限定本发明保护的范围，本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：傅峰峰
技术所有人：广州富港万嘉智能科技有限公司
我是此专利的发明人