语音控制方法及电子设备与流程

文档序号：13672147阅读：144来源：国知局

技术领域本发明涉及语音控制领域，尤其涉及一种语音控制方法及电子设备。

背景技术：
随着通信技术的发展，各种电子设备在趋于数字化的同时也趋于智能化。目前可以进行声音采集的电子设备一般用来进行录音等，不具备其他的智能化的功能。例如，用户在电子设备中预设采集时间，但对语音采集的时间把握不准确，在该采集时间内不能把用户的语音信息采集完全，例如，如果用户说话较慢，即电子设备还没有录取完音频数据时采集就结束了，这时采集的语音信息不完整。

技术实现要素：
本发明的主要目的在于解决避免电子设备采集语音信息不完整的情形发生的技术问题。为实现上述目的，本发明提供的一种语音控制方法，包括：A、在语音控制键触发时，采集声音数据，并获取所采集到的声音数据的数字音频频率；B、根据所述数字音频频率判断所述声音数据是否为语音数据；C、若是语音数据，则根据所述数字音频频率设置采集延长时间，并在所述语音控制键关闭时，按照所述采集延长时间延长声音采集。优选地，所述步骤B之后还包括：D、若非语音数据，则当达到预设的声音采集时间时，停止所述声音数据的采集。优选地，所述步骤B包括：采集所述声音数据的数字音频频率，将所采集的数字音频频率与预设的声音频段进行比对；若所采集的数字音频频率在所述预设的声音频段范围内，则判断所述声音数据为语音数据。优选地，所述语音控制方法还包括步骤E、F：E、将所采集的声音数据进行语音识别，获取识别结果；F、将识别结果发送给智能设备，以作为所述智能设备输入指令对所述智能设备进行操作。优选地，所述步骤E包括：将所述声音数据与本地词库的词语进行匹配；若匹配成功，将匹配成功的词语作为所述识别结果；若匹配失败，则将所述声音数据发送至云端，并获取云端返回的识别结果。为了实现上述目的，本发明还提供一种电子设备，所述电子设备包括：获取模块，用于在语音控制键触发时，采集声音数据，并获取所采集到的声音数据的数字音频频率；判断模块，用于根据所述数字音频频率判断所述声音数据是否为语音数据；设置模块，用于若是语音数据，则根据所述数字音频频率设置采集延长时间，并在所述语音控制键关闭时，按照所述采集延长时间延长声音采集。优选地，所述电子设备还包括：停止模块，用于若非语音数据，则当达到预设的声音采集时间时，停止所述声音数据的采集。优选地，所述判断模块包括：比对单元，用于采集所述声音数据的数字音频频率，将所采集的数字音频频率与预设的声音频段进行比对；判断单元，用于若所采集的数字音频频率在所述预设的声音频段范围内，则判断所述声音数据为语音数据。优选地，所述电子设备还包括：识别模块，用于将所采集的声音数据进行语音识别，获取识别结果；发送模块，用于将识别结果发送给智能设备，以作为所述智能设备输入指令对所述智能设备进行操作。优选地，所述识别模块包括：匹配单元，用于将所述声音数据与本地词库的词语进行匹配；第一识别单元，用于若匹配成功，将匹配成功的词语作为所述识别结果；第二识别单元，用于若匹配失败，则将所述声音数据发送至云端，并获取云端返回的识别结果。本发明的一种语音控制方法及电子设备，电子设备采集声音数据，根据声音数据的数字音频频率确认其是否是人声输入的语音数据，如果是语音数据，则根据数字音频频率设置采集延长时间，即根据用户说话快慢程度设置采集延长时间，避免了用户说话较慢、语音控制开关提前关闭而导致录取的声音数据不完整的情形发生，提高录取的声音数据的完整性。附图说明图1为本发明语音控制方法第一实施例的流程示意图；图2为本发明语音控制方法第二实施例的流程示意图；图3为图1中的步骤B的细化流程示意图；图4为本发明语音控制方法第三实施例的流程示意图；图5为本发明电子设备第一实施例的功能模块示意图；图6为本发明电子设备第二实施例的功能模块示意图；图7为图5中判断模块的功能模块示意图；图8为本发明电子设备第三实施例的功能模块示意图。本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。具体实施方式应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。本发明提供一种语音控制方法，参照图1，在一实施例中，该语音控制方法包括：步骤A，在语音控制键触发时，采集声音数据，并获取所采集到的声音数据的数字音频频率；本实施例中，电子设备中预置语音控制装置，当按下语音控制键时开始采集声音数据。优选地，本实施例更适合进行短时间的声音数据的录取，如录取5秒钟内的声音数据。本实施例中，电子设备在采集声音数据的同时将其转换为数字信号。其中，在采集一小部分声音数据时就获取声音数据的数字音频频率，根据该数字音频频率可以获知声音数据的语速的快慢，进而根据声音数据的语速的快慢进行下一步的操作。举例而言，本实施例中的电子设备可以是遥控器或其他能够采集声音数据的电子设备(如手机、录音笔等等)，用户按下遥控器中的语音控制按键时，语音控制开关接通，然后采集周围环境中的声音数据，例如可以使用遥控器将用户的语音采集下来，作为语音输入来控制电视机。在本实施例中，在采集声音数据的同时，获取所采集到的声音数据的数字音频频率。步骤B，根据所述数字音频频率判断所述声音数据是否为语音数据；其中，由采集到的声音数据中的数字音频频率可以获知其所属频段，在本实施例中，定义f(x)为数字音频频率，单位为赫兹：(246.9<f(x)<987.8)：女高音说话时的频率范围；(164.8<f(x)<659.2)：女低音说话时的频率范围；(110<f(x)<440)：男高音说话时的频率范围；(73.4<f(x)<293.7)：男低音说话时的频率范围；(100<f(x)<300)：普通人说话时的频率范围。其中，本实施例根据人说话时的声音数据的数字音频频率的特点及上述定义的频率范围，采用一定的算法，例如对声音频率进行采样，连续采集上述声音数据的10个数字音频频率，如果有5个数字音频频率均在上述的某一个频率范围内，如在246.9<f(x)<987.8，则判断为对应的女高音说话。即根据声音数据中的数字音频频率得出其所属频段或频率范围，可以得出是女高音、女低音、男高音、男低音或者普通人说话的语音数据。一般来说，目前语音的采样频率为40KHz，即每秒对原始信号采样的次数为40000次。优选地，若已经得出当前采集到的声音数据的数字音频频率所属的频段，则还可采用其他算法对声音数据再次进行计算，以再次确认其是否为人声的语音数据。在一实施例中，若确认所属的频段为女高音246.9-987.8Hz，取声音数据中的n组频率，若有n/2组频率出现的次数在(40000/246.9)-(40000/987.8)的范围内时，则确认为人声的语音数据，否则不是人声的语音数据，不进行下一步的处理。步骤C，若是语音数据，则根据所述数字音频频率设置采集延长时间，并在所述语音控制键关闭时，按照所述采集延长时间延长声音采集；本实施例中，当确定为语音数据后，通过数字音频频率判断人声的语速的快慢，若数字音频频率较高，即表明用户说话较快，反之则较慢，用户说话较快可以设置较短的采集延长时间，而说话较慢则可以设置较长的采集延长时间。本实施例中，根据数字音频频率设置采集延长时间，例如如果用户说话较慢，则可以设置电子设备的语音采集延长时间，以此来延长电子设备的采集时间，如可以设置语音采集延长时间为300m秒或500m秒等。当用户不能把握语音采集时间，即还没有说完话电子设备的语音控制开关就提前断开了，本实施例由于延长了语音采集时间，因此仍然可以录取声音数据，避免用户说话较慢时提前断开语音控制开关而导致录取的声音数据不完整的情况发生。本实施例中，如果确认是采集的是语音数据，无论用户说话快慢，均根据数字音频频率设置采集延长时间，防止在没有采集完声音数据时，语音控制开关断开而导致录取的声音数据不完整。与现有技术相比，本实施例的电子设备采集声音数据，根据声音数据的数字音频频率确认其是否是人声输入的语音数据，如果是语音数据，则根据数字音频频率设置采集延长时间，即根据用户说话快慢程度设置采集延长时间，避免了用户说话较慢、语音控制开关提前关闭而导致录取的声音数据不完整的情形发生，提高录取的声音数据的完整性。在一优选的实施例中，如图2所示，在上述图1的实施例的基础上，本实施例在上述步骤C之后还包括：步骤D，若不是语音数据，则当达到预设的声音采集时间时，停止所述声音数据的采集。本实施例中，可以在电子设备中预置一个定时器，当确认不是语音数据时，定时器计时开始，当达到预设的声音采集时间时，通过定时器的触发自动关闭语音控制开关，停止声音数据的采集。优选地，在本实施例中，如果在预设的声音采集时间内检测到语音数据时，则计时器的计时时间清零，然后根据语音数据的数字音频频率设置采集延长时间。本实施例中，如果未检测到语音数据，电子设备继续声音数据的采集，当达到预设的声音采集时间时，停止所述声音数据的采集。在一优选的实施例中，如图3所示，在上述图1的实施例的基础上，上述步骤B还包括：步骤B1，采集所述声音数据的数字音频频率，将所采集的数字音频频率与预设的声音频段进行比对；步骤B2，若所采集的数字音频频率在所述预设的声音频段范围内，则判断所述声音数据为语音数据。在本实施例中，预设的声音频段包括上述的女高音、女低音、男高音、男低音或者普通人的发音的声音频段。其中，本实施例根据人说话时的声音数据的数字音频频率的特点及上述定义的频率范围，采用一定的算法，例如对声音频率进行采样，连续采集上述声音数据的10个数字音频频率，如果有5个数字音频频率均在上述的某一个频率范围内，如在246.9<f(x)<987.8，则判断为对应的女高音说话。即根据声音数据中的数字音频频率得出其所属频段或频率范围，可以得出是女高音、女低音、男高音、男低音或者普通人说话的语音数据。本实施例中，由声音数据中的数字音频频率推导出其所属的声音频段为：表1表2如上表1及表2所示，表1及表2为反复测试得到的先验值。输入低段频率或者输入高段频率相当于本实施例中的数字音频频率，Zstar最低频率及Zend最高频率构成在该数字音频频率对应的声音类型的频率范围，由此，可以得到：倍数关系P(x)＝(Zend-Zstar)/F(x)＝2.5，依此类推。因此，若已经获取得到本实施例中的数字音频频率，可以通过计算得到该数字音频频率所属的声音频段，如下表3所示：表3如表3所示，表3的倍数关系P(x)为上述表1及表2中的倍数关系的两者之和的平均数，即倍数关系P(x)＝(2.5+1.25)/2＝1.875。另外，在本实施例中，输入频率F(x)若大于等于500Hz，则可以取Zstar最低频率为F(x)的一半，输入频率F(x)若小于500Hz，则可以取Zstar最低频率为F(x)的三分之一，然后计算Zend最高频率＝F(x)*P(x)+Zstar＝500*1.875+250＝1187.5Hz。至此，由声音数据中的数字音频频率得出其所属的声音频段为250-1187.5。另外，判断数字音频频率每秒钟出现的次数是否在预设的声音频段对应的次数范围内：例如，对于女高音来说：若Zstar最低频率＝260，则频率每秒钟出现的次数为40000/260＝153，依次类推。若取10组Zstar最低频率，分别计算得到频率每秒钟出现的次数为153、4000、153、153、150、150、150、150、150及150，预设的声音频段每秒钟出现对应的次数为(40000/1187.5)至(40000/250)的范围内，即33.68至160的范围内。可知，除了第二组的4000次之外，其他的次数均在33.68至160的范围内，因此，有9组数据满足条件，其大于10组的二分之一，因此，可再次确认所录取的声音数据为语音数据。在一优选的实施例中，如图4所示，在上述图1的实施例的基础上，该语音控制方法还包括：步骤E、将所采集的声音数据进行语音识别，获取识别结果；步骤F、将识别结果发送给智能设备，以作为所述智能设备输入指令对所述智能设备进行操作。本实施例中，当采集结束后，电子设备可以将所录取的声音数据进行语音识别，然后发送给智能设备，智能设备将识别结果输出并显示在屏幕上。本实施例中，电子设备可以是遥控器，通过遥控器采集或录取声音数据，将声音数据进行识别，发送给智能电视并显示，然后还可将识别结果作为输入信息对电视进行操控。优选地，上述步骤E包括：将所述声音数据与本地词库的词语进行匹配；若匹配成功，将匹配成功的词语作为所述识别结果；若匹配失败，则将所述声音数据发送至云端，并获取云端返回的识别结果。其中，电子设备可以先在本地进行识别，即在本地的词库中将声音数据与本地词库的词语进行匹配；若在本地没有匹配到，也可以将声音数据发送至云端进行识别。本发明提供一种电子设备，参照图5，在一实施例中，电子设备包括：获取模块101，用于在语音控制键触发时，采集声音数据，并获取所采集到的声音数据的数字音频频率；本实施例中，电子设备中预置语音控制装置，当按下语音控制键时开始采集声音数据。优选地，本实施例更适合进行短时间的声音数据的录取，如录取5秒钟内的声音数据。本实施例中，电子设备在采集声音数据的同时将其转换为数字信号。其中，在采集一小部分声音数据时就获取声音数据的数字音频频率，根据该数字音频频率可以获知声音数据的语速的快慢，进而根据声音数据的语速的快慢进行下一步的操作。举例而言，本实施例中的电子设备可以是遥控器或其他能够采集声音数据的电子设备(如手机、录音笔等等)，用户按下遥控器中的语音控制按键时，语音控制开关接通，然后采集周围环境中的声音数据，例如可以使用遥控器将用户的语音采集下来，作为语音输入来控制电视机。在本实施例中，在采集声音数据的同时，获取所采集到的声音数据的数字音频频率。判断模块102，用于根据所述数字音频频率判断所述声音数据是否为语音数据；其中，由采集到的声音数据中的数字音频频率可以获知其所属频段，在本实施例中，定义f(x)为数字音频频率，单位为赫兹：(246.9<f(x)<987.8)：女高音说话时的频率范围；(164.8<f(x)<659.2)：女低音说话时的频率范围；(110<f(x)<440)：男高音说话时的频率范围；(73.4<f(x)<293.7)：男低音说话时的频率范围；(100<f(x)<300)：普通人说话时的频率范围。其中，本实施例根据人说话时的声音数据的数字音频频率的特点及上述定义的频率范围，采用一定的算法，例如对声音频率进行采样，连续采集上述声音数据的10个数字音频频率，如果有5个数字音频频率均在上述的某一个频率范围内，如在246.9<f(x)<987.8，则判断为对应的女高音说话。即根据声音数据中的数字音频频率得出其所属频段或频率范围，可以得出是女高音、女低音、男高音、男低音或者普通人说话的语音数据。一般来说，目前语音的采样频率为40KHz，即每秒对原始信号采样的次数为40000次。优选地，若已经得出当前采集到的声音数据的数字音频频率所属的频段，则还可采用其他算法对声音数据再次进行计算，以再次确认其是否为人声的语音数据。在一实施例中，若确认所属的频段为女高音246.9-987.8Hz，取声音数据中的n组频率，若有n/2组频率出现的次数在(40000/246.9)-(40000/987.8)的范围内时，则确认为人声的语音数据，否则不是人声的语音数据，不进行下一步的处理。设置模块103，用于若是语音数据，则根据所述数字音频频率设置采集延长时间，并在所述语音控制键关闭时，按照所述采集延长时间延长声音采集。本实施例中，当确定为语音数据后，通过数字音频频率判断人声的语速的快慢，若数字音频频率较高，即表明用户说话较快，反之则较慢，用户说话较快可以设置较短的采集延长时间，而说话较慢则可以设置较长的采集延长时间。本实施例中，根据数字音频频率设置采集延长时间，例如如果用户说话较慢，则可以设置电子设备的语音采集延长时间，以此来延长电子设备的采集时间，如可以设置语音采集延长时间为300m秒或500m秒等。当用户不能把握语音采集时间，即还没有说完话电子设备的语音控制开关就提前断开了，本实施例由于延长了语音采集时间，因此仍然可以录取声音数据，避免用户说话较慢时提前断开语音控制开关而导致录取的声音数据不完整的情况发生。本实施例中，如果确认是采集的是语音数据，无论用户说话快慢，均根据数字音频频率设置采集延长时间，防止在没有采集完声音数据时，语音控制开关断开而导致录取的声音数据不完整。在一优选的实施例中，如图6所示，在上述图5的实施例的基础上，所述电子设备还包括：停止模块104，用于若非语音数据，则当达到预设的声音采集时间时，停止所述声音数据的采集。本实施例中，可以在电子设备中预置一个定时器，当确认不是语音数据时，定时器计时开始，当达到预设的声音采集时间时，通过定时器的触发自动关闭语音控制开关，停止声音数据的采集。优选地，在本实施例中，如果在预设的声音采集时间内检测到语音数据时，则计时器的计时时间清零，然后根据语音数据的数字音频频率设置采集延长时间。本实施例中，如果未检测到语音数据，电子设备继续声音数据的采集，当达到预设的声音采集时间时，停止所述声音数据的采集。在一优选的实施例中，如图7所示，在上述图5的实施例的基础上，所述判断模块102包括：比对单元1021，用于采集所述声音数据的数字音频频率，将所采集的数字音频频率与预设的声音频段进行比对；判断单元1022，用于若所采集的数字音频频率在所述预设的声音频段范围内，则判断所述声音数据为语音数据。在本实施例中，预设的声音频段包括上述的女高音、女低音、男高音、男低音或者普通人的发音的声音频段。其中，本实施例根据人说话时的声音数据的数字音频频率的特点及上述定义的频率范围，采用一定的算法，例如对声音频率进行采样，连续采集上述声音数据的10个数字音频频率，如果有5个数字音频频率均在上述的某一个频率范围内，如在246.9<f(x)<987.8，则判断为对应的女高音说话。即根据声音数据中的数字音频频率得出其所属频段或频率范围，可以得出是女高音、女低音、男高音、男低音或者普通人说话的语音数据。本实施例中，由声音数据中的数字音频频率推导出其所属的声音频段可以参阅上述的表1、表2、表3中的数据及相关的推导过程，此处不再赘述。另外，判断数字音频频率每秒钟出现的次数是否在预设的声音频段对应的次数范围内：例如，对于女高音来说：若Zstar最低频率＝260，则频率每秒钟出现的次数为40000/260＝153，依次类推。若取10组Zstar最低频率，分别计算得到频率每秒钟出现的次数为153、4000、153、153、150、150、150、150、150及150，预设的声音频段每秒钟出现对应的次数为(40000/1187.5)至(40000/250)的范围内，即33.68至160的范围内。可知，除了第二组的4000次之外，其他的次数均在33.68至160的范围内，因此，有9组数据满足条件，其大于10组的二分之一，因此，可再次确认所录取的声音数据为语音数据。在一优选的实施例中，如图8所示，在上述图5的实施例的基础上，所述电子设备还包括：识别模块105，用于将所采集的声音数据进行语音识别，获取识别结果；发送模块106，用于将识别结果发送给智能设备，以作为所述智能设备输入指令对所述智能设备进行操作。本实施例中，当采集结束后，电子设备可以将所录取的声音数据进行语音识别，然后发送给智能设备，智能设备将识别结果输出并显示在屏幕上。本实施例中，电子设备可以是遥控器，通过遥控器采集或录取声音数据，将声音数据进行识别，发送给智能电视并显示，然后将识别结果作为输入信息对电视进行操控。优选地，所述识别模块105包括：匹配单元，用于将所述声音数据与本地词库的词语进行匹配；第一识别单元，用于若匹配成功，将匹配成功的词语作为所述识别结果；第二识别单元，用于若匹配失败，则将所述声音数据发送至云端，并获取云端返回的识别结果。其中，电子设备可以先在本地进行识别，即在本地的词库中将声音数据与本地词库的词语进行匹配；若在本地没有匹配到，也可以将声音数据发送至云端进行识别。需要说明的是，上述遥控器的实施例中的所有模块均可以由遥控器的CPU处理模块来控制完成相应的功能。以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵侠;王云华;
技术所有人：深圳TCL新技术有限公司;
我是此专利的发明人

上一篇：一种螺纹连接式架子鼓的制作方法
上一篇：一种基于共振峰频率的数字语音感知哈希方法与流程