基于语音识别的参数调节方法、装置及健身设备与流程

文档序号：17837420发布日期：2019-06-05 23:43阅读：209来源：国知局

本发明涉及语音识别
技术领域：
：，尤其涉及基于语音识别的参数调节方法、装置及健身设备。
背景技术：
：：现有的健身设备，例如跑步机，几乎都是通过按键的方式进行参数设定和调整。人在奔跑过程中，手动操作跑步机上的按键，会破坏运动过程的协调性和流畅度，容易发生摔倒。健身者自身也难以判断哪个速度范围适合自己的健身需求。现有的健身设备存在的缺陷在于，健身设备不能自动调整参数以满足用户的健身需求。技术实现要素：有鉴于此，本发明实施例提供了基于语音识别的参数调节方法、装置及健身设备，用以解决现有技术中健身设备不能自动调整参数以满足用户的健身需求的问题。为了实现上述目的，根据本发明的一个方面，提供了一种基于语音识别的参数调节方法，所述方法包括：获取健身者的语音信号；使用预设的深度学习语音识别模型识别所述语音信号，得到语音文本；提取所述语音文本中的关键词，得到目标关键词，并将所述目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配，得到目标语音指令，所述语音指令集中的每个语音指令至少与一个关键词相对应；响应于所述目标语音指令，检测所述健身者的实时心率；判断所述健身者的实时心率是否在预设心率范围之内；如果所述健身者的实时心率不在所述预设心率范围之内，根据所述目标语音指令调节健身设备的参数，所述参数包括速度和/或坡度。进一步地，在所述响应于所述目标语音指令，检测所述健身者的实时心率之后，并在所述判断所述健身者的实时心率是否在预设心率范围之内之前，所述方法还包括：获取所述健身者的用户信息，所述用户信息包括年龄、性别及静态心率；根据所述用户信息计算所述预设心率范围。进一步地，在所述获取所述健身者的语音信号之后，并且，在所述使用预设的深度学习语音识别模型识别所述语音信号之前，所述方法还包括：从所述语音信号中识别语音唤醒词；计算所述语音唤醒词与预设的标准唤醒词之间的相似度；当计算得到的相似度大于第一预设阈值时，则确认所述语音唤醒词为有效唤醒词；输出提示信息，所述提示信息用于提示使用所述深度学习语音识别模型进行识别。进一步地，在所述从所述语音信号中识别语音唤醒词之前，所述方法还包括：将所述语音信号进行降噪处理。进一步地，在所述获取健身者的语音信号之前，所述方法还包括：采集待识别人脸图像，所述待识别人脸图像为所述健身者的人脸图像；采用预设的人脸识别模型识别所述待识别人脸图像，得到所述待识别人脸图像的特征向量；将所述待识别人脸图像的特征向量与数据库中的多个人脸图像样本的特征向量进行匹配，得到匹配结果，其中，所述人脸图像样本所关联的用户具有健身设备的使用权限；根据所述匹配结果，判断所述健身者是否具有所述健身设备的使用权限，若有，激活所述健身设备。进一步地，在所述根据所述目标语音指令调节健身设备的参数之后，所述方法还包括：获取所述健身者的历史音频播放记录；根据所述历史音频播放记录，识别所述历史音频的标签；基于识别到的所述历史音频的标签，从云端获取与所述标签相匹配的音乐；播放获取到的所述音乐。为了实现上述目的，根据本发明的一个方面，提供了一种基于语音识别的参数调节装置，所述装置包括：第一获取单元，用于获取健身者的语音信号；第一识别单元，用于使用预设的深度学习语音识别模型识别所述语音信号，得到语音文本；第一匹配单元，用于提取所述语音文本中的关键词，得到目标关键词，并将所述目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配，得到目标语音指令，所述语音指令集中的每个语音指令至少与一个关键词相对应；检测单元，用于响应于所述目标语音指令，检测所述健身者的实时心率；判断单元，用于判断所述健身者的实时心率是否在预设心率范围之内；调节单元，用于如果所述健身者的实时心率不在所述预设心率范围之内，根据所述目标语音指令调节健身设备的参数，所述参数包括速度和/或坡度。进一步地，所述装置还包括：第二获取单元，用于获取所述健身者的用户信息，所述用户信息包括年龄、性别及静态心率；计算单元，用于根据所述用户信息计算所述预设心率范围。进一步地，所述装置还包括：采集单元，用于采集待识别人脸图像，所述待识别人脸图像为所述健身者的人脸图像；第二识别单元，用于采用预设的人脸识别模型识别所述待识别人脸图像，得到所述待识别人脸图像的特征向量；第二匹配单元，用于将所述待识别人脸图像的特征向量与数据库中的多个人脸图像样本的特征向量进行匹配，得到匹配结果，其中，所述人脸图像样本所关联的用户具有健身设备的使用权限；激活单元，用于根据所述匹配结果，判断所述健身者是否具有所述健身设备的使用权限，若有，激活所述健身设备。为了实现上述目的，根据本发明的一个方面，提供了一种健身设备，包括上述的基于语音识别的参数调节装置。在本方案中，通过识别健身者的语音信号来得到用于调节健身设备的语音指令，并进一步通过检测健身者的实时心率，判断实时心率是否在预设心率范围之内，以确定是否达到健身需求，在实时心率不在预设心率范围之内时，响应语音指令调节健身设备的参数，使得健身者的实时心率随运动状态的变化调整至预设心率范围内，从而保持最佳运动状态。从而解决现有技术中健身设备不能自动调整参数以满足用户的健身需求的问题。【附图说明】为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。图1是根据本发明实施例的一种基于语音识别的参数调节方法的流程图；图2是根据本发明实施例的一种基于语音识别的参数调节装置的示意图。【具体实施方式】为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。应当理解，尽管在本发明实施例中可能采用术语第一、第二、第三等来描述终端，但这些终端不应限于这些术语。这些术语仅用来将终端彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一获取单元也可以被称为第二获取单元，类似地，第二获取单元也可以被称为第一获取单元。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。图1是根据本发明实施例的一种基于语音识别的参数调节方法的流程图，如图1所示，该方法包括：步骤s101，获取健身者的语音信号；步骤s102，使用预设的深度学习语音识别模型识别语音信号，得到语音文本；步骤s103，提取语音文本中的关键词，得到目标关键词，并将目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配，得到目标语音指令，语音指令集中的每个语音指令至少与一个关键词相对应；步骤s104，响应于目标语音指令，检测健身者的实时心率；步骤s105，判断健身者的实时心率是否在预设心率范围之内；步骤s106，如果健身者的实时心率不在预设心率范围之内，根据目标语音指令调节健身设备的参数，参数包括速度和/或坡度。在本方案中，通过识别健身者的语音信号来得到用于调节健身设备的语音指令，并进一步通过检测健身者的实时心率，判断实时心率是否在预设心率范围之内，以确定是否达到健身需求，在实时心率不在预设心率范围之内时，响应语音指令调节健身设备的参数，使得健身者的实时心率随运动状态的变化调整至预设心率范围内，从而保持最佳运动状态。从而解决现有技术中健身设备不能自动调整参数以满足用户的健身需求的问题。可选地，在获取健身者的语音信号之后，并且，在使用预设的深度学习语音识别模型识别语音信号之前，方法还包括：从语音信号中识别语音唤醒词；计算语音唤醒词与预设的标准唤醒词之间的相似度；当计算得到的相似度大于第一预设阈值时，则确认语音唤醒词为有效唤醒词；输出提示信息，提示信息用于提示使用深度学习语音识别模型进行识别。其中，语音唤醒词可以是“你好”、“hello”、“达人”等。如果深度学习语音识别模型长期处于识别状态，增大健身设备的功耗，因此通过识别语音唤醒词，再使用深度学习语音识别模型进行识别，可以有效降低系统功耗。可选地，在从语音信号中识别语音唤醒词之前，方法还包括：将语音信号进行降噪处理。其中，降噪处理的方式有多种，方式一：可以采用最小均方算法滤除语音信号中的环境噪声信号。方式二，可以直接调用降噪模型来进行降噪处理。从而获取更加清晰的语音信号，使得语音识别模型识别得到的语音文本更加准确。可选地，通过预设的关键词提取接口来提取语音文本中的关键词，例如语音文本为“达人，请帮我加速一档”，提取的关键词为“加速一档”。可以理解地，通过深度学习的语音识别模型来识别健身者关于指示调节参数的语音信号，使得健身者在运动状态下，无需通过手动操作，即可实现健身设备的参数调节，不会破坏运动过程的协调性和流畅度。可选地，在响应于目标语音指令，检测健身者的实时心率之后，并在判断健身者的实时心率是否在预设心率范围之内之前，方法还包括：获取健身者的用户信息，用户信息包括年龄、性别及静态心率；根据用户信息计算预设心率范围。其中，健身者的实时心率可以通过健身者身上佩戴的采集器获取，也可将采集器集成设置于健身设备上，例如手柄处。预设心率范围(男性)＝(210-静态心率-年龄)*(0.6～0.8)+静态心率；预设心率范围(女性)＝((210-静态心率-年龄)*(0.6～0.8)+静态心率)*0.95。可以理解地，预设心率范围为健身用户通过有氧运动提高心血管循环系统的机能时有效而安全的运动心率。当健身者的实时心率超出预设心率范围时，应适当放慢速度和减小动作幅度；当实时心率过慢时，可适当加快速度和加大动作幅度。可以理解地，在识别健身者的语音信号，得到目标语音指令之后，系统能够根据健身者的实时心率来判断健身者的健身状态，是否需要执行语音指令。可选地，如果健身者的实时心率在预设心率范围之内，表明健身者的健身状态良好，不执行目标语音指令。可选地，在获取健身者的语音信号之前，方法还包括：采集待识别人脸图像，待识别人脸图像为健身者的人脸图像；采用预设的人脸识别模型识别待识别人脸图像，得到待识别人脸图像的特征向量；将待识别人脸图像的特征向量与数据库中的多个人脸图像样本的特征向量进行匹配，得到匹配结果，其中，人脸图像样本所关联的用户具有健身设备的使用权限；根据匹配结果，判断健身者是否具有健身设备的使用权限，若有，激活健身设备。可选地，通过多个人脸训练样本训练初始人脸识别模型，并进一步将初始人脸识别模型的输出结果输入预先建立的判别模型，通过判别模型与初始人脸识别模型的对抗训练，得到深度学习的人脸识别模型。其中，初始人脸识别模型可以是利用机器学习方法和训练样本对现有的卷积神经网络结构进行有监督训练而得到的。训练好的人脸识别模型能够用于人脸识别，且能够有效提高人脸识别的准确度，从而进一步提高健身设备的管理效率。通过人脸识别技术激活健身设备，无需其他门禁系统来管理健身设备，使得具有使用权限的用户直接刷脸即可健身，提高健身设备的管理效率。可选地，在根据目标语音指令调节健身设备的参数之后，方法还包括：获取健身者的历史音频播放记录；根据历史音频播放记录，识别历史音频的标签；基于识别到的历史音频的标签，从云端获取与标签相匹配的音乐；播放获取到的音乐。从而能够自动播放健身者喜欢的音乐，在健身过程中给健身者提供音乐，能够帮助用户缓解运动带来的疲劳，提高健身体验，更加个性化。本发明实施例提供了一种基于语音识别的参数调节装置，该装置用于执行上述基于语音识别的参数调节方法，如图2所示，该装置包括：第一获取单元10、第一识别单元20、第一匹配单元30、检测单元40、判断单元50、调节单元60。第一获取单元10，用于获取健身者的语音信号；第一识别单元20，用于使用预设的深度学习语音识别模型识别语音信号，得到语音文本；第一匹配单元30，用于提取语音文本中的关键词，得到目标关键词，并将目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配，得到目标语音指令，语音指令集中的每个语音指令至少与一个关键词相对应；检测单元40，用于响应于目标语音指令，检测健身者的实时心率；判断单元50，用于判断健身者的实时心率是否在预设心率范围之内；调节单元60，用于如果健身者的实时心率不在预设心率范围之内，根据目标语音指令调节健身设备的参数，参数包括速度和/或坡度。在本方案中，通过识别健身者的语音信号来得到用于调节健身设备的语音指令，并进一步通过检测健身者的实时心率，判断实时心率是否在预设心率范围之内，以确定是否达到健身需求，在实时心率不在预设心率范围之内时，响应语音指令调节健身设备的参数，使得健身者的实时心率随运动状态的变化调整至预设心率范围内，从而保持最佳运动状态。从而解决现有技术中健身设备不能自动调整参数以满足用户的健身需求的问题。可选地，装置还包括第三识别单元、第二计算单元、确认单元、输出单元。第三识别单元，用于从语音信号中识别语音唤醒词；第二计算单元，用于计算语音唤醒词与预设的标准唤醒词之间的相似度；确认单元，用于当计算得到的相似度大于第一预设阈值时，则确认语音唤醒词为有效唤醒词；输出单元，用于输出提示信息，提示信息用于提示使用深度学习语音识别模型进行识别。其中，语音唤醒词可以是“你好”、“hello”、“达人”等。如果深度学习语音识别模型长期处于识别状态，增大健身设备的功耗，因此通过识别语音唤醒词，再使用深度学习语音识别模型进行识别，可以有效降低系统功耗。可选地，装置还包括：降噪单元，用于将语音信号进行降噪处理。其中，降噪处理的方式有多种，方式一：可以采用最小均方算法滤除语音信号中的环境噪声信号。方式二，可以直接调用降噪模型来进行降噪处理。从而获取更加清晰的语音信号，使得语音识别模型识别得到的语音文本更加准确。可选地，通过预设的关键词提取接口来提取语音文本中的关键词，例如语音文本为“达人，请帮我加速一档”，提取的关键词为“加速一档”。可以理解地，通过深度学习的语音识别模型来识别健身者关于指示调节参数的语音信号，使得健身者在运动状态下，无需通过手动操作，即可实现健身设备的参数调节，不会破坏运动过程的协调性和流畅度。可选地，装置还包括：第二获取单元、第一计算单元。第二获取单元，用于获取健身者的用户信息，用户信息包括年龄、性别及静态心率；第一计算单元，用于根据用户信息计算预设心率范围。其中，健身者的实时心率可以通过健身者身上佩戴的采集器获取，也可将采集器集成设置于健身设备上，例如手柄处。预设心率范围(男性)＝(210-静态心率-年龄)*(0.6～0.8)+静态心率；预设心率范围(女性)＝((210-静态心率-年龄)*(0.6～0.8)+静态心率)*0.95。可以理解地，预设心率范围为健身用户通过有氧运动提高心血管循环系统的机能时有效而安全的运动心率。当健身者的实时心率超出预设心率范围时，应适当放慢速度和减小动作幅度；当实时心率过慢时，可适当加快速度和加大动作幅度。可以理解地，在识别健身者的语音信号，得到目标语音指令之后，系统能够根据健身者的实时心率来判断健身者的健身状态，是否需要执行语音指令。可选地，如果健身者的实时心率在预设心率范围之内，表明健身者的健身状态良好，不执行目标语音指令。可选地，装置还包括：采集单元、第二识别单元、第二匹配单元、激活单元。采集单元，用于采集待识别人脸图像，待识别人脸图像为健身者的人脸图像；第二识别单元，用于采用预设的人脸识别模型识别待识别人脸图像，得到待识别人脸图像的特征向量；第二匹配单元，用于将待识别人脸图像的特征向量与数据库中的多个人脸图像样本的特征向量进行匹配，得到匹配结果，其中，人脸图像样本所关联的用户具有健身设备的使用权限；激活单元，用于根据匹配结果，判断健身者是否具有健身设备的使用权限，若有，激活健身设备。可选地，通过多个人脸训练样本训练初始人脸识别模型，并进一步将初始人脸识别模型的输出结果输入预先建立的判别模型，通过判别模型与初始人脸识别模型的对抗训练，得到深度学习的人脸识别模型。其中，初始人脸识别模型可以是利用机器学习方法和训练样本对现有的卷积神经网络结构进行有监督训练而得到的。训练好的人脸识别模型能够用于人脸识别，且能够有效提高人脸识别的准确度，从而进一步提高健身设备的管理效率。通过人脸识别技术激活健身设备，无需其他门禁系统来管理健身设备，使得具有使用权限的用户直接刷脸即可健身，提高健身设备的管理效率。可选地，装置还包括：第三获取单元、第四识别单元、第四获取单元、播放单元。第三获取单元，用于获取健身者的历史音频播放记录；第四识别单元，用于根据历史音频播放记录，识别历史音频的标签；第四获取单元，用于基于识别到的历史音频的标签，从云端获取与标签相匹配的音乐；播放单元，用于播放获取到的音乐。从而能够自动播放健身者喜欢的音乐，在健身过程中给健身者提供音乐，能够帮助用户缓解运动带来的疲劳，提高健身体验，更加个性化。本发明实施例提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行以下步骤：获取健身者的语音信号；使用预设的深度学习语音识别模型识别语音信号，得到语音文本；提取语音文本中的关键词，得到目标关键词，并将目标关键词与预设的语音指令集中的每个语音指令进行关键词匹配，得到目标语音指令，语音指令集中的每个语音指令至少与一个关键词相对应；响应于目标语音指令，检测健身者的实时心率；判断健身者的实时心率是否在预设心率范围之内；如果健身者的实时心率不在预设心率范围之内，根据目标语音指令调节健身设备的参数，参数包括速度和/或坡度。可选地，在程序运行时控制存储介质所在设备还执行以下步骤：获取健身者的用户信息，用户信息包括年龄、性别及静态心率；根据用户信息计算预设心率范围。可选地，在程序运行时控制存储介质所在设备还执行以下步骤：从语音信号中识别语音唤醒词；计算语音唤醒词与预设的标准唤醒词之间的相似度；当计算得到的相似度大于第一预设阈值时，则确认语音唤醒词为有效唤醒词；输出提示信息，提示信息用于提示使用深度学习语音识别模型进行识别。可选地，在程序运行时控制存储介质所在设备还执行以下步骤：将语音信号进行降噪处理。可选地，在程序运行时控制存储介质所在设备还执行以下步骤：采集待识别人脸图像，待识别人脸图像为健身者的人脸图像；采用预设的人脸识别模型识别待识别人脸图像，得到待识别人脸图像的特征向量；将待识别人脸图像的特征向量与数据库中的多个人脸图像样本的特征向量进行匹配，得到匹配结果，其中，人脸图像样本所关联的用户具有健身设备的使用权限；根据匹配结果，判断健身者是否具有健身设备的使用权限，若有，激活健身设备。可选地，在程序运行时控制存储介质所在设备还执行以下步骤：获取健身者的历史音频播放记录；根据历史音频播放记录，识别历史音频的标签；基于识别到的历史音频的标签，从云端获取与标签相匹配的音乐；播放获取到的音乐。本发明实施例提供了一种健身设备，包括上述的基于语音识别的参数调节装置。需要说明的是，本发明实施例中所涉及的终端可以包括但不限于个人计算机(personalcomputer，pc)、个人数字助理(personaldigitalassistant，pda)、无线手持设备、平板电脑(tabletcomputer)、手机、mp3播放器、mp4播放器等。可以理解的是，所述应用可以是安装在终端上的应用程序(nativeapp)，或者还可以是终端上的浏览器的一个网页程序(webapp)，本发明实施例对此不进行限定。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。当前第1页12当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张杰
技术所有人：深圳壹账通智能科技有限公司
我是此专利的发明人

上一篇：一种用于改善碳纤维丝束展幅的收丝机改进型兔子头装置的制作方法
上一篇：一种苗木培养剂的制作方法