基于深度学习的肠鸣音识别方法及相关装置与流程

文档序号:17427935发布日期:2019-04-17 03:06阅读:436来源:国知局
基于深度学习的肠鸣音识别方法及相关装置与流程

本申请涉及肠鸣音识别技术领域,具体涉及一种基于深度学习的肠鸣音识别方法及相关装置。



背景技术:

肠鸣音指的是当肠管蠕动时,肠腔内空气和液体随之流动,产生一种断续的气过水声(或咕噜声)。由于正常情况和患病情况的肠鸣音是不同的,因此可以利用肠鸣音辅助医生诊断肠病患者。目前,识别肠鸣音类型通过将待识别对象的肠鸣音特征与肠鸣音类型库进行比对,进而得到待识别对象的肠鸣音类型。由于每个人的肠鸣音存在差别,因此现有的肠鸣音识别方法准确性低。



技术实现要素:

本申请实施例提供一种基于深度学习的肠鸣音识别方法及相关装置,用于识别待识别对象的肠鸣音类型,提高了肠鸣音识别的准确性。

第一方面,本申请实施例提供一种基于深度学习的肠鸣音识别方法,所述方法包括:

通过可穿戴设备获取待识别对象的肠鸣音数据;

对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列;

将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,所述肠鸣音识别模型用于确定语音帧序列对应的肠鸣音类型。

第二方面,本申请实施例提供一种基于深度学习的肠鸣音识别装置,所述装置包括:

获取单元,用于通过可穿戴设备获取待识别对象的肠鸣音数据;

音频处理单元,用于对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列;

确定单元,用于将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,所述肠鸣音识别模型用于确定语音帧序列对应的肠鸣音类型。

第三方面,本申请实施例提供一种服务器,包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面所述的方法中的步骤的指令。

第四方面,本申请实施例提供了一种计算机可读存储介质,上述计算机可读存储介质用于存储计算机程序,上述计算机程序被处理器执行,以实现如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。

第五方面,本申请实施例提供了一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。

可以看出,在本申请实施例中,服务器首先通过可穿戴设备获取待识别对象的肠鸣音数据,然后对肠鸣音数据执行音频处理操作,得到肠鸣音数据对应的语音帧序列,最后将语音帧序列输入肠鸣音识别模型进行处理,输出语音帧序列对应的目标肠鸣音类型。这样可识别待识别对象的肠鸣音类型,提高了肠鸣音识别的准确性。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。

图1是本申请实施例提供的第一种基于深度学习的肠鸣音识别方法的流程示意图;

图2是本申请实施例提供的第二种基于深度学习的肠鸣音识别方法的流程示意图;

图3是本申请实施例提供的第三种基于深度学习的肠鸣音识别方法的流程示意图;

图4是本申请实施例提供的一种基于深度学习的肠鸣音识别装置的结构示意图;

图5是本申请实施例提供的一种服务器的结构示意图。

具体实现方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

以下分别进行详细说明。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

以下,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。

(1)疾病诊断设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms),终端设备(terminaldevice,td),等等。

(2)服务器,也称伺服器,是提供计算服务的设备。服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器,数据库服务器,应用程序服务器,web服务器等。

下面对本申请实施例进行详细介绍。

请参阅图1,图1是本申请实施例提供的第一种基于深度学习的肠鸣音识别方法的流程示意图,该基于深度学习的肠鸣音识别方法包括:

步骤101:服务器通过可穿戴设备获取待识别对象的肠鸣音数据。

其中,可穿戴设备用于采集待识别对象的肠鸣音声音信号,可穿戴设备具有放大肠鸣音和降低环境音的功能。

在一个可能的示例中,服务器通过可穿戴设备获取待识别对象的肠鸣音数据,包括:

服务器向所述可穿戴设备发送请求信息,所述请求信息用于指示所述可穿戴设备反馈所述待识别对象的肠鸣音声音信号,所述肠鸣音声音信号的时长为预设时长范围;

服务器接收所述可穿戴设备针对所述请求信息发送的第一肠鸣音声音信号,所述第一肠鸣音声音信号的时长为第一时长,所述第一时长处于所述预设时长范围;

服务器将所述第一肠鸣音声音信号转换为第一肠鸣音数字信号,所述第一肠鸣音数字信号的时长为所述第一时长;

服务器将所述第一肠鸣音数字信号作为所述肠鸣音数据。

其中,服务器与可穿戴设备具有连接关系。

进一步地,可穿戴设备接收请求信息之后,所述方法还包括:

可穿戴设备采集待识别对象的第一肠鸣音声音信号,第一肠鸣音声音信号的采集时长为第一时长;

可穿戴设备将第一肠鸣音声音信号发送至服务器。

其中,预设时长范围可以为5ms~200ms,第一时长可以为20ms、25ms、30ms、35ms、40ms或者是其他值。

其中,服务器将第一肠鸣音声音信号转换为第一肠鸣音数字信号的实施方式为现有技术,在此不再叙述。

步骤102:服务器对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列。

其中,音频处理操作包括语音去噪操作和音频分段操作。

在一个可能的示例中,服务器对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列,包括:

服务器调用预先存储的语音去噪算法;

服务器根据所述语音去噪算法对所述肠鸣音数据进行语音去噪,得到所述肠鸣音数据对应的第一肠鸣音数据;

服务器对所述第一肠鸣音数据执行音频分段操作,得到所述第一肠鸣音数据对应的至少一个语音帧,每个语音帧的时长为第二时长,所述第二时长小于所述第一时长,所述每个语音帧包括64个频率分量;

服务器将所述至少一个语音帧组成的序列作为所述语音帧序列。

其中,语音去噪算法包括以下至少一种:稀疏分解法、谱减法、小波变换法。

其中,第二时长可以为4ms。

其中,语音帧序列包括语音帧的数量为待识别对象的第一肠鸣音数据的时长与每个语音帧的时长的比值,即第一时长与第二时长的比值。

步骤103:服务器将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,所述肠鸣音识别模型用于确定语音帧序列对应的肠鸣音类型。

其中,肠鸣音识别模型为完成训练的深度学习的循环神经网络模型,肠鸣音识别模型包括编码器、激活层、解码器、全连接层和分类器。

其中,肠鸣音类型包括肠鸣音正常、肠鸣音活跃、肠鸣音亢进、肠鸣音减弱和肠鸣音消失。

1)肠鸣音正常:正常情况下,肠鸣音每分钟4~5次,其频率、声响和音调变异较大,餐后频繁而明显,休息时稀疏而微弱。

2)肠鸣音活跃:肠蠕动增强,肠鸣音在6~10次/分,称肠鸣音活跃,见于急性胃肠炎、腹泻药后或消化道大出血时。

3)肠鸣音亢进:如次数增多(10次/分以上),音调响亮、高亢,甚至呈叮当声或金属声,称肠鸣音亢进,见于机械性肠梗阻。

4)肠鸣音减弱:肠蠕动减慢、减弱,肠鸣音次数减少,数分钟(3~5分钟)听见一次称肠鸣音减弱,见于老年性便秘、腹膜炎、电解质紊乱(低血钾)、胃肠动力低下等。

5)肠鸣音消失:若持续3~5分钟还未听到肠鸣音,用手指轻叩或搔弹刺激腹部仍听不到肠鸣音,称肠鸣音消失,见于麻痹性肠梗阻或急性腹膜炎。

在一个可能的示例中,服务器将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,包括:

服务器将所述语音帧序列输入所述肠鸣音识别模型;

服务器将所述语音帧序列转换为第一输入向量,以及将所述第一输入向量输入第一神经网络层进行处理,输出所述第一输入向量对应的第二输入向量,所述第一神经网络层包括128个神经元,所述第一神经网络层对应第一权重矩阵;

服务器将所述第二输入向量输入第二神经网络层进行处理,输出所述第二输入向量对应的第三输入向量,所述第二神经网络层包括64个神经元,所述第二神经网络层对应第二权重矩阵;

服务器将所述第三输入向量输入第三神经网络层进行处理,输出所述第三输入向量对应的第四输入向量,所述第三神经网络层包括32个神经元,所述第三神经网络层对应第三权重矩阵;

服务器将所述第四输入向量输入激活层进行处理,输出所述第四输入向量对应的第五输入向量,所述激活层包括32个神经元,所述激活层对应第四权重矩阵;

服务器将所述第五输入向量输入第四神经网络层进行处理,输出所述第五输入向量对应的第六输入向量,所述第四神经网络层包括64个长短期记忆网络单元,所述第四神经网络层对应第五权重矩阵;

服务器将所述第六输入向量输入全连接层进行处理,输出所述第六输入向量对应的输出向量,所述全连接层包括256个激活函数神经元,所述全连接层对应第六权重矩阵;

服务器将所述输出向量输入分类器进行处理,输出所述输出向量对应的所述目标肠鸣音类型。

具体地,服务器将语音帧序列转换为第一输入向量的实施方式可以是:调用服务器预先存储的梅尔频率倒谱系数(melfrequencycepstralcoefficients,mfcc)算法;根据mfcc算法将语音帧序列转化为第一输入向量。

其中,第一神经网络层为编码器的第1个双向循环层,第一神经网络层包括的128个神经元中每个神经元对应一个权重。

其中,第二神经网络层为编码器的第2个双向循环层,第二神经网络层包括的64个神经元中每个神经元对应一个权重。

其中,第三神经网络层为编码器的单向层,第三神经网络层包括的32个神经元中每个神经元对应一个权重。

其中,激活层包括的32个神经元中每个神经元对应一个权重,激活层用于初始化解码器。

其中,第四神经网络层为解码器的单独循环层,第四神经网络层包括的64个长短期记忆网络单元中每个长短期记忆网络单元对应一个权重。

其中,全连接层包括的256个激活函数神经元中每个激活函数神经元对应一个权重。

具体地,服务器将输入向量输入分类器进行处理,输出输出向量对应的目标肠鸣音类型的实施方式可以是:调用分类器预先存储的向量与肠鸣音类型的对应关系;根据向量与肠鸣音类型的对应关系确定目标向量对应的目标肠鸣音类型。

可以看出,在本申请实施例中,服务器首先通过可穿戴设备获取待识别对象的肠鸣音数据,然后对肠鸣音数据执行音频处理操作,得到肠鸣音数据对应的语音帧序列,最后将语音帧序列输入肠鸣音识别模型进行处理,输出语音帧序列对应的目标肠鸣音类型。这样可识别待识别对象的肠鸣音类型,提高了肠鸣音识别的准确性。

在一个可能的示例中,服务器将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型之前,所述方法还包括:

服务器获取多个第一训练数据和多个肠鸣音类型,每个肠鸣音类型对应一个第一训练数据;

服务器对每个第一训练数据执行音频处理操作,得到所述多个第一训练数据对应的多个第二训练数据;

服务器根据所述多个第二训练数据、所述多个肠鸣音类型和第一循环神经网络模型构建所述肠鸣音识别模型,所述第一循环神经网络模型为未进行深度学习的循环神经网络模型。

其中,多个第一训练数据的数量大于等于第一阈值,第一阈值可以是可穿戴设备自定义的,也可以是服务器自定义的。

其中,服务器对每个第一训练数据执行音频处理操作,得到多个第一训练数据对应的多个第二训练数据的实施方式与服务器对肠鸣音数据执行音频处理操作,得到肠鸣音数据对应的语音帧序列的实施方式是相同的,在此不再叙述。

其中,服务器根据多个第二训练数据、多个肠鸣音类型和第一循环神经网络模型构建肠鸣音识别模型只需要构建一次,无需每次对肠鸣音数据执行音频处理操作,得到肠鸣音数据对应的语音帧序列就构建肠鸣音识别模型。

在一个可能的示例中,服务器根据所述多个第二训练数据、所述多个肠鸣音类型和第一循环神经网络模型构建所述肠鸣音识别模型,包括:

在所述多个第二训练数据的数量为n,所述n为大于1的整数的情况下,服务器将n个第二训练数据中第i个第二训练数据输入所述第一循环神经网络模型进行第i次正向训练,输出肠鸣音类型i;

若所述肠鸣音类型i不同于所述第i个第二训练数据对应的肠鸣音类型,则服务器对第i次正向训练后的第一循环神经网络模型进行反向训练,得到第i次训练后的第一循环神经网络模型;

在将所述第i个第二训练数据输入所述第一循环神经网络模型进行第i次训练结束后,服务器将第(i+1)个第二训练数据输入所述第i次训练后的第一循环神经网络模型进行第(i+1)次训练;

直到i=n,服务器停止训练,得到第n次训练后的第一循环神经网络模型,所述i是初始值为1,以1为间隔的递增函数;

服务器将所述n次训练后的第一循环神经网络模型作为所述肠鸣音识别模型。

具体地,服务器将第(i+1)个第二训练数据输入第i次训练后的第一循环神经网络模型进行第(i+1)次训练的实施方式可以是:将第(i+1)个第二训练数据输入第i次训练后的第一循环神经网络模型进行第(i+1)次正向训练,输出肠鸣音类型j,j=i+1;判断肠鸣音类型j与第(i+1)个第二训练数据对应的肠鸣音类型是否相同;若肠鸣音类型j不同于第(i+1)个第二训练数据对应的肠鸣音类型,则对第(i+1)次正向训练后的第一循环神经网络模型进行反向训练,得到第(i+1)次训练后的第一循环神经网络模型。

在一个可能的示例中,服务器将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型之后,所述方法还包括:

服务器判断所述目标肠鸣音类型是否包含于患病肠鸣音类型集,所述患病肠鸣音类型集包括肠鸣音活跃、肠鸣音亢进、肠鸣音减弱、肠鸣音消失;

若所述目标肠鸣音类型包含于所述患病肠鸣音类型集,则服务器根据预先存储的肠鸣音类型与疾病的对应关系确定所述目标肠鸣音类型对应的至少一种目标疾病;

服务器发送所述目标肠鸣音类型和所述至少一种目标疾病至疾病诊断设备。

可见,在本示例中,服务器将待识别对象的目标肠鸣音类型和待识别对象可能患有的至少一种目标疾病发送至疾病诊断设备,有助于辅助医生诊断肠道疾病。

请参阅图2,图2是本申请实施例提供的第二种基于深度学习的肠鸣音识别方法的流程示意图,该基于深度学习的肠鸣音识别方法包括:

步骤201:服务器通过可穿戴设备获取待识别对象的肠鸣音数据。

步骤202:服务器对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列。

步骤203:服务器将所述语音帧序列输入所述肠鸣音识别模型。

步骤204:服务器将所述语音帧序列转换为第一输入向量,以及将所述第一输入向量输入第一神经网络层进行处理,输出所述第一输入向量对应的第二输入向量,所述第一神经网络层包括128个神经元,所述第一神经网络层对应第一权重矩阵。

步骤205:服务器将所述第二输入向量输入第二神经网络层进行处理,输出所述第二输入向量对应的第三输入向量,所述第二神经网络层包括64个神经元,所述第二神经网络层对应第二权重矩阵。

步骤206:服务器将所述第三输入向量输入第三神经网络层进行处理,输出所述第三输入向量对应的第四输入向量,所述第三神经网络层包括32个神经元,所述第三神经网络层对应第三权重矩阵。

步骤207:服务器将所述第四输入向量输入激活层进行处理,输出所述第四输入向量对应的第五输入向量,所述激活层包括32个神经元,所述激活层对应第四权重矩阵。

步骤208:服务器将所述第五输入向量输入第四神经网络层进行处理,输出所述第五输入向量对应的第六输入向量,所述第四神经网络层包括64个长短期记忆网络单元,所述第四神经网络层对应第五权重矩阵。

步骤209:服务器将所述第六输入向量输入全连接层进行处理,输出所述第六输入向量对应的输出向量,所述全连接层包括256个激活函数神经元,所述全连接层对应第六权重矩阵。

步骤210:服务器将所述输出向量输入分类器进行处理,输出所述输出向量对应的所述目标肠鸣音类型。

需要说明的是,图2所示的方法的各个步骤的具体实现过程可参见上述方法所述的具体实现过程,在此不再叙述。

请参阅图3,图3是本申请实施例提供的第三种基于深度学习的肠鸣音识别方法的流程示意图,该基于深度学习的肠鸣音识别方法包括:

步骤301:服务器通过可穿戴设备获取待识别对象的肠鸣音数据。

步骤302:服务器对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列。

步骤303:服务器获取多个第一训练数据和多个肠鸣音类型,每个肠鸣音类型对应一个第一训练数据。

步骤304:服务器对每个第一训练数据执行音频处理操作,得到所述多个第一训练数据对应的多个第二训练数据。

步骤305:在所述多个第二训练数据的数量为n,所述n为大于1的整数的情况下,服务器将n个第二训练数据中第i个第二训练数据输入所述第一循环神经网络模型进行第i次正向训练,输出肠鸣音类型i。

步骤306:若所述肠鸣音类型i不同于所述第i个第二训练数据对应的肠鸣音类型,则服务器对第i次正向训练后的第一循环神经网络模型进行反向训练,得到第i次训练后的第一循环神经网络模型。

步骤307:在将所述第i个第二训练数据输入所述第一循环神经网络模型进行第i次训练结束后,服务器将第(i+1)个第二训练数据输入所述第i次训练后的第一循环神经网络模型进行第(i+1)次训练。

步骤308:直到i=n,服务器停止训练,得到n次训练后的第一循环神经网络模型,所述i是初始值为1,以1为间隔的递增函数。

步骤309:服务器将所述n次训练后的第一循环神经网络模型作为所述肠鸣音识别模型。

步骤310:服务器将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,所述肠鸣音识别模型用于确定语音帧序列对应的肠鸣音类型。

步骤311:服务器判断所述目标肠鸣音类型是否包含于患病肠鸣音类型集,所述患病肠鸣音类型集包括肠鸣音活跃、肠鸣音亢进、肠鸣音减弱、肠鸣音消失。

步骤312:若所述目标肠鸣音类型包含于所述患病肠鸣音类型集,则服务器根据预先存储的肠鸣音类型与疾病的对应关系确定所述目标肠鸣音类型对应的至少一种目标疾病。

步骤313:服务器发送所述目标肠鸣音类型和所述至少一种目标疾病至疾病诊断设备。

需要说明的是,图3所示的方法的各个步骤的具体实现过程可参见上述方法所述的具体实现过程,在此不再叙述。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,基于深度学习的肠鸣音识别装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对基于深度学习的肠鸣音识别装置进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

请参阅图4,图4是本申请实施例提供的一种基于深度学习的肠鸣音识别装置400的结构示意图,该基于深度学习的肠鸣音识别装置400包括处理单元401、存储单元402和通信单元403,处理单元401包括获取单元、音频处理单元和确定单元,其中:

获取单元,用于通过可穿戴设备获取待识别对象的肠鸣音数据;

音频处理单元,用于对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列;

确定单元,用于将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,所述肠鸣音识别模型用于确定语音帧序列对应的肠鸣音类型。

可见,在本申请实施例中,首先通过可穿戴设备获取待识别对象的肠鸣音数据,然后对肠鸣音数据执行音频处理操作,得到肠鸣音数据对应的语音帧序列,最后将语音帧序列输入肠鸣音识别模型进行处理,输出语音帧序列对应的目标肠鸣音类型。这样可识别待识别对象的肠鸣音类型,提高了肠鸣音识别的准确性。

在一个可能的示例中,在通过可穿戴设备获取待识别对象的肠鸣音数据方面,上述获取单元具体用于:

向所述可穿戴设备发送请求信息,所述请求信息用于指示所述可穿戴设备反馈所述待识别对象的肠鸣音声音信号,所述肠鸣音声音信号的时长为预设时长范围;

接收所述可穿戴设备针对所述请求信息发送的第一肠鸣音声音信号,所述第一肠鸣音声音信号的时长为第一时长,所述第一时长处于所述预设时长范围;

将所述第一肠鸣音声音信号转换为第一肠鸣音数字信号,所述第一肠鸣音数字信号的时长为所述第一时长;

将所述第一肠鸣音数字信号作为所述肠鸣音数据。

在一个可能的示例中,在对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列方面,上述音频处理单元具体用于:

调用预先存储的语音去噪算法;

根据所述语音去噪算法对所述肠鸣音数据进行语音去噪,得到所述肠鸣音数据对应的第一肠鸣音数据;

对所述第一肠鸣音数据执行音频分段操作,得到所述第一肠鸣音数据对应的至少一个语音帧,每个语音帧的时长为第二时长,所述第二时长小于所述第一时长,所述每个语音帧包括64个频率分量;

将所述至少一个语音帧组成的序列作为所述语音帧序列。

在一个可能的示例中,在将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型方面,上述确定单元具体用于:

将所述语音帧序列输入所述肠鸣音识别模型;

将所述语音帧序列转换为第一输入向量,以及将所述第一输入向量输入第一神经网络层进行处理,输出所述第一输入向量对应的第二输入向量,所述第一神经网络层包括128个神经元,所述第一神经网络层对应第一权重矩阵;

将所述第二输入向量输入第二神经网络层进行处理,输出所述第二输入向量对应的第三输入向量,所述第二神经网络层包括64个神经元,所述第二神经网络层对应第二权重矩阵;

将所述第三输入向量输入第三神经网络层进行处理,输出所述第三输入向量对应的第四输入向量,所述第三神经网络层包括32个神经元,所述第三神经网络层对应第三权重矩阵;

将所述第四输入向量输入激活层进行处理,输出所述第四输入向量对应的第五输入向量,所述激活层包括32个神经元,所述激活层对应第四权重矩阵;

将所述第五输入向量输入第四神经网络层进行处理,输出所述第五输入向量对应的第六输入向量,所述第四神经网络层包括64个长短期记忆网络单元,所述第四神经网络层对应第五权重矩阵;

将所述第六输入向量输入全连接层进行处理,输出所述第六输入向量对应的输出向量,所述全连接层包括256个激活函数神经元,所述全连接层对应第六权重矩阵;

将所述输出向量输入分类器进行处理,输出所述输出向量对应的所述目标肠鸣音类型。

在一个可能的示例中,将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型之前,上述处理单元401还包括:

第一获取单元,用于获取多个第一训练数据和多个肠鸣音类型,每个肠鸣音类型对应一个第一训练数据;

第一音频处理单元,用于对每个第一训练数据执行音频处理操作,得到所述多个第一训练数据对应的多个第二训练数据;

模型训练单元,用于根据所述多个第二训练数据、所述多个肠鸣音类型和第一循环神经网络模型构建所述肠鸣音识别模型,所述第一循环神经网络模型为未进行深度学习的循环神经网络模型。

在一个可能的示例中,在根据所述多个第二训练数据、所述多个肠鸣音类型和第一循环神经网络模型构建所述肠鸣音识别模型方面,上述模型训练单元具体用于:

在所述多个第二训练数据的数量为n,所述n为大于1的整数的情况下,将n个第二训练数据中第i个第二训练数据输入所述第一循环神经网络模型进行第i次正向训练,输出肠鸣音类型i;

若所述肠鸣音类型i不同于所述第i个第二训练数据对应的肠鸣音类型,则对第i次正向训练后的第一循环神经网络模型进行反向训练,得到第i次训练后的第一循环神经网络模型;

在将所述第i个第二训练数据输入所述第一循环神经网络模型进行第i次训练结束后,将第(i+1)个第二训练数据输入所述第i次训练后的第一循环神经网络模型进行第(i+1)次训练;

直到i=n,停止训练,得到第n次训练后的第一循环神经网络模型,所述i是初始值为1,以1为间隔的递增函数;

将所述n次训练后的第一循环神经网络模型作为所述肠鸣音识别模型。

在一个可能的示例中,将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型之后,上述处理单元401还包括:

判断单元,用于判断所述目标肠鸣音类型是否包含于患病肠鸣音类型集,所述患病肠鸣音类型集包括肠鸣音活跃、肠鸣音亢进、肠鸣音减弱、肠鸣音消失;

第一确定单元,用于若所述目标肠鸣音类型包含于所述患病肠鸣音类型集,则根据预先存储的肠鸣音类型与疾病的对应关系确定所述目标肠鸣音类型对应的至少一种目标疾病;

发送单元,用于发送所述目标肠鸣音类型和所述至少一种目标疾病至疾病诊断设备。

其中,处理单元401可以是处理器或控制器,例如可以是中央处理器(centralprocessingunit,cpu),通用处理器,数字信号处理器(digitalsignalprocessor,dsp),专用集成控制器(application-specificintegratedcircuit,asic),现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。存储单元402可以是存储器,通信单元403可以是收发器、收发控制器、射频芯片、通信接口等。

与上述图1、图2和图3所示的实施例一致的,请参阅图5,图5是本申请实施例提供的一种服务器的结构示意图,该服务器包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:

通过可穿戴设备获取待识别对象的肠鸣音数据;

对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列;

将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型,所述肠鸣音识别模型用于确定语音帧序列对应的肠鸣音类型。

可见,在本申请实施例中,服务器首先通过可穿戴设备获取待识别对象的肠鸣音数据,然后对肠鸣音数据执行音频处理操作,得到肠鸣音数据对应的语音帧序列,最后将语音帧序列输入肠鸣音识别模型进行处理,输出语音帧序列对应的目标肠鸣音类型。这样可识别待识别对象的肠鸣音类型,提高了肠鸣音识别的准确性。

在一个可能的示例中,在通过可穿戴设备获取待识别对象的肠鸣音数据方面,上述程序包括具体用于执行以下步骤的指令:

向所述可穿戴设备发送请求信息,所述请求信息用于指示所述可穿戴设备反馈所述待识别对象的肠鸣音声音信号,所述肠鸣音声音信号的时长为预设时长范围;

接收所述可穿戴设备针对所述请求信息发送的第一肠鸣音声音信号,所述第一肠鸣音声音信号的时长为第一时长,所述第一时长处于所述预设时长范围;

将所述第一肠鸣音声音信号转换为第一肠鸣音数字信号,所述第一肠鸣音数字信号的时长为所述第一时长;

将所述第一肠鸣音数字信号作为所述肠鸣音数据。

在一个可能的示例中,在对所述肠鸣音数据执行音频处理操作,得到所述肠鸣音数据对应的语音帧序列方面,上述程序包括具体用于执行以下步骤的指令:

调用预先存储的语音去噪算法;

根据所述语音去噪算法对所述肠鸣音数据进行语音去噪,得到所述肠鸣音数据对应的第一肠鸣音数据;

对所述第一肠鸣音数据执行音频分段操作,得到所述第一肠鸣音数据对应的至少一个语音帧,每个语音帧的时长为第二时长,所述第二时长小于所述第一时长,所述每个语音帧包括64个频率分量;

将所述至少一个语音帧组成的序列作为所述语音帧序列。

在一个可能的示例中,在将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型方面,上述程序包括具体用于执行以下步骤的指令:

将所述语音帧序列输入所述肠鸣音识别模型;

将所述语音帧序列转换为第一输入向量,以及将所述第一输入向量输入第一神经网络层进行处理,输出所述第一输入向量对应的第二输入向量,所述第一神经网络层包括128个神经元,所述第一神经网络层对应第一权重矩阵;

将所述第二输入向量输入第二神经网络层进行处理,输出所述第二输入向量对应的第三输入向量,所述第二神经网络层包括64个神经元,所述第二神经网络层对应第二权重矩阵;

将所述第三输入向量输入第三神经网络层进行处理,输出所述第三输入向量对应的第四输入向量,所述第三神经网络层包括32个神经元,所述第三神经网络层对应第三权重矩阵;

将所述第四输入向量输入激活层进行处理,输出所述第四输入向量对应的第五输入向量,所述激活层包括32个神经元,所述激活层对应第四权重矩阵;

将所述第五输入向量输入第四神经网络层进行处理,输出所述第五输入向量对应的第六输入向量,所述第四神经网络层包括64个长短期记忆网络单元,所述第四神经网络层对应第五权重矩阵;

将所述第六输入向量输入全连接层进行处理,输出所述第六输入向量对应的输出向量,所述全连接层包括256个激活函数神经元,所述全连接层对应第六权重矩阵;

将所述输出向量输入分类器进行处理,输出所述输出向量对应的所述目标肠鸣音类型。

在一个可能的示例中,将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型之前,上述程序包括具体用于以下步骤的指令:

获取多个第一训练数据和多个肠鸣音类型,每个肠鸣音类型对应一个第一训练数据;

对每个第一训练数据执行音频处理操作,得到所述多个第一训练数据对应的多个第二训练数据;

根据所述多个第二训练数据、所述多个肠鸣音类型和第一循环神经网络模型构建所述肠鸣音识别模型,所述第一循环神经网络模型为未进行深度学习的循环神经网络模型。

在一个可能的示例中,在根据所述多个第二训练数据、所述多个肠鸣音类型和第一循环神经网络模型构建所述肠鸣音识别模型方面,上述程序包括具体用于执行以下步骤的指令:

在所述多个第二训练数据的数量为n,所述n为大于1的整数的情况下,将n个第二训练数据中第i个第二训练数据输入所述第一循环神经网络模型进行第i次正向训练,输出肠鸣音类型i;

若所述肠鸣音类型i不同于所述第i个第二训练数据对应的肠鸣音类型,则对第i次正向训练后的第一循环神经网络模型进行反向训练,得到第i次训练后的第一循环神经网络模型;

在将所述第i个第二训练数据输入所述第一循环神经网络模型进行第i次训练结束后,将第(i+1)个第二训练数据输入所述第i次训练后的第一循环神经网络模型进行第(i+1)次训练;

直到i=n,停止训练,得到第n次训练后的第一循环神经网络模型,所述i是初始值为1,以1为间隔的递增函数;

将所述n次训练后的第一循环神经网络模型作为所述肠鸣音识别模型。

在一个可能的示例中,将所述语音帧序列输入肠鸣音识别模型进行处理,输出所述语音帧序列对应的目标肠鸣音类型之后,上述程序还包括用于执行以下步骤的指令:

判断所述目标肠鸣音类型是否包含于患病肠鸣音类型集,所述患病肠鸣音类型集包括肠鸣音活跃、肠鸣音亢进、肠鸣音减弱、肠鸣音消失;

若所述目标肠鸣音类型包含于所述患病肠鸣音类型集,则根据预先存储的肠鸣音类型与疾病的对应关系确定所述目标肠鸣音类型对应的至少一种目标疾病;

发送所述目标肠鸣音类型和所述至少一种目标疾病至疾病诊断设备。

本申请实施例还提供一种计算机存储介质,该计算机存储介质用于存储计算机程序,上述计算机程序被处理器执行,以实现如上述方法实施例中记载的任一方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-onlymemory,简称:rom)、随机存取器(英文:randomaccessmemory,简称:ram)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实现方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1