基于人声识别技术实现吸烟者识别及戒烟行为监测的方法

文档序号：37583665发布日期：2024-04-18 12:08阅读：5来源：国知局

本发明属于机器学习与智能声音信号处理，特别是涉及基于人声识别技术实现吸烟者识别及戒烟行为监测的方法。

背景技术：

1、吸烟行为是世界迄今面临的最大公共卫生威胁之一，每年使800多万人失去生命，其中包括大约120万人死于接触二手烟。中国是世界上最大的烟草生产国和消费国。同时，烟草使用的经济成本是巨大的，包括治疗由烟草使用引起的疾病的大量卫生保健费用，以及由可归因于烟草的发病率和死亡率造成的人力资本损失。吸烟造成的人类悲剧和经济悲剧规模令人震惊，但也是可以预防的。戒烟行为可以极大地减少未来疾病和过早死亡的风险。国务院发布的《“健康中国2030”规划纲要》提出到2030年，全国力争将15岁以上人群吸烟率降低到20％，因此对戒烟行为进行有效监督对实现这一目标非常重要。

2、在戒烟行为的临床试验和治疗中，验证吸烟状况的方法包括生物标志物方法和自我报告检测方法。生物标志物方法中，呼气中的一氧化碳测定和尿液或唾液中的尼古丁含量测定是目前最有效和可行的方法。但由于成本、偏远地区和样本采集等原因而造成的生物标志物方法不可用的情况下，自我报告检测方法被广泛应用作为其替代方法来检测吸烟者的状况信息。然而研究表明，自我报告检测方法因为其主观性可能会受到偏见和误报的影响，从而影响吸烟状况验证结果的有效性和准确性。

3、因此，有必要开发一种新的验证吸烟状况的方法，这个方法需要简单、无创、成本低，能够用于广泛分散的人群，并且不需要面对面的接触。这种方法的开发将彻底改变评估戒烟研究和监测人口吸烟趋势的方式，改善吸烟状况评估的可行性，特别是在大型研究中。

技术实现思路

1、本发明的目的在于提供基于人声识别技术实现吸烟者识别及戒烟行为监测的方法，以解决上述背景技术中提出的问题。

2、为实现上述目的，本发明采用的一个技术方案是：基于人声识别技术实现吸烟者识别的方法包括以下步骤：

3、s1：实时收集使用者声音数据；

4、s2：将所述声音数据输入到经过合成数据训练的深度神经网络模型中得到输出结果；

5、s3：根据输出结果评价使用者是否为吸烟者；

6、其中，所述经过合成数据训练的深度神经网络模型为采用语言交流关键字数据、点火声音数据、场景声音数据和易混声音数据合成的数据集训练得到的深度神经网络模型；

7、所述深度神经网络模型的训练步骤包括：

8、s101：采集吸烟者的声音数据合集，建立相关样本库，吸烟者的声音数据合集具体包括语言交流关键字数据、点火声音数据，采集场景声音数据和易混声音数据的合集，建立非相关样本库；

9、s102：将相关样本库和非相关样本库中的声音数据转换为计算机可识别的频谱图；

10、s103：按照固定帧长提取相关样本库和非相关样本库中声音数据的mfcc特征；

11、s104：构建卷积神经网络，对声音数据进行音色提取分离，确定区域内总的独立音色个体，对非相关样本库中的声音数据进行对照并排除与之对应的音色个体，同时，对相关样本库中的声音数据进行对照确定使用者是否吸烟。

12、优选的，收集全部使用者在步骤s104后的判定数据，构建设备采集数据库，随后分别统计吸烟者的个体数量和非吸烟者个体数量。

13、优选的，在卷积神经网络中加入循环神经网络形成cnn-rnn架构，将相关样本库中的声音数据通过cmm模型进行计算得到具有盖然性的吸烟者mfcc特征，通过cnn-rnn架构，可以有效分辨吸烟者个体数量。

14、优选的，基于cnn-rnn架构，使用迁移学习方法进行优化，具体训练步骤如下：

15、s111：以相关样本库和非相关样本库中声音数据的mfcc特征为编码网络输入；

16、s112：用字序列通过词嵌入变换作为解码网络输入，该输入序列将高维稀疏字序列映射低维密集的特征空间，从而减少输入参数量便于模型训练；

17、s113：联合cnn-rnn模型架构将编码网络与解码网络相结合，通过softmax函数输出结果。

18、优选的，所述循环神经网络采用lstm，以使得其与卷积神经网络形成cnn-lstm模型构架。

19、一种戒烟行为监测的方法，包括以下步骤；

20、s121：收集大量的吸烟者整个戒烟过程的声音数据；

21、s122：选取每天同时间段内相同标志性动作发生前后整个过程的吸烟者声音数据片段作为标签形成时序样本集；

22、s123：将时序样本集中的声音数据转换为计算机可识别的频谱图；

23、s124：判断步骤s121中的声音数据是否有符合相关样本库中mfcc特征，如果存在，则将该样本排除；

24、s125：选取步骤s214筛选出的剩余样本中，不同吸烟者在相同戒烟时长区间内的时序样本集，提取相同的mfcc特征；

25、s126：在步骤s215采样的样本中，基于cnn-rnn模型架构，将吸烟者做出时序样本集中标签动作时的声音数据输入，即可得到吸烟者当前的戒烟行为应当处于哪个戒烟时长区间内，以及持续监测过程中根据前后数据的变化判断吸烟者在两个检测点的区间内是否存在复吸现象。

26、优选的，所述标志性动作包括起床、吃饭、刷牙、洗漱、上卫生间、睡觉过程中的呼吸声、打嗝声和咳嗽声、以及每天同时间段内语音数据。

27、优选的，在步骤s124中对于mfcc特征使用vggish预训练网络进行提取。

28、优选的，所述循环神经网络采用gru，以使得其与卷积神经网络形成cnn-gru模型构架。

29、本发明的有益效果：本发明提供了一种基于人声识别技术实现吸烟者识别的方法，通过采用深度学习方法中的理论，收集环境中的声音数据合集形成与吸烟者相关的相关样本库以及与吸烟者不相关的非相关样本库，并提取出能够识别吸烟者和非吸烟者的mfcc特征，随后通过输入使用者的声音数据，通过cnn-rnn架构模型计算后，确定使用者是否吸烟，同时，通过设置设备采集数据库，在长时间的声音数据采集统计过程中，对于重复统计的吸烟者只保留一次数据，最终就可以得到长时间的数据采集统计过程中，吸烟者的总体数量和非吸烟者的总体数量，这样就能有效的为相关研究提供准确的实验数据；

30、同时，本发明提供了一种戒烟行为监测的方法，通过收集标志性动作前后整个过程的声音数据片段形成时序样本集，通过统计不同吸烟者之间的时序样本集，得到相同戒烟时长区间内mfcc特征，在cnn-rnn模型架构中，即可通过输入标志性动作发生前后整个过程的吸烟者声音数据，判断吸烟者当前戒烟状态处于哪个阶段，进而有效的判别吸烟者何时能达到完全戒烟的标准，同时，在持续监测过程中可以根据前后数据的变化判断吸烟者是否在两个检测点的区间内是否存在复吸现象，在本方法中通过使用vggish预训练网络对mfcc特征进行提取，这可以帮助利用和转移从外部大规模通用音频数据集学到的知识，同时，由于完整的吸烟者戒烟数据收集程度较为困难，因此采用gru构架模型，进行对声音数据的识别；

31、在本方案中，戒烟行为监测的方法可以在基于人声识别技术实现吸烟者识别的方法的基础上使用，即在判断使用者为吸烟者后，对吸烟者进行持续的监测，通过戒烟行为监测的方法就可以了解使用者的吸烟行为保持趋势、或是戒烟行为趋势，根据两种方法的相互配合甄别，可以判断使用者在戒烟行为中又是否存在复吸等现象；通过上述方法的结合，能做到能低成本、准确的验证每个被监测的吸烟者戒烟全过程中戒烟行为，同时，通过运用上述方法，在被监测的吸烟者广泛分布的情况下，能够实现采集数据的分区域调研，为吸烟相关方面的研究提供在地区或整体上的实验数据支撑。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马稚中,王睿俐
技术所有人：温州理工学院
我是此专利的发明人