本发明涉及一种男性不育风险预测和风险特征描述的方法,同时涉及相应的男性不育风险预测和风险特征描述的装置,属于人工智能辅助诊断。
背景技术:
1、男性不育是指一对夫妇在进行了1年以上的有规律性生活,并且没有采取任何避孕措施的情况下,由于男性因素而无法自然怀孕。据估计,全球8%-12%的夫妇受到不孕不育的影响,其中约50%是由男性生殖功能障碍引起的,大多数患者的病因尚不清楚。男性不育症的原因差异很大,但可能与先天性、获得性或特发性因素有关,这些因素损害了精子发生。
2、不孕不育造成巨大的心理和社会痛苦,并给病人和保健系统带来相当大的经济负担。早期诊断和适当处理可以减轻这些因素。及早发现男性亚生育能力为识别和纠正不仅影响生育,而且影响一般健康和福祉的医疗状况提供了机会。男性低生育力的原因多种多样,但在大多数情况下人们对其了解甚少。尽管有各种诊断测试可用,但它们的解释并不精确,而且往往带有主观性。
3、目前,人工智能(ai)技术正处于蓬勃发展之中,不断与医疗辅助诊断、风险预测碰撞出火花。针对男性不育可疑人群,如何有效利用人工智能技术准确预测未来不育患病风险以及描述其风险特征,仍然是一个亟待解决的问题。
技术实现思路
1、本发明所要解决的首要技术问题在于提供一种男性不育风险预测和风险特征描述的方法。
2、本发明所要解决的另一技术问题在于提供一种男性不育风险预测和风险特征描述的装置。
3、为了实现上述目的,本发明采用下述的技术方案:
4、根据本发明实施例的第一方面,提供一种按男性不育的风险预测方法,包括如下步骤:
5、步骤s1、获得待调查数据,该待调查数据包括患者的人口统计学数据、职业及环境暴露数据、营养状况数据、生活习惯数据、家族史;
6、步骤s2、将所述待调查数据输入到预先训练好的男性不育风险预测模型中;
7、步骤s3、所述男性不育风险预测模型的输出结果为待调查者的不育患病概率;
8、步骤s4、计算shap值,分析待调查者的风险特征状态。
9、其中较优地,获得所述人口统计学数据时,做如下处理:
10、步骤111、在性别、年龄、民族、教育、亲属状况中,将有序分类变量离散化为线性,将无序二分类变量转化为0/1。数据进一步标准化至0-1之间,防止不同变量间的量纲差异引起的误差。
11、其中较优地,获得所述职业及环境暴露数据时,做如下处理:
12、步骤121、在职业、每天工作时长、倒班、工作年份、化学物暴露、环境危险因素暴露、长时间开车频率、长时间骑车频率、长时间处空调间、计算机暴露、最近装修、住所附近是否有污染工厂、水源中,将有序分类变量离散化为线性,将无序二分类变量转化为0/1。
13、其中较优地,获得所述生活习惯数据时,做如下处理:
14、步骤131、在吸烟史、饮酒史、被动吸烟、饮茶、饮咖啡、蔬果频率、蔬果量、畜禽肉&内脏频率、畜禽肉&内脏量、鱼虾频率、鱼虾量、奶制品频率、奶制品量、豆制品频率、豆制品量、炸烤煎食品频率、炸烤煎食品量、芹菜、棉籽油、维生素补充剂、矿物质&微量元素、碳酸饮料、热水澡、紧身衣、化纤材料内裤中,将有序分类变量离散化为线性,将无序二分类变量转化为0/1。数据进一步标准化至0-1之间,防止不同变量间的量纲差异引起的误差。数据进一步标准化至0-1之间,防止不同变量间的量纲差异引起的误差。
15、其中较优地,获得所述体格检查数据时,做如下处理:
16、步骤141、在身高、体重、营养状况、发育水平中,将有序分类变量离散化为线性,将无序二分类变量转化为0/1。数据进一步标准化至0-1之间,防止不同变量间的量纲差异引起的误差。
17、其中较优地,获得所述家族史数据时,做如下处理:
18、步骤151、在生殖相关基因疾病、直系亲属生殖相关基因疾病、父母是否近亲结婚、直系亲属不良生育结局、直系亲属生殖系统相关疾病、直系亲属肿瘤中,将有序分类变量离散化为线性,将无序二分类变量转化为0/1。数据进一步标准化至0-1之间,防止不同变量间的量纲差异引起的误差。
19、其中较优地,按男性不育风险预测模型采用了全连接层堆叠的结构,同时使用了dropout层进行正则化。通过调整中间层的节点数降低了模型复杂度。最后一个dense层用sigmoid激活函数输出一个概率,用于二分类问题。包括5个dense层和2个dropout层:
20、所述第一个dense层,包含64个节点,使用relu激活函数,输入形状为21,并使用l2正则化(权重衰减),后接dropout层,用于正则化,防止过拟合;
21、所述第二个dense层,包含32个节点,使用relu激活函数,并使用l2正则化,后接dropout层;
22、所述第三个dense层,包含16个节点,使用relu激活函数,并使用l2正则化;
23、所述第四个dense层,包含8个节点,使用relu激活函数,并使用l2正则化;
24、所述最后一个dense层,包含1个节点,使用sigmoid激活函数,用于二分类。
25、其中较优地,所述男性不育风险预测模型在做出预测后,使用shapley方法计算各个风险特征的shap值并进行可视化(瀑布图)。
26、根据本发明实施例的第二方面,提供一种男性不育风险预测装置,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,结果展示于显示器上,用于执行以下操作:
27、获得待调查数据,该待调查数据包括患者的人口统计学数据、职业及环境暴露数据、营养状况数据、生活习惯数据、体格检查数据、家族史的数据。
28、将所述调查数据输入到预先训练好的按男性不育风险预测模型中;
29、所述男性不育风险预测模型的输出结果为患者的不育风险概率,以及风险特征排序展示于显示器上。
30、有益效果:
31、本发明所提供的男性不育风险预测和风险特征描述的方法及装置,通过采集被调查者人口统计学数据、职业及环境暴露数据、生活习惯数据、体格检查数据、家族史的数据,为预测男性不育提供了更广更丰富的相关特征,大大提高了患者的男性不育预测精度和效率,一方面可以有效辅助一生的诊断和治疗工作,另一方面有效帮助可疑患者进行自我筛查。与此同时,依据模型最终所出的风险特征瀑布图可以有效提供建设性的改善建议。
1.一种男性不育风险预测和风险特征描述的方法,其特征在于包括如下步骤:
2.如权利要求1所述的方法,其特征在于:
3.如权利要求1所述的方法,其特征在于获得所述人口统计学数据时:
4.如权利要求1所述的方法,其特征在于获得所述职业及环境暴露数据时:
5.如权利要求1所述的方法,其特征在于获得所述生活习惯数据时:
6.如权利要求1所述的方法,其特征在于获得所述体格检查数据时:
7.如权利要求1所述的方法,其特征在于获得所述家族史数据时:
8.如权利要求1所述的方法,其特征在于:所述男性不育风险模型经过如下步骤得到:
9.如权利要求1或8所述的方法,其特征在于:
10.一种男性不育风险预测装置,包括处理器、存储器和显示器,所述处理器读取所述存储器中的计算机程序,结果展示于显示器上,其特征在于处理器用于执行权利要求1-9中任一项所述的一种男性不育风险预测方法和风险特征描述的方法。