一种数据处理方法、装置、及存储介质和计算机设备与流程

文档序号:17981789发布日期:2019-06-22 00:09阅读:135来源:国知局
本发明涉及数据处理领域,尤其涉及一种数据处理方法、装置、及存储介质和计算机设备。
背景技术
::乳腺疾病在女性人群中发病率较高,早期的检测在降低乳腺肿瘤、乳腺癌的发病率和死亡率中有重要的现实意义。随着医学技术的发展,乳腺肿瘤等疾病的辅助诊断的检测方式也不断发展,如x射线、钼靶、红外热成像技术等检测方式,主要依靠医学影像来获取辅助诊断的检测信息。但是,上述现有技术中的方法都属于有损的检测方法,不仅对人体有一定伤害,而且必须去医院检测,由医生根据检测结果进行判断,患者和医院负担成本相对较高且设备资源负荷大,患者可能会由于主观原因延误就医。因此,如何使女性能够无损、快捷地对乳腺情况进行监测成为急需解决的问题。针对相关技术中对乳腺健康的监测方法复杂、不便于操作且成本较高的技术问题,目前尚未提出有效的解决方案。技术实现要素:有鉴于此,本发明实施例提供了一种数据处理方法、装置、及存储介质和计算机设备,用以解决相关技术中对乳腺健康的监测方法复杂、不便于操作且成本较高的技术问题。一方面,本发明实施例提供了一种数据处理方法,包括:获取多个采样传感器中每个采样传感器的采样结果,其中,多个采样传感器对称的布置于目标对象的两侧乳腺区域,每个采样结果为在第一目标时段内对应的采样传感器对皮肤的温度或湿度进行多次采样之后得到的多个数据;对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果;计算每个有效采样结果的至少一种统计特征,得到多个特征量;将多个特征量输入至目标分类器,得到用于表示目标对象两侧乳腺的健康情况的指标参数值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在计算每个有效采样结果的至少一种统计特征,得到多个特征量之前,该方法还包括:获取训练数据集合,其中,训练数据集合中包括多个样本对象的采样结果,以及用于表示每个样本对象的乳腺健康情况的指标参数值;确定初始的分类组合的编码,其中,分类组合中包括预设个数的统计特征以及一个分类器;通过差分进化算法对初始的分类组合进行迭代;在达到迭代终止条件时,在迭代过程中产生的所有分类组合中,选择出差分进化算法的适应度函数值最高的分类组合,得到至少一种统计特征以及目标分类器。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,差分进化算法的适应度函数用于计算分类器的准确率。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在确定初始的分类组合的编码之前,该方法还包括:基于训练数据集合,通过过滤法特征选择算法和/或嵌入式特征选择算法在预设的多种统计特征中去除部分统计特征,得到差分进化算法的迭代过程中所使用的候选统计特征。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果的步骤,包括:根据预设筛选条件,筛除每个采样结果中的无效数据,得到每个采样结果的有效数据;基于采样时间,对多个采样结果进行对齐;根据对齐结果在第一目标时段内选择第二目标时段;对每个采样结果中第二目标时段内的有效数据执行连续化,得到每个采样结果对应的有效采样结果。另一方面,本发明实施例提供了一种数据处理装置,包括:获取单元,用于获取多个采样传感器中每个采样传感器的采样结果,其中,多个采样传感器对称的布置于目标对象的两侧乳腺区域,每个采样结果为在第一目标时段内对应的采样传感器对皮肤的温度或湿度进行多次采样之后得到的多个数据;预处理单元,用于对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果;计算单元,用于计算每个有效采样结果的至少一种统计特征,得到多个特征量;输入单元,用于将多个特征量输入至目标分类器,得到用于表示目标对象两侧乳腺的健康情况的指标参数值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,该装置还包括:获取模块,用于在计算每个有效采样结果的至少一种统计特征,得到多个特征量之前,获取训练数据集合,其中,训练数据集合中包括多个样本对象的采样结果,以及用于表示每个样本对象的乳腺健康情况的指标参数值;确定模块,用于确定初始的分类组合的编码,其中,分类组合中包括预设个数的统计特征以及一个分类器;迭代模块,用于通过差分进化算法对初始的分类组合进行迭代;第一选择模块,用于在达到迭代终止条件时,在迭代过程中产生的所有分类组合中,选择出差分进化算法的适应度函数值最高的分类组合,得到至少一种统计特征以及目标分类器。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,差分进化算法的适应度函数用于计算分类器的准确率。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,该装置还包括:第一筛除模块,用于在确定初始的分类组合的编码之前,基于训练数据集合,通过过滤法特征选择算法和/或嵌入式特征选择算法在预设的多种统计特征中去除部分统计特征,得到差分进化算法的迭代过程中所使用的候选统计特征。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果的步骤,包括:第二筛除模块,用于根据预设筛选条件,筛除每个采样结果中的无效数据,得到每个采样结果的有效数据;对齐模块,用于基于采样时间,对多个采样结果进行对齐;第二选择模块,用于根据对齐结果在第一目标时段内选择第二目标时段;连续化处理模块,用于对每个采样结果中第二目标时段内的有效数据执行连续化,得到每个采样结果对应的有效采样结果。再一方面,本发明实施例提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本发明的数据处理方法。再一方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,当处理器执行计算机程序时实现本发明实施例的数据处理方法。上述任一技术方案具有如下有益效果:通过多个采样传感器获取乳腺皮肤温度和湿度的采样结果,利用采样结果计算至少一种统计特征的特征量,并利用目标分类器对计算出的特征量进行分类,得到用于指示乳腺健康情况的指标参数值,监测方法简单且便于操作,降低了检测成本,解决了相关技术中对乳腺健康的监测方法复杂、不便于操作且成本较高的问题。【附图说明】为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1是本发明实施例所提供的一种可选的数据处理方法的流程示意图;图2是本发明实施例所提供的一种可选的数据处理装置的示意图。【具体实施方式】为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。需要说明的是,尽管在本发明的权利要求书、说明书和附图中可能采用术语第一、第二、第三等来用于区别类似的对象xxx,应当理解,术语第一、第二、第三等不必用于描述特定的顺序或先后次序,仅用来将这些类似的对象xxx彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一xxx也可以被称为第二xxx,类似地,第二xxx也可以被称为第一xxx。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。针对现有技术中所存在的相关技术中对乳腺健康的监测方法复杂、不便于操作且成本较高的技术问题,本发明实施例提供了如下解决思路:获取多个采样传感器中每个采样传感器的采样结果,其中,多个采样传感器对称的布置于目标对象的两侧乳腺区域,每个采样结果为在第一目标时段内对应的采样传感器对皮肤的温度或湿度进行多次采样之后得到的多个数据;对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果;计算每个有效采样结果的至少一种统计特征,得到多个特征量;将多个特征量输入至目标分类器,得到用于表示目标对象两侧乳腺的健康情况的指标参数值。在该思路的引导下,本方案实施例提供了以下可行的实施方案。本发明实施例提供了一种数据处理方法。具体的,请参考图1,其为本发明实施例所提供的一种可选的数据处理方法的流程示意图,如图1所示,该方法包括以下步骤:步骤101,获取多个采样传感器中每个采样传感器的采样结果,其中,多个采样传感器对称的布置于目标对象的两侧乳腺区域,每个采样结果为在第一目标时段内对应的采样传感器对目标对象皮肤的温度或湿度进行多次采样之后得到的多个数据;步骤102,对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果;步骤103,计算每个有效采样结果的至少一种统计特征,得到多个特征量;步骤104,将多个特征量输入至目标分类器,得到用于表示目标对象两侧乳腺的健康情况的指标参数值。采样传感器为湿度传感器或温度传感器,分别用于测试皮肤的湿度或温度。传感器可以是贴片传感器、探头传感器等,通过粘贴等方式固定在皮肤上,以检测皮肤的温度。多个采样传感器可以分布式的固定设置于目标对象(被测对象)的两侧乳腺区域,以检测乳腺区域中不同位置的温湿度值,提高采样结果所覆盖的乳腺区域。需要说明的是,多个采样传感器在两侧乳腺是对称分布的,以使一侧乳腺的采样数据在与另一侧乳腺对应位置的采样数据按时间同步之后,能够具有对照的参考性。一个采样结果是在一个时间段(第一目标时段)之内对应的采样传感器多次采样得到的多个数据,每个数据是在采样时刻采样传感器所感应到的数据,例如,每个采样结果通过一个文件(如excel表格)记录保存数据。在获取基于多个采样传感器得到的多个采样结果之后,对每个采样结果进行预处理。预处理至少包括对采样结果中的多个数据进行数据清洗,筛选出有效数据,剔除无效数据,将所有的有效数据形成一个有效采样结果。例如,在第一目标时段内,目标对象在佩戴采样传感器时可能会不小心脱落一段时间,导致采样的数据没有意义。因此,可以通过剔除超过预设阈值范围的采样数据的方式,剔除没有意义的数据。此外,如果剔除后剩余的数据时间间断性较强,也可能导致无法准确的寻找出特征,进而,可以将剔除后的剩余数据基于时间顺序排序,选取连续一段时间内的数据为有效数据(也即有效采样结果)。需要说明的是,为了使两侧乳腺的数据能够基于时间同步的对照参考,可以在剔除超过预设阈值范围的采样数据之后,选取两侧乳腺数据在时间上均连续的一个时间段,基于选取出的时间段内的数据进行下面的处理。在得到有效采样结果之后,计算每个有效采样结果的至少一种统计特征,得到多个特征量。例如,统计特征可以包括以下任意一种或多种:两侧乳腺区域上对称设置的采样传感器得到的有效采样结果的温差面积绝对值/温度相关性/温差最大值的绝对值/湿度差面积绝对值/湿度相关性、单侧温度面积/平均温度/超过温度阈值的时长等等,不再穷举。一个特征量是对一个有效采样结果的一种统计特征计算得到的数值。由于有多个采样结果,对每个有效采样结果计算至少一种统计特征可以得到多个特征量。在得到多个特征量之后,将多个特征量输入至目标分类器。目标分类器用于根据多个特征量输出用于表示目标对象的两侧乳腺的健康情况的指标参数值。目标分类器是基于模式识别的分类模块,例如,svm分类器(属于监督学习分类器)、knn分类器(属于监督学习分类器)等。由于分类器是根据已知的训练数据来学习分类规则,进而对未知数据进行分类和预测,在本发明实施例中,已知的训练数据可以是从有效采样结果中选出的一部分(例如,25%)数据、对有效采样结果中的其余部分进行分类,或者,已知的训练数据也可以是在目标对象监测的历史有效采样结果中选出的一部分数据,或者,已知的训练数据也可以是通过对其他人员进行采样得到的有效采样结果。在训练数据利用目标对象自身的有效采样结果的情况下,分类器相当于通过目标对象自身的纵向对比,判断目标对象在第一目标时段内的乳腺健康情况,在训练数据利用其他人员的有效采样结果的情况下,分类器相当于通过与其他人员的横向对比,判断目标对象在第一目标时段内的乳腺健康情况。可选的,由于统计特征可能有很多,并非所有的统计特征都与目标对象的乳腺健康情况具有很高的相关性,分类器也有很多种,每种分类器可能与某几种统计特征相配合,能够对健康情况得到更准确的识别结果。因此,可以通过一些算法筛选出准确率最高的分类组合(也即,统计特征和分类器的组合)。在本发明实施例中,提供了通过差分进化算法(differentialevolutionalgorithm,简称de算法)寻找最优组合的方法,差分进化算法的适应度函数用于计算分类组合的准确率。具体而言,可以通过如下步骤执行:步骤201,获取训练数据集合,训练数据集合中包括多人(多个样本对象)的采样结果,以及用于表示每个人(每个样本对象)的乳腺健康情况的指标参数值。步骤202,确定初始分类组合的编码,例如,通过集合xi(xi1,xi2,xi3,xi4,……)表示一个分类组合(种群),集合中的每个元素用于表示一种统计特征或者一个分类器,每个集合中只包含一个分类器。步骤203,通过差分进化算法进行迭代,每次迭代会变化上一次迭代中使用的分类组合的一个或多个元素,在所有候选的统计特征中选取预设个数的统计特征,并在候选的分类器中选取一个特征,得到一个新的分类组合。步骤204,在达到迭代终止条件(例如,达到最高迭代次数,或者适应度函数达到预设阈值)时,在迭代过程中的所有分类组合中,选择出适应度函数的值最高(也即分类的准确率)最高的分类组合。在选出准确率最高的分类组合之后,确定了需要使用的统计特征组合和分类器。在差分进化算法的迭代过程中,需要不断的更新迭代分类组合,也即,在候选的统计特征中选择部分统计特征、并在候选的分类器中选择一个分类器,组成本次迭代的分类组合。其中,候选的统计特征可以是常用的统计特征,而有些统计特征可能与想要达到的分类效果的相关程度较低,因此,一种可选的实施方式为,在确定初始分类组合的编码之前,根据传统的特征选择方式过滤掉一些相关程度较低的特征,具体的,在确定初始分类组合的编码之前,可以执行如下步骤:基于训练数据集合,通过过滤特征选择算法和/或嵌入式特征选择算法在预设的多种统计特征中去除部分统计特征,得到迭代过程中的候选统计特征。其中,候选统计特征是在差分进化算法的每次迭代中,变化统计特征所能选用的候选项,预设的多种统计特征是预先提供的、未经过筛选的一些常用的统计特征。可选的,在对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果时,可以采用如下步骤:步骤301,根据预设筛选条件,筛除每个采样结果中的无效数据,得到每个采样结果的有效数据。例如,删除超过预设阈值的数据、删除相差超过预设阈值的相邻采样结果,等等,也即,可以根据大量的实验结果统计出一些采样结果符合的规则,删除不符合规则的数据。步骤302,基于采样时间,对多个采样结果进行对齐。将不同采样传感器的采样结果基于时间对齐。步骤303,根据对齐结果在第一目标时段内选择第二目标时段。在对齐之后,由于删除的数据会使得采样结果存在空缺,基于对齐结果选择采样结果没有空缺或空缺较少的时间段,得到第二目标时段。步骤304,对每个采样结果中第二目标时段内的有效数据执行连续化(也即,将存在空缺的数据进行补齐),得到每个采样结果对应的有效采样结果。需要说明的是,步骤101~步骤104的执行主体可以为数据处理装置,该装置可以是位于本地终端的应用,或者还可以是位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,本发明实施例对此不进行特别限定。可以理解的是,所述应用可以是安装在终端上的应用程序(nativeapp),或者还可以是终端上的浏览器的一个网页程序(webapp),本发明实施例对此不进行限定。需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(personalcomputer,pc)、个人数字助理(personaldigitalassistant,pda)、无线手持设备、平板电脑(tabletcomputer)、手机、mp3播放器、mp4播放器等。本发明实施例的数据处理方法至少具有以下有益效果:通过多个采样传感器获取乳腺皮肤温度和湿度的采样结果,利用采样结果计算至少一种统计特征的特征量,并利用目标分类器对计算出的特征量进行分类,得到用于指示乳腺健康情况的指标参数值,监测方法简单且便于操作,降低了检测成本,解决了相关技术中对乳腺健康的监测方法复杂、不便于操作且成本较高的问题。基于本发明实施例所提供的数据处理方法,本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。请参考图2,其为本发明实施例所提供的一种可选的数据处理装置的功能方块图。如图2所示,该装置包括:获取单元10,预处理单元20,计算单元30和输入单元40。获取单元用于获取多个采样传感器中每个采样传感器的采样结果,其中,多个采样传感器对称的布置于目标对象的两侧乳腺区域,每个采样结果为在第一目标时段内对应的采样传感器对皮肤的温度或湿度进行多次采样之后得到的多个数据;预处理单元用于对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果;计算单元用于计算每个有效采样结果的至少一种统计特征,得到多个特征量;输入单元用于将多个特征量输入至目标分类器,得到用于表示目标对象两侧乳腺的健康情况的指标参数值。可选的,该装置还包括:获取模块,用于在计算每个有效采样结果的至少一种统计特征,得到多个特征量之前,获取训练数据集合,其中,训练数据集合中包括多个样本对象的采样结果,以及用于表示每个样本对象的乳腺健康情况的指标参数值;确定模块,用于确定初始的分类组合的编码,其中,分类组合中包括预设个数的统计特征以及一个分类器;迭代模块,用于通过差分进化算法对初始的分类组合进行迭代;第一选择模块,用于在达到迭代终止条件时,在迭代过程中产生的所有分类组合中,选择出差分进化算法的适应度函数值最高的分类组合,得到至少一种统计特征以及目标分类器。可选的,差分进化算法的适应度函数用于计算分类器的准确率。可选的,该装置还包括:第一筛除模块,用于在确定初始的分类组合的编码之前,基于训练数据集合,通过过滤法特征选择算法和/或嵌入式特征选择算法在预设的多种统计特征中去除部分统计特征,得到差分进化算法的迭代过程中所使用的候选统计特征。可选的,对每个采样结果进行预处理,得到每个采样结果对应的有效采样结果的步骤,包括:第二筛除模块,用于根据预设筛选条件,筛除每个采样结果中的无效数据,得到每个采样结果的有效数据;对齐模块,用于基于采样时间,对多个采样结果进行对齐;第二选择模块,用于根据对齐结果在第一目标时段内选择第二目标时段;连续化处理模块,用于对每个采样结果中第二目标时段内的有效数据执行连续化,得到每个采样结果对应的有效采样结果。由于本实施例中的各单元能够执行图1所示的数据处理方法,本实施例未详细描述的部分,可参考对图1对应实施例的相关说明。本发明实施例的数据处理装置至少具有以下有益效果:通过多个采样传感器获取乳腺皮肤温度和湿度的采样结果,利用采样结果计算至少一种统计特征的特征量,并利用目标分类器对计算出的特征量进行分类,得到用于指示乳腺健康情况的指标参数值,监测方法简单且便于操作,降低了检测成本,解决了相关技术中对乳腺健康的监测方法复杂、不便于操作且成本较高的问题。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员可以理解,实现上述实施例方法中的全部或部分步骤可以是通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,计算机通过读取存储介质中的程序进而能够执行本发明实施例提供的数据处理方法。相应的,本发明实施例还提供了一种存储介质,本发明实施例的存储介质包括存储的程序,其中,在程序运行时,控制存储介质所在设备执行本发明实施例提供的数据处理方法。此外,本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,当处理器执行计算机程序时实现本发明实施例的数据处理方法。在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1