基于医疗大数据的儿童发育筛查方法与流程

文档序号:29815355发布日期:2022-04-27 10:01阅读:187来源:国知局
基于医疗大数据的儿童发育筛查方法与流程

1.本公开的实施例一般涉及医疗数据筛查领域,并且更具体地,涉及基于医疗大数据的儿童发育筛查方法、装置、设备和计算机可读存储介质。


背景技术:

2.了解儿童的发育能力,并针对儿童的发育能力制定养育策略,是目前科学的育儿方式。其中,针对不同的年龄段,儿童发育能力的评估项目也不同,例如,对于0~3岁儿童的发育评估,需要评估大运动、精细动作、认知能力、语言、社交行为等方面。
3.目前,常用的评估方式是人工评估,即由评估人员将根据待评估儿童的评估表中各个评估项目的评估值确定待评估儿童的综合分值,以完成评估。
4.然而,人工评估的方式将消耗大量的人力及时间,成本高,效率低,且人工评估的方式受限于评估人员的专业能力,评估的准确性无法保障。


技术实现要素:

5.根据本公开的实施例,提供了一种基于医疗大数据的儿童发育筛查方案。
6.在本公开的第一方面,提供了一种基于医疗大数据的儿童发育筛查方法。该方法包括:
7.获取儿童医疗数据;所述儿童医疗数据包括图像、语音和/或文本;
8.对所述医疗数据进行清洗,提取出儿童的属性特征;所述属性特征包括年龄、性别、身高、体重、血常规、尿常规、心率和/或血压;
9.将所述儿童的属性特征输入至儿童发育模型,得到儿童的生长发育报告。
10.进一步地,所述对所述医疗数据进行清洗,提取出儿童的属性特征包括:
11.根据所述儿童医疗数据的类型,对所述儿童医疗数据进行清洗,得到儿童的数据特征;
12.若所述儿童医疗数据的类型为图像,则通过第一算法对所述图像信息进行分析,确定所述图像信息内的表格区域和文本区域;通过ocr文本识别算法提取所述表格区域和文本区域内的文本行,并将所述文本行转化为文本信息;
13.若所述儿童医疗数据的类型为语音,则对所述语音进行回声消除和降噪处理,得到干净的语音信号;通过预设语音转化算法,将所述干净的语音转化为文本信息;
14.通过预设的分词词典对所述文本信息进行分词处理,得到儿童的属性特征。
15.进一步地,所述通过第一算法对所述图像信息进行分析,确定所述图像信息内的表格区域包括:
16.获取所述图像信息中的所有横线和竖线;
17.将任意两条横线和任意两条竖线进行组合;
18.判断所述组合是否符合单元格的构建规则;
19.如是,则将邻近的单元格进行组合形成所述表格区域。
20.进一步地,所述对所述语音进行回声消除和降噪处理,得到干净的语音信号包括:
21.对所述语音进行预处理,得到所述语音信号的音频频谱;
22.基于所述音频频谱,对所述语音进行回声消除和降噪处理,得到优化的语音信号。
23.进一步地,所述对所述语音进行预处理,得到所述语音信号的音频频谱包括:
24.通过如下公式,得到所述语音的中心频率值:
[0025][0026]
其中,所述n表示滤波器的个数;
[0027]
所述e为频率常数;
[0028]
所述h为频率赫兹值;
[0029]
所述i表示带通滤波器的排列数;
[0030]
对所述中心频率值进行数学转换,得到所述中心频率值的对数;
[0031]
对所述对数进行离线余弦变换,得到所述语音的音频频谱。
[0032]
进一步地,所述儿童发育模型通过如下方式进行构建:
[0033]
将标注好的训练样本输入预先建立的逻辑回归模型中;所述逻辑回归模型中的目标函数为对数似然函数;
[0034]
通过梯度上升算法,确定所述逻辑回归模型中决策函数的权值向量;
[0035]
对所述权值向量进行迭代,直到梯度的摸小于预设的阈值,完成对儿童发育模型的训练。
[0036]
进一步地,还包括:
[0037]
在对所述儿童发育模型的训练过程前,基于儿童生长发育参照标准对样本数值范围进行扩充。
[0038]
在本公开的第二方面,提供了一种基于医疗大数据的儿童发育筛查装置。该装置包括:
[0039]
获取模块,用于获取儿童医疗数据;所述儿童医疗数据包括图像、语音和/或文本;
[0040]
清洗模块,用于对所述医疗数据进行清洗,提取出儿童的属性特征;所述属性特征包括年龄、性别、身高、体重、血常规、尿常规、心率和/或血压;
[0041]
生成模块,用于将所述儿童的属性特征输入至儿童发育模型,得到儿童的生长发育报告。
[0042]
在本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
[0043]
在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面的方法。
[0044]
本技术实施例提供的基于医疗大数据的儿童发育筛查方法,通过获取儿童医疗数据;所述儿童医疗数据包括图像、语音和/或文本;对所述医疗数据进行清洗,提取出儿童的属性特征;所述属性特征包括年龄、性别、身高、体重、血常规、尿常规、心率和/或血压;将所述儿童的属性特征输入至儿童发育模型,得到儿童的生长发育报告,实现了客观评价儿童生长发育状况的技术效果,减少了人力成本,提高了效率。
[0045]
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理
解。
附图说明
[0046]
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
[0047]
图1示出了能够在其中实现本公开的实施例的示例性运行环境的示意图;
[0048]
图2示出了根据本公开的实施例的基于医疗大数据的儿童发育筛查方法的流程图;
[0049]
图3示出了根据本公开的实施例的基于医疗大数据的儿童发育筛查装置的方框图;
[0050]
图4示出了能够实施本公开的实施例的示例性电子设备的方框图。
具体实施方式
[0051]
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
[0052]
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0053]
图1示出了可以应用本技术的基于医疗大数据的儿童发育筛查方法或基于医疗大数据的儿童发育筛查装置的实施例的示例性系统架构100。
[0054]
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0055]
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如模型训练类应用、视频识别类应用、网页浏览器应用、社交平台软件等。
[0056]
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
[0057]
当终端101、102、103为硬件时,其上还可以安装有视频采集设备。视频采集设备可以是各种能实现采集视频功能的设备,如摄像头、传感器等等。用户可以利用终端101、102、103上的视频采集设备来采集视频。
[0058]
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的数据处理的后台服务器。后台服务器可以对接收到的数据进行分析等处理,并可以将处理结果(例如儿童的生长发育报告)反馈给终端设备。
[0059]
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
[0060]
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。特别地,在目标数据不需要从远程获取的情况下,上述系统架构可以不包括网络,而只包括终端设备或服务器。
[0061]
如图2所示,是本技术实施例基于医疗大数据的儿童发育筛查方法的流程图。从图2中可以看出,本实施例的基于医疗大数据的儿童发育筛查方法,包括以下步骤:
[0062]
s210,获取儿童医疗数据。
[0063]
其中,所述儿童医疗数据包括图像、语音和/或文本。
[0064]
在本实施例中,用于基于医疗大数据的儿童发育筛查方法的执行主体(例如图1所示的服务器)可以通过有线方式或者无线连接的方式获取儿童医疗数据。
[0065]
进一步地,上述执行主体可以获取与之通信连接的电子设备(例如图1所示的终端设备)发送的儿童医疗数据,也可以是预先存储于本地的儿童医疗数据。
[0066]
在一些实施例中,所述儿童医疗数据包括医生的诊疗结果、体检数据、检查数据和/或化验结果等。
[0067]
s220,对所述医疗数据进行清洗,提取出儿童的属性特征。
[0068]
其中,所述属性特征包括年龄、性别、身高、体重、血常规、尿常规、心率和/或血压。
[0069]
在一些实施例中,对所述医疗数据进行分类,确定所述医疗数据中的数据类型,针对不同的数据类型,分别提取出与其对应的文本信息。
[0070]
具体地,若所述儿童医疗数据的类型为图像,通过centernet模型对所述图像进行分析,检测图像中倾斜的横线和竖线(显示器边框或者屏显内容中的表格线等),并通过透视变换矫正整个图片。确定图像中心,并从图像中心向上下左右四个方向扫描寻找屏幕边缘(根据颜色分布的变化程度),并裁减图像为屏幕区域。确定屏幕区域中心,从所述屏幕区域中心向上下左右四个方向扫描寻找主要内容区域边缘(根据颜色分布的变化程度),并裁减图像为主要内容区域(确定区域内四个角的坐标)。所述主要内容区域包括表格区域和文本区域。
[0071]
其中,表格区域的确定方法如下:
[0072]
将相邻的横线进行组合形成横线区域;将相邻的竖线进行组合形成竖线区域;
[0073]
删除长宽比小的横线和/或竖线区域;所述长宽比可根据实际情况预先设定;
[0074]
分别对所有横线和竖线进行排序;
[0075]
将任意两条横线和任意两条竖线进行组合,判断是否符合单元格的规则,如是,则保留所述组合(单元格);
[0076]
将所有单元格进行合并(相邻原则),形成所述表格区域。如邻近单元格有所缺失的,则进行单元格补全(形成完整表格区域)。
[0077]
进一步地,通过ocr文本识别算法提取所述表格区域和文本区域内的文本行,并将所述文本行转化为文本信息。
[0078]
若儿童医疗数据的类型为语音,则通过如下公式,得到所述语音的中心频率值:
[0079][0080]
其中,所述n表示滤波器的个数;
[0081]
所述e为频率常数;
[0082]
所述h为频率赫兹值;
[0083]
所述i表示带通滤波器的排列数;
[0084]
对所述中心频率值进行数学转换,得到所述中心频率值的对数;
[0085]
对所述对数进行离线余弦变换,得到所述语音的音频频谱;
[0086]
基于所述音频频谱,对所述语音进行回声消除和降噪处理,得到优化的语音信号;
[0087]
进一步地,通过预设语音转化算法,将所述干净的语音转化为文本信息。所述预设语音转化算法包括声学模型、语言模型和解码三个部分。其中,声学模型可以为rnn-ctc,语言模型可以为n-gram或基于rnn的语言模型,解码算法可以为beam search。通过基于语言模型的方法和/或seq2seq(序列到序列)深度学习的方法对所述干净的语音进行自动纠错,以提高所述干净的语音的识别准确率。
[0088]
在一些实施例中,通过预设的分词词典对上述文本信息(包括从图像、语音转化的以及儿童医疗数据本身的文本信息)进行分词处理,得到儿童的属性特征。
[0089]
s230,将所述儿童的属性特征输入至儿童发育模型,得到儿童的生长发育报告。
[0090]
在一些实施例中,将标注好的训练样本输入预先建立的逻辑回归模型中;所述样本为基于儿童生长发育参照标准对样本数值范围进行扩充的样本;
[0091]
其中,所述逻辑回归模型是由条件概率所表示的决策函数,即:
[0092][0093]
式中样本特征向量x为输入数据,标签y∈{0,1}为输出数据,w为权值向量(逻辑回归模型参数),wx为w和x的内积。
[0094]
利用条件概率形式表示决策函数,然后利用最大化似然函数的方法,得到相对于训练集样本最优的参数w(得到最好的模型),通过该模型进行样本的分析预测;
[0095]
其中,所述逻辑回归模型中的目标函数为对数似然函数;
[0096]
其推到公式为:设p(y=1|x)=π(x),p(y=0|x)=1-π(x);则似然函数为:
[0097]
[0098][0099]
进一步地,基于对数似然函数的意义和性质,问题转化为目标函数的最大化问题。
[0100]
在一些实施例中,采用梯度上升算法,求取目标函数的最大值。梯度上升算法为一种迭代方法,通过不断改变变量w的值,使得目标函数l(w)越来越大,直至函数l(w)取得极大值,此时,w可确定一个最好的逻辑回归模型。
[0101]
梯度为一个向量,表示当目标函数l(w)的变量沿着梯度方向移动时,目标函数的增长最快。梯度方向由函数对变量的偏导数求取,所述目标函数l(w)可表示为:
[0102][0103]
进一步地,该目标函数的梯度方向为:
[0104][0105]
将参数w初始化,之后使w向梯度方向进行不断迭代,迭代公式为:
[0106][0107]
其中,常数η为学习率,可随迭代次数进行自定义;
[0108]
不断对w进行更新,直到梯度的模小于设定好的阈值为止,将最终的w值带入决策模型,即得到最好的逻辑回归模型,完成对儿童发育模型的训练。
[0109]
在一些实施例中,将儿童的属性特征输入至儿童发育模型,得到儿童的生长发育报告,确定儿童的生长发育是否正常。
[0110]
根据本公开的实施例,实现了以下技术效果:
[0111]
针对医疗大数据的种类,分别通过不同的处理方法,对该医疗大数据进行清洗,得到所需的儿童属性特征,通过基于逻辑回归模型和梯度上升算法训练的儿童发育模型,对所述儿童属性特征进行处理,能够快速准确的得到包含儿童生长发育是否正常的儿童生长发育报告,减少了人力成本的同时大幅度提升了处理效率。
[0112]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
[0113]
以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
[0114]
图3示出了根据本公开的实施例的基于医疗大数据的儿童发育筛查装置300的方框图。如图3所示,装置300包括:
[0115]
获取模块310,用于获取儿童医疗数据;所述儿童医疗数据包括图像、语音和/或文本;
[0116]
清洗模块320,用于对所述医疗数据进行清洗,提取出儿童的属性特征;所述属性特征包括年龄、性别、身高、体重、血常规、尿常规、心率和/或血压;
[0117]
生成模块330,用于将所述儿童的属性特征输入至儿童发育模型,得到儿童的生长发育报告。
[0118]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0119]
图4示出了可以用来实施本公开的实施例的电子设备400的示意性框图。如图所示,设备400包括中央处理单元(cpu)401,其可以根据存储在只读存储器(rom)402中的计算机程序指令或者从存储单元408加载到随机访问存储器(ram)403中的计算机程序指令,来执行各种适当的动作和处理。在ram403中,还可以存储设备400操作所需的各种程序和数据。cpu 401、rom402以及ram 403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。
[0120]
设备400中的多个部件连接至i/o接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0121]
处理单元401执行上文所描述的各个方法和处理,例如方法200。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由rom 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到ram403并由cpu401执行时,可以执行上文描述的方法200的一个或多个步骤。备选地,在其他实施例中,cpu 401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法200。
[0122]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
[0123]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0124]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0125]
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
[0126]
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1