一种基于神经网络的智能病案文字识别的方法与流程

文档序号：19572416发布日期：2019-12-31 19:05阅读：来源：国知局

技术特征：

1.一种基于神经网络的智能病案文字识别的方法，其特征在于，包括以下步骤：

s1、取病案文本行数据进行标注，标出每个文本行里面所包含的文字，得到病案训练数据；

s2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据，并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集；

s3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图，并输入卷积神经网络模块中进行图片的特征提取，生成4x35x192的特征图，然后将特征图进行维度交换35x4x192，再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取，得到特征图的35个切片；

s4、利用文本识别模型对特征图的35个切片分别进行分类预测得分；

s5、取每一个切片预测得分最高的分类，该分类对应的字即为所预测的字，最后将35个切片的相同字符进行合并，得到10个字符。

2.根据权利要求1所述的一种基于神经网络的智能病案文字识别的方法，其特征在于，在步骤s1中，每张病案训练数据长宽相同并包含10个文字。

3.根据权利要求1所述的一种基于神经网络的智能病案文字识别的方法，其特征在于，在步骤s3中，所述特征图的35个切片为35个字或字符的数量。

4.根据权利要求1所述的一种基于神经网络的智能病案文字识别的方法，其特征在于，在步骤s4中，文本识别模型采用ctc作为损失函数，采用adam梯度下降优化器进行模型的反向传播，调整神经网络模型参数。

完整全部详细技术资料下载

当前第2页1 2 3