医疗单类型的判断方法、系统、设备及介质与流程

文档序号：30096855发布日期：2022-05-18 11:09阅读：125来源：国知局

1.本发明涉及人工智能技术领域，特别涉及一种医疗单类型的判断方法、系统、设备及介质。

背景技术：

2.患者在医院看完病后，会有各种类型的医疗单据，例如：医疗病例、药品清单、医疗小结和医疗发票等。对于保险业务人员说，面对各种各样种类繁多的医疗单据，如何对医疗单据进行准确高效的分类成为当前急需解决的一个难题。现有技术中，保险业务人员拿取到医疗单据的纸质材料后，通常需要跑取多家不同的医疗单位，收集到一定数量的医疗单后，然后通过pc端的收单功能，打开扫描仪扫描纸质件，人工归类收单类别并录入影像库中。这种方式需要通过人工一件一件识别对应纸质件，识别效率较慢。此外，目前的ocr识别技术，通常只能识别基础的文本信息，只能根据单一的识别模型进行对应位置文字的提取，无法按照业界的动态规则组装改进。因此，对于实际应用场景中，保险业务员收取的往往都是具有不同差异化的医疗单件，这种单一位置的ocr识别无法满足现有市场的需求。
3.需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

4.本发明的目的在于提供一种医疗单类型的判断方法、系统、设备及介质，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
5.为实现上述目的及其他相关目的，本发明提供一种医疗单类型的判断方法，包括：
6.获取医疗单的图像；
7.通过ocr提取技术，遍历所述医疗单的图像，获得所述医疗单的图像中多段待识别文字区域，并根据每段待识别文字区域中的文字特征，提取所述医疗单的图像中的文本信息；
8.将所述文本信息输入至医疗单类型匹配模型中，将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，得到所述文本信息中含有的多个关键词，并根据所述文本信息中各关键词对应的预设权重，计算所述医疗单与所述医疗单的类型库中各类型对应的匹配率，得到所述医疗单的类型，所述医疗单类型匹配模型是将textmatching与softmax分类器串联组成，所述医疗单的类型库中包括预存的各类型以及每种类型所对应的关键词。
9.将所述图像块数据集中的每一组图像块数据分别输入至待训练的证件识别模型进行迭代训练，并基于迭代训练的结果更新模型的权重，得到训练好的证件识别模型，所述证件识别模型是将resnet34网络与softmax分类器串联组成。
10.在本发明的一个实施例中，所述通过ocr提取技术，遍历所述医疗单的图像，获得所述医疗单的图像中多段待识别文字区域，并根据每段待识别文字区域中的文字特征，提取所述医疗单的图像中的文本信息包括：
11.对所述医疗单的图像进行预处理，得到预处理后医疗单图像；
12.通过滑动窗口算法，遍历所述预处理医疗单图像，提取所述预处理后医疗单图像的文字区域；
13.对所述预处理后医疗单图像的文字区域进行矩形分割，得到多段待识别文字区域，其中，每段待识别文字区域与所述预处理后医疗单图像的文字区域中的一个段落相对应；
14.提取所述每段待识别文字区域中的文字特征，通过字符识别得到所述医疗单的图像中的文本信息。
15.在本发明的一个实施例中，所述对所述医疗单的图像进行预处理，得到预处理后医疗单图像包括：
16.对所述医疗单的图像进行灰度化处理，得到灰度化医疗单图像；
17.采用动态阈值分割的方法，对所述灰度化医疗单图像进行二值化处理，得到二值化医疗单图像；
18.使用最近邻聚类方法，对所述二值化医疗单图像进行倾斜校正处理，得到预处理后医疗单图像。
19.在本发明的一个实施例中，所述将所述文本信息输入至医疗单类型匹配模型中，将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，得到所述文本信息中含有的多个关键词，并根据所述文本信息中各关键词对应的预设权重，计算所述医疗单与所述医疗单的类型库中各类型对应的匹配率，得到所述医疗单的类型包括：
20.将所述文本信息输入至所述医疗单类型匹配模型中，通过将所述文本信息与所述医疗单的类型库中的各关键词进行匹配，提取所述文本信息中含有的多个关键词；
21.根据所述文本信息中各关键词对应的预设权重，得到所述医疗单与各类型的匹配率；
22.将所述医疗单与各类型对应的匹配率进行排序，并选取与所述医疗单匹配率最高的类型，将最高的匹配率与预设的匹配率阈值进行比较，若所述最高的匹配率大于或等于预设的匹配率阈值，将所述最高的匹配率对应的类型作为所述医疗单的类型。
23.在本发明的一个实施例中，所述将所述医疗单与各类型对应的匹配率进行排序，并选取与所述医疗单匹配率最高的类型，将最高的匹配率与预设的匹配率阈值进行比较之后，还包括：
24.若所述最高的匹配率小于所述预设的匹配率阈值，根据所述医疗单的类型，对所述医疗单添加数据标签；
25.将含数据标签的医疗单输入至所述医疗单类型匹配模型进行训练，通过梯度下降法更新医疗单类型匹配模型的权重。
26.在本发明的一个实施例中，所述医疗单类型匹配模型通过预训练得到，所述预训练的过程包括：
27.获取包含有各类型的医疗单数据，所述类型至少包括：医疗小结、医疗病例、医疗发票、医疗清单；
28.采用文本识别提取所述医疗单数据的文本信息，
29.将所述文本信息输入至待训练的医疗单类型匹配模型进行训练，通过
textmatching的卷积运算提取所述文本信息的特征向量，并将所述特征向量送入至softmax分类器进行映射，得到医疗单类型匹配模型。
30.在本发明一实施例中，所述匹配率的获取方式，包括：
31.其中，p
im
为第i个医疗单与所述医疗单的类型库中的第m个类型的匹配率，n
im
为第i个医疗单属于第m个类型的关键词的总数，为第m个类型中第j个关键词的预设权重，为第i个医疗单中，第j个关键词与文本信息的匹配值。
32.为实现上述目的及其他相关目的，本发明还提供一种判断医疗单类型的系统，包括：
33.图像获取模块，用于获取医疗单的图像；
34.文本提取模块，用于通过ocr提取技术，遍历所述医疗单的图像，获得所述医疗单的图像中多段待识别文字区域，并根据每段待识别文字区域中的文字特征，提取所述医疗单的图像中的文本信息；
35.类型判断模块，用于将所述文本信息输入至医疗单类型匹配模型中，将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，得到所述文本信息中含有的多个关键词，并根据所述文本信息中各关键词对应的预设权重，计算所述医疗单与所述医疗单的类型库中各类型对应的匹配率，得到所述医疗单的类型，所述医疗单类型匹配模型是将textmatching与softmax分类器串联组成，所述医疗单的类型库中包含有预存的各类型以及每种类型对应的关键词。
36.为实现上述目的及其他相关目的，本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。
37.为实现上述目的及其他相关目的，本发明还提供一种计算机可读存储介质，其上存储于计算机程序，所述计算机程序被处理器执行时实现现上述方法的步骤。
38.本发明的判断医疗单类型的及证件识别的方法、系统、设备及介质，通过将医疗单中的文本信息与预设的医疗单的类型库中关键词进行匹配，其中，医疗单的类型库中具有不同的医疗单的类型，以及每种类型中的多个关键词信息，根据不同关键词具有的不同权重，进而得到医疗单对应的类型。从而能够便捷、高效、精准的识别到医疗单的类型，有效地提升了业务人员的收单效率。
附图说明
39.通过参考附图会更加清楚的理解本发明的特征和优点，附图是示意性的而不应理解为对本发明进行任何限制，在附图中：
40.图1显示为本发明一实施例中医疗单类型的判断方法的流程示意图；
41.图2显示为本发明一实施例中步骤s20的流程示意图；
42.图3显示为本发明一实施例中步骤s21的流程示意图；
43.图4显示为本发明一实施例中步骤s30的流程示意图；
44.图5显示为本发明一实施例中模型预训练的流程示意图；
45.图6显示为本发明一实施例中判断医疗单类型的系统的结构框图；
46.图7显示为本发明一实施例中电子设备的结构示意图。
具体实施方式
47.以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。
48.请参阅图1-7。需要说明的是，本实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。
49.图1示出了本发明的医疗单类型的判断方法的流程示意图。
50.所述医疗单类型的判断方法应用于一个或者多个电子设备中，所述电子设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit，asic)、可编程门阵列(field－programmable gate array，fpga)、数字处理器(digital signal processor，dsp)、嵌入式设备等。
51.所述电子设备可以是任何一种可与用户进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant，pda)、游戏机、交互式网络电视(internet protocol television，iptv)、智能式穿戴式设备等。
52.所述电子设备还可以包括网络设备和/或用户设备。其中，所述网络设备包括，但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloud computing)的由大量主机或网络服务器构成的云。
53.所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network，vpn)等。
54.下面将结合图1来详细阐述本发明的医疗单类型的判断方法。
55.一种医疗单类型的判断方法，包括：
56.s10、获取医疗单的图像。
57.在本实施例中，业务人员收取到需要报销的医疗单后，将医疗单图像上传至训练好的医疗单匹配模型中，判断医疗单的类型。作为示例，业务人员可通过使用“平安健康”软件获取医疗单数据，可以有利于业务人员可以随时随地收取医疗单，极大地改善了传统收单模式中由于人工收单导致的地域限制。业务人员接收到各种医疗单后，可打开“平安健康”软件，通过软件上的“添加图像”按钮，采用现场拍照或从相册中直接读取图像的方式，将一张或多张医疗单图像上传至软件。考虑到人工选取图像时可能会存在选择误差，例如将一些清晰度较差的图像选入，或者是重复多次选择同一张图像。为了使选择结果更具有针对性，选择完毕的图像可在软件中采用小窗口预览的方式，从而更加便于业务人员挑选质量较好的医疗单图像。可以理解的是，本发明中医疗单图像的获取方式包括但不限于软
件、智能手机、平板电脑、数码设备，在此不做限制。
58.接着，执行步骤s20、通过ocr提取技术，遍历所述医疗单的图像，获得所述医疗单的图像中多段待识别文字区域，并根据每个待识别文字区域中的文字特征，提取所述医疗单的图像中的文本信息。
59.具体地，如图2所示，所述通过ocr提取技术，遍历所述医疗单的图像，获得所述医疗单的图像中多段待识别文字区域，并根据每个待识别文字区域中的文字特征，提取所述医疗单的图像中的文本信息包括：
60.s21、对所述医疗单图像进行预处理，得到预处理后医疗单图像；
61.s22、通过滑动窗口算法，遍历所述预处理医疗单图像，提取到所述预处理后医疗单图像的文字区域；
62.s23、对所述文字区域进行矩形分割，得到多段待识别文字区域，其中，每段待识别文字区域与所述文字区域中的一个段落相对应；
63.s24、提取每段所述待识别文字区域中的文字特征，通过字符识别得到医疗单图像的文本信息。
64.ocr(optical character recognition，光学字符识别)是指电子设备，例如扫描仪或数码相机等，通过检查纸上打印的字符，采用检测暗、亮的模式确定字符形状，然后用字符识别方法将形状翻译成计算机文字的过程。使用深度ocr识别技术获取到医疗单上的文本信息后，通过将文本信息遍历预先设置的医疗单类型库中的各关键词，可以得到该文本信息中含有的医疗单类型库中的多个关键词。文本信息包括医疗单中的文字信息，例如医疗病例中症状描述的内容，医生签名等。可以理解的是，文本信息的获取过程并不局限于上述实施例提到的方法，还可通过east(efficient and accuracy scene text，高效和准确的场景文本检测)等方法，在此不做限制。
65.进一步地，如图3所示，所述对所述医疗单的图像进行预处理，得到预处理后医疗单图像包括：
66.s211、对所述医疗单的图像进行灰度化处理，得到灰度化医疗单图像；
67.s212、采用动态阈值分割的方法，对所述灰度化医疗单图像进行二值化处理，得到二值化医疗单图像；
68.s213、使用最近邻聚类方法，对所述二值化医疗单图像进行倾斜校正处理，得到预处理后医疗单图像。
69.考虑到医疗单涉及到医疗病例、医疗发票、医疗清单等多种不同的类型，不同类型的医疗单纸张的厚薄、光洁度和印刷质量也不相同。而这些因素都可能会导致ocr在识别过程中产生文字畸变、断笔、黏连和污点等现象。为了减少这种现象的发生，在本实施例中，在进行ocr文字识别之前，需要对带有噪声的文字图像进行一系列处理，从而保证医疗单的图像更加清晰可辫。具体地，在本实施例中，首先对获得的医疗单图像进行灰度化处理。这是由于获得的医疗单图像通常都是彩色图像，但这种彩色图像中往往会夹杂多种的干扰信息，因此需要使用灰度化处理的方法滤除这些干扰信息。通过将图像中由三维描述的像素点映射为一维描述的像素点，实现了图像的灰度化处理过程。此外，为了将文字与背景进一步精确区分，需要将灰度化医疗单图像进行二值化处理。在本实施例中，使用动态阈值分割的方法，将灰度化医疗单图像平滑处理后，通过比较原图和平滑后处理后医疗单图像中对
应像素值，进行差值处理，从而获得二值化医疗单的图像。由于医疗单通常情况下为印刷体，而印刷体的文本资料大多是由平行于页面边缘的水平或垂直的文本组成，其倾斜角度为零。但在ocr扫描识别的过程中，不可避免会出现图像倾斜现象。而这种倾斜的医疗单图像会严重影响字符分隔和识别的正确率。为了改善这一情形，需要对医疗单图像进行倾斜校正。具体地，在一实施例中，可通过将医疗单图像中的前景像素映射到极坐标空间，通过统计极坐标空间中，医疗图像各点的累加值，得到医疗图像需要旋转的角度。根据该角度对医疗图像进行角度调整，即可得到预处理后医疗单图像。
70.接着，执行步骤s30、将所述文本信息输入至医疗单类型匹配模型中，将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，得到所述文本信息中含有的多个关键词，并根据所述文本信息中各关键词对应的预设权重，计算所述医疗单与所述医疗单的类型库中各类型对应的匹配率，得到所述医疗单的类型，所述医疗单类型匹配模型是将textmatching与softmax分类器串联组成，所述医疗单的类型库中包括预存的各类型以及每种类型所对应的关键词。
71.具体地，如图4所示，所述将所述文本信息输入至医疗单类型匹配模型中，将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，得到所述文本信息中含有的多个关键词，并根据所述文本信息中各关键词对应的预设权重，计算所述医疗单与所述医疗单的类型库中各类型对应的匹配率，得到所述医疗单的类型包括：
72.s31、将所述文本信息输入至医疗单类型匹配模型中，通过将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，提取所述文本信息中含有的多个关键词；
73.s32、根据所述文本信息中各关键词对应的预设权重，得到所述医疗单与各医疗单类型的匹配率；
74.s33、将所述医疗单与各类型对应的匹配率进行排序，并选取与所述医疗单匹配率最高的类型，将最高的匹配率与预设的匹配率阈值进行比较，若所述最高的匹配率大于或等于预设的匹配率阈值，将所述最高的匹配率对应的类型作为所述医疗单的类型。
75.textmatching网络是一种端到端的文本匹配方法，主要是为了找到与目标文本最相关的文本。首先通过词向量模型提取文本中的词向量，词向量模型可以使用主流的模型，包括但不限于word2vec、fasttext、glove、bert等。然后通过计算待识别文本与关键词之间的相似度得分，得到相似度矩阵。使用卷积神经网络提取文本特征，并使用两层卷积神经网络在相似度矩阵中进行特征抽取，最终获得文本信息中的关键词信息。在本实施例中，每个关键词具有对应的预设权重，通过计算文本信息中涉及的关键词的权重，可以得到医疗单与各医疗单的类型的匹配率。需要说明的是，在本实施例中，医疗单的类型包括但不限于医疗发票、医疗病例、增值税发票、医疗出院小结，本领域技术人员可根据需要适应性设置不同的医疗单的类型，以及各医疗单的类型对应的关键词，从而形成不同的医疗单的类型库，在此不做赘述。
76.在本实施例中，匹配率的公式为：其中，p
im
为第i个医疗单与所述医疗单的类型库中的第m个类型的匹配率，n
im
为第i个医疗单属于第m个类型的关键词的总数，为第m个类型中第j个关键词的预设权重,为第i个医疗单，第j个关键词与
文本信息的匹配值。具体地，的取值为0或1，当取值为0时，表示第i个医疗单的第m个类型中，第j个关键词与文本信息相匹配，当取值为1时，表示第i个医疗单的第m个类型中，第j个关键词与文本信息不匹配。可以理解的是，也可以为其他值，只要可以表征关键词与文本信息是否匹配即可。作为示例，p
12
为预设的医疗单的类型库中第1个医疗单的第2个类型，即医疗病例。在医疗病例的类型中，总计有120个关键词，即n
12
为120。将文本信息与医疗病例中各关键词进行匹配后，有第3个和第6个关键词与文本信息相匹配。其中，第3个关键词为病例，其预设权重为4，第6个关键词为疾病，其预设权重为2。则医疗单与预设的医疗的类型库中，医疗病例的匹配率为6/120。
77.得到与医疗单对应的各医疗单的类型的匹配率后，可进行降序或升序排列。并选择匹配率最高的医疗单的类型作为待设置医疗单类型。然后将待设置医疗单对应的匹配率与预设的匹配率阈值进行比较，如果匹配率大于或等于预设的匹配率阈值，说明该待设置医疗单类型与医疗单各项数据较为契合，即可将待设置医疗单类型作为此医疗单的类型。例如，医疗单与医疗单类型库中各种不同的医疗单类型匹配后，通过计算不同医疗单类型中对应的权重，得到如下匹配率：该医疗单与发票的匹配率为85％，该医疗单与医疗病例的匹配率为73％，该医疗单与医疗出院小结的匹配率为83.7％。将三者进行排序后，选取与该医疗单匹配率最高的发票作为待设置医疗单类型。其中，预设的匹配率阈值为79％，则可认为此医疗单类型为发票。需要说明的是，本领域技术人员可根据检测精度适应性改变匹配率阈值，在此不做限定。进一步地，考虑到增值税发票中具有防伪标示坐标，因此可通过坐标检测，检测其中的防伪标示从而判断医疗单的类型。举例来说，匹配完成后，该医疗单左上角中的防伪标示与医疗单类型库中的防伪标示相同。文本信息中的关键词为发票、开票、增值和病例，发票、开票和增值同属于增值税发票类型，病例属于医疗病例的类型，其中，发票的预设权重为4，增值的预设权重为3，开票的权重为4，病例的预设权重为3，左上角防伪标示坐标规则的权重为6，增值税发票的关键词有90个，医疗病例的关键词有120个。因此，该医疗单对应增值税发票类型的概率即为17/90，该医疗单对应医疗病例的概率为3/120。
78.进一步地，如图5所示，所述医疗单类型匹配模型通过预训练得到，所述预训练的过程包括：
79.s301、获取包含有各类型的医疗单数据，所述类型至少包括：医疗小结、医疗病例、医疗发票、医疗清单；
80.s302、采用文本识别提取所述医疗单数据的文本信息；
81.s303、将所述文本信息输入至待训练的医疗单类型匹配模型进行训练，通过textmatching的卷积运算提取所述文本信息的特征向量，并将所述特征向量送入至softmax分类器进行映射，得到医疗单类型匹配模型。
82.本实施例中的医疗单类型匹配模型是通过预先训练获得。首先需要获取训练样本数据，训练样本数据为多张不同类型的医疗单图像制作而成的样本数据集，其中，类型包括但不限于医疗小结、医疗病例、医疗发票和医疗清单。并按照一定比例将样本数据集分为训练集和测试集，训练集用于确定模型参数，测试集用于检验训练好的模型的泛化能力。通过深度ocr识别技术提取医疗单数据中的文本信息，然后将文本信息输入医疗单类型匹配模
型进行训练，本实施例中医疗单类型匹配网络模型是基于textmatching网络与softmax层进行构建，具体地，将文本信息送入textmatching网络后，首先通过卷积运算得到文本信息的特征向量，将特征向量送入至softmax层进行映射，得到文本信息与预设的医疗单的类型库中各类型的匹配率，通过损失函数不断更新模型的权重，当损失函数收敛时，说明模型中各权重达到最优状态，即可得到医疗单类型匹配模型。考虑到训练集太小时，神经网络容易出现欠拟合的现象，导致模型不能很好的拟合数据特征，使得最终预测精度偏小。训练集太大时，神经网络容易出现过拟合的现象，导致模型泛化能力不高。在一实施例中，所述样本数据集中训练集和测试集的比例为8:2。这样既可对模型进行有效训练，同时又可以改善训练样本过多导致过拟合的现象。当然，训练集和测试集的样本比例不做固定限制，本领域技术人员可根据实际需要适应性改变。
83.进一步地，所述将所述医疗单与各类型对应的匹配率进行排序，并选取与所述医疗单匹配率最高的类型，将最高的匹配率与预设的匹配率阈值进行比较之后，还包括：
84.若所述最高的匹配率小于预设的匹配率阈值，根据所述医疗单类型，对所述医疗单添加数据标签；
85.将含数据标签的医疗单输入至所述医疗单类型匹配模型进行训练，通过梯度下降法更新医疗单类型匹配模型的权重。
86.在本实施例中，如果最高的匹配率小于预设的匹配率阈值，表明最高匹配率对应的类型与医疗单存在较大差异，此时，不能简单将此最高匹配率对应的类型认定为医疗单的类型，从而降低识别的准确度。因此，需要提升模型的识别精度。首先需要将判断的医疗单通过后台保存至待训练识别池内。当待训练识别池内的医疗单数据积累到一定数量后，会通知特定的操作人员，由操作人员根据待判断医疗单的特征，识别其属于医疗单的类型库中哪一种医疗单的类型，并对该医疗单添加对应类别的数据标签。例如，发票类的数据标签为1，医疗病例类的数据标签为2，医疗小结类的数据标签为3。考虑到由于图像模糊、图像残缺等原因，会导致操作人员判断失误，从而为医疗单添加错误标签。例如原本属于发票的医疗单，由于判断失误，会误认为其是医疗小结。这种错误的标签会误导模型的识别方向，导致该医疗单判断模型的识别率下降。为了改善这一情形，在本实施例中，数据标签添加完成后，会将添加数据标签的医疗单自动反馈至业务人员处，使业务人员进一步确认添加的数据标签是否正确，若正确，则将添加有数据标签的医疗单送入医疗单类型匹配模型中进行训练，通过梯度下降法不断更新模型的权重，进一步优化模型的性能。若不正确，则由业务人员将数据标签更改为正确的类型，并将标注有正确数据标签的医疗单送入模型进行训练，通过不断增加样本数据的方式，进一步提升模型的识别性能。
87.需要说明的是，在本发明中，为了进一步保证数据的安全性，还可以将涉及到的数据及模型部署于区块链，以防止数据被恶意篡改。
88.需要说明的是，上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包含相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。
89.如图6所示，是本发明的判断医疗单类型的系统的结构框图。所述判断医疗单类型的系统包括：图像获取模块111，文本提取模块112和类型判断模块113。本发明所称的模块
是指一种能够被处理器13所执行，并且能够完成固定功能的一系列计算机程序段，其存储在存储器12中。
90.所述图像获取模块111用于获取医疗单的图像。
91.在本实施例中，业务人员收取到需要报销的医疗单后，将医疗单图像上传至训练好的医疗单匹配模型中，判断医疗单的类型。作为示例，业务人员可通过使用“平安健康”软件获取医疗单数据，可以有利于业务人员可以随时随地收取医疗单，极大地改善了传统收单模式中由于人工收单导致的地域限制。业务人员接收到各种医疗单后，可打开“平安健康”软件，通过软件上的“添加图像”按钮，采用现场拍照或从相册中直接读取图像的方式，将一张或多张医疗单图像上传至软件。考虑到人工选取图像时可能会存在选择误差，例如将一些清晰度较差的图像选入，或者是重复多次选择同一张图像。为了使选择结果更具有针对性，选择完毕的图像可在软件中采用小窗口预览的方式，从而更加便于业务人员挑选质量较好的医疗单图像。可以理解的是，本发明中医疗单图像的获取方式包括但不限于软件、智能手机、平板电脑、数码设备，在此不做限制。
92.所述文本提取模块112用于通过ocr提取技术，遍历所述医疗单的图像，获得所述医疗单的图像中多段待识别文字区域，并根据每个待识别文字区域中的文字特征，提取所述医疗单的图像中的文本信息。
93.ocr(optical character recognition，光学字符识别)是指电子设备，例如扫描仪或数码相机等，通过检查纸上打印的字符，采用检测暗、亮的模式确定字符形状，然后用字符识别方法将形状翻译成计算机文字的过程。使用深度ocr识别技术获取到医疗单上的文本信息后，通过将文本信息遍历预先设置的医疗单类型库中的各关键词，可以得到该文本信息中含有的医疗单类型库中的多个关键词。文本信息包括医疗单中的文字信息，例如医疗病例中症状描述的内容，医生签名等。可以理解的是，文本信息的获取过程并不局限于上述实施例提到的方法，还可通过east(efficient and accuracy scene text，高效和准确的场景文本检测)等方法，在此不做限制。
94.考虑到医疗单涉及到医疗病例、医疗发票、医疗清单等多种不同的类型，不同类型的医疗单纸张的厚薄、光洁度和印刷质量也不相同。而这些因素都可能会导致ocr在识别过程中产生文字畸变、断笔、黏连和污点等现象。为了减少这种现象的发生，在本实施例中，在进行ocr文字识别之前，需要对带有噪声的文字图像进行一系列处理，从而保证医疗单的图像更加清晰可辫。具体地，在本实施例中，首先对获得的医疗单图像进行灰度化处理。这是由于获得的医疗单图像通常都是彩色图像，但这种彩色图像中往往会夹杂多种的干扰信息，因此需要使用灰度化处理的方法滤除这些干扰信息。通过将图像中由三维描述的像素点映射为一维描述的像素点，实现了图像的灰度化处理过程。此外，为了将文字与背景进一步精确区分，需要将灰度化医疗单图像进行二值化处理。在本实施例中，使用动态阈值分割的方法，将灰度化医疗单图像平滑处理后，通过比较原图和平滑后处理后医疗单图像中对应像素值，进行差值处理，从而获得二值化医疗单的图像。由于医疗单通常情况下为印刷体，而印刷体的文本资料大多是由平行于页面边缘的水平或垂直的文本组成，其倾斜角度为零。但在ocr扫描识别的过程中，不可避免会出现图像倾斜现象。而这种倾斜的医疗单图像会严重影响字符分隔和识别的正确率。为了改善这一情形，需要对医疗单图像进行倾斜校正。具体地，在一实施例中，可通过将医疗单图像中的前景像素映射到极坐标空间，通过
统计极坐标空间中，医疗图像各点的累加值，得到医疗图像需要旋转的角度。根据该角度对医疗图像进行角度调整，即可得到预处理后医疗单图像。
95.所述类型判断模块113用于将所述文本信息输入至医疗单类型匹配模型中，将所述文本信息与预设医疗单的类型库中的各关键词进行匹配，得到所述文本信息中含有的多个关键词，并根据所述文本信息中各关键词对应的预设权重，计算所述医疗单与所述医疗单的类型库中各类型对应的匹配率，得到所述医疗单的类型，所述医疗单类型匹配模型是将textmatching与softmax分类器串联组成，所述医疗单的类型库中包括预存的各类型以及每种类型所对应的关键词。
96.textmatching网络是一种端到端的文本匹配方法，主要是为了找到与目标文本最相关的文本。首先通过词向量模型提取文本中的词向量，词向量模型可以使用主流的模型，包括但不限于word2vec、fasttext、glove、bert等。然后通过计算待识别文本与关键词之间的相似度得分，得到相似度矩阵。使用卷积神经网络提取文本特征，并使用两层卷积神经网络在相似度矩阵中进行特征抽取，最终获得文本信息中的关键词信息。在本实施例中，每个关键词具有对应的预设权重，通过计算文本信息中涉及的关键词的权重，可以得到医疗单与各医疗单的类型的匹配率。需要说明的是，在本实施例中，医疗单的类型包括但不限于医疗发票、医疗病例、增值税发票、医疗出院小结，本领域技术人员可根据需要适应性设置不同的医疗单的类型，以及各医疗单的类型对应的关键词，从而形成不同的医疗单的类型库，在此不做赘述。
97.在本实施例中，匹配率的公式为：其中，p
im
为第i个医疗单与所述医疗单的类型库中的第m个类型的匹配率，n
im
为第i个医疗单属于第m个类型的关键词的总数，为第m个类型中第j个关键词的预设权重,为第i个医疗单中，第j个关键词与文本信息的匹配值。具体地，的取值为0或1，当取值为0时，表示第i个医疗单的第m个类型中，第j个关键词与文本信息相匹配，当取值为1时，表示第i个医疗单的第m个类型中，第j个关键词与文本信息不匹配。可以理解的是，也可以为其他值，只要可以表征关键词与文本信息是否匹配即可。作为示例，p
12
为预设的医疗单的类型库中第1个医疗单的第2个类型，即医疗病例。在医疗病例的类型中，总计有120个关键词，即n
12
为120。将文本信息与医疗病例中各关键词进行匹配后，有第3个和第6个关键词与文本信息相匹配。其中，第3个关键词为病例，其预设权重为4，第6个关键词为疾病，其预设权重为2。则医疗单与预设的医疗的类型库中，医疗病例的匹配率为6/120。
98.得到与医疗单对应的各医疗单的类型的匹配率后，可进行降序或升序排列。并选择匹配率最高的医疗单的类型作为待设置医疗单类型。然后将待设置医疗单对应的匹配率与预设的匹配率阈值进行比较，如果匹配率大于或等于预设的匹配率阈值，说明该待设置医疗单类型与医疗单各项数据较为契合，即可将待设置医疗单类型作为此医疗单的类型。例如，医疗单与医疗单类型库中各种不同的医疗单类型匹配后，通过计算不同医疗单类型中对应的权重，得到如下匹配率：该医疗单与发票的匹配率为85％，该医疗单与医疗病例的
匹配率为73％，该医疗单与医疗出院小结的匹配率为83.7％。将三者进行排序后，选取与该医疗单匹配率最高的发票作为待设置医疗单类型。其中，预设的匹配率阈值为79％，则可认为此医疗单类型为发票。需要说明的是，本领域技术人员可根据检测精度适应性改变匹配率阈值，在此不做限定。进一步地，考虑到增值税发票中具有防伪标示坐标，因此可通过坐标检测，检测其中的防伪标示从而判断医疗单的类型。举例来说，匹配完成后，该医疗单左上角中的防伪标示与医疗单类型库中的防伪标示相同。文本信息中的关键词为发票、开票、增值和病例，发票、开票和增值同属于增值税发票类型，病例属于医疗病例的类型，其中，发票的预设权重为4，增值的预设权重为3，开票的权重为4，病例的预设权重为3，左上角防伪标示坐标规则的权重为6，增值税发票的关键词有90个，医疗病例的关键词有120个。因此，该医疗单对应增值税发票类型的概率即为17/90，该医疗单对应医疗病例的概率为3/120。
99.需要说明的是，本实施例的判断医疗单类型的系统是与上述医疗单类型的判断方法相对应的系统。判断医疗单类型的系统中的功能模块或者分别对应医疗单类型的判断方法中的相应步骤。本实施例的判断医疗单类型的系统可与医疗单类型的判断方法相互相配合实施。相应地，本实施例的判断医疗单类型的系统中提到的相关技术细节也可应用在上述医疗单类型的判断方法中。
100.需要说明的是，上述的各功能模块实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的部分或全部步骤，或以上的各功能模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
101.如图7所示，是本发明电子设备的结构示意图。
102.所述电子设备1可以包括存储器12、处理器13和总线，还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序，例如基于方向检测的文字识别程序。
103.其中，存储器12至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地，存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于方向检测的文字识别程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。
104.处理器13在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备1的控制核心(control unit)，利用各种接口和线路连接整个电子设备1的各个部件，通过运行或执行存储在所述存储器12内的程序
或者模块(例如执行体检报告校验程序等)，以及调用存储在所述存储器12内的数据，以执行电子设备1的各种功能和处理数据。
105.所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个医疗单类型的判断方法实施例中的步骤，例如图1所示的步骤。
106.示例性的，所述计算机程序可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器12中，并由所述处理器13执行，以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如，所述计算机程序可以被分割成图像获取模块111，文本提取模块112和类型判断模块113。
107.上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备，或者网络设备等)或处理器(processor)执行本发明各个实施例所述体检项目推荐方法的部分功能。
108.本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
109.总线可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，在图7中仅用一根箭头表示，但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
110.本发明的判断医疗单类型的及证件识别的方法、系统、设备及介质，通过将医疗单中的文本信息与预设的医疗单的类型库中关键词进行匹配，其中，医疗单的类型库中具有不同的医疗单的类型，以及每种类型中的多个关键词信息，根据不同关键词具有的不同权重，进而得到医疗单对应的类型。从而能够便捷、高效、精准的识别到医疗单的类型，有效地提升了业务人员的收单效率。
111.对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。
112.以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴思佳
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

上一篇：一种给排水用污泥脱水装置的制作方法
上一篇：一种卫星发射场试验鉴定业务消息交互方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。