在线问题归一化处理方法、装置、计算机设备和存储介质与流程

文档序号：15889017发布日期：2018-11-09 20:02阅读：223来源：国知局

本申请涉及计算机技术领域，特别是涉及一种在线问题归一化处理方法、装置、计算机设备和存储介质。

背景技术

通过在线问诊平台可以方便用户就疾病问题在线向医生咨询。用户提出问题之后，期望能够得到医生及时的答复。医生在做出回复之前，需要结合用户的基本信息以及相应的症状信息进行诊断。如果症状信息较少，则需要医生向用户提问。为了减少症状信息的收集耗时，以便医生能及时诊断，在线问诊平台需要自动向用户发送问题，在收集到用户回答之后，自动对用户回答与问题进行匹配。

在医疗领域内，用户回答与问题匹配的准确率要求非常高，如果对用户回答匹配错误，对在线问诊的后续处理可以造成直接影响，甚至造成误诊。尤其当用户通过语音进行回答时，回答内容是开放式的。面对同一个问题，不同的用户可以有不同的回答。因此在线问诊中有效如何提高用户回答与问题之间的匹配准确率成为目前亟需解决的一个技术问题。

技术实现要素：

基于此，有必要针对上述技术问题，提供一种在线问诊时能够有效提高用户回答与问题之间的匹配准确率的在线问题归一化处理方法、装置、计算机设备和存储介质。

一种在线问题归一化处理方法，所述方法包括：

接收用户终端上传的问诊请求；所述问诊请求携带了用户标识；

根据所述问诊请求为所述用户标识分配对应的医生；

将所述用户标识存入相应队列等待医生，向所述用户终端返回相应的问题；

接收用户终端上传的答复信息，识别所述答复信息对应的答复类型；

当所述答复类型为编号类型时，在所述答复信息中提取相应的编号信息，将所述编号信息与答案选项进行匹配，得到所述问题的答案；

当所述答复类型为语义类型时，通过第一神经网络基于所述答复信息进行预测运算，得到所述问题的答案。

在其中一个实施例中，所述在所述答复信息中提取相应的编号信息，将所述编号信息与答案选项进行匹配包括：

在所述答复信息中提取编号信息；

获取所述问题中多个答案选项的排列顺序；

根据所述编号信息与所述排列顺序，识别与所述答复信息对应的答案选项。

在其中一个实施例中，所述通过第一神经网络基于所述答复信息进行预测运算包括：

在所述答复信息中提取与答案选项对应的关键词，生成每个关键词对应的一维向量；

对多个关键词对应的一维向量进行转换，得到第一向量矩阵；

通过第一神经网络基于所述第一向量矩阵进行预测预算，得到与所述答复信息对应的答案选项。

在其中一个实施例中，所述方法还包括：

获取多个问题的答案选项，对所述多个问题的答案选项进行拆分，得到多个选项词；

为每个选项词添加对应的同义词；

将多个选项词以及对应的同义词作为训练数据，通过所述训练数据对所述第一神经网络进行训练。

在其中一个实施例中，所述方法还包括：

当所述答复类型为数值抽取类型时，在所述答复信息中进行数值抽取，得到答复数值；

获取所述问题对应的动态规则，根据所述动态规则以及所述答复数值生成相应的正则表达式；

对所述正则表达式进行解析，得到与所述答复数值对应的度量单位；

将所述答复数值以及对应的度量单位作为所述问题的答案。

在其中一个实施例中，所述方法还包括：

在所述接收用户终端上传的问诊请求的步骤之后且在所述根据所述问诊请求为所述用户标识分配对应的医生的步骤之前，根据所述用户标识采集基本信息、历史信息以及主诉信息；

在将所述用户标识存入相应队列等待医生时，将通过问题采集到的答案标记为对应的症状信息；

对所述基本信息、历史信息、主诉信息以及症状信息进行向量化处理，得到第二向量矩阵；

通过第二神经网络基于所述第二向量矩阵进行预测运算，得到对应的拟诊建议数据；

将所述拟诊建议数据推送至医生终端。

一种在线问题归一化处理装置，所述装置包括：

通信模块，用于接收用户终端上传的问诊请求；所述问诊请求携带了用户标识；

分配模块，用于根据所述问诊请求为所述用户标识分配对应的医生；

排队模块，用于将所述用户标识存入相应队列等待医生；

所述通信模块还用于向所述用户终端返回相应的问题；接收用户终端上传的答复信息；

识别模块，用于识别所述答复信息对应的答复类型；当所述答复类型为编号类型时，在所述答复信息中提取相应的编号信息，将所述编号信息与答案选项进行匹配，得到所述问题的答案；当所述答复类型为语义类型时，通过第一神经网络基于所述答复信息进行预测运算，得到所述问题的答案。

在其中一个实施例中，所述识别模块还用于在所述答复信息中提取与答案选项对应的关键词，生成每个关键词对应的一维向量；对多个关键词对应的一维向量进行转换，得到第一向量矩阵；通过第一神经网络基于所述第一向量矩阵进行预测预算，得到与所述答复信息对应的答案选项。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。

上述在线问题归一化处理方法、装置、计算机设备和存储介质，当用户需要在线问诊时，可以通过用户终端上传问诊请求。服务器根据问诊请求为其分配相应的医生。通过将用户标识存入队列以便排队等待医生，在等待医生时，服务器可以向用户终端返回相应的问题，在接收到用户终端上传的答复信息之后，识别答复信息对应的答复类型。当答复类型为编号类型时，在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，以此得到问题的答案。当答复类型为语义类型时，通过第一神经网络基于答复信息进行预测运算，以此得到问题的答案。由于的不同答复类型的答复信息进行了不同的处理方式，通过将用户的答复信息归一化到答案选项，以此能够准确得到问题的答案。从而实现了在线问诊时有效提高用户回答与问题之间的匹配准确率。

附图说明

图1为一个实施例中在线问题归一化处理方法的应用场景图；

图2为一个实施例中在线问题归一化处理方法的流程示意图；

图3为一个实施例中数值抽取类型的匹配步骤的流程示意图；

图4为一个实施例中拟诊建议数据的生成步骤的流程示意图；

图5为一个实施例中在线问题归一化处理装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的在线问题归一化处理方法，可以应用于如图1所示的应用环境中。其中，用户终端102通过网络与服务器104进行通信。其中，用户终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当用户需要在线问诊时，可以通过用户终端102上传问诊请求。服务器104接收用户终端上传的问诊请求，为用户分配相应的医生。服务器104将用户标识存入相应队列，以便排队等待医生。在等待医生的间隙，服务器104向用户终端返回相应的问题，采集用户的症状信息。用户可以通过用户终端102将答复信息上传至服务器104。服务器104识别答复信息对应的答复类型。当答复类型为编号类型时，服务器104在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，得到问题的答案。当答复类型为语义类型时，服务器104通过第一神经网络基于答复信息进行预测运算，得到问题的答案。通过将用户的答复信息归一化到答案选项，以此能够准确得到问题的答案。

在一个实施例中，如图2所示，提供了一种在线问题归一化处理方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤202，接收用户终端上传的问诊请求；问诊请求携带了用户标识。

步骤204，根据问诊请求为用户标识分配对应的医生。

用户终端上安装了在线问诊的应用程序。在登录该应用程序之前，用户需要进行注册。注册信息中包含了用户标识、性别等基本信息。当用户希望在线咨询医生时，可以点击应用程序中的问诊按钮，生成问诊请求，通过应用程序向服务器发送问诊请求。服务器接收用户终端上传的问诊请求，为用户分配待就诊科室。服务器根据待就诊科室为用户分配相应的医生。

步骤206，将用户标识存入相应队列等待医生，向用户终端返回相应的问题。

医生通常在线接诊多位用户。当医生处于忙碌状态时，服务器可以将用户标识存入医生对应的队列。当医生接诊完上一位用户时，可以通过医生终端在队列中拉取相应的用户标识，对下一位用户进行在线问诊。

在用户等待医生排队时，服务器通过与科室对应的问题模板采集相应的症状信息。具体的，服务器获取与待就诊科室向对应的问题模板，问题模板中包括多个问题。服务器可以从问题模板中选择相应问题，将选中的问题发送至用户终端。用户可以通过用户终端将答复信息上传至服务器。

步骤208，接收用户终端上传的答复信息，识别答复信息对应的答复类型。

服务器接收用户终端上传的语音答复信息。其中，用户可以通过语音直接回答，答复信息可以是语音答复信息。当答复信息为语音答复信息时，服务器对语音答复信息进行转换，将语音答复信息转换为文本答复信息。服务器对文本答复信息进行识别，以便确定答复信息对应的答复类型。答复类型可以包括编号类型和语义类型。

步骤210，当答复类型为编号类型时，在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，得到问题的答案。

当答复信息中包含答案选项对应的编号信息时，服务器将答复信息识别为编号类型。编号可以是数字编号，也可以是字母编号。例如，问题：您的水肿在哪个部位呢？答案选项为：1.集中在小腿；2.整只脚；3.关节处。或者答案选项为：a.集中在一个部位；b.整只脚；c.关节处。当答复信息中包含了数字或者字母时，服务器将相应的答复信息识别为编号类型。服务器在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，由此将用户的答复信息归一化到答案选项，以此能够准确得到问题的答案。

步骤212，当答复类型为语义类型时，通过第一神经网络基于答复信息进行预测运算，得到问题的答案。

当答复信息不为编号类型时，如果答复信息中不包含数字或字母，且问题包括多个答案选项时，服务器将答复信息识别为语义类型。对答复信息进行特征选择，将选择出的每个特征转换为对应的一维向量，对多个特征对应的一维向量进行转换，得到第一向量矩阵。服务器调用第一神经网络，通过第一神经网络基于第一向量矩阵进行预测预算，得到与答复信息对应的答案选项。其中，第一神经网络可以是预先利用多个问题以及答案选项进行训练的。通过第一神经网络进行答案预测，能够有效提高用户回答与问题之间的匹配准确率。

例如，问题：您的水肿在哪个部位呢？答案选项为：1.集中在小腿；2.整只脚；3.关节处。答复信息为：水肿在关节处。那么服务器可以将该答复信息识别为语义类型。通过第一神经网络进行预测预设，可以得到该答复信息与第三个答案选项相符，该问题的答案即可确定为是第三个选项。

本实施例中，当用户需要在线问诊时，可以通过用户终端上传问诊请求。服务器根据问诊请求为其分配相应的医生。通过将用户标识存入队列以便排队等待医生，在等待医生时，服务器可以向用户终端返回相应的问题，在接收到用户终端上传的答复信息之后，识别答复信息对应的答复类型。当答复类型为编号类型时，服务器在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，以此得到问题的答案。当答复类型为语义类型时，通过第一神经网络基于答复信息进行预测运算，以此得到问题的答案。由于的不同答复类型的答复信息进行了不同的处理方式，通过将用户的答复信息归一化到答案选项，以此能够准确得到问题的答案。从而实现了在线问诊时有效提高用户回答与问题之间的匹配准确率。

在一个实施例中，在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配包括：在答复信息中提取编号信息；获取问题中多个答案选项的排列顺序；根据编号信息与排列顺序，识别与答复信息对应的答案选项。

当用户在回答问题时，回答的是问题的编号，例如，第一个、第一项、选a或者最后一个、倒数第二项等。当答复类型为编号类型时，服务器在答复信息中提取编号信息。编号信息中包括基数词、序数词以及字母等。其中，基数词可以是数字，如1、2、3等。序数词包括正向序数词，如第一、第二等，也包括逆向序数词，如最后一个、倒数第二等。字母可以是英文字母，如a、b、c等。服务器根据编号信息以及答案选项的排列顺序，识别出用户的回答所对应的答案选项，从而得到相应问题的答案。

问题的答案可以包括一个答案选项，也可以包括多个答案选项。当问题的答案包括一个选项时，服务器根据编号信息以及多个答案选项的排序顺序进行识别，从而识别出相匹配的答案选项。当问题的答案包括多个选项时，编号信息中可以包括多个编号，服务器对多个编号于多个答案选项分别进行识别，得到与每个编号相匹配的答案选项。

本实施例中，通过在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，由此将用户的答复信息归一化到答案选项，以此能够准确得到问题的答案。

在一个实施例中，通过第一神经网络基于答复信息进行预测运算包括：

在答复信息中提取与答案选项对应的关键词，生成每个关键词对应的一维向量；对多个关键词对应的一维向量进行转换，得到第一向量矩阵；通过第一神经网络基于第一向量矩阵进行预测预算，得到与答复信息对应的答案选项。

当答复信息不为编号类型时，如果答复信息中不包含数字或字母，且问题包括多个答案选项时，服务器将答复信息识别为语义类型。例如，问题：您的水肿在哪个部位呢？答案选项为：1.集中在小腿；2.整只脚；3.关节处。答复信息为：我的是关节水肿。那么服务器可以将该答复信息识别为语义类型。

对于语义类型的答复信息，服务器在答复信息中提取与答案选项对应的关键词。例如，上述答复信息的关键词包括“关节”、“水肿”。服务器对每个关键词进行编码，转换为一维向量，例如，可以采用one-hotencoder(独热编码)转换为一维向量。一维向量中只有一个值为1，其余都为0。例如，服务器可以通过one-hotencoder将“关节”转换化为[000000000100000000….00],服务器可以通过one-hotencoder将“水肿”转换为[0000…00000100000…..000]。

为了便于进行选项匹配，服务器可以将多个一维向量转换为相应的第一向量矩阵。例如，可以是将每个一维向量作为一行，按照答复信息中关键字出现的顺序，将多个一维向量组合，生成相应的第一向量矩阵。服务器调用第一神经网络，将第一向量矩阵作为第一神经网络的输入，通过第一神经网络进行预测运算，得到与答复信息对应的答案选项。

其中，第一神经网络可以是卷积神经网络，是预先通过对多个问题以及相应的答案选项进行训练所得到的。第一神经网络中包括卷积层、全连接层以及输出层。卷积层、全连接层以及输出层中包括多个神经元。神经元也就是深层神经网络模型中进行计算与存储的单元。卷积层、全连接层以及输出层的神经元数量各不相同。卷积层的神经元数量可以与每个输入类别的维度数量相同。输入类别的维度数量可以是输入类别对应的多维向量矩阵的维度数量。

第一神经网络是预先经过训练的。在其中一个实施例中，该方法还包括：获取多个问题的答案选项，对多个问题的答案选项进行拆分，得到多个选项词；为每个选项词添加对应的同义词；将多个选项词以及对应的同义词作为训练数据，通过训练数据对第一神经网络进行训练。

第一神经网络在训练之前，服务器需要获取相应的训练数据。为了有效提高第一神经网络的预测准确率，服务器需要获取到全面的训练数据。具体的，服务器获取多个问题的答案选项，对答案选项进行拆分，得到相应的选项词。服务器还可以根据选项词获取医学领域内相应的同义词。服务器利用多个选项词以及对应的同义词作为第一神经网络训练所需的训练数据。通过训练数据对第一神经网络进行训练。

例如，问题：宝宝有以下症状吗？1、腹胀；2、腹泻。选项：a:腹胀；b:腹泻；如果答复信息为“我宝宝有肚子胀的”，则通过第一神经网络进行预测后，可以得到a选项为本题的答案。

当答复类型为语义类型时，通过第一神经网络基于答复信息进行预测运算，能够准确用户对问题给出的答案。由此将用户的答复信息准确归一化到答案选项，提高了用户回答与问题之间的匹配准确率。

在一个实施例中，该方法还包括：数值抽取类型的匹配步骤，如图3所示，具体包括：

步骤302，当答复类型为数值抽取类型时，在答复信息中进行数值抽取，得到答复数值。

步骤304，获取问题对应的动态规则，根据动态规则以及答复数值生成相应的正则表达式。

步骤306，对正则表达式进行解析，得到与答复数值对应的度量单位。

步骤308，将答复数值以及对应的度量单位作为问题的答案。

有些问题不包含相应的选项，需要用户根据问题的内容进行答复。当答复信息中需要包含数值时，用户可以根据自身的情况进行答复。例如，问题1：您的血压是多少？用户可以根据情况输入自己的血压。由于血压的度量单位是毫米汞柱，即使用户仅仅回答130、80，那服务器也可以识别到用户的血压为130毫米汞柱、80毫米汞柱。服务器根据答复信息中的数值可以得知用户的血压情况。

但是在不同的情况下，同样的数值不同的度量单位，实际的区别很大。例如，问题2：年龄是多少？用户可以回答35。如果是在儿科，则可以认为是35个月的月龄。如果是在妇科，则认为是35岁。或者用户也可以回答是2010年出生的，还需要根据当前的就诊时间来计算相应的年龄。

为了能够对数值抽取类型的答复信息准确归一化到相应的答案。服务器可以采用动态规则对答复信息进行匹配。具体的，服务器在答复信息中抽取相应数值，得到答复数据。服务器根据问题获取对应的动态规则。动态规则是预先进行配置的，不同的问题所配置的动态规则可以是不同的。服务器根据动态规则以及答复数值生成相应的表达式。表达式可以有多种形式，例如，可以是正则表达式。服务器对正则表达式进行解析，得到与答复数值对应的度量单位。服务将答复数值以及对应的度量单位作为相应问题的答案。

通过对不同的问题配置不同的动态规则，由此对数值抽取类型的答复信息结合动态规则进行匹配，有效提高了用户回答与问题之间的匹配准确率。

进一步的，有些问题需要用户进行肯定答复或者否定答复。服务器可以识别答复信息中是否包含肯定信息或者否定信息，以便识别问题答案。例如，问题：您是否去过医院？用户的回答可以是开放式的。用户回答：是的，或者去过，或者yes，或者这次没去等。服务器在答复信息中提取肯定词或否定词，若提取到肯定词，则可以确定用户为肯定回答，若提取到否定词，则可以确定用户为否定回答。

由于性别对于医学判断是非常重要的，通常还会将性别问题单独列出。用户的回答依然可以是开放式的，除了男、女之外，还可以是男人、女人、男娃、女娃，甚至还可以是网络上比较流行的表示性别的词语，例如，小哥哥、小姐姐、仙女等。服务器可以预先采集与性别相关的词语，通过这些词语与答复信息进行匹配，以此识别用户的性别。

此外，考虑到可能存在一些用户不知道或不清楚情况，答案选项中还可以设置“不清楚”或“以上都无”等模糊内容。当用户回答之后，服务器可以利用上述模糊内容与答复信息进行匹配，若在答复信息中匹配到相应的内容，则根据匹配到的内容，确定问题答案。

在一个实施例中，该方法还包括：拟诊建议数据的生成步骤，如图4所示，具体包括：

步骤402，在接收用户终端上传的问诊请求之后且在根据问诊请求为用户标识分配对应的医生之前，根据用户标识采集基本信息、历史信息以及主诉信息。

步骤404，在将用户标识存入相应队列等待医生时，将通过问题采集到的答案标记为对应的症状信息。

步骤406，对基本信息、历史信息、主诉信息以及症状信息进行向量化处理，得到第二向量矩阵。

步骤408，通过第二神经网络基于第二向量矩阵进行预测运算，得到对应的拟诊建议数据。

步骤410，将拟诊建议数据推送至医生终端。

服务器接收到用户终端上传的问诊请求之后，根据用户标识通过多种方式采集相应的用户信息。所需采集的用户信息包括基本信息、历史信息、主诉信息以及症状信息等。其中，基本信息可以是用户注册应用程序时，通过用户终端上传至服务器的信息，包括：年龄、性别等。历史信息包括用户通过应用程序进行在线问诊的历史记录、历史主诉信息、历史拟诊结果、历史处方以及在诊疗机构的历史诊疗记录等。主诉信息是用户主动描述的反映当前症状的信息。症状信息是用户根据服务器或医生终端的提问所描述的反映当前症状以及近期身体状况的信息。

具体的，在接收到问诊请求之后，服务器即可根据用户标识采集基本信息和历史信息。在对用户标识分配医生之前，服务器采集与用户标识对应的主诉信息。在用户标识等待医生排队时，服务器通过与科室对应的问题模板采集相应的症状信息。服务器在用户终端与医生终端建立通信之后，通过医生终端继续补充采集相应的症状信息。

服务器对收集到的基本信息、历史信息、主诉信息以及症状信息等用户信息进行预处理。预处理包括：分词、去停用词、繁转简等。服务器在在预处理后的用户信息中进行特征选择，得到多个特征。服务器将选择出的每个特征转换为对应的一维向量，通过词向量模型对多个特征对应的一维向量进行转换，得到与用户标识对应的第二向量矩阵。

服务器调用第二神经网络，第二神经网络可以采用多层循环神经网络，多层循环神经网络中的多层隐含层可以是2层、4层或者6层等。第二神经网络可以是基于icd-10(internationalclassificationofdiseases，国际疾病分类第10次修订本)作为训练数据，预先进行训练好的。第二神经网络基于多维向量矩阵进行预测运算，得到相应的拟诊分类概率。拟诊分类概率可以是拟诊的疾病类型所对应的概率。服务器对预测出的拟诊分类概率进行筛选，根据筛选出的拟诊分类概率，利用相应拟诊疾病类型生成对应的拟诊建议数据。服务器将至少一个拟诊建议数据发送至医生终端。医生可以通过医生终端在拟诊建议数据中选择一个与用户症状最接近的，作为最终的拟诊结果发送至用户终端。

通过对用户的基本信息、历史信息、主诉信息以及症状信息进行采集，能够对用户的症状进行全面覆盖，通过第二神经网络可以对多种用户信息进行综合预测运算，从而能够有效提高拟诊建议数据的准确性。为医生进行快速有效的诊断提供了便利。

应该理解的是，虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种在线问题归一化处理装置，包括：通信模块502、分配模块504、排队模块506和识别模块508，其中：

通信模块502，用于接收用户终端上传的问诊请求；问诊请求携带了用户标识。

分配模块504，用于根据问诊请求为用户标识分配对应的医生。

排队模块506，用于将用户标识存入相应队列等待医生。

通信模块502还用于向用户终端返回相应的问题；接收用户终端上传的答复信息。

识别模块508，用于识别答复信息对应的答复类型；当答复类型为编号类型时，在答复信息中提取相应的编号信息，将编号信息与答案选项进行匹配，得到问题的答案；当答复类型为语义类型时，通过第一神经网络基于答复信息进行预测运算，得到问题的答案。

在一个实施例中，识别模块还用于在答复信息中提取与答案选项对应的关键词，生成每个关键词对应的一维向量；对多个关键词对应的一维向量进行转换，得到第一向量矩阵；通过第一神经网络基于第一向量矩阵进行预测预算，得到与答复信息对应的答案选项。

在一个实施例中，在答复信息中提取相应的编号信息，识别模块还用于在答复信息中提取编号信息；获取问题中多个答案选项的排列顺序；根据编号信息与排列顺序，识别与答复信息对应的答案选项。

在一个实施例中，该装置还包括训练模块，用于获取多个问题的答案选项，对多个问题的答案选项进行拆分，得到多个选项词；为每个选项词添加对应的同义词；将多个选项词以及对应的同义词作为训练数据，通过训练数据对第一神经网络进行训练。

在一个实施例中，识别模块还用于当答复类型为数值抽取类型时，在答复信息中进行数值抽取，得到答复数值；获取问题对应的动态规则，根据动态规则以及答复数值生成相应的正则表达式；对正则表达式进行解析，得到与答复数值对应的度量单位；将答复数值以及对应的度量单位作为问题的答案。

在一个实施例中，该装置还包括拟诊模块，用于在接收到问诊请求之后，在对用户标识分配医生之前，根据用户标识采集基本信息、历史信息以及主诉信息；在将用户标识存入相应队列等待医生时，将通过问题采集到的答案标记为对应的症状信息；对基本信息、历史信息、主诉信息以及症状信息进行向量化处理，得到第二向量矩阵；通过第二神经网络基于第二向量矩阵进行预测运算，得到对应的拟诊建议数据；将拟诊建议数据推送至医生终端。

关于在线问题归一化处理装置的具体限定可以参见上文中对于在线问题归一化处理方法的限定，在此不再赘述。上述在线问题归一化处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基本信息、历史信息、主诉信息以及症状信息以及采集症状信息的问题等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种在线问题归一化处理方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现上述各个方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述各个方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高羽;柳恭;葛培明
技术所有人：平安医疗科技有限公司;平安健康互联网股份有限公司
我是此专利的发明人

上一篇：需求选择及传达系统的制作方法
上一篇：一种泡罩药品包装的远程监控方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。