语句处理方法、系统和电子设备与流程

文档序号：20030077发布日期：2020-02-28 10:16阅读：163来源：国知局

本公开涉及计算机
技术领域：
，更具体地，涉及一种语句处理方法、系统和电子设备。
背景技术：
：随着电子商务的发展，电子商务平台承担了有关商品的售后需求，但随着业务的发展、用户线上购物数量的增多，传统的人工客服模式已难以适应海量电商用户的售后需求，同时也给企业带来了巨大的人力成本负担。为解决该现象，基于语音对话性质的导购服务应运而生，即引入对话生成系统(dialoguegenerationsystem)，通过训练机器学习模型来更准确的捕捉用户的购物需求，同时动态理解用户的需求变化，以模拟自然人的对话方式，引导和帮助用户完成在电商网站上的购物行为以及完善各类售后服务。在实现本发明的过程中，发明人发现现有技术中至少存在以下问题：现有的对话生成模型，由于缺乏关于对话内容的背景知识，无法有效生成相应答复，或者经常生成与对话内容不相关的万能答复，例如“哈哈”、“我不知道”，阻碍提升对话生成系统的效率。技术实现要素：有鉴于此，本公开提供了一种语句处理方法、系统和电子设备。本公开的一个方面提供了一种语句处理方法，包括确定待处理语句的向量表示，将所述待处理语句的向量表示输入至第一循环神经网络，更新所述第一循环神经网络的隐含层状态作为历史对话的向量表示，其中，若存在已处理语句，所述第一循环神经网络的隐含层状态与所述已处理语句相关，确定与所述待处理语句相关的知识向量，基于所述历史对话的向量表示以及所述知识向量，生成答复语句。根据本公开的实施例，所述确定所述待处理语句的向量表示包括，将所述待处理语句中的词转化为词向量，将所述词向量有序输入至第二循环神经网络，获得所述第二循环神经网络的隐含层状态作为所述待处理语句的向量表示，其中，所述第二循环神经网络的隐含层状态与已处理语句无关。根据本公开的实施例，所述确定与所述待处理语句相关的知识向量包括，确定与所述待处理语句相关的多个候选条目，确定所述候选条目的候选条目向量，确定各个所述候选条目向量与所述待处理语句的向量表示之间的相关度系数，以及基于所述相关度系数以及所述候选条目向量，确定知识向量。根据本公开的实施例，所述确定与所述待处理语句相关的知识向量包括，确定与所述待处理语句相关的多个候选条目，确定所述候选条目的候选条目向量，确定各个所述候选条目向量与所述历史对话的向量表示之间的相关度系数，以及基于所述相关度系数以及所述候选条目向量，确定知识向量。根据本公开的实施例，所述确定与所述待处理语句相关的多个候选条目包括以下至少一种，确定与所述待处理语句匹配的候选条目，确定与所述待处理语句中的实体内容相似的候选条目，或者，在存在已处理语句的情况下，确定与所述已处理语句相关的候选条目。根据本公开的实施例，所述方法还包括，在所述候选条目的数量超过预设数量的情况下，忽略部分候选条目。根据本公开的实施例，所述基于所述历史对话的向量表示以及所述知识向量，生成答复语句包括，将所述历史对话的向量表示、所述知识向量以及前一次预测的词的词向量输入至第三循环神经网络，基于所述第三循环神经网络的隐含层状态确定当前预测词，并循环执行上述操作直至生成完整的答复语句，其中，所述第三循环神经网络的隐含层状态与已处理语句无关，在不存在前一次预测的词的情况下，将默认起始符作为前一次预测的词。本公开的另一个方面提供了一种语句处理系统，包括待处理语句向量确定模块、历史对话向量确定模块、知识向量确定模块以及答复语句生成模块。待处理语句向量确定模块，用于确定待处理语句的向量表示。历史对话向量确定模块，用于将所述待处理语句的向量表示输入至第一循环神经网络，更新所述第一循环神经网络的隐含层状态作为历史对话的向量表示，其中，若存在已处理语句，所述第一循环神经网络的隐含层状态与所述已处理语句相关。知识向量确定模块，用于确定与所述待处理语句相关的知识向量。答复语句生成模块，用于基于所述历史对话的向量表示以及所述知识向量，生成答复语句。根据本公开的实施例，所述待处理语句向量确定模块包括词向量转化子模块和待处理语句向量确定子模块。词向量转化子模块，用于将所述待处理语句中的词转化为词向量。待处理语句向量确定子模块，用于将所述词向量有序输入至第二循环神经网络，获得所述第二循环神经网络的隐含层状态作为所述待处理语句的向量表示，其中，所述第二循环神经网络的隐含层状态与已处理语句无关。根据本公开的实施例，所述知识向量确定模块包括候选条目确定子模块、候选条目向量确定子模块、相关度系数确定子模块以及知识向量确定子模块。候选条目确定子模块，用于确定与所述待处理语句相关的多个候选条目。候选条目向量确定子模块，用于确定所述候选条目的候选条目向量。相关度系数确定子模块，用于确定各个所述候选条目向量与所述待处理语句的向量表示之间的相关度系数，或者，确定各个所述候选条目向量与所述历史对话的向量表示之间的相关度系数。知识向量确定子模块，用于基于所述相关度系数以及所述候选条目向量，确定知识向量。根据本公开的实施例，所述候选条目确定子模块包括第一确定单元、第二确定单元或者第三确定单元中的至少一种。第一确定单元，用于确定与所述待处理语句匹配的候选条目。第二确定单元，用于确定与所述待处理语句中的实体内容相似的候选条目。第三确定单元，用于在存在已处理语句的情况下，确定与所述已处理语句相关的候选条目。根据本公开的实施例，所述系统还包括忽略子模块，用于在所述候选条目的数量超过预设数量的情况下，忽略部分候选条目。根据本公开的实施例，所述答复语句生成模块包括循环子模块，用于将所述历史对话的向量表示、所述知识向量以及前一次预测的词的词向量输入至第三循环神经网络，基于所述第三循环神经网络的隐含层状态确定当前预测词，并循环执行上述操作直至生成完整的答复语句，其中，所述第三循环神经网络的隐含层状态与已处理语句无关，在不存在前一次预测的词的情况下，将默认起始符作为前一次预测的词。本公开的另一个方面提供了一种电子设备，包括，至少一个处理器以及至少一个存储器，用于存储一个或多个计算机可读指令，其中，当所述一个或多个计算机可读指令被所述至少一个处理器执行时，使得所述处理器执行如上所述的方法。本公开的另一个方面提供了一种计算机可读介质，其上存储有计算机可读指令，该指令被执行时使处理器执行如上所述的方法。本公开的另一方面提供了一种计算机程序，所述计算机程序包括计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。该方法能够利用知识向量弥补缺乏背景知识的不足，从而能够生成更好的答复语句，避免无意义的答复，提高用户体验。附图说明通过以下参照附图对本公开实施例的描述，本公开的上述以及其他目的、特征和优点将更为清楚，在附图中：图1示意性示出了根据本公开实施例的语句处理方法的应用场景；图2示意性示出了根据本公开实施例的语句处理方法的流程图；图3示意性示出了根据本公开实施例的确定待处理语句的向量表示的流程图；图4示意性示出了根据本公开实施例的确定与所述待处理语句相关的知识向量的流程图；图5示意性示出了根据本公开实施例的语句处理系统的框图；图6示意性示出了根据本公开实施例的待处理语句向量确定模块的框图；图7示意性示出了根据本公开实施例的知识向量确定模块的框图；图8示意性示出了根据本公开实施例的候选条目向量确定子模块的框图；图9示意性示出了根据本公开另一实施例的知识向量确定模块的框图；图10示意性示出了根据本公开实施例的答复语句生成模块的框图；以及图11示意性示出了根据本公开实施例的适于实现语句处理方法和系统的计算机系统的方框图。具体实施方式以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。在使用类似于“a、b和c等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。本领域技术人员还应理解，实质上任意表示两个或更多可选项目的转折连词和/或短语，无论是在说明书、权利要求书还是附图中，都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如，短语“a或b”应当被理解为包括“a”或“b”、或“a和b”的可能性。本公开的实施例提供了一种语句处理方法，包括确定待处理语句的向量表示，将所述待处理语句的向量表示输入至第一循环神经网络，更新所述第一循环神经网络的隐含层状态作为历史对话的向量表示，其中，若存在已处理语句，所述第一循环神经网络的隐含层状态与所述已处理语句相关，确定与所述待处理语句相关的知识向量，基于所述历史对话的向量表示以及所述知识向量，生成答复语句。图1示意性示出了根据本公开实施例的语句处理方法的应用场景。如图1所示，用户a可以与对话生成系统b对话。用户a输入语句“泰坦尼克号的导演是谁？”，对话生成系统b可以生成“詹姆斯·卡梅隆。”的答复语句，当用户a继续提问“有没有类似的电影？”时，对话生成系统b可以生成诸如“海神号，一部典型的海洋电影”的答复语句。在现有技术中，对话生成系统可以通过神经网络实现，通过大量语料的训练，能够掌握一定的背景知识，从而能够在一些情况下，生成令人满意的答复语句。然而，如果遇到没有训练过的内容，就难以生成符合要求的答复语句。因此，若要提高对话生成系统的知识量，则需要不断对其进行训练，如此可能产生过度训练的问题，仍然不能得到令人满意的结果。为此，本公开实施例提供了一种基于知识库的对话生成系统，能够在不训练知识内容的情况下，从知识库抓取所需要的知识，以解决上述问题。图2示意性示出了根据本公开实施例的语句处理方法的流程图。如图2所示，该方法包括操作s210～s240。在操作s210，确定待处理语句的向量表示。在操作s220，将所述待处理语句的向量表示输入至第一循环神经网络，更新所述第一循环神经网络的隐含层状态作为历史对话的向量表示，其中，若存在已处理语句，所述第一循环神经网络的隐含层状态与所述已处理语句相关。在操作s230，确定与所述待处理语句相关的知识向量。在操作s240，基于所述历史对话的向量表示以及所述知识向量，生成答复语句。该方法能够利用知识向量弥补缺乏背景知识的不足，从而能够生成更好的答复语句，避免无意义的答复，提高用户体验。下面参考图3，对本公开实施例的操作s210进行介绍。图3示意性示出了根据本公开实施例的确定待处理语句的向量表示的流程图。如图3所示，该方法包括操作s310和s320。在操作s310，将所述待处理语句中的词转化为词向量。可以通过某种算法进行该转换，例如可以是cbow(continuousbag-of-wordmodel)，也可以是其他的算法。通过这种方式，不同的词被转换成不同的词向量，而且语义相近的词，其转化后的词向量具有相似性。在操作s320，将所述词向量有序输入至第二循环神经网络，获得所述第二循环神经网络的隐含层状态作为所述待处理语句的向量表示，其中，所述第二循环神经网络的隐含层状态与已处理语句无关。根据本公开实施例，该第二循环神经网络也可称为编码器循环神经网络，用于将待处理语句转化为向量的形式。该神经网络每次处理新的待处理语句时，会将隐含层初始化，以保证各语句之间不会互相影响性，保证转化的独立性。根据本公开实施例，该方法首先对待处理语句分词，然后将各个词转化为词向量，按照顺序，将各个词向量依次输入初始化后的第二循环神经网络，每次输入后，第二循环神经网络的隐含层被更新，直至最后一个词向量处理完毕后，取第二循环神经网络的隐含层状态作为所述待处理语句的向量表示。返回参考图2。在操作s220，根据本公开实施例，该第一循环神经网络也可称为文本循环神经网络，用于引用已处理语句，获得历史对话的向量表示。每一次处理待处理语句时，将所述待处理语句的向量表示输入到第一循环神经网络中，更新所述第一循环神经网络的隐含层状态。例如，在获得“泰坦尼克号的导演是谁？”的待处理语句时，将与其对应的向量表示输入到第一循环神经网络中，更新所述第一循环神经网络的隐含层状态，暂且将其称为第一隐含层状态；在获得“有没有类似的电影？”时，第一循环神经网络中的隐含层状态为第一隐含层状态，此时将与“有没有类似的电影？”对应的向量表示输入到该第一循环神经网络中，将所述第一循环神经网络的隐含层状态由第一隐含层状态更新为第二隐含层状态，其中，第一隐含层状态作为处理“泰坦尼克号的导演是谁？”的待处理语句时的历史对话的向量表示，第二隐含层状态作为处理“有没有类似的电影？”的待处理语句时的历史对话的向量表示。该神经网络在处理各个待处理语句之间，不会初始化隐含层，使得生成答复语句时能够参考已处理语句中的信息。下面参考图4，对本公开实施例的操作s230进行介绍。图4示意性示出了根据本公开实施例的确定与所述待处理语句相关的知识向量的流程图。如图4所示，该方法包括操作s410～s440。在操作s410，确定与所述待处理语句相关的多个候选条目。根据本公开的实施例，s410可以包括以下几种实施方式，下面分别进行介绍。根据本公开的实施例，所述确定与所述待处理语句相关的多个候选条目包括确定与所述待处理语句匹配的候选条目。例如，“泰坦尼克号的导演是谁？”的待处理语句，可以提取实体内容“泰坦尼克号”，并基于该实体内容在知识库中搜索相关的候选条目，参见表1。由于待处理语句中包含“导演”，所以其中关于“泰坦尼克号”的导演的候选条目的得分较高。表1实体关系实体得分泰坦尼克号--0.001泰坦尼克号发布时间19970.001泰坦尼克号导演詹姆斯·卡梅隆1泰坦尼克号演员莱昂纳多·迪卡普里奥0.001泰坦尼克号演员凯特·温丝莱特0.001泰坦尼克号演员比利·赞恩0.001……………………根据本公开的实施例，所述确定与所述待处理语句相关的多个候选条目包括确定与所述待处理语句中的实体内容相似的候选条目。该方法基于待处理语句的实体内容进行扩展，能够获得更多相关背景知识。例如，关于“泰坦尼克号”的相似的候选条目如表2所示。表2实体得分…………断魂蓝桥0.1恶童日记0.05海神号0.15生化危机0.001…………根据本公开的实施例，所述确定与所述待处理语句相关的多个候选条目包括，在存在已处理语句的情况下，确定与所述已处理语句相关的候选条目。该方法能够一定程度上保有已处理语句的候选条目，使知识向量带有一定的记忆性。例如，在获得“有没有类似的电影？”的待处理语句时，可以保留前一次获得的候选条目，例如与“泰坦尼克号”有关的候选条目，也可以基于前一次采用的内容进行搜索，例如搜索与“詹姆斯·卡梅隆”有关的候选条目。表3示意性地示出了在处理“有没有类似的电影？”时获得的多个候选条目。表3实体关系实体得分泰坦尼克号--0.75詹姆斯·卡梅隆--0.05泰坦尼克号发布时间19970.001泰坦尼克号导演詹姆斯·卡梅隆0.001泰坦尼克号演员莱昂纳多·迪卡普里奥0.001泰坦尼克号演员凯特·温丝莱特0.001……………………类似地，也可以与实体内容相似的候选条目，参见表4。表4实体得分…………断魂蓝桥0.85恶童日记0.45海神号0.95生化危机0.05…………由此，可以生成如图1所示的“海神号，一部典型的海洋电影”的答复语句。根据本公开的实施例，所述方法还包括，在所述候选条目的数量超过预设数量的情况下，忽略部分候选条目。该方法可以在获得的候选条目的数量较多的情况下，提高处理效率。例如，可以设定预设数量n，当候选条目的数量超过预设数量n时，取得分最高的前n个候选条目，而忽略其他候选条目，其中，得分为获得候选条目时确定的与当前语境的关联性的得分。返回参考图4。在操作s420，确定所述候选条目的候选条目向量。在操作s430，确定各个所述候选条目向量与所述待处理语句的向量表示之间的相关度系数，或者，确定各个所述候选条目向量与所述历史对话的向量表示之间的相关度系数。例如，可以通过余弦相似度的方法计算两个向量之间的相关度系数。此处，可以计算候选条目向量与所述待处理语句的向量表示之间的相关度系数，也可以计算候选条目向量与所述历史对话的向量表示之间的相关度系数。在操作s440，基于所述相关度系数以及所述候选条目向量，确定知识向量。例如，采用相关度系数与候选条目向量分别相乘然后求和的方式，确定知识向量。该方法基于相关度系数处理候选条目向量，生成的知识向量更具针对性。返回参考图2。根据本公开的实施例，在操作s240，所述基于所述历史对话的向量表示以及所述知识向量，生成答复语句包括，将所述历史对话的向量表示、所述知识向量以及前一次预测的词的词向量输入至第三循环神经网络，基于所述第三循环神经网络的隐含层状态确定当前预测词，并循环执行上述操作直至生成完整的答复语句，其中，所述第三循环神经网络的隐含层状态与已处理语句无关，在不存在前一次预测的词的情况下，将默认起始符作为前一次预测的词。根据本公开实施例，该第三循环神经网络也可称为解码器循环神经网络，用于根据历史对话的向量表示和知识向量生成答复语句。该神经网络每次处理新的待处理语句时，可以将隐含层初始化，使输出不受已处理语句的干扰。根据本公开实施例，该方法首先将默认起始符、历史对话的向量表示以及知识向量的拼接输入到第三循环神经网络中，更新第三循环神经网络的隐含层状态，将其作为答复语句的第一个词的词向量；然后将答复语句的第一个词的词向量、历史对话的向量表示以及知识向量的拼接输入到第三循环神经网络中，更新第三循环神经网络的隐含层状态，将其作为答复语句的第二个词的词向量；……以此类推，直至生成答复语句中所有的词向量，将词向量转化为自然语言即可生成答复语句。图5示意性示出了根据本公开实施例的语句处理系统500的框图。如图5所示，该语句处理系统500包括待处理语句向量确定模块510、历史对话向量确定模块520、知识向量确定模块530以及答复语句生成模块540。待处理语句向量确定模块510，例如执行上文参考图2描述的操作s210，用于确定待处理语句的向量表示。历史对话向量确定模块520，例如执行上文参考图2描述的操作s220，用于将所述待处理语句的向量表示输入至第一循环神经网络，更新所述第一循环神经网络的隐含层状态作为历史对话的向量表示，其中，若存在已处理语句，所述第一循环神经网络的隐含层状态与所述已处理语句相关。知识向量确定模块530，例如执行上文参考图2描述的操作s230，用于确定与所述待处理语句相关的知识向量。答复语句生成模块540，例如执行上文参考图2描述的操作s240，用于基于所述历史对话的向量表示以及所述知识向量，生成答复语句图6示意性示出了根据本公开实施例的待处理语句向量确定模块510的框图。如图6所示，该待处理语句向量确定模块510包括词向量转化子模块610和待处理语句向量确定子模块620。词向量转化子模块610，例如执行上文参考图3描述的操作s310，用于将所述待处理语句中的词转化为词向量。待处理语句向量确定子模块620，例如执行上文参考图3描述的操作s320，用于将所述词向量有序输入至第二循环神经网络，获得所述第二循环神经网络的隐含层状态作为所述待处理语句的向量表示，其中，所述第二循环神经网络的隐含层状态与已处理语句无关。图7示意性示出了根据本公开实施例的知识向量确定模块530的框图。如图7所示，该知识向量确定模块530包括候选条目确定子模块710、候选条目向量确定子模块720、相关度系数确定子模块730以及知识向量确定子模块740。候选条目确定子模块710，例如执行上文参考图4描述的操作s410，用于确定与所述待处理语句相关的多个候选条目。候选条目向量确定子模块720，例如执行上文参考图4描述的操作s420，用于确定所述候选条目的候选条目向量。相关度系数确定子模块730，例如执行上文参考图4描述的操作s430，用于确定各个所述候选条目向量与所述待处理语句的向量表示之间的相关度系数，或者，确定各个所述候选条目向量与所述历史对话的向量表示之间的相关度系数。知识向量确定子模块740，例如执行上文参考图4描述的操作s440，用于基于所述相关度系数以及所述候选条目向量，确定知识向量。图8示意性示出了根据本公开实施例的候选条目向量确定子模块720的框图。如图8所示，该候选条目确定子模块720包括第一确定单元810、第二确定单元820或者第三确定单元830中的至少一种。第一确定单元810，用于确定与所述待处理语句匹配的候选条目。第二确定单元820，用于确定与所述待处理语句中的实体内容相似的候选条目。第三确定单元830，用于在存在已处理语句的情况下，确定与所述已处理语句相关的候选条目。图9示意性示出了根据本公开另一实施例的知识向量确定模块900的框图。如图9所示，该知识向量确定模块900在图7所示意的实施例的基础上，还包括忽略子模块910，用于在所述候选条目的数量超过预设数量的情况下，忽略部分候选条目。图10示意性示出了根据本公开实施例的答复语句生成模块540的框图。如图10所示，该答复语句生成模块540包括循环子模块1010，用于将所述历史对话的向量表示、所述知识向量以及前一次预测的词的词向量输入至第三循环神经网络，基于所述第三循环神经网络的隐含层状态确定当前预测词，并循环执行上述操作直至生成完整的答复语句，其中，所述第三循环神经网络的隐含层状态与已处理语句无关，在不存在前一次预测的词的情况下，将默认起始符作为前一次预测的词。根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic)，或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。例如，待处理语句向量确定模块510、历史对话向量确定模块520、知识向量确定模块530、答复语句生成模块540、词向量转化子模块610、待处理语句向量确定子模块620、候选条目确定子模块710、候选条目向量确定子模块720、相关度系数确定子模块730、知识向量确定子模块740、第一确定单元810、第二确定单元820、第三确定单元、忽略子模块910以及循环子模块1010中的任意多个可以合并在一个模块中实现，或者其中的任意一个模块可以被拆分成多个模块。或者，这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合，并在一个模块中实现。根据本公开的实施例，待处理语句向量确定模块510、历史对话向量确定模块520、知识向量确定模块530、答复语句生成模块540、词向量转化子模块610、待处理语句向量确定子模块620、候选条目确定子模块710、候选条目向量确定子模块720、相关度系数确定子模块730、知识向量确定子模块740、第一确定单元810、第二确定单元820、第三确定单元、忽略子模块910以及循环子模块1010中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及同件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，待处理语句向量确定模块510、历史对话向量确定模块520、知识向量确定模块530、答复语句生成模块540、词向量转化子模块610、待处理语句向量确定子模块620、候选条目确定子模块710、候选条目向量确定子模块720、相关度系数确定子模块730、知识向量确定子模块740、第一确定单元810、第二确定单元820、第三确定单元、忽略子模块910以及循环子模块1010中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。图11示意性示出了根据本公开实施例的适于实现语句处理方法和系统的计算机系统的方框图。图11示出的计算机系统仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。图11示出的计算机系统可以实现为服务器集群，包括至少一个处理器(例如处理器1101)以及至少一个存储器(例如存储部分1108)。如图11所示，根据本公开实施例的计算机系统1100包括处理器1101，其可以根据存储在只读存储器(rom)1102中的程序或者从存储部分1108加载到随机访问存储器(ram)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(asic))，等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。在ram1103中，存储有系统1100操作所需的各种程序和数据。处理器1101、rom1102以及ram1103通过总线1104彼此相连。处理器1101通过执行rom1102和/或ram1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除rom1102和ram1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。根据本公开的实施例，系统1100还可以包括输入/输出(i/o)接口1105，输入/输出(i/o)接口1105也连接至总线1104。系统1100还可以包括连接至i/o接口1105的以下部件中的一项或多项：包括键盘、鼠标等的输入部分1106；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1107；包括硬盘等的存储部分1108；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至i/o接口1105。可拆卸介质1111，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1110上，以便于从其上读出的计算机程序根据需要被安装入存储部分1108。根据本公开的实施例，根据本公开实施例的方法流程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1109从网络上被下载和安装，和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时，执行本公开实施例的系统中限定的上述功能。根据本公开的实施例，上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。本公开还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。根据本公开的实施例，计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线、光缆、射频信号等等，或者上述的任意合适的组合。例如，根据本公开的实施例，计算机可读介质可以包括上文描述的rom1102和/或ram1103和/或rom1102和ram1103以外的一个或多个存储器。附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。以上对本公开的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本公开的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本公开的范围之内。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈宏申;刘舒曼;任昭春;殷大伟;赵一鸿
技术所有人：北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。