信息处理方法及装置的制造方法_2

文档序号：9865746阅读：来源：国知局

提供第一答案而导致用户不满意的情况再次发生，提升用户的体验。
[0042]为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。
[0043]本发明实施例提供了一种信息处理方法，参照图1，以下通过具体步骤进行详细说明。
[0044]步骤SlOl，获取问答日志数据。
[0045]在具体实施中，问答日志数据可以包括多条问答日志，一条问答日志可以包括一次会话过程中用户与智能问答系统或人工客服系统的全部会话内容。会话内容可以包括用户请求信息以及对应的答案信息，用户请求信息可以包括用户在会话窗口中输入的信息，例如，用户向智能问答系统或人工客服系统提出的问题;对应的答案信息可以包括智能问答系统或人工客服系统针对用户提出的问题所做出的回答。
[0046]在本发明实施例中，用户请求信息至少包括第一问题。相应地，答案信息中至少包括与第一问题对应的第一答案。
[0047]例如，在一次会话过程中，用户向智能问答系统提问“我当前还有多少余额?”，智能问答系统回复“您当前余额为500元”，则第一问题为“我当前还有多少余额?”，对应的第一答案为“您当前余额为500元”。
[0048]问答日志数据可以保存在智能问答系统或人工客服系统对应的服务器中。运行维护人员可以定期从服务器中获取某一时间段内的所有问答日志数据。例如，运行维护人员每天凌晨I: 00，从服务器中获取昨天0:00?今天0:00内的所有问答日志数据。
[0049]在获取到问答日志数据后，可以执行步骤S102。
[0050]步骤S102，当所述用户请求信息还包括反馈信息时，对所述反馈信息进行情感分析，获取用户对所述第一答案的情感信息。
[0051 ]在实际应用中，用户在与智能问答系统或者人工客服系统进行会话时，在获知自己想要咨询的问题的答案后，可能会针对智能问答系统或者人工客服系统回复的答案给出自己的反馈。例如，用户在会话窗口中输入针对回复的答案的反馈信息。用户在会话窗口中输入的反馈信息可以是用户请求信息中的一部分，也就是说，用户请求信息可以包括用户输入的想要咨询的问题以及针对回复的答案输入的反馈信息。
[0052]例如，用户向智能问答系统提问“我当前还有多少余额?”，智能问答系统回复“您当前余额为500元”，则第一问题为“我当前还有多少余额?”，对应的第一答案为“您当前余额为500元”。用户在获知自己的余额后，继续在会话窗口中输入“好的，我知道了，谢谢啊”之类的反馈信息。本次会话中，用户请求信息包括“我当前还有多少余额?”、“好的，我知道了，谢谢啊”等信息。
[0053]用户在获知自己想要咨询的问题的答案后，也可能不在会话窗口中输入信息，直接关闭会话窗口，结束本次会话。在这种情况下，本次会话中，用户请求信息只包括用户输入的想要咨询的问题。
[0054]继续参照上述实例，用户在获知自己的余额后，关闭会话窗口，结束本次会话，则本次会话中，用户请求信息只包括“我当前还有多少余额?”。
[0055]也就是说，在会话过程中，用户有可能会针对回复的答案输入反馈信息，也有可能没有输入反馈信息。
[0056]因此，在本发明实施例中，可以先判断每一条问答日志中的用户请求信息是否包括反馈信息，该反馈信息为用户针对第一答案所反馈的信息。当用户请求信息中包括反馈信息时，可以对反馈信息进行情感分析，以获取用户对第一答案的情感信息。
[0057]在具体实施中，反馈信息可以是文本格式的，例如，用户通过键盘输入的反馈文本。反馈信息也可以是语音格式的，例如，用户通过麦克风输入的语音。反馈信息还可以是图片格式的，例如，用户选择表情图片作为反馈信息。
[0058]在本发明一实施例中，当反馈信息为文本格式时，采用如下步骤对反馈信息进行情感分析:
[0059]S21，根据反馈信息中的标点符号对反馈信息进行分段。
[0060]通常情况下，反馈信息为文本格式时，文本中可能会出现一些标点符号，例如逗号、句号、问号、感叹号等等，可以按照标点符号对反馈信息进行分段处理。
[0061 ]例如，用户输入的反馈信息为“好的，谢谢啊，再见”，则可以根据标点符号将用户输入的反馈信息分成“好的”、“谢谢啊”、“再见”三个分段。
[0062]S22，将各个分段与情感值词典进行匹配，获取各个分段各自对应的情感值。
[0063]在具体实施中，可以预先定义不同的情感值词典，包括以下四种类型情感词典:权值词典、负面词词典、程度词词典以及姓氏词典。以权值词典为主，负面词词典、程度词词典以及姓氏词典为辅助词典对分段进行情感值匹配。对权值词典的匹配拥有最高优先级，其次为负面词词典和程度词词典，姓氏词典用作特殊用途，在匹配权值词典后进行姓名排除。
[0064]将所有分段匹配的结果按顺序存储，作为中间结果。对中间结果进行处理，分析所有可能出现的句式结果，选取最优结果。选取最优结果的方法为挑选最佳句式匹配的方法，对于句式相近的多结果匹配，则根据程度词与情感词之间的距离判断，获取距离最小的一种句式作为结果。利用权值词典、负面词词典以及程度词词典中的情感值和权重，进行情感值计算。
[0065]根据情感值匹配结果，对分段的情感词赋值。根据中文句法构成，分析分段的组成结构，将负面词、权重词以及情感词进行排列以进行情感值计算，从而获取各个分段对应的情感值。
[0066]S23，将各个分段的情感值相加，得到所述反馈信息的情感值。
[0067]在获取到各个分段各自对应的情感值之后，可以将各个分段对应的情感值相加，得到的和值即可作为反馈信息的情感值。
[0068]S24，将反馈信息的情感值分别与预设的贬义情感阈值以及褒义情感阈值进行比较，以确定反馈信息的情感信息。
[0069]例如，贬义情感阈值为X1，褒义情感阈值为X2，且X2> X1。当反馈信息的情感值Xo小于或等于贬义情感阈值Xdt，判定反馈信息的情感信息为贬义；当反馈信息的情感值Xo大于或等于褒义情感阈值X2时，判定反馈信息的情感信息为褒义；当反馈信息的情感值Xo处于X1与X2之间时，判定反馈信息的情感信息为中性。
[0070]在本发明另一实施例中，当反馈信息为文本格式时，采用如下步骤对反馈信息进行情感分析:
[0071]S31，对反馈信息进行预处理操作。
[0072]在具体实施中，预处理操作可以包括分句、分词、词性标注以及语法分析等操作。
[OO73 ] S32，对预处理后的反馈信息进行特征提取，将反馈信息向量化。
[0074]将反馈信息向量化，是为了将预处理后的反馈信息转化为情感分析模型训练器能够处理的格式。情感分析模型训练器可以定期对情感分析模型进行训练。情感分析模型可以根据预设的算法构建，例如，采用支持向量机(Support Vector Machine)或者逻辑回归(Logistic Regress 1n)构建情感分析模型。
[0075]S33，将向量化的反馈信息输入至预设的情感分析模型中，确定所述向量化的反馈信息的情感信息。
[0076]将向量化的反馈信息输入至训练好的情感分析模型中，即可获知向量化的反馈信息对应的情感信息，也即可以获知用户的反馈信息的情感信息是褒义、贬义还是中性。
[0077]在实际应用中，还可以采用其他的文本情感分析方法对反馈信息进行情感分析，此处不做赘述。当反馈信息为语音格式或者图片格式时，也可以采用相对应的情感分析方法进行情感分析。
[0078]可以理解的是，用户输入的反馈信息还可能是第一问题的同义问，即用户有可能在接收到第一答案后，发现第一答案与自己提出的第一问题不相关，认为智能问答系统没有理解第一问题的语义，因此重新提出了一个与第一问题语义相同的问题。而情感分析算法对同义问进行情感分析后，得到的情感分析可能是中性的，但实质上用户对第一答案是不满意的。
[0079]因此，在本发明实施例中，当用户的请求信息不仅包括第一问题，还在收到第一答案时，又提出第一问题的同义问时，可以判定用户对第一答案并不满意，此时可以将该同义问作为反馈信息，且情感分析得出情感信息为贬义。
[0080]步骤S103，当所述情感信息为贬义，且检测到用户再次提出所述第一问题时，通过搜索处理从知识库中选取第二答案并提供给用户。
[0081]当获知用户对第一答案的情感信息为贬义时，表明用户可能对第一答案并不满意，第一答案可能是错误的答案，或者第一答案答非所问。当检测到有其他用户再次提出与第一答案对应的第一问题时，若仍继续向用户发送第一答案，则用户在获取到第一答案后，可能仍会对第一答案不满意。若多个用户多次都对第一答案不满意，若不及时进行修正，则可能会造成用户投诉量增加，甚至造成用户流失。
[0082]在本发明实施例中，为避免上述情况的发生，在检测到用户再次提出第一问题时，可以通过搜索处理，从知识库中选取第二答案并提供给用户，第一答案与第二答案为不同的答案。
[0083]也就是说，在获知用户对第一答案的情感信息为贬义，即用户对第一答案不满意时，若检测到有其他用户再次提出了第一问题，则可以将与第一答案不同的第

完整全部详细技术资料下载

当前第2页1 2 3 4