问答数据处理、自动问答方法及装置与流程

文档序号:12271292阅读:来源:国知局

技术特征:

1.一种问答数据处理方法,其特征在于,包括:

收集对业务对象的进行咨询过程中产生的问答数据;

根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;

根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;

根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。

2.根据权利要求1所述的方法,其特征在于:

所述收集的问答数据包括:

在第一用户提出的问题命中所述问答数据库中某知识点时,所述问答数据库自动给出的答案,以及,在第一用户提出的问题未命中所述问答数据库中的知识点时,由第二用户手动输入的答案。

3.根据权利要求1所述的方法,其特征在于,所述根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定第二用户问答数据库中可合并的问题,包括:

确定所述问答数据库的知识点中,相同/相似的答案对应的不同问题;

如果所述问题中均包含业务对象标签,则将所述问题中包含的业务对象标签信息去掉,比较各问题中剩余部分的相似性;

如果相似性符合预置条件,则将所述问题确定为可合并的问题;

所述根据所述可合并的问题确定合并后的知识点文本包括:

根据所述问题中的剩余部分确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的问题对应的答案。

4.根据权利要求1所述的方法,其特征在于,所述根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定第二用户问答数据库中可合并的问题,包括:

如果第一用户提出的第一目标问题未命中所述问答数据库中的知识点,则将所述第二用户手动输入的答案与所述问答数据库中的各个答案进行比对;

如果所述问答数据库中存在相同/相似的答案,则将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对;

其中,所述将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对,包括:

如果所述第一目标问题以及所述第二目标问题中均存在业务对象标签,则将所述业务对象标签去掉后,比对第一目标问题与所述第二目标问题剩余部分的相似性;

如果相似性符合预置条件,则将该第一目标问题与所述第二目标问题确定为可合并的问题;

所述根据所述可合并的问题确定合并后的知识点文本包括:

根据所述第一目标问题文本与所述第二目标问题中剩余部分的文本确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的答案。

5.根据权利要求4所述的方法,其特征在于,还包括:

如果所述问答数据库中不存在与所述第二用户手动输入的答案相同/相似的答案,则将该目标问题以及对应的答案确定为该新知识点;

利用所述新的知识点提供第二推荐信息。

6.根据权利要求1所述的方法,其特征在于,还包括:

接收第一用户对问答过程的满意程度信息;

针对不满意的问答情况进行聚类,并将聚类结果提供给所述第二用户端,以便所述第二用户端对所述问答数据库进行修改。

7.一种自动问答方法,其特征在于,包括:

预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签;

接收第一用户端的问题文本;

判断所述问题文本中是否存在业务对象标签;

如果存在,则利用所述非公共知识点与所述问题文本进行匹配;

如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;

如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。

8.根据权利要求7所述的方法,其特征在于,所述利用所述非公共知识点与所述问题文本进行匹配,包括:

判断所述问题文本中的业务对象标签与所述非公共知识点中包括的业务对象标签是否相同;

如果相同,利用所述问题文本以及所述非公共知识点中去掉业务对象标签的部分进行相似性比较,如果符合预置条件,则匹配成功。

9.根据权利要求7所述的方法,其特征在于,还包括:

如果所述问题文本中不包括业务对象标签,则利用所述公共知识点与所述问题文本进行匹配。

10.一种问答数据处理装置,其特征在于,包括:

问答数据收集单元,用于收集对业务对象的进行咨询过程中产生的问答数据;

合并问题确定单元,用于根据所述问答数据中包含的业务对象标签信息,对所述问答数据进行文本分析,确定可合并的问题;

合并知识点确定单元,用于根据所述可合并的问题确定合并后的知识点,所述合并后的知识点文本包括合并后的问题以及对应的答案;

第一推荐信息提供单元,用于根据所述可合并的问题、合并后的知识点,向第二用户端提供第一推荐信息,以便对所述问答数据库进行更新。

11.根据权利要求10所述的装置,其特征在于:

所述问答数据收集单元包括:

在第一用户提出的问题命中所述问答数据库中某知识点时,所述问答数据库自动给出的答案,以及,在第一用户提出的问题未命中所述问答数据库中的知识点时,由第二用户手动输入的答案。

12.根据权利要求10所述的装置,其特征在于,所述合并问题确定单元包括:

相似答案确定子单元,用于确定所述问答数据库的知识点中,相同/相似的答案对应的不同问题;

相似度比对子单元,用于如果所述问题中均包含业务对象标签,则将所述问题中包含的业务对象标签信息去掉,比较各问题中剩余部分的相似性;

问题确定子单元,用于如果相似性符合预置条件,则将所述问题确定为可合并的问题;

所述知识点合并单元具体用于:

根据所述问题中的剩余部分确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的问题对应的答案。

13.根据权利要求10所述的装置,其特征在于,所述合并问题确定单元包括:

答案比对子单元,用于如果第一用户提出的第一目标问题未命中所述问答数据库中的知识点,则将所述第二用户手动输入的答案与所述问答数据库中的各个答案进行比对;

问题比对子单元,用于如果所述问答数据库中存在相同/相似的答案,则将该第一目标问题与问答数据库中该答案对应的第二目标问题进行比对;

其中,所述问题比对子单元具体用于:

如果所述第一目标问题以及所述第二目标问题中均存在业务对象标签,则将所述业务对象标签去掉后,比对第一目标问题与所述第二目标问题剩余部分的相似性;如果相似性符合预置条件,则将该第一目标问题与所述第二目标问 题确定为可合并的问题;

所述知识点合并单元具体用于:

根据所述第一目标问题文本与所述第二目标问题中剩余部分的文本确定合并后的问题,并根据所述相同/相似的答案确定所述合并后的答案。

14.根据权利要求13所述的装置,其特征在于,还包括:

新知识点确定单元,用于如果所述问答数据库中不存在与所述第二用户手动输入的答案相同/相似的答案,则将该目标问题以及对应的答案确定为该新知识点;

第二推荐信息提供单元,用于利用所述新的知识点提供第二推荐信息。

15.根据权利要求11所述的装置,其特征在于,还包括:

满意度信息接收单元,用于接收第一用户对问答过程的满意程度信息;

聚类单元,用于针对不满意的问答情况进行聚类,并将聚类结果提供给所述第二用户端,以便所述第二用户端对所述问答数据库进行修改。

16.一种自动问答装置,其特征在于,包括:

问答数据库提供单元,用于预先建立问答数据库,所述问答数据库中包括公共知识点以及非公共知识点,所述公共知识点的问题中不带有业务对象标签,所述非公共知识点的问题中带有业务对象标签;

问题文本接收单元,用于接收第一用户端的问题文本;

判断单元,用于判断所述问题文本中是否存在业务对象标签;

第一匹配单元,用于如果存在,则利用所述非公共知识点与所述问题文本进行匹配;

第二匹配单元,用于如果利用非公共知识点匹配失败,将所述问题文本中的业务对象标签去掉,与所述公共知识点进行匹配;

答案提供单元,用于如果与某公共知识点匹配成功,则提供该公共知识点对应的答案。

17.根据权利要求16所述的装置,其特征在于,所述第一匹配单元包括:

标签判断子单元,用于判断所述问题文本中的业务对象标签与所述非公共知识点中包括的业务对象标签是否相同;

其他部分判断子单元,用于如果相同,利用所述问题文本以及所述非公共知识点中去掉业务对象标签的部分进行相似性比较,如果符合预置条件,则匹配成功。

18.根据权利要求16所述的装置,其特征在于,还包括:

第三匹配单元,用于如果所述问题文本中不包括业务对象标签,则利用所述公共知识点与所述问题文本进行匹配。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1