自动回复信息的方法以及装置的制造方法_2

文档序号:8433653阅读:来源:国知局
二特征的相关度计算所述待回复信息与所述待定回复的匹配度,其中,所述第一特征W及 所述第二特征的相关度为由语料环境中获取的原文w及对所述原文的回复多次训练得到, 其中,所述语料环境包括微博、论坛W及贴吧;选择匹配度最高的待定回复W作为所述待回 复信息的回复信息,W实现自动回复待回复信息,所述发送设备用于发送回复信息。
[0023] 结合第六方面,本申请第六方面的第一种可能的实施方式中,所述处理器还用于 从语料环境中获取原文W及对所述原文的合格回复,其中,所述语料环境包括微博、论坛W 及贴吧,所述合格回复为符合设定条件的回复;获取所述原文的关键词W作为所述第一特 征,并获取对所述合格回复的关键词W作为所述第二特征;利用所述第一特征与所述第二 特征对神经网络模型进行训练,W获得所述第一特征和所述第二特征之间的相关度。
[0024] 结合第六方面,本申请第六方面的第二种可能的实施方式中,所述处理器还用于 对所述匹配度最高的待定回复进行个性化处理,W获得个性化的回复。
[00巧]结合第六方面,本申请第六方面的第H种可能的实施方式中,所述处理器还用于 对回复数据库中的回复进行快速检索W获得待定回复集合,获取待定回复集合中的一待定 回复的关键词W作为第二特征。
[0026] 结合第六方面,本申请第六方面的第四种可能的实施方式中,所述处理器还用于 根据
【主权项】
1. 一种特征相关度获取方法,其特征在于,包括如下步骤: 从语料环境中获取原文以及对所述原文的合格回复,其中,所述语料环境包括微博、论 坛以及贴吧,所述合格回复为符合设定条件的回复; 获取原文的关键词以作为第一特征,并获取对所述合格回复的关键词以作为第二特 征; 利用所述第一特征与所述第二特征对神经网络模型进行训练,以获得第一特征和第二 特征之间的相关度。
2. 根据权利要求1所述的方法,其特征在于,从语料环境中获取原文以及对所述原文 的合格回复的步骤包括: 从语料环境中获取原文以及对所述原文的回复; 按设定条件对所述原文的回复进行清洗以获得对所述原文的合格回复,其中,所述设 定条件包括字数超过5,没有附件,以及在按回复顺序排列的前一百条以内。
3. -种特征相关度获取装置,其特征在于,包括语料获取模块、特征获取模块以及训练 模块, 所述语料获取模块用于从语料环境中获取原文以及对所述原文的合格回复,其中,所 述语料环境包括微博、论坛以及贴吧,所述合格回复为符合设定条件的回复,所述语料获取 模块将获取的原文以及对所述原文的合格回复发送给所述特征获取模块; 所述特征获取模块用于接收所述获取的原文以及对所述原文的合格回复,获取原文的 关键词以作为第一特征,并获取对所述合格回复的关键词以作为第二特征,所述特征获取 模块将所述第一特征以及第二特征发送给所述训练模块; 所述训练模块用于接收所述第一特征以及第二特征,利用所述第一特征与所述第二特 征对神经网络模型进行训练,以获得第一特征和第二特征之间的相关度。
4. 根据权利要求3所述的装置,其特征在于,所述语料获取模块包括语料获取单元以 及清洗单元, 所述语料获取单元用于从语料环境中获取原文以及对所述原文的回复,所述语料获取 单元将对所述原文的回复发送所述清洗单元; 所述清洗单元用于接收对所述原文的回复,按设定条件对所述原文的回复进行清洗以 获得对所述原文的合格回复,其中,所述设定条件包括字数超过5,没有附件,以及在按回复 顺序排列的前一百条以内。
5. -种自动回复信息的方法,其特征在于,包括如下步骤: 接收待回复信息; 获取所述待回复信息的关键词以作为第一特征,并获取待定回复集中的一待定回复的 关键词以作为第二特征; 根据所述第一特征以及所述第二特征的相关度计算所述待回复信息与所述待定回复 的匹配度,其中,所述第一特征以及所述第二特征的相关度为由语料环境中获取的原文以 及对所述原文的回复多次训练得到,其中,所述语料环境包括微博、论坛以及贴吧; 重复获取第一特征以及第二特征、计算匹配度的步骤,直到获得所述待回复信息与所 有待定回复的匹配度; 选择匹配度最高的待定回复以作为所述待回复信息的回复,以实现自动回复待回复信 肩、。
6. 根据权利要求5所述的方法,其特征在于,所述方法还包括: 从语料环境中获取原文以及对所述原文的合格回复,其中,所述语料环境包括微博、论 坛以及贴吧,所述合格回复为符合设定条件的回复; 获取所述原文的关键词以作为所述第一特征,并获取对所述合格回复的关键词以作为 所述第二特征; 利用所述第一特征与所述第二特征对神经网络模型进行训练,以获得所述第一特征和 所述第二特征之间的相关度。
7. 根据权利要求5所述的方法,其特征在于,所述选择匹配度最高的待定回复以作为 所述待回复信息的回复之后还包括: 对所述匹配度最高的待定回复进行个性化处理,以获得个性化的回复。
8. 根据权利要求5所述的方法,其特征在于,所述获取待定回复集合中的一待定回复 的关键词以作为第二特征的步骤包括: 对回复数据库中的回复进行快速检索以获得待定回复集合; 获取待定回复集合中的一待定回复的关键词以作为第二特征。
9. 根据权利要求5所述的方法,其特征在于,所述根据第一特征以及所述第二特征的 相关度计算所述待回复信息与所述待定回复的匹配度的步骤包括: 根据
计算所述待回复信息与所述待定回复的匹配度,其中,P为匹配度,N为 所述第一特征以及所述第二特征的关联集合,i为N中的一个元素,%为权值,Xi为所述第 一特征以及所述第二特征的相关度。
10. -种自动回复信息的装置,其特征在于,包括接收模块、特征获取模块、匹配度计算 模块以及选择模块, 所述接收模块用于接收待回复信息,所述接收模块将所述待回复信息发送给所述特征 获取模块; 所述特征获取模块用于接收所述待回复信息,获取所述待回复信息的关键词以作为第 一特征,并获取待定回复集中的一待定回复的关键词以作为第二特征,所述特征获取模块 将所述第一特征以及所述第二特征发送给所述匹配度计算模块; 所述匹配度计算模块用于接收所述第一特征以及所述第二特征,根据所述第一特征以 及所述第二特征的相关度计算所述待回复信息与所述待定回复的匹配度,其中,所述第一 特征以及所述第二特征的相关度为由语料环境中获取的原文以及对所述原文的回复多次 训练得到,其中,所述语料环境包括微博、论坛以及贴吧,所述匹配度计算模块将所述匹配 度发送给所述选择模块; 所述选择模块用于接收所述匹配度,选择匹配度最高的待定回复以作为所述待回复信 息的回复,以实现自动回复待回复信息。
11. 根据权利要求10所述的装置,其特征在于,所述装置还包括语料获取模块、特征获 取模块以及训练模块, 所述语料获取模块用于从语料环境中获取原文以及对所述原文的合格回复,其中,所 述语料环境包括微博、论坛以及贴吧,所述合格回复为符合设定条件的回复,所述语料获取 模块将获取的原文以及对所述原文的合格回复发送给所述特征获取模块; 所述特征获取模块用于接收所述获取的原文以及对所述原文的合格回复,获取原文的 关键词以作为第一特征,并获取对所述合格回复的关键词以作为第二特征,所述特征获取 模块将所述第一特征以及第二特征发送给所述训练模块; 所述训练模块用于接收所述第一特征以及第二特征,利用所述第一特征与所述第二特 征对神经网络模型进行训练,以获得第一特征和第二特征之间的相关度。
12. 根据权利要求10所述的装置,其特征在于,所述装置还包括个性化处理模块, 所述个性化处理模块用于对所述匹配度最高的待定回复进行个性化处理,以获得个性 化的回复。
13. 根据权利要求10所述的装置,其特征在于,所述特征获取模块包括快速检索单元 以及特征获取单元, 所述快速检索单元用于对回复数据库中的回复进行快速检索以获得待定回复集合,所 述快速检索单元将所述待定回复集合发送给所述特征获取单元; 所述特征获取单元用于接收所述待定回复集合,获取待定回复集合中的一待定回复的 关键词以作为第二特征。
14. 根据权利要求10所述的装置,其特征在于,所述匹配度计算模块用于根据
计算所述待回复信息与所述待定回复的匹配度,其中,P为匹配度,N为所述第一 特征以及所述第二特征的关联集合,i为N中的一个元素,%为权值,Xi为所述第一特征以 及所述第二特征的相关度。
【专利摘要】本申请公开了一种自动回复信息的方法以及装置,包括如下步骤:获取待回复信息的关键词以作为第一特征,并获取待定回复集中的一待定回复的关键词以作为第二特征;根据第一特征以及第二特征的相关度计算待回复信息与待定回复的匹配度,其中,第一特征以及第二特征的相关度为由语料环境中获取的原文以及对原文的回复多次训练得到,语料环境包括微博、论坛以及贴吧;重复上述步骤,直到获得待回复信息与所有待定回复的匹配度;选择匹配度最高的待定回复以作为待回复信息的回复,以实现自动回复待回复信息。上述方案能选出一个匹配度最高的待定回复作为待回复信息的回复,从而能够提高用户回复的效率。
【IPC分类】H04L12-58, G06F17-30
【公开号】CN104753765
【申请号】CN201310754249
【发明人】吕正东, 李航
【申请人】华为技术有限公司
【公开日】2015年7月1日
【申请日】2013年12月31日
【公告号】WO2015101020A1
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1