一种回复信息推荐方法及装置的制造方法

文档序号:9375570阅读:220来源:国知局
一种回复信息推荐方法及装置的制造方法
【技术领域】
[0001 ] 本发明涉及数据库领域,尤其涉及一种回复信息推荐方法及装置。
【背景技术】
[0002]随着移动互联网的发展,越来越多的用户通过智能终端设备进行互联网访问。以社交服务、即时消息为代表的移动互联网应用的发展,带来了远高于传统的输入需求。
[0003]目前,多采用预置信息模板技术、词语联想输入技术、基于个人语言模型(Individual Language Model)的单词输入推荐及纠正技术、或者通过UI (User Interface,用户界面)设计提升编辑功能的便捷性等技术方法。
[0004]关于预置信息模板技术,此类技术的共同特点是,对待回复内容进行分词、分类处理,再根据设定的规则模式推荐回复内容。具体的实现方案有基于终端的,有基于网络侧服务的,也有终端网络结合的。此类方案仅凭关键词与给定规则的匹配进行推荐,导致模型的准确度较低。
[0005]关于词语联想输入技术,此类技术的特点是:将字、词、短语或句子按照使用频率重新排列形成词库,将用户的键盘输入作为检索条件,从词库中搜索多个优先待选项供用户选择;某些还将最近一次输入(如前一个字、词)纳入搜索条件中;此类方案亦提供一定的容错特性。但是,不能反映用户的语言特点,且仅仅能够联想出词组和短语,对于输入便捷性提升有限。
[0006]关于基于个人语言模型的输入技术,该类技术基于用户的历史输入记录训练用户的个人语言模型,利用贝叶斯方法基于上述统计模型对用户的输入进行预测和纠正。这类方法利用用户的输入进行了预测、纠正,却无法提供切合语境的推荐回复信息。
[0007]目前还有一些搜索引擎采用的模糊匹配技术,根据用户输入来预测并推荐可能的搜索内容通过人机交互技术(Human-Computer Interact1n Techniques, CHI)改善用户输入界面。这些技术与现有基于个人语言模型的输入法技术类似,虽然能够一定程度上改善用户的输入便捷性,但都不能提供切合语境的推荐回复信息。
[0008]随着用户对终端的使用由简单的地址簿查询、短消息输入过渡到即时消息、社交互动、甚至撰写博客等复杂场景,上述技术越来越难以在用户回复信息时快速准确的提供切合语境的推荐回复信息。

【发明内容】

[0009]本发明的实施例提供一种回复信息推荐方法及装置,该方法及装置能在用户回复信息时快速准确的计算出切合语境的推荐回复信息。
[0010]为达到上述目的,本发明的实施例采用如下技术方案:
[0011]第一方面,提供一种回复信息推荐方法,其特征在于,包括:
[0012]获取用户收到的待回复信息和所述用户输入的对应所述待回复信息的预回复信息;
[0013]对所述待回复信息进行分割处理得到分割处理结果;
[0014]学习存储的所述用户的文字交互历史集得出回复模型,所述文字交互历史集包括所述用户历史收到的至少一个历史待回复信息以及与所述至少一个历史待回复信息对应的回复信息,所述回复模型包括至少一组历史待回复信息和回复信息的对应关系;
[0015]结合所述待回复信息的分割处理结果和所述回复模型得出候选回复信息;
[0016]结合所述候选回复信息和所述预回复信息计算出推荐回复信息的集合。
[0017]结合第一方面,在第一种可能的实现方式中,对所述待回复信息进行分割处理得到分割处理结果,包括:
[0018]对所述待回复信息按照字、词、短语或句子的层次进行分割得到分割处理结果。
[0019]结合第一方面或第一种可能的实现方式,在第二种可能的实现方式中,结合所述候选回复信息和所述预回复信息计算出推荐回复信息的集合,包括:
[0020]根据所述候选回复信息产生针对所述待回复信息的多元语法信息集,所述多元语法信息集包括与所述待回复信息对应的至少一个候选回复信息,以及所述至少一个候选回复信息中的每个候选回复信息被用作推荐回复信息的优先级;
[0021]将所述预回复信息和所述多元语法信息集进行合并,产生至少一个第一推荐回复信息;
[0022]对所述预回复信息和所述候选回复信息进行语义匹配,产生至少一个第二推荐回复信息;
[0023]对所述预回复信息和所述候选回复信息进行模糊字串匹配,产生至少一个第三推荐回复信息;
[0024]依据所述多元语法信息集计算出条件概率模型,所述条件概率模型包括所述至少一个候选回复信息和所述至少一个候选回复信息中的每个候选回复信息的使用频率;
[0025]根据所述条件概率模型对所述第一推荐回复信息、所述第二推荐回复信息和所述第三推荐回复信息进行综合排序,得出推荐回复信息的集合,所述推荐回复信息的集合包含至少一种表达方式的推荐回复信息,以便所述用户择一使用所述推荐回复信息对所述待回复信息进行回复。
[0026]结合第一方面和第二种可能的实现方式,在第三种可能的实现方式中,依据所述多元语法信息集计算出条件概率模型,所述条件概率模型包括所述至少一个候选回复信息和所述至少一个候选回复信息中的每个候选回复信息的使用频率,包括:
[0027]依据所述多元语法信息集及存储的所述用户的个人语言模型计算出条件概率模型,所述个人语言模型包括所述用户历史发出的回复信息的统计结果。
[0028]结合第一方面和第二种或第三种可能的实现方式,在第四种可能的实现方式中,所述第一推荐回复信息包括:推荐字和推荐词中的至少一种。
[0029]结合第一方面和第二种至第四种可能的实现方式中的任一种,在第五种可能的实现方式中,所述第二推荐回复信息包括:推荐短语和推荐句子中的至少一种。
[0030]结合第一方面和第二种至第五种可能的实现方式中的任一种,在第六种可能的实现方式中,所述第三推荐回复信息包括:推荐短语和推荐句子中的至少一种。
[0031]结合第一方面和第一种至第六种可能的实现方式中的任意一种,在第七种可能的实现方式中,所述候选回复信息包括:候选字、候选词、候选短语和候选句子中的至少一种。
[0032]结合第一方面和第一种至第七种可能的实现方式中的任意一种,在第八种可能的实现方式中,所述推荐回复信息包括:推荐字、推荐词、推荐短语和推荐句子中的至少一种。
[0033]第二方面,提供一种回复信息推荐装置,其特征在于,包括:
[0034]获取单元,用于获取用户收到的待回复信息和所述用户输入的对应所述待回复信息的预回复信息;
[0035]分割单元,用于对所述获取单元获取的所述待回复信息进行分割处理得到分割处理结果;
[0036]学习单元,用于学习存储的所述用户的文字交互历史集得出回复模型,所述文字交互历史集包括所述用户历史收到的至少一个历史待回复信息以及与所述至少一个历史待回复信息对应的回复信息,所述回复模型包括至少一组历史待回复信息和回复信息的对应关系;
[0037]候选单元,用于结合所述分割单元对所述待回复信息的分割处理结果和所述学习单元得出的所述回复模型得出候选回复信息;
[0038]推荐单元,用于结合所述候选单元得出的所述候选回复信息和所述获取单元获取的所述预回复信息计算出推荐回复信息的集合。
[0039]结合第二方面,在第一种可能的实现方式中,所述分割单元具体用于:对所述待回复信息按照字、词、短语或句子的层次进行分割得到分割处理结果。
[0040]结合第二方面和第一种可能的实现方式,在第二种可能的实现方式中,所述推荐单元包括:
[0041]多元语法子单元,用于根据所述候选单元得出的所述候选回复信息产生针对所述待回复信息的多元语法信息集,所述多元语法信息集包括与所述待回复信息对应的至少一个候选回复信息,以及所述至少一个候选回复信息中的每个候选回复信息被用作推荐回复信息的优先级;
[0042]字词子单元,用于结合所述获取单元获取的所述预回复信息和所述多元语法子单元产生的所述多元语法信息集来产生至少一个第一推荐回复信息;
[0043]相似度匹配子单元,用于将所述获取单元获取的所述预回复信息和所述候选单元得出的所述候选回复信息进行语义相似度匹配,产生至少一个第二推荐回复信息;
[0044]模糊匹配子单元,用于将所述获取单元获取的所述预回复信息和所述候选单元得出的所述候选回复信息进行模糊字串匹配,产生至少一个第三推荐回复信息;
[0045]合并子单元,用于依据所述多元语法子单元产生的所述多元语法信息集计算出条件概率模型,所述条件概率模型包括所述至少一个候选回复信息和所述至少一个候选回复信息中的每个候选回复信息的使用频率;
[0046]排序子单元,用于根据所述合并子单元产生的所述条件概率模型对所述字词子单元产生的所述第一推荐回复信息、所述相似度匹配子单元产生的所述第二推荐回复信息和所述模糊匹配子单元产生的所述第三推荐回复信息进行综合排序,得出推荐回复信息的集合,所述推荐回复信息的集合包含至少一
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1