提供信息的方法及装置的制造方法

文档序号:9274649阅读:138来源:国知局
提供信息的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及计算机技术领域,尤其涉及一种提供信息的方法及装置。
【背景技术】
[0002] 在电商客服对话的应用场景下,在客户开始说话之前,自动客服系统通常会事先 向客户展示一些预测客户可能问到的问题(简称"预测问题")以及对应的标准答复信息。 通过问题预测,可以更快地为客户服务,让用户感到更贴心。
[0003] 现有技术中,这些预测问题通常是从历史问题中统计出数量最多的问题进行推 荐,或者综合各种规则进行加权投票,最后进行问题推荐。通过制定规则然后进行加权投 票,该方法是一种比较原始的处理方式,需要做大量的实验后人工调整各种规则的权重;如 果规则种类过多并且各自存在一定的关联时,处理复杂度会成倍的增长,也不易维护;规则 制定后也不容易进行调整,扩展性差。

【发明内容】

[0004] 有鉴于此,本发明提供一种提供信息的方法及装置,具有客观高效、适用范围广、 可扩展性强等优点。
[0005] 为实现上述目的,根据本发明的一个方面,提供了一种提供信息的方法,包括:从 历史咨询会话数据中提取样本特征向量和所述样本特征向量对应的样本决策,其中,所述 样本特征向量中的元素是按预设属性从历史咨询会话数据中提取的属性值,所述样本决策 为用户提问语句;利用多个所述样本特征向量和各个所述样本特征向量对应的样本决策 作为训练数据进行训练,得到概率分类模型;从当前客户咨询请求中提取待测特征向量,所 述待测特征向量与所述样本特征向量的格式相同;向所述概率分类模型输入所述待测特征 向量,然后接收所述概率分类模型输出的一个或多个候选决策以及对应的概率,其中,所述 候选决策为候选用户提问语句;选择概率最大的K个候选决策作为预测决策,然后将所述 预测决策对应的标准答复提供给客户,其中K为自然数。
[0006] 可选地,所述预设属性包括如下选择中的多种:用户新老类型、用户来源入口、用 户画像信息、以及咨询商品属性信息。
[0007] 可选地,所述样本决策是由原始用户提问语句经过分类处理后得到的用户提问语 句。
[0008] 可选地,所述样本特征向量和所述待测特征向量是二值化多维离散型向量。
[0009]为实现上述目的,根据本发明的另一个方面,提供了一种提供信息的装置,其特征 在于,包括:第一提取模块,用于从历史咨询会话数据中提取样本特征向量和所述样本特 征向量对应的样本决策,其中,所述样本特征向量中的元素是按预设属性从历史咨询会话 数据中提取的属性值,所述样本决策为用户提问语句;训练模块,用于利用多个所述样本特 征向量和各个所述样本特征向量对应的样本决策作为训练数据进行训练,得到概率分类模 型;第二提取模块,用于从当前客户咨询请求中提取待测特征向量,所述待测特征向量与所 述样本特征向量的格式相同;预测模块,用于向所述概率分类模型输入所述待测特征向量, 然后接收所述概率分类模型输出的一个或多个候选决策以及对应的概率,其中,所述候选 决策为候选用户提问语句;信息提供模块,用于选择概率最大的K个候选决策作为预测决 策,然后将所述预测决策对应的标准答复提供给客户,其中K为自然数。
[0010] 可选地,所述预设属性包括如下选择中的多种:用户新老类型、用户来源入口、用 户画像信息、以及咨询商品属性信息。
[0011] 可选地,所述样本决策是由原始用户提问语句经过分类处理后得到的用户提问语 句。
[0012] 可选地,所述样本特征向量和所述待测特征向量是二值化多维离散型向量。
[0013] 根据本发明的技术方案,先是采集数据训练概率分类模型,然后利用该模型来预 测客户可能的提问以及对应的概率,最后向客户提供最可能提问问题的标准答复。该方法 至少具有如下优点:a)避免了人工分析各个特征重要性以及设置权重的工作,避免了主 观性,提高了效率;(2)当影响决策的因素种类很多、复杂程度高时也可以采用该方法,适 用范围广。(3)当影响决策的因素发生变化时,仅需要修改特征向量的格式即可,扩展性强。
【附图说明】
[0014] 附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
[0015] 图1是根据本发明实施例的提供信息的方法的主要步骤的示意图;
[0016] 图2是根据本发明实施例的提供信息的装置的主要部件的示意图。
【具体实施方式】
[0017] 以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种 细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识 到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同 样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0018] 图1是根据本发明实施例的提供信息的方法的主要步骤的示意图。如图1所示, 该提供信息的方法主要包括如下步骤A至步骤E。
[0019] 步骤A :从历史咨询会话数据中提取样本特征向量和样本特征向量对应的样本决 策。其中,样本特征向量中的元素是按预设属性从历史咨询会话数据中提取的属性值,样本 决策为用户提问语句。
[0020] 需要说明的是,预设属性通常反映了历史咨询会话的背景信息,均可能对样本决 策产生影响。本发明并不限定预设属性的种类,可以根据实际情况灵活地选取,选取之后在 未来还可以根据需要进行改变。例如:当新发现某个属性可能会对决策产生影响,则将该属 性加入预设属性列表中,相应地,样本特征向量中新增一个元素。
[0021] 步骤B :利用多个样本特征向量和各个样本特征向量对应的样本决策作为训练数 据进行训练,得到概率分类模型。
[0022] 步骤C :从当前客户咨询请求中提取待测特征向量,待测特征向量与样本特征向 量的格式相同。也就是说,待测特征向量与样本特征向量中元素的种类和顺序一致。与样 本特征向量类似地,待测特征向量中的元素是按预设属性从当前客户咨询请求中提取的属 性值。
[0023] 步骤D:向概率分类模型输入待测特征向量,然后接收概率分类模型输出的一个 或多个候选决策以及对应的概率,其中,候选决策为候选用户提问语句。
[0024] 步骤E :选择概率最大的K个候选决策作为预测决策,然后将预测决策对应的标准 答复提供给客户,其中K为自然数。
[0025] 本发明的提供信息的方法,先是采集数据训练概率分类模型,然后利用该模型来 预测客户可能的提问以及对应的概率,最后向客户提供最可能提问问题的标准答复。该方 法至少具有如下优点:(1)避免了人工分析各个特征重要性以及设置权重的工作,避免了 主观性,提高了效率;(2)当影响决策的因素种类很多、复杂程度高时也可以采用该方法, 适用范围广。(3)当影响决策的因素发生变化时,仅需要修改特征向量的格式即可,扩展性 强。
[0026] 在本发明的实施方式中,预设属性可以包括如下选择中的多种:用户新老类型、用 户来源入口、用户画像信息以及咨询商品属性信息。需要说明的是,用户画像信息属性本身 可以是一个复合属性,下面还可以进一步细分为年龄属性、性别属性等等。咨询商品属性信 息同样也可以是一个复合属性。这几种属性是常见的能够对决策(包括样本决策和候选决 策)产生影响的属性,下面举例进行说明具有不同的属性值的用户是如何做出不同的决策 的。当用户为新用户时,可能倾向于问是否赠送试用装;当用户为老用户时,可能咨询是否 有VIP折扣。当用户是从售前入口发起对话时,可能咨询商品库存事宜;当用户是从售后入 口发起对话时,可能咨询追踪物流事宜。用户画像信息(User Profile)反映出了用户的行 为习惯,具有不同用户画像信息的用户针对同一个商品提出的咨询问题通常不同。例如女 性客户可能咨询能否多点优惠,男性客户可能只咨询关于产品本身的问题。咨询商品属性 信息则反映了商品的特性,同一用户针对不同商品提出的咨询问题也通常不同。例如客户 买衣服时可能咨询面料问题,买食品时可能咨询保质期问题。由上可知,用户新老类型、用 户来源入口、用户画像信息以及咨询商品属性信息这几个属性对决策具有重要影响,可以 选作特征向量的特征。
[0027] 在本发明的实施方式中,样本决策可以是由原始用户提问语句经过分类处理后得 到的用户提问语句。例如:将"这个商品何时有货""什么时候补货上架"这两个原始用户提 问语句经过分类后都归为同一个问题一一相当于"何时有货"的用户提问语句。该实施方式 不采用原始用户提问语句作为决策,而使用分类处理后的语句,这样可以使决策变为有限 数目的问句集合,可以消减语言表述的多样性带来的弊端,降低模型的训练时间和复杂度。
[0028] 在本发明的实施方式中,样本特征向量和待测特征向量可以是二值化多维离散型 向量。换言之,当一个属性下面有多个属性值时,把多个属性值分解成多个特征,出现的离 散特征值取1,不出现的离散特征值取0。如果不采用二值化多维离散的形式、而是采用离 散多值的形式来表示向量,可能在某些算法下会产生误差。该实施方式中采用二值化多维
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1