提供信息的方法及装置的制造方法_2

文档序号：9274649阅读：来源：国知局

离散型向量，可以降低误差，提高准确性。
[0029] 为使本领域技术人员更好地理解，列举本发明的提供信息的方法一个详细实施例如下。
[0030] (1)获取历史咨询会话数据。历史咨询会话数据如表1所示，表格中的每一行表示一个样本。该实施例中预设属性限定为"用户新老类型""用户入口来源" "用户画像信息""咨询商品属性"这四个预设属性。
[0031] 表1历史咨询会话数据
[0032]
[0033] 从历史咨询会话数据中提取二值化多维离散形式的样本特征向量，如表2所示。
[0034] 表2样本特征向量列表
[0035]
[0036] 然后将原始用户提问语句经过分类处理后得到的有限个数的用户提问语句的集合，提取样本决策。如表3所示。
[0037] 表3样本决策列表
[0038]
[0039] (2)选用台湾大字的Uhih-Jen Lin傅士丼反的Liblinear作为概率分类模型工具，设置solver Type(算法类型）为L2R_LR算法（L2正规化的逻辑回归算法），设置C(惩罚因子）为4.0,设置eps (迭代停止阈值）为0.01。将表2中的多个样本特种向量以及表 3中的多个决策作为训练数据输入Liblinear，得到训练后的概率分类模型。
[0040] (3)参照提取样本特征模型的方法，从当前客户咨询请求中提取待测特征向量。待测特征向量与样本特征向量的格式相同。假设有一位中年男性的老客户，他在浏览电商网站的某一个商品页面时，对该商品感兴趣但又有疑问，因此他在用户交互界面中触发了"联系售后客服"的按键从而发起了咨询请求。对于此，可以提取出待测特征向量X = (0, 1,0, 1,0, 1,0, 1,0,……)〇
[0041] (4)将待测特征向量X代入步骤（3)得到的训练后的概率分类模型中，可以预测出若干个客户可能提出的问题，并且给出这些问题被提出的概率大小。换言之，可以得到一个或多个候选决策以及对应的概率，其中，候选决策为候选用户提问语句。在该实施例中，概率分类模型的输出结果如表4所不。
[0042] 表4候选决策以及对应的概率
[0043]
[0044] (5)选择概率最大的前四个候选决策作为预测决策，然后将预测决策对应的标准答复"亲，您好！欢迎光临"、"上架的都有货，都可以正常拍下"、"本店所有商品均为正品，敬请放心购买"以及"本店的家电主体（不包括配件）七天包退，一个月包换，一年保修"一同提供给客户。至此，为客户提供了有用的信息。
[0045] 图2是根据本发明实施例的提供信息的装置的主要部件的示意图。如图2所示，该提供信息的装置20主要包括如下部件：第一提取模块21、训练模块22、第二提取模块23、预测模块24和信息提供模块25。
[0046] 第一提取模块21用于从历史咨询会话数据中提取样本特征向量和样本特征向量对应的样本决策，其中，样本特征向量中的元素是按预设属性从历史咨询会话数据中提取的属性值，样本决策为用户提问语句。
[0047] 训练模块22用于利用多个样本特征向量和各个样本特征向量对应的样本决策作为训练数据进行训练，得到概率分类模型。
[0048] 第二提取模块23用于从当前客户咨询请求中提取待测特征向量，待测特征向量与样本特征向量的格式相同。
[0049] 预测模块24用于向概率分类模型输入待测特征向量，然后接收概率分类模型输出的一个或多个候选决策以及对应的概率，其中，候选决策为候选用户提问语句。
[0050] 信息提供模块25用于选择概率最大的K个候选决策作为预测决策，然后将预测决策对应的标准答复提供给客户，其中K为自然数。
[0051] 本发明的提供信息的装置，先是采集数据训练概率分类模型，然后利用该模型来预测客户可能的提问以及对应的概率，最后向客户提供最可能提问问题的标准答复。该装置至少具有如下优点：（1)避免了人工分析各个特征重要性以及设置权重的工作，避免了主观性，提高了效率；（2)当影响决策的因素种类很多、复杂程度高时也可以采用该方法，适用范围广。（3)当影响决策的因素发生变化时，仅需要修改特征向量的格式即可，扩展性强。
[0052] 在本发明的实施方式中，预设属性包括如下选择中的多种：用户新老类型、用户来源入口、用户画像信息以及咨询商品属性信息。这几个属性对决策具有重要影响，可以选作特征向量的特征。
[0053] 在本发明的实施方式中，样本决策是由原始用户提问语句经过分类处理后得到的用户提问语句。这样可以使决策变为有限数目的问句集合，可以消减语言表述的多样性带来的弊端，降低模型的训练时间和复杂度。
[0054] 在本发明的实施方式中，样本特征向量和待测特征向量是二值化多维离散型向量。采用二值化多维离散型向量，可以降低误差，提高准确性。
[0055] 上述【具体实施方式】，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。
【主权项】
1. 一种提供信息的方法，其特征在于，包括：从历史咨询会话数据中提取样本特征向量和所述样本特征向量对应的样本决策，其中，所述样本特征向量中的元素是按预设属性从历史咨询会话数据中提取的属性值，所述样本决策为用户提问语句；利用多个所述样本特征向量和各个所述样本特征向量对应的样本决策作为训练数据进行训练，得到概率分类模型；从当前客户咨询请求中提取待测特征向量，所述待测特征向量与所述样本特征向量的格式相同；向所述概率分类模型输入所述待测特征向量，然后接收所述概率分类模型输出的一个或多个候选决策以及对应的概率，其中，所述候选决策为候选用户提问语句；选择概率最大的K个候选决策作为预测决策，然后将所述预测决策对应的标准答复提供给客户，其中K为自然数。2. 根据权利要求1所述的提供信息的方法，其特征在于，所述预设属性包括如下选择中的多种：用户新老类型、用户来源入口、用户画像信息、以及咨询商品属性信息。3. 根据权利要求1所述的提供信息的方法，其特征在于，所述样本决策是由原始用户提问语句经过分类处理后得到的用户提问语句。4. 根据权利要求1所述的提供信息的方法，其特征在于，所述样本特征向量和所述待测特征向量是二值化多维离散型向量。5.-种提供信息的装置，其特征在于，包括：第一提取模块，用于从历史咨询会话数据中提取样本特征向量和所述样本特征向量对应的样本决策，其中，所述样本特征向量中的元素是按预设属性从历史咨询会话数据中提取的属性值，所述样本决策为用户提问语句；训练模块，用于利用多个所述样本特征向量和各个所述样本特征向量对应的样本决策作为训练数据进行训练，得到概率分类模型；第二提取模块，用于从当前客户咨询请求中提取待测特征向量，所述待测特征向量与所述样本特征向量的格式相同；预测模块，用于向所述概率分类模型输入所述待测特征向量，然后接收所述概率分类模型输出的一个或多个候选决策以及对应的概率，其中，所述候选决策为候选用户提问语句；信息提供模块，用于选择概率最大的K个候选决策作为预测决策，然后将所述预测决策对应的标准答复提供给客户，其中K为自然数。6. 根据权利要求5所述的提供信息的装置，其特征在于，所述预设属性包括如下选择中的多种：用户新老类型、用户来源入口、用户画像信息、以及咨询商品属性信息。7. 根据权利要求5所述的提供信息的装置，其特征在于，所述样本决策是由原始用户提问语句经过分类处理后得到的用户提问语句。8. 根据权利要求5所述的提供信息的装置，其特征在于，所述样本特征向量和所述待测特征向量是二值化多维离散型向量。
【专利摘要】本发明提供一种提供信息的方法及装置，具有客观高效、适用范围广、可扩展性强等优点。其中，该方法包括：从历史咨询会话数据中提取样本特征向量和对应的样本决策，其中，样本特征向量中的元素是按预设属性从历史咨询会话数据中提取的属性值，样本决策为用户提问语句；利用多个样本特征向量和对应的样本决策进行训练，得到概率分类模型；从当前客户咨询请求中提取待测特征向量，待测特征向量与样本特征向量的格式相同；向概率分类模型输入待测特征向量，然后接收概率分类模型输出的一个或多个候选决策以及对应的概率，其中，候选决策为候选用户提问语句；选择概率最大的K个候选决策作为预测决策，然后将预测决策对应的标准答复提供给客户。
【IPC分类】G06Q30/00, G06F17/27
【公开号】CN104991887
【申请号】CN201510340470
【发明人】罗欢, 李杰, 汤鹏飞, 王智
【申请人】北京京东尚科信息技术有限公司, 北京京东世纪贸易有限公司
【公开日】2015年10月21日
【申请日】2015年6月18日

完整全部详细技术资料下载

当前第2页1 2