1.一种标准问题数据的确定方法,其特征在于,包括:
根据获得的个性化问题数据,获取与所述个性化问题数据相关联的特征;
将所述个性化问题数据和获取的特征,输入训练好的标准问题概率模型;所述标准问题概率模型,是根据所述预设的标准问题数据和与所述预设的标准问题数据相关联的特征样本训练的;
根据标准问题概率模型输出的概率分布,从所述预设的标准问题数据中确定标准问题数据。
2.如权利要求1所述的方法,其特征在于,根据获得的个性化问题数据,获取与所述个性化问题数据相关联的特征,具体包括:
根据所述个性化问题数据,利用特征查找树,获得所述特征查找树中包含的、与所述个性化问题数据相匹配的问题数据特征;所述特征查找树,是通过将与标准问题数据相关联的特征进行组合构建的。
3.如权利要求1所述的方法,其特征在于,所述标准问题概率模型,是通过下述方法训练的:
获取训练特征集;
根据预设的特征选择算法,从获取的训练特征集中选取样本特征;
获取样本特征对应的标准问题数据;
将所述预设的标准问题数据以及选取的样本特征作为标准问题概率模型的输入,将所述样本特征对应的标准问题数据作为标准问题概率模型的预设输出,对所述标准问题概率模型进行训练,得到所述标准问题概率模型。
4.如权利要求3所述的方法,其特征在于,所述标准问题概率模型为深度神经网络模型。
5.如权利要求3所述的方法,其特征在于,根据预设的特征选择算法,从获取的训练特征集中选取样本特征,包括:
根据基于信息增益的特征选择算法,从所述训练特征集中选取第一样本特 征;
根据基于卡方的特征选择算法,从所述训练特征集中选取第二样本特征;
从所述第一样本特征和第二样本特征中选取样本特征。
6.如权利要求3~5任一权项所述的方法,其特征在于,训练特征集中的特征,包括下述至少一种:
用户点击特征;
词语特征。
7.如权利要求1~5任一权项所述的方法,其特征在于,所述个性化问题数据,为用户实时输入的个性化问题数据。
8.一种标准问题数据的确定装置,其特征在于,所述装置包括:
获取单元:根据获得的个性化问题数据,获取与所述个性化问题数据相关联的特征;
解码单元:将所述个性化问题数据和获取的特征,输入训练好的标准问题概率模型;所述标准问题概率模型,是根据所述预设的标准问题数据和与所述预设的标准问题数据相关联的特征样本训练的;
标准问题数据确定单元:根据标准问题概率模型输出的概率分布,从所述预设的标准问题数据中确定标准问题数据。
9.如权利要求8所述的装置,其特征在于:
所述获取单元,具体用于根据所述个性化问题数据,利用特征查找树,获得所述特征查找树中包含的、与所述个性化问题数据相匹配的问题数据特征;所述特征查找树,是通过将与标准问题数据相关联的特征进行组合构建的。
10.如权利要求8所述的装置,其特征在于,所述标准问题概率模型为深度神经网络模型。