特征推荐方法和装置的制造方法

文档序号：8299216阅读：246来源：国知局

特征推荐方法和装置的制造方法
【技术领域】
[0001] 本发明涉及互联网技术领域，尤其涉及一种特征推荐方法和装置。
【背景技术】
[0002] 现有技术中，文本推荐系统选取特征时通常采用以下方式：
[0003] 1、通过分解机（FactorizationMachines;以下简称：FM)选取，其中FM是一个泛化的模型，主要用于对所有两两交互特征进行建模，交互特征的参数通过共享的低秩向量内积获得；
[0004] 2、通过随机分割树算法选取，具体地，用文本信息根据特定文本值将用户物品矩阵分离为子矩阵，对于每个子矩阵再进行矩阵分解，最终的预测值是T个生成决策树预测的平均值。
[0005] 但是，FM中模拟了所有两两交互特征，却没有选取有效的特征组合，而在现实中，可能某些交互特征是无效的，在FM模型中，所有交互特征的权重是通过共享的低秩向量内积来获取的，如果某个交互特征无效，就会导致对参数预估以及最终结果预测的不准确。
[0006] 另外，随机分割树算法中也没有讨论对于组合特征选取的问题，当有几十个离散特征的时候，随机分割树算法并不十分有效。
[0007] 综上所述，现有技术存在不能有效选取组合特征，推荐文本特征的有效性较低的问题。

【发明内容】

[0008] 本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
[0009] 为此，本发明的第一个目的在于提出一种特征推荐方法。该方法可以自动选取有效的组合特征，省时省力，并能提高推荐系统的有效性。
[0010] 本发明的第二个目的在于提出一种特征推荐装置。
[0011] 为了实现上述目的，本发明第一方面实施例的特征推荐方法，包括：根据输出的文本特征估计模型确定样本数据中文本特征的目标值，所述输出的文本特征估计模型是根据从训练数据中选取的最优组合特征获得的；根据所述目标值对所述样本数据中的文本特征进行排序，并按照目标值由高到低的顺序对所述样本数据中的文本特征进行推荐。
[0012] 本发明实施例的特征推荐方法，根据从训练数据中选取的最优组合特征获得的文本特征估计模型确定样本数据中文本特征的目标值，根据上述目标值对样本数据中的文本特征进行排序，并按照目标值由高到低的顺序对上述样本数据中的文本特征进行推荐。从而可以实现自动选取有效的组合特征，省时省力，有效地解决了现有的人工特征选择过程中费时费力的难题，并能提高推荐系统的有效性。
[0013] 为了实现上述目的，本发明第二方面实施例的特征推荐装置，包括：确定模块，用于根据输出的文本特征估计模型确定样本数据中文本特征的目标值，所述输出的文本特征估计模型是根据从训练数据中选取的最优组合特征获得的；排序模块，用于根据所述确定模块确定的目标值对所述样本数据中的文本特征进行排序；推荐模块，用于按照目标值由高到低的顺序对所述样本数据中的文本特征进行推荐。
[0014] 本发明实施例的特征推荐装置，确定模块根据从训练数据中选取的最优组合特征获得的文本特征估计模型确定样本数据中文本特征的目标值，排序模块根据上述目标值对样本数据中的文本特征进行排序，推荐模块按照目标值由高到低的顺序对上述样本数据中的文本特征进行推荐。从而可以实现自动选取有效的组合特征，省时省力，有效地解决了现有的人工特征选择过程中费时费力的难题，并能提高推荐系统的有效性。
[0015] 本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
【附图说明】
[0016] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
[0017] 图1为本发明特征推荐方法一个实施例的流程图；
[0018]图2为本发明获得输出的文本特征估计模型一个实施例的流程图；
[0019] 图3为本发明特征推荐装置一个实施例的结构示意图；
[0020] 图4为本发明特征推荐装置另一个实施例的结构示意图。
【具体实施方式】
[0021] 下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0022] 图1为本发明特征推荐方法一个实施例的流程图，如图1所示，该特征推荐方法可以包括：
[0023] 步骤101，根据输出的文本特征估计模型确定样本数据中文本特征的目标值，上述输出的文本特征估计模型是根据从训练数据中选取的最优组合特征获得的。
[0024] 步骤102,根据上述目标值对样本数据中的文本特征进行排序，并按照目标值由高到低的顺序对所述样本数据中的文本特征进行推荐。
[0025] 上述实施例中，根据从训练数据中选取的最优组合特征获得的文本特征估计模型确定样本数据中文本特征的目标值，根据上述目标值对样本数据中的文本特征进行排序，并按照目标值由高到低的顺序对上述样本数据中的文本特征进行推荐。从而可以实现自动选取有效的组合特征，省时省力，有效地解决了现有的人工特征选择过程中费时费力的难题，并能提高推荐系统的有效性。
[0026] 具体地，在本发明图1所示实施例步骤101之前，还可以包括：根据从训练数据中选取的最优组合特征获得上述输出的文本特征估计模型的步骤。图2为本发明获得输出的文本特征估计模型一个实施例的流程图，如图2所示，可以包括：
[0027]步骤201，获得训练数据的文本特征。
[0028] 步骤202,从上述文本特征中穷举选取最优的组合特征。
[0029] 具体地，从上述文本特征中穷举选取最优的组合特征可以为：通过贪婪特征选择算法从上述文本特征中穷举选取最优的组合特征。
[0030] 本实施例中，对于每个特征，通过计算其加入当前的文本特征估计模型后带来的增益来选择，举例来说，该增益可以为训练数据的拟合精度。通常，为了简化计算，可固定当前的文

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：夏粉;程陈;张潼;金国庆;吕荣聪;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种三维码的生成和解析方法及装置的制造方法
上一篇：一种数据分类方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。