特征推荐方法和装置的制造方法

文档序号:8299216阅读:246来源:国知局
特征推荐方法和装置的制造方法
【技术领域】
[0001] 本发明涉及互联网技术领域,尤其涉及一种特征推荐方法和装置。
【背景技术】
[0002] 现有技术中,文本推荐系统选取特征时通常采用以下方式:
[0003] 1、通过分解机(FactorizationMachines;以下简称:FM)选取,其中FM是一个泛 化的模型,主要用于对所有两两交互特征进行建模,交互特征的参数通过共享的低秩向量 内积获得;
[0004] 2、通过随机分割树算法选取,具体地,用文本信息根据特定文本值将用户物品矩 阵分离为子矩阵,对于每个子矩阵再进行矩阵分解,最终的预测值是T个生成决策树预测 的平均值。
[0005] 但是,FM中模拟了所有两两交互特征,却没有选取有效的特征组合,而在现实中, 可能某些交互特征是无效的,在FM模型中,所有交互特征的权重是通过共享的低秩向量内 积来获取的,如果某个交互特征无效,就会导致对参数预估以及最终结果预测的不准确。
[0006] 另外,随机分割树算法中也没有讨论对于组合特征选取的问题,当有几十个离散 特征的时候,随机分割树算法并不十分有效。
[0007] 综上所述,现有技术存在不能有效选取组合特征,推荐文本特征的有效性较低的 问题。

【发明内容】

[0008] 本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
[0009] 为此,本发明的第一个目的在于提出一种特征推荐方法。该方法可以自动选取有 效的组合特征,省时省力,并能提高推荐系统的有效性。
[0010] 本发明的第二个目的在于提出一种特征推荐装置。
[0011] 为了实现上述目的,本发明第一方面实施例的特征推荐方法,包括:根据输出的文 本特征估计模型确定样本数据中文本特征的目标值,所述输出的文本特征估计模型是根据 从训练数据中选取的最优组合特征获得的;根据所述目标值对所述样本数据中的文本特征 进行排序,并按照目标值由高到低的顺序对所述样本数据中的文本特征进行推荐。
[0012] 本发明实施例的特征推荐方法,根据从训练数据中选取的最优组合特征获得的文 本特征估计模型确定样本数据中文本特征的目标值,根据上述目标值对样本数据中的文本 特征进行排序,并按照目标值由高到低的顺序对上述样本数据中的文本特征进行推荐。从 而可以实现自动选取有效的组合特征,省时省力,有效地解决了现有的人工特征选择过程 中费时费力的难题,并能提高推荐系统的有效性。
[0013] 为了实现上述目的,本发明第二方面实施例的特征推荐装置,包括:确定模块,用 于根据输出的文本特征估计模型确定样本数据中文本特征的目标值,所述输出的文本特征 估计模型是根据从训练数据中选取的最优组合特征获得的;排序模块,用于根据所述确定 模块确定的目标值对所述样本数据中的文本特征进行排序;推荐模块,用于按照目标值由 高到低的顺序对所述样本数据中的文本特征进行推荐。
[0014] 本发明实施例的特征推荐装置,确定模块根据从训练数据中选取的最优组合特征 获得的文本特征估计模型确定样本数据中文本特征的目标值,排序模块根据上述目标值对 样本数据中的文本特征进行排序,推荐模块按照目标值由高到低的顺序对上述样本数据中 的文本特征进行推荐。从而可以实现自动选取有效的组合特征,省时省力,有效地解决了现 有的人工特征选择过程中费时费力的难题,并能提高推荐系统的有效性。
[0015] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0016] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变 得明显和容易理解,其中 :
[0017] 图1为本发明特征推荐方法一个实施例的流程图;
[0018]图2为本发明获得输出的文本特征估计模型一个实施例的流程图;
[0019] 图3为本发明特征推荐装置一个实施例的结构示意图;
[0020] 图4为本发明特征推荐装置另一个实施例的结构示意图。
【具体实施方式】
[0021] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考 附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反, 本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同 物。
[0022] 图1为本发明特征推荐方法一个实施例的流程图,如图1所示,该特征推荐方法可 以包括:
[0023] 步骤101,根据输出的文本特征估计模型确定样本数据中文本特征的目标值,上述 输出的文本特征估计模型是根据从训练数据中选取的最优组合特征获得的。
[0024] 步骤102,根据上述目标值对样本数据中的文本特征进行排序,并按照目标值由高 到低的顺序对所述样本数据中的文本特征进行推荐。
[0025] 上述实施例中,根据从训练数据中选取的最优组合特征获得的文本特征估计模型 确定样本数据中文本特征的目标值,根据上述目标值对样本数据中的文本特征进行排序, 并按照目标值由高到低的顺序对上述样本数据中的文本特征进行推荐。从而可以实现自动 选取有效的组合特征,省时省力,有效地解决了现有的人工特征选择过程中费时费力的难 题,并能提高推荐系统的有效性。
[0026] 具体地,在本发明图1所示实施例步骤101之前,还可以包括:根据从训练数据中 选取的最优组合特征获得上述输出的文本特征估计模型的步骤。图2为本发明获得输出的 文本特征估计模型一个实施例的流程图,如图2所示,可以包括:
[0027]步骤201,获得训练数据的文本特征。
[0028] 步骤202,从上述文本特征中穷举选取最优的组合特征。
[0029] 具体地,从上述文本特征中穷举选取最优的组合特征可以为:通过贪婪特征选择 算法从上述文本特征中穷举选取最优的组合特征。
[0030] 本实施例中,对于每个特征,通过计算其加入当前的文本特征估计模型后带来的 增益来选择,举例来说,该增益可以为训练数据的拟合精度。通常,为了简化计算,可固定当 前的文
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1