特征属性的构建方法

文档序号:8905606阅读:394来源:国知局
特征属性的构建方法
【技术领域】
[0001] 本发明设及大数据应用技术,特别是设及一种数据对象的特征属性的构建方法。
【背景技术】
[0002] 在传统工业时代,消费者与消费者,消费者与企业、产业链上下游之间的信息交流 是闭塞的,不对等的。企业在生产商品时,往往根据自己的经验进行商品生产,确定商品需 要生产的各项属性,最终进行生产。由于没有很好的提前对市场进行调研,收集用户需求, 导致生产出的商品往往不受人们所需要,甚至自认为对用户有很大帮助的功能用户都从来 没有用过,造成企业大多数是在生产用户不需要的商品。因此如何确定商品的各项属性是 用户所需要的,如何确定该商品的各项属性是当今制造业面临的巨大挑战。
[0003] 目前被广泛应用的特征属性的确定方案中,是根据特征属性所属数据对象(如某 种商品)的历史市场销量数据确定的,例如,将历史销量中卖的最好的属性值组合起来,构 成数据对象的属性集合。
[0004] 例如屏幕尺寸、颜色、电池容量是手机的S个特征属性,而屏幕尺寸目前有5英 寸、4. 5英寸、4英寸=个可供生产的属性值。厂商在确定手机屏幕尺寸时通过历史中各尺 寸的销售记录来看哪个尺寸卖的最好,从而最终确定下一代手机的屏幕尺寸大小,同理确 定其他手机属性如颜色、电池容量等等。
[0005] 由于在实际应用中,单个属性值历史销量最好无法确保它们组合起来后可W获得 较好的销量,因此,上述直接选择销量数据最大的属性值,构建数据对象的特征属性的方 法,无法对未来的用户真实需要进行预测,进而也不能确保所得到数据对象与实际的市场 需要所匹配。

【发明内容】

[0006] 有鉴于此,本发明的主要目的在于提供一种特征属性的构建方法,可W使得所得 到数据对象满足更多用户的实际需要。
[0007] 为了达到上述目的,本发明提出的技术方案为:
[0008] 一种特征属性的构建方法,包括:
[0009]a、根据属性值数量,从数据对象的特征属性集合中,选择出候选特征属性;并根据 属性值对应的产品销量占比,对所述候选特征属性的属性值进行筛选;
[0010]b、根据所述数据对象所属类别下已有产品的销量数据,确定所述候选特征属性的 每个属性值的整体效用贡献系数;
[0011]C、根据所述整体效用贡献系数和所述数据对象所属类别下已有产品的用户评论 数据,确定每个所述候选特征属性的重要性分值;
[0012]t选择所述候选特征属性中重要性分值最大的前M个候选特征属性作为所述数 据对象的重要特征属性;其中,M为预设的重要特征属性的数量口限;
[0013]e、将不同重要特征属性的不同属性值进行组合,得到N组属性值组合,其中,每组 属性值组合包含M个属性值且各自所属的特征属性不同;
[0014] f、确定每组属性值组合的可生产性占比;根据所述可生产性占比和属性值组合中 各属性值的所述整体效用贡献系数,确定出所述数据对象的最优属性值组合。
[0015] 综上所述,本发明提出的特征属性的构建方法,根据历史销量数据和用户评论数 据,选择出重要特征属性,然后对其属性值进行组合,最后根据每种组合的可生产性占比W 及组合中各属性值的整体效用贡献系数,确定出数据对象的最优属性值组合。该样,在确定 重要特征属性W及选择相应属性值组合时,不仅考虑了历史销售数据,还考虑了用户的评 论数据,W及属性值组合的可生产性,从而可W有效提升最终确定出的特征属性值组合的 客观性和准确性,使得对应的数据对象可W满足更多用户的实际需要。
【附图说明】
[0016] 图1为本发明实施例一的流程示意图。
【具体实施方式】
[0017] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对 本发明作进一步地详细描述。
[0018] 本发明的核屯、思想是;通过建模分析数据对象的重要特征属性及每个属性值,据 此确定数据对象的最优的特征属性组合,W提升数据对象的客观性和准确性。
[0019] 图1为本发明实施例一的流程示意图,如图1所示,该实施例主要包括:
[0020] 步骤101、根据属性值数量,从数据对象的特征属性集合中,选择出候选特征属性; 并根据属性值对应的产品销量占比,对所述候选特征属性的属性值进行筛选。
[0021] 本步骤,用于选择出候选特征属性并对其属性值进行筛选。
[0022] 较佳地,可W采用下述方法选择出候选特征属性:
[0023] 步骤al、删除所述特征属性集合中只有两种属性值的特征属性。
[0024] 该里,考虑到只有两种属性值时,如支持和不支持化va功能,用户的可选择性较 小,该种属性对于用户的选择性影响不大,因此,其重要性较低,可W剔除。
[0025] 步骤a2、删除所述特征属性集合中属性值数量超过预设的数量阔值a的特征属 性,a〉9。
[0026] 该里,考虑到特征属性的属性值太多的话,用户不知道选择哪个,因此,其重要性 较低,可W剔除。
[0027] 步骤a3、将当前得到的所述特征属性集合中的特征属性作为所述候选特征属性。 [002引较佳地,本步骤中可W采用下述方法对候选特征属性的属性值进行筛选:
[0029] 对于所述候选特征属性的每个属性值,如果该属性值对应的产品销量占比小于预 设的占比阔值b,则删除该属性值。
[0030] 该里,考虑到如果一个属性值对应的产品销量占比很少,则说明该属性值不重要, 可W剔除。
[0031] 上述筛选过程W属性值对应的产品销量占比为依据进行,可W去除候选特征属性 中对用户不重要的属性值,W确保最终构建的特征属性与用户的实际需要所匹配。
[0032] 本步骤中,各属性值对应的产品销量占比的具体获知方法为本领域技术人员所掌 握,在此不再寶述。
[0033] 所述占比阔值b可由本领域技术人员根据实际需要设置,较佳地,可W为20%。
[0034] 步骤102、根据所述数据对象所属类别下已有产品的销量数据,确定所述候选特征 属性的每个属性值的整体效用贡献系数。
[0035] 本步骤,用于根据与数据对象同类别下的已有产品的销量数据,确定候选特征属 性的每个属性值的整体效用贡献系数。例如,当数据对象是一种新款手机时,此情况下,需 要分析之前存在的各种手机的销售数据,根据该些已有手机的候选特征属性配置W及相应 的销量,来确定出对销量大小影响较大的属性值。由于历史的销售数据是由用户的最终消 费行为所决定的,因此,可W反映出用户的真实需要。相应地,基于此所得到的属性值得的 整体效用贡献系数也可W客观的反映出其对销量的影响程度。
[0036] 较佳地,可W通过求解方程注
来确定所述候选特征属性的每 个属性值的整体效用贡献系数。
[0037] 其中,Yj.为所述数据对象所属类别下第j个产品的销量,j= 1,…,J,J为所述数 据对象所属类别下已有产品的总数;\h为第i个所述候选特征属性的第h个属性值的整体 效用贡献系数,Xj.Ah为第j个产品是否具有第i个所述候选特征属性的第h个属性值的标 识参数,其中,如果具有,则Xj.Ah= 1,否则,Xj.Ah= 0,I为所述候选特征属性的总数;Hi为 第i个候选特征属性的属性值总数。
[003引该里通过求解上述由J个回归方程组成的方程组,即可得到每个候选特征属性的 每个属性值的整体效用贡献系数\h。具体求解方法为本领域人员所掌握,在此不再寶述。
[0039] 步骤103、根据所述整体效用贡献系数和所述数据对象所属类别下已有产品的用 户评论数据,确定每个所述候选特征属性的重要性分值。
[0040] 本步骤,用于对每个所述候选特征属性的重要性进行评分,即确定其重要性分值。 该里,不仅考虑了根据历史销量数据所确定出的整体效用贡献系数,还将考虑已有同类产 品的用户评论数据中对特征属性的关注情况,如此,可W确保特征属性的重要性评分结果 的客观、准确性。
[0041] 较佳地,可W采用下述方法来确定每个所述候选特征属性的重要性分值:
[0042] 步骤bl、对于每个所述候选特征属性,根据属性值的所述整体效用贡献系数,确定 该候选特征属性的效用重要性系数。
[0043] 较佳地,可W采用下述方法来确定每个所述候选特征属性的效用重要性系数:
[0044] 步骤bll、对于每个所述候选特征属性i,根据该属性的每个属性值的所述整体效 用贡献系数,计算该属性的整体效用贡献系数标准差stdi。
[0045] 本步骤中,整体效用贡献系数标准差Stdi的具体计算方法为本域技术人员所掌 握,在此不再寶述。
[0046] 步骤bl2、按照
确定每个所述候选特征属性i的效用重要性 系数Wi,其中,2Stdi为所有所述候选特征属性的整体效用贡献系数标准差总和。
[0047] 步骤bl3、按照
确定每个所述候选特征属性i的语义重要性系数Zi,其 中,ti为所述用户评论数据中用户对候选特征属性i的评论次数,为所述用户评论数 据中用户对所有所述候选特征属性评论的总次数。
[0048] 步骤b2、根据所述用户评论数据,确定每个所述候选特征属性的语义重要性系数。
[0049] 步骤b3、根据每个所述候选特征属性的效用重要性系数和语义重要性系数,确定 每
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1