分析购买需求的方法和装置与流程

文档序号:17330126发布日期:2019-04-05 22:01阅读:240来源:国知局
分析购买需求的方法和装置与流程
本发明涉及计算机
技术领域
,尤其涉及一种分析购买需求的方法和装置。
背景技术
:互联网技术的不断发展进一步促进了电子商务渗透到人们的多样的生活中,其中最具代表性的就是网络购物对于人们生活的影响。对用户的购买需求进行分析能够有效地改善商品的推荐与广告推送的效果,从而提高用户在购物网站的购买率,因此,如何快速准确地分析用户的购买需求已经成为了提升用户网络购物体验、增强用户购物粘度的重要一环。现有的分析用户购买需求的方法,是在用户个体层面上分析用户的购物习惯以及喜好,即获取每个用户的历史购物信息、收藏信息或关注信息等数据,根据这些数据来分析用户的购买需求。在实现本发明过程中,发明人发现现有技术中至少存在如下问题:1.由于用户个体之间存在购物习惯以及喜好倾向的差异性,因此,在用户个体层面上分析用户购买需求会耗费大量资源;2.现有的分析用户购买需求的方法忽略了用户的购买需求与时间的关联性。技术实现要素:有鉴于此,本发明实施例提供一种分析购买需求的方法和装置,能够准确分析用户群体在不同时间的购买需求,提高了用户群体的购物体验,增强了用户群体的购物粘度。为实现上述目的,根据本发明实施例的一个方面,提供了一种分析购买需求的方法。本发明实施例的一种分析购买需求的方法包括:计算至少一个商品标题中的产品词的爆发特性值和记忆特性值;基于所述爆发特性值和所述记忆特性值筛选出目的产品词;根据设定时间范围内用户购买所述目的产品词对应商品的行为确定所述目的产品词在所述设定时间范围的购买权重。可选地,计算至少一个商品标题中的产品词的爆发特性值和记忆特性值包括:基于所述产品词所对应商品的属性对所述产品词进行聚合得到有效产品词;计算所述有效产品词的所述爆发特性值和所述记忆特性值。可选地,所述爆发特性值根据如下公式确定:其中,b表示爆发特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内所述产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。可选地,记忆特性值根据如下公式确定:其中,m表示记忆特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内所述产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。可选地,基于所述爆发特性值和所述记忆特性值筛选出目的产品词包括:将所述产品词的所述爆发特性值和所述记忆特性值分别与预设的爆发特性参数和记忆特性参数进行比较;选择所述爆发特性值大于预设的爆发特性参数且所述记忆特性值大于预设的记忆特性参数的所述产品词作为所述目的产品词。可选地,确定所述目的产品词在所述设定时间范围的购买权重包括:利用lda模型计算所述目的产品词在所述设定时间范围的所述购买权重。为实现上述目的,根据本发明实施例的另一方面,提供了一种分析购买需求的装置。本发明实施例的一种分析购买需求的装置包括:第一计算模块,用于计算至少一个商品标题中的产品词的爆发特性值和记忆特性值;筛选模块,用于基于所述爆发特性值和所述记忆特性值筛选出目的产品词;第二计算模块,用于根据设定时间范围内用户购买所述目的产品词对应商品的行为确定所述目的产品词在所述设定时间范围的购买权重。可选地,所述第一计算模块还用于:基于所述产品词所对应商品的属性对所述产品词进行聚合得到有效产品词;计算所述有效产品词的所述爆发特性值和所述记忆特性值。可选地,所述爆发特性值根据如下公式确定:其中,b表示爆发特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内所述产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。可选地,记忆特性值根据如下公式确定:其中,m表示记忆特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内所述产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。可选地,所述筛选模块还用于:将所述产品词的所述爆发特性值和所述记忆特性值分别与预设的爆发特性参数和记忆特性参数进行比较;选择所述爆发特性值大于预设的爆发特性参数且所述记忆特性值大于预设的记忆特性参数的所述产品词作为所述目的产品词。可选地,所述第二计算模块还用于:利用lda模型计算所述目的产品词在所述设定时间范围的所述购买权重。为实现上述目的,根据本发明实施例的又一方面,提供了一种分析购买需求的电子设备。本发明实施例的一种分析购买需求的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种分析购买需求的方法。为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读存储介质。本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种分析购买需求的方法。上述发明中的一个实施例具有如下优点或有益效果:因为采用基于产品词在时间维度上的爆发特性和记忆特性来分析用户群体的购买需求的技术手段,所以克服了在用户个体层面上分析用户购买需求耗费大量资源,以及忽略了用户的购买需求是与时间相关联的技术问题,进而达到准确分析用户群体在不同时间的购买需求;提高用户群体的购物体验;增强用户群体的购物粘度的技术效果。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本发明,不构成对本发明的不当限定。其中:图1是根据本发明实施例的分析购买需求的方法的主要步骤的示意图;图2是根据本发明实施例的分析购买需求的装置的主要模块的示意图;图3是根据本发明实施例的分析购买需求的方法的实现流程示意图;图4是根据本发明实施例的分析购买需求的方法的爆发特性值-记忆特性值分布示意图;图5是本发明实施例可以应用于其中的示例性系统架构图;图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本发明实施例的分析购买需求的方法的主要步骤的示意图。如图1所示,本发明实施例的一种分析购买需求的方法主要包括以下步骤:步骤s101:计算至少一个商品标题中的产品词的爆发特性值和记忆特性值。为了快速准确地分析用户群体的购买需求、提升用户群体的购物体验、增强用户群体购物粘度,购物粘度是指用户对某些品牌或某些商家的依赖程度。本发明实施例结合时间维度对用户群体的购买需求进行分析,基于产品词在时间维度上的爆发特性和记忆特性来分析用户群体的购买需求。此外,为了避免个别用户的特殊需求对于分析用户群体购买需求的影响,以及降低分析购买需求所耗费的资源,可以选择符合特定要求的数据进行分析,即数据来源于购物次数及购物种类均超过预设值的用户,该预设值可以根据实际情况或需求设置。在进行分析时,从符合特定要求的数据中获取至少一个商品标题,利用分词操作对商品标题进行拆分并添加标注,即将商品标题拆分为至少一个分词,并对拆分得到的每个分词的进行种类标注,其中,分词的种类主要包括:产品词、品牌词以及修饰词等,例如商品标题“西昊/sihoo黑色人体工学办公椅”可以拆分得到:品牌词“西昊/sihoo”、修饰词“人体工学”和“黑色”以及产品词“办公椅”。需要说明的是,某些词语会具有多种标注,例如“夏新”这一词在不同的商品标题中会表示不同的含义,其既可以作为修饰词也可以作为品牌词,而产品词是对用户购买需求的一种描述,因此,与品牌词和修饰词相比,产品词能够更好地描述用户群体的购买需求。同时,产品词在时间维度上的爆发特性与用户群体对于该产品词所对应商品的需求的突发性相一致,即产品词的爆发特性体现了某一时间范围内该产品词所对应商品的需求信息。例如在每年的中秋节前后一段时间,月饼的需求增长明显。并且,产品词在时间维度上的记忆特性与用户群体对于该产品词所对应商品的需求的持续性相一致,即产品词的记忆特性体现了某一时间范围内用户群体对该产品词所对应商品的持续需求信息。例如某些用户在每年夏季都需要购买凉席。本发明实施例通过爆发特性值和记忆特性值来度量产品词在时间维度上的爆发特性和记忆特性。在本发明实施例中,计算至少一个商品标题中的产品词在设定时间范围的爆发特性值和记忆特性值可以包括:基于产品词所对应商品的属性对产品词进行聚合得到有效产品词,计算有效产品词的爆发特性值和记忆特性值。在时间维度上,用户群体购买产品词所对应商品的购买量能够形成多条时间序列特征,每个时间序列特征能够体现出用户群体对于某一商品的需求量的变化。但是,产品词所对应的商品可能对应于多个产品词,因此,在计算产品词在设定时间范围的爆发特性值和记忆特性值之前,还可以基于产品词所对应商品的属性先对产品词进行聚合,然后再计算聚合得到的有效产品词的爆发特性值和记忆特性值。需要说明的是,商品的属性可以是商品的品牌、商品特征等,因此,在对产品词进行聚合时,可以对包含相同产品词的商品进行聚合,例如产品词“裤子”,可以统计包含“a品牌裤子”、“b品牌裤子”以及“c品牌裤子”等词的商品的购买量,进而计算产品词“裤子”的爆发特性值和记忆特性值。在本发明实施例中,爆发特性值通过以下公式得出:其中,b表示爆发特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。计算出的爆发特征值的取值范围为[-1,1],其中,当b取值为正时,表示用户群体对产品词所对应商品的购买行为具有爆发特性,且b的值越大爆发特性越明显;当b取值为负时,表示用户群体对产品词所对应商品的购买行为具有周期性,且b的值越小周期性越明显;当b取值为零时,表示用户群体对产品词所对应商品的购买行为即不具有爆发特性也不具有周期性。在本发明实施例中,记忆特性值通过以下公式得出:其中,m表示记忆特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。计算出的记忆特性值的取值范围为[-1,1]。当m取值为正时,表明后一时间段内用户群体对产品词所对应商品的购买量的高低,更有可能与前一时间段内用户群体对产品词所对应商品的购买量正相关,即前一时间段内用户群体对产品词所对应商品的购买量越高则后一时间段内用户群体对产品词所对应商品的购买量也越高,前一时间段内用户群体对产品词所对应商品的购买量越低则后一时间段内用户群体对产品词所对应商品的购买量也越低;当m取值为负时,表明后一时间段内用户群体对产品词所对应商品的购买量的高低,更有可能与前一时间段内用户群体对产品词所对应商品的购买量的高低负相关,即前一时间段内用户群体对产品词所对应商品的购买量越高则后一时间段内用户群体对产品词所对应商品的购买量越低,前一时间段内用户群体对产品词所对应商品的购买量越低则后一时间段内用户群体对产品词所对应商品的购买量越高;当m取值为零时,表明用户群体对产品词所对应商品的购买量的高低与前后时间内用户群体对产品词所对应商品的购买量的高低无关。步骤s102:基于爆发特性值和记忆特性值筛选出目的产品词。产品词在时间维度上的爆发特性值和记忆特性值反映的是用户的购买需求在时间维度上的特征,基于爆发特性值和记忆特性值可以对产品词进行过滤,能够筛选出具有明显的爆发特性和记忆特性的目的产品词。具体地,可以根据实际情况或需求预先设置爆发特性参数和记忆特性参数,通过爆发特性参数和记忆特性参数对产品词进行过滤得到与时间具有较高的关联性的目的产品词。在本发明实施例中,基于爆发特性值和记忆特性值筛选出目的产品词包括:将产品词的爆发特性值和记忆特性值分别与预设的爆发特性参数和记忆特性参数进行比较;选择爆发特性值大于预设的爆发特性参数且记忆特性值大于预设的记忆特性参数的产品词作为目的产品词。步骤s103:根据设定时间范围内用户购买目的产品词对应商品的行为确定目的产品词在设定时间范围的购买权重。通过步骤s102对产品词进行过滤能够得到目的产品词,在设定时间范围内,对用户购买目的产品词所对应商品的行为进行聚合,即统计各个用户在设定时间范围内购买各目的产品词所对应商品的行为,能够计算出计算目的产品词在设定时间范围内的购买权重,该权重能够体现出设定时间范围内用户群体的购买需求,因此,可以基于权重分析购买需求,还可以基于权重在设定时间范围内制定目的产品词的商品推荐或广告推广策略。需要说明的是,设定时间范围是指不同周期的同一时间段,例如基于2015年-2017年的数据分析2018年9月的用户群体的购买需求时,以12个月作为一个周期,则设定时间范围包括2015年9月、2016年9月、2017年9月和2018年9月。具体地,本步骤可以通过隐含狄利克雷分布(lda)模型计算各目的产品词在设定时间范围的购买权重,该lda模型的输入数据为在该设定时间范围内各个用户购买商品所对应的目的产品词,需要说明的是,输入数据的每一行表示一个用户在设定时间范围内的购买行为,即每一行包含的是某个用户在该设定时间范围内已购买的目的产品词对应商品。例如,某个用户购买了手机、蚊香和笔记本电脑,则lda的输入为“手机蚊香笔记本电脑”;lda模型的输出数据为目的产品词及其在该设定时间范围内的购买权重,即输出数据包括了各目的产品词在该设定时间范围内的购买权重。在本发明实施例中,确定目的产品词在设定时间范围的购买权重包括:利用lda模型计算目的产品词在设定时间范围的购买权重。需要说明的是,lda模型是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式输出,同时它是一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量。根据本发明实施例的分析购买需求的方法可以看出,因为采用基于产品词在时间维度上的爆发特性和记忆特性来分析用户群体的购买需求的技术手段,所以克服了在用户个体层面上分析用户购买需求耗费大量资源,以及忽略了用户的购买需求是与时间相关联的技术问题,进而达到准确分析用户群体在不同时间的购买需求;提高用户群体的购物体验;增强用户群体的购物粘度的技术效果。图2是根据本发明实施例的分析购买需求的装置的主要模块的示意图。如图2所示,本发明实施例的一种分析购买需求的装置200主要包括:第一计算模块201、筛选模块202、第二计算模块203。其中,第一计算模块201,用于计算至少一个商品标题中的产品词的爆发特性值和记忆特性值;筛选模块202,用于基于所述爆发特性值和所述记忆特性值筛选出目的产品词;第二计算模块203,用于根据设定时间范围内用户购买所述目的产品词对应商品的行为确定所述目的产品词在所述设定时间范围的购买权重。为了快速准确地分析用户的购买需求、提升用户的购物体验、增强用户购物粘度,本发明实施例的分析购买需求的装置200结合时间维度对用户的购买需求进行分析,基于产品词在时间维度上的爆发特性和记忆特性来分析用户群体的购买需求,能够准确分析用户群体在不同时间的购买需求,提高了用户群体的购物体验,增强了用户群体的购物粘度。在本发明实施例中,所述第一计算模块201还用于:基于所述产品词所对应商品的属性对所述产品词进行聚合得到有效产品词;计算所述有效产品词的所述爆发特性值和所述记忆特性值。此外,所述爆发特性值根据如下公式确定:其中,b表示爆发特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内所述产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。此外,记忆特性值根据如下公式确定:其中,m表示记忆特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内所述产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。在本发明实施例中,所述筛选模块202还用于:将所述产品词的所述爆发特性值和所述记忆特性值分别与预设的爆发特性参数和记忆特性参数进行比较;选择所述爆发特性值大于预设的爆发特性参数且所述记忆特性值大于预设的记忆特性参数的所述产品词作为所述目的产品词。在本发明实施例中,所述第二计算模块203具体用于:利用lda模型计算所述目的产品词在所述设定时间范围的所述购买权重。根据本发明实施例的分析购买需求的装置可以看出,因为采用基于产品词在时间维度上的爆发特性和记忆特性来分析用户群体的购买需求的技术手段,所以克服了在用户个体层面上分析用户购买需求耗费大量资源,以及忽略了用户的购买需求是与时间相关联的技术问题,进而达到准确分析用户群体在不同时间的购买需求;提高用户群体的购物体验;增强用户群体的购物粘度的技术效果。图3是根据本发明实施例的分析购买需求的方法的实现流程示意图。在本发明实施例中,为了避免个别用户的特殊需求对于分析用户群体购买需求的影响,并降低分析购买需求所耗费的资源,需要选择符合特定要求的数据(即分析的数据来源于购物次数及购物种类均超过预设值的用户)进行分析,如图3所示,具体的分析购买需求的方法可以通过以下流程实现:步骤s301:对商品标题进行拆分以获得产品词。从需要分析的数据中获取多个商品标题,利用分词操作对所获取到的多个商品标题进行拆分并标注,即将商品标题拆分为多个分词,并对拆分得到的每个分词的种类进行标注,其中,分词的种类主要包括:产品词、品牌词以及修饰词等,且产品词可以用p表示,例如“连衣裙”;品牌词可以用b表示,例如“101忠狗”;修饰词可以用q表示,例如“浅蓝色”。步骤s302:对产品词进行聚合。由于同一个产品词可能对应于多个商品,因此,还可以按照产品词所对应商品的属性对产品词进行聚合,在对产品词进行聚合时,可以对包含相同产品词的商品进行聚合,例如产品词“裤子”,可以统计包含“a品牌裤子”、“b品牌裤子”以及“c品牌裤子”等词的商品的用户购买行为。步骤s303:分析产品词的爆发特性。产品词在时间维度上的爆发特性与用户群体对于该产品词所对应商品的需求的突发性相一致,可以用来描述用户群体所具有的与时间密切相关的购买需求,即产品词的爆发特性体现了某一时间范围内该产品词所对应商品的需求信息。产品词的爆发特性可以用爆发特性值来度量,爆发特性值可以通过如下公式计算:其中,b表示爆发特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。计算出的爆发特征值的取值范围为[-1,1],其中,当b取值为正时,表示用户群体对产品词所对应商品的购买行为具有爆发特性,且b的值越大爆发特性越明显;当b取值为负时,表示用户群体对产品词所对应商品的购买行为具有周期性,且b的值越小周期性越明显;当b取值为零时,表示用户群体对产品词所对应商品的购买行为即不具有爆发特性也不具有周期性。步骤s304:分析产品词的记忆特性。在计算产品词的爆发特性值的同时,计算产品词的记忆特性值。产品词在时间维度上的记忆特性与用户群体对于该产品词所对应商品的需求的持续性相一致,可以用来描述用户群体所具有的购买需求的持续性,即产品词的记忆特性体现了某一时间范围内用户群体对该产品词所对应商品的持续需求信息。产品词的记忆特性可以用记忆特性值来度量,记忆特性值可以通过如下公式计算:其中,m表示记忆特性值、q表示周期长度、n表示周期的个数以及sti和stj分别表示在第t个周期中第i和j个时间段内产品词所对应商品的购买量,且t≤n、1≤i≤q、1≤j≤q。计算出的记忆特性值的取值范围为[-1,1]。当m取值为正时,表明后一时间段内用户群体对产品词所对应商品的购买量的高低,更有可能与先前一时间段内用户群体对产品词所对应商品的购买量的高低正相关;当m取值为负时,表明后一时间段内用户群体对产品词所对应商品的购买量的高低,更有可能与先前一时间段内用户群体对产品词所对应商品的购买量的高低负相关;当m取值为零时,表明用户群体对产品词所对应商品的购买量的高低与前后时间内用户群体对产品词所对应商品的购买量的高低无关。步骤s305:对产品词进行筛选得到目的产品词。可以根据实际情况或需要预先设置爆发特性参数和记忆特性参数,通过爆发特性值、记忆特性值、爆发特性参数和记忆特性参数对产品词进行过滤得到目的产品词,即选择爆发特性值大于爆发特性参数且记忆特性值大于记忆特性参数的产品词作为目的产品词。此外,如图4所示,可以基于爆发特性值和记忆特性值构建爆发特性值-记忆特性值(m-b)分布图,通过m-b分布图能够直观的体现产品词在两个维度(爆发特性和记忆特性)上的特性分布,因此,可以利用m-b分布图对产品词进行过滤。步骤s306:对用户购买目的产品词所对应商品的行为进行聚合。在时间维度上对用户购买目的产品词所对应商品的行为进行聚合,统计各个用户在设定时间范围内购买各目的产品词所对应商品的行为,即在设定时间范围内,整合每个用户所购买商品对应于哪一目的产品词,如果与用户所购买商品对应的产品词不是目的产品词,则不整合该商品。步骤s307:计算目的产品词的购买权重。基于时间范围内各个用户购买各目的产品词的行为计算时间范围内各目的产品词的购买权重,其中,目的产品词的购买权重越大,则在该时间段内用户群体越需要此产品词对应商品。可以通过隐含狄利克雷分布(lda)模型计算各目的产品词的购买权重,具体地,lda模型的输入数据为在该设定时间范围内各个用户购买商品所对应的目的产品词,需要说明的是,输入数据的每一行表示一个用户在设定时间范围内的购买行为,即每一行包含的是某个用户在该设定时间范围内已购买的目的产品词,例如,某个用户购买了手机、蚊香和笔记本电脑,则lda的输入为“手机蚊香笔记本电脑”;lda模型的输出数据为目的产品词及其在该时间段内的购买权重,即输出数据包括了各目的产品词在该时间段内的购买权重。通过上述步骤得到的目的产品词的购买权重,能够体现在某一时间段内用户的购买需求,因此,可以基于目的产品词的购买权重制定商品推荐或广告推广策略。现结合具体的应用场景对本发明实施例提供的分析购买需求的方法进行介绍,假设基于500个用户(所有用户均符合购物次数及购物种类要求)的数据进行分析,以分析用户群体在一月和六月的购买需求,该数据中包括5000个商品标题。此外,在分析时,一月和六月可以设置不同的爆发特性参数和记忆特性参数,也可以使用相同的爆发特性参数和记忆特性参数。本发明实施例中一月和六月使用相同的爆发特性参数和记忆特性参数,爆发特性参数和记忆特性参数分别设置为0.1000和0.2000;选择lda模型计算各目的产品词的购买权重,则具体的分析过程如下:首先,将这5000个商品标题进行拆分,并对拆分得到的分词添加种类标注,获取其中的产品词及其所对应商品的用户群体购买量,同时,对产品词进行聚合,对包含相同的产品词的商品的购买量进行合并统计。然后,根据公式计算各产品词的爆发特性值;同时根据公式计算各产品词的记忆特性值。本发明实施例中,q取值为12(表示12个自然月)、n取值为1(表示一个周期),所计算出的各产品词的爆发特性值和记忆特性值如表1所示,其中,活力棉、加厚棉服、童棉衣、加厚棉衣、藤席子、粽子等产品词具有一定的爆发特性,棉服、秋冬装、电风扇等产品词具有较明显的记忆特性。表1产品词爆发特性记忆特性秋衣0.1395540474810.825877132104秋裤0.1496705190310.819813547456棉衣0.1936977564660.835794280692棉服0.2014450189460.841251017703冬装0.1801708820380.813878538763棉毛衫0.1499981590600.807167375113羽绒服0.1804165589530.807152206991秋冬装0.1163641242550.860435588487大衣0.1121295445110.822329250418保暖外套0.1963604452440.847555856074保暖裤0.1782658058800.833712205947羽绒外套0.2083838176120.812692639106毛呢外套0.1383341795670.789999495332保暖衣0.1769245120290.827418625387加厚外套0.1942739527650.853474854796呢大衣0.1303451997610.774990307389活力棉0.2244543617050.631193948390加厚棉服0.2327195337780.844933620233童棉衣0.2316932308250.817049393952加厚棉衣0.2244634248600.792627048497夏凉席子0.1810301338720.647560437222床席0.1427303877180.665073357656藤席0.1172435899440.715262544199冰丝席0.1815251292670.680830495466电风扇0.1103449679210.724922079269落地扇0.1628205655830.709157767420藤席子0.2212008922210.572239495560席子0.1321870151580.690544424359空调席0.1400553101830.689780480955空调席子0.1478717613030.643535197468御藤席0.1080355232160.720825855390凉席子0.1499564919650.702339586604双面席0.1657792140060.637056801905薄被子0.1172431735280.574185099092转页扇0.1815732713990.691101520457塔扇0.1734167356400.692760909991单人床席0.1715863981560.477904877842夏凉席0.1478393734460.701824739782凳子垫0.1167915985950.534704033806粽子0.3638174561580.251532629060最后,分别分析用户群体在一月和六月的购买需求。对产品词进行筛选得到目的产品词。一月:利用预先设置的爆发特性参数和记忆特性参数对产品词进行筛选得到目的产品词,爆发特性值大于爆发特性参数且记忆特性值大于记忆特性参数的产品词即为目的产品词。六月:利用同样的爆发特性参数和记忆特性参数对产品词进行筛选得到目的产品词,爆发特性值大于爆发特性参数且记忆特性值大于记忆特性参数的产品词即为目的产品词。利用lda模型计算各目的产品词的购买权重。计算一月所筛选出的各目的产品词的购买权重时,lda模型的输入数据为各个用户在一月购买商品所对应的目的产品词,即每一行包含一个用户在一月已购买的目的产品词。计算六月所筛选出的各目的产品词的购买权重时,lda模型的输入数据为各个用户在六月购买商品所对应的目的产品词,即每一行包含一个用户在六月已购买的目的产品词。一月所筛选出的各目的产品词及其权重如表2所示,六月所筛选出的各目的产品词及其权重如表3所示,可以根据各目的产品词的购买权重来分析用户群体在一月和六月的购买需求,还可以进一步地制定一月和六月的推荐产品或推送广告的策略。表2表3产品词权重夏凉席子0.1345床席0.1305藤席0.1198冰丝席0.1010电风扇0.0941落地扇0.0627藤席子0.0595席子0.0432空调席0.0336空调席子0.0315御藤席0.0158凉席子0.0153双面席0.0150薄被子0.0138转页扇0.0130塔扇0.0129单人床席0.0091夏凉席0.0090凳子垫0.0055粽子0.0050综上所述,本发明实施例的分析购买需求的方法能够针对不同时间范围进行具有针对性的分析,从而得到用户群体在某一特定时间的购买需求。图5示出了可以应用本发明实施例的分析购买需求的方法或分析购买需求的装置的示例性系统架构500。如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用等。终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果反馈给终端设备。需要说明的是,本发明实施例所提供的分析购买需求的方法一般由服务器505执行,相应地,分析购买需求的装置一般设置于服务器505中。应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,计算机系统600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有系统600操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本发明的系统中限定的上述功能。需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、第一计算模块、筛选模块和第二计算模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“从商品标题中获取产品词的模块”。作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:步骤s101:计算至少一个商品标题中的产品词的爆发特性值和记忆特性值;步骤s102:基于爆发特性值和记忆特性值筛选出目的产品词;步骤s103:根据设定时间范围内用户购买目的产品词对应商品的行为确定目的产品词在设定时间范围的购买权重。根据本发明实施例的技术方案,因为采用基于产品词在时间维度上的爆发特性和记忆特性来分析用户群体的购买需求的技术手段,所以克服了在用户个体层面上分析用户购买需求耗费大量资源,以及忽略了用户的购买需求是与时间相关联的技术问题,进而达到降低用户个体的购物习惯以及喜好倾向对分析用户群体的购买需求的影响,准确分析用户群体在不同时间的购买需求;提高用户群体的购物体验;增强用户群体的购物粘度的技术效果。上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1