汽车竞品车型确定方法及装置与流程

文档序号:13388486阅读:494来源:国知局
汽车竞品车型确定方法及装置与流程

【技术领域】

本发明涉及互联网数据挖掘领域,具体涉及一种汽车竞品车型确定方法及装置。



背景技术:

当前数字营销已经成为企业推广品牌、促进销售的主要方式之一。近年来,随着大数据技术和应用的快速发展,数字营销的运作模式,从预算分配到投放调整,再到投放后的效果评估,都发生了深刻的变化。

大数据对数字营销的最重要的影响之一,在于其能够综合多种来源数据,对用户的大数据进行整合分析,当进行某款汽车产品的在线广告投放和产品设计时,通常需要得到该款汽车的“竞品车型”,方便进行广告投放和产品设计,通常而言,汽车产品在产品策划阶段、开发阶段和在售阶段的竞品车型不尽相同。

产品策划阶段和开发阶段的竞品车型更多地是设计及开发人员的主观判断,不能跟进消费者的反馈进行调整,而在售阶段的汽车产品由于有了消费者的反馈使得竞品车型的识别更加精准。目前,竞品车型的实现方式比较简单,更多通过经验进行操作,常见的几种形式有:

一是凭感觉或经验定义竞品;

二是以技术规格和价格等作为衡量指标,取相近者作为竞品;

三是以细分市场中销量的前几名品牌直接作为竞品;

四是综合销量、预算、市场定位和企业竞争品牌等多种因素形成的竞品方法,如图3所示。

现有的技术存在以下缺陷:

(1)不同人员由于感觉和经验的差异,给出不同的竞品车型,准确度抖动较大;

(2)技术规格和价格的衡量指标是一种静态评估方式,与使用者真正的感受有较大差异;

(3)根据销量判断竞品车型无法区分不同等级车型的情况,存在较大缺陷;

(4)通过销量、预算、市场定位及企业竞争品牌等维度构建竞品车型的方法,无法根据使用者的反馈对竞品车型进行修正,无法进行动态调整。



技术实现要素:

本发明的目的在于提供一种汽车竞品车型确定方法及装置。

为实现该目的,本发明采用如下技术方案:

第一方面,本发明提供一种汽车竞品车型确定方法,包括如下步骤:

从多个汽车相关网站及应用的车辆基础数据及用户行为数据获取各个车型的至少一个特征指标;

根据主成分分析规则确定每个所述特征指标的权重,为每一个车型生成包含所述特征指标对应数值的数组;

以每一所述数组确定对应坐标系上的一个特征点,并计算任意两个所述特征点的关联程度,以此构建竞品车型预测模型;

当输入一个车型时,根据所述竞品车型预测模型获取与该车型对应的特征点的关联程度在预设范围内的目标特征点,由该目标特征点确定相应的竞品车型。

具体的,所述车型的特征指标包括销售线索指标、降价指标、关注度指标及对比数指标的一种或多种。

具体的,所述车型的销售线索指标由如下步骤确定:

分别获取每一个城市的每个车型提交过销售线索量;

统计所有城市每个车型的销售线索之和作为每一个车型的所述销售线索指标。

进一步的,所述车型的降价指标由如下步骤确定:

获取所有城市同一车型不同车款的售价均值及降价均值;

根据所述售价均值及降价得到该车型的降价百分比;

将所述降价百分比乘以预设值作为该车型的所述降价指标。

进一步的,所述车型的关注度指标由如下步骤确定:

分别获取每一个城市的每个车型的页面浏览量;

计算所有城市每个车型的页面浏览量之和作为每个车型的所述关注度指标。

进一步的,所述车型的对比数指标由如下步骤确定:

获取用户进行过相互比较的每个车款的次数;

由所述车款确定对应的车型,并计算每个车型被比较过的次数之和作为每个车型的所述对比数指标。

优选的,所述特征指标在预设时间内的汽车相关网站及应用的车辆基础数据及用户行为数据中获取得到。

可选的,所述任意两个所述特征点的关联程度包括任意两个所述特征点的相关系数或欧式距离。

第二方面,本发明提供一种汽车竞品车型确定装置,包括:

获取模块:用于从多个汽车相关网站及应用的车辆基础数据及用户行为数据获取各个车型的至少一个特征指标;

权重确定模块:用于根据主成分分析规则确定每个所述特征指标的权重,为每一个车型生成包含所述特征指标对应数值的数组;

关联度确定模块:用于以每一所述数组确定对应坐标系上的一个特征点,并计算任意两个所述特征点的关联程度,以此构建竞品车型预测模型;

车型确定模块:用于当输入一个车型时,根据所述竞品车型预测模型获取与该车型对应的特征点的关联程度在预设范围内的目标特征点,由该目标特征点确定相应的竞品车型。

与现有技术相比,本发明具备如下优点:

本发明选出的特征指标均可以很好地表现车型的特征,并且竞品车之间这些特征均有着相似的情况,其中,车型的销售线索指标是反应该车受用户欢迎程度的重要指标;降价指标是考虑到竞品车型在销售策略上有着相似的模式;关注度指标是考虑到用户对竞品车型的浏览情况是近似相同的;对比数指标是反应竞品的最直观的指标之一,通过用户对车型的对比情况更能直观的看出用户关注的本品车以及其相关的竞品车;

同时,本模型运用聚类的思想以及用主成分分析的方法来确定特征的权重,使得模型有着很好的数学理论支持;

再者,本模型可以灵活、动态地调整特征指标数据的来源,使得所获得的竞品车型能更好地适应市场环境、适应用户需求。

显然,上述有关本发明优点的描述是概括性的,更多的优点描述将体现在后续的实施例揭示中,以及,本领域技术人员也可以本发明所揭示的内容合理地发现本发明的其他诸多优点。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

【附图说明】

图1为本发明汽车竞品车型确定方法的一实施例流程示意图;

图2为本一个汽车网站上关于“帕萨特2016款”的相关数据的示意图;

图3是现有技术中分析竞品车型的一种方法示意图;

图4为本发明汽车竞品车型确定装置的一实施例示意图。

【具体实施方式】

下面结合附图和示例性实施例对本发明作进一步地描述,其中附图中相同的标号全部指的是相同的部件。此外,如果已知技术的详细描述对于示出本发明的特征是不必要的,则将其省略。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

在进行本实施例的具体描述之前,先对本实施例中出现的车型、车款作如下解释:

车型是在车辆品牌的基础上进行划分的,比如德系车下的大众品牌,大众品牌下面有帕萨特、途观、辉腾等车型。

车款是指同一车型的不同款式,比如帕萨特有2015款和2016款、本田雅阁1代到7代,均属于车款。

步骤s100:从多个汽车相关网站及应用的车辆基础数据及用户行为数据获取各个车型的至少一个特征指标。

本实施例的目的旨在建立一个汽车竞品车型预测模型,以此更精确地找出某一车型对应的竞品车型。本实施例通过从多个汽车相关的互联网网站、应用程序的车辆基础数据及用户行为数据中获取各个车型的至少一个特征指标,如“易车”、“汽车之家”等网站均提供了大量的车辆基础数据,所述车辆基础数据包括车辆的款式、配置、厂商指导价格、商家销售价格等,用户可以从该类网站获取到车辆的各种基础信息,同时,用户在网站上的各种操作行为都被记录为用户行为数据,所获取到的车辆基础数据及用户行为数据通过下述方法转化成相应的特征指标后为本实施例的竞品车型预测模型提供数据支持。

具体的,将车辆基础数据及用户行为数据转化成的所述特征指标包括销售线索指标、降价指标、关注度指标及对比数指标的一种或多种。

销售线索又称saleslead,是在销售管理体系中处于客户产生机会的最前端,比如一个用户在浏览了一个汽车广告后,留下自己的联系方式记为一次量的销售线索。例如用户在“易车网”上浏览雅阁7代,然后填入了自己的联系方式预约去当地的4s车店看车、试车,此时记雅阁7代的销售线索量为1次。本实施例首先从多个汽车相关网站及应用获取每一个城市的每个车型提交过的销售线索量,然后统计所有城市每个车型的销售线索总和作为每一个车型的所述销售线索指标。

降价指标,在本实施例中,规定一个车型的所有车款的降价的均值为该车型的降价值,该车型的所有车款的均值为该车型的车价值,根据所述降价值同所述车价值得到该车型的降价百分比,然后将所述降价百分比乘以预设值作为该车型的所述降价指标。如图2所示是一个汽车网站上关于“帕萨特2016款”的相关数据,同时该款车标出了“降价2.5万元,降价百分比为14%”,一般地,汽车相关网站均会标明一款汽车的降价信息,本实施例首先统计该车型的所有车款的降价的均值,再与该车型的所有车款的厂商指导价均值计算得出降价百分比,乘以预设值后作为该车型的降价指标,在本实施例中,所述预设值设为10000。

关注度是指用户行为数据中对某一车款的点击量/浏览量/搜索量,在本实施例中,以浏览量为例进行说明,用户通过不同的方式进入“xx车款”的信息展示界面,每刷新一次该信息展示界面,记为一次浏览量(或称pv流量),通过pv流量可以直观地得出每一款车的关注度,本实施例中,首先获取每一个城市的每个车型的pv量,然后统计所有城市每个车型的pv量总和作为每一个车型的所述关注度指标。

同时,大多数的汽车网站/应用都提供了对比车型、车款的功能,用户可以更好地比较两款或多款车辆的不同信息,一般地,用户选取对比的多个车款后,相关网站/应用会记录用户对比过的车款字段,然后通过拆分该字段可以得到每一次用户对比的多个车款,再由该车款可以得到对应的车型,每一次用户对比的车款均记为对应车型的1次对比量,在本实施例中,统计所有车型的对比量的综合作为每一个车型的所述对比数指标。

优选的,所述特征指标在预设时间内的汽车相关网站及应用的车辆基础数据及用户行为数据中获取得到,所述预设时间可以是1个月、2个月、半年等。

步骤s200:根据主成分分析规则确定每个所述特征指标的权重,为每一个车型生成包含所述特征指标对应数值的数组。

不同特征指标对于预测竞品车型的影响程度不同,本实施例通过主成分分析规则确定每一个特征指标对于竞品车型预测的权重,主成分分析是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关,通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标;其中,最经典的做法就是用f1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即var(f1)越大,表示f1包含的信息越多。因此在所有的线性组合中选取的f1应该是方差最大的,故称f1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取f2即选第二个线性组合,为了有效地反映原来信息,f1已有的信息就不需要再出现在f2中,用数学语言表达就是要求cov(f1,f2)=0,则称f2为第二主成分,依此类推可以构造出第三、第四,……,第p个主成分。具体的,主成分分析的步骤如下:

1.原始指标数据的标准化采集p维随机向量x=(x1,x2,x3,...xp)t,n个样品xi=(xi1,xi2,...,xip)t,i=1,2,...n,n>p,构造样本阵,对样本阵元进行如下标准化变换:

其中,,

2.对标准化阵z求相关系数矩阵

其中,

3.解样本相关矩阵r的特征方|r-λip|个特征p,确定主成分按确定m值,使信息的利用率达到85%以上,对每一个λj,j=1,2,...m,解方程组rb=λj。得单位特征向量

4.将标准化的指标变量转化为主成分

u1称为第一主成分,u2称为第二主成分,...,up称为第p主成分。

5.对m个主成分进行综合评价

对m个主成分进行加权求和,即得到最终评价值,权重为每个主成分的方差贡献率。

经过上述计算,得到销售线索指标、降价指标、关注度指标、对比数指标的权重分别为0.33、0.04、0.31、0.32,再为每一个车型生成一个包含所述特征指标对应数值的数组,该数组由权重乘以各自的特征指标数值,得到一个包含4个变量的数组。

步骤s300:以每一所述数组确定对应坐标系上的一个特征点,并计算任意两个所述特征点的关联程度,以此构建竞品车型预测模型。

例如上述得到的一个特征点的坐标为x(x,x,x,x),另一个特征点的坐标为y(y,y,y,y),然后计算任意两个特征点的关联程度,本实施例中,采用聚类分析来描述两个点的关联程度,在聚类分析中,常用的研究对象之间的联系的紧密程度可以用“距离”或“相关系数”指标,在一种实施例中,将“距离”较小的点或“相似系数”较大的点归为同一类,将“距离”较大的点或“相似系数”较小的点归为不同的类,在本实施例中,采用距离来研究对象之间的关联程度,在一种实施方式中,测量距离的方法选取欧式距离,对于任意两个点xi=(xi1,xi2…,xik)、xj=(xj1,xj2…,xjk),k=1,2,3...n,这两点的欧式距离为至此,以坐标系上的每一个特征点代表一个不同的车型,以此构建了一个竞品车型预测模型,通过该模型可以更加精确地预测一个车型的竞品车型。

步骤s400:当输入一个车型时,根据所述竞品车型预测模型获取与该车型对应的特征点的关联程度在预设范围内的目标特征点,由该目标特征点确定相应的竞品车型。

由上述方法确定了一个车型预测模型,当在这个模型中输入某一“车型”信息时,将输入的车型信息转化为该模型上对应的特征点,然后查找与该特征点的关联程度在预设范围内的目标特征点,然后输出由该目标特征点确定的相应的竞品车型。进一步的,所述竞品车型按照关联程度从大到小进行排列,关联程度越大说明互为竞品车型的可能性越高。例如,当输入的车型信息为“帕萨特”时,得到的竞品车型为“丰田凯美瑞”、“本田雅阁”、“别克君越”等。

相应地,如图4所示是本发明汽车竞品车型确定装置的一实施例示意图,包括:

获取模块100:用于从多个汽车相关网站及应用的车辆基础数据及用户行为数据获取各个车型的至少一个特征指标。

本实施例的获取模块100通过从多个汽车相关的互联网网站、应用程序的车辆基础数据及用户行为数据中获取各个车型的至少一个特征指标,如“易车”、“汽车之家”等网站均提供了大量的车辆基础数据,所述车辆基础数据包括车辆的款式、配置、厂商指导价格、商家销售价格等,用户可以从该类网站获取到车辆的各种基础信息,同时,用户在网站上的各种操作行为都被记录为用户行为数据。

具体的,获取模块100将车辆基础数据及用户行为数据转化成的所述特征指标包括销售线索指标、降价指标、关注度指标及对比数指标的一种或多种。

销售线索又称saleslead,是在销售管理体系中处于客户产生机会的最前端,比如一个用户在浏览了一个汽车广告后,留下自己的联系方式记为一次量的销售线索。例如用户在“易车网”上浏览雅阁7代,然后填入了自己的联系方式预约去当地的4s车店看车、试车,此时记雅阁7代的销售线索量为1次。本实施例的获取模块100首先从多个汽车相关网站及应用获取每一个城市的每个车型提交过的销售线索量,然后统计所有城市每个车型的销售线索总和作为每一个车型的所述销售线索指标。

降价指标,在本实施例中,规定一个车型的所有车款的降价的均值为该车型的降价值,该车型的所有车款的均值为该车型的车价值,根据所述降价值同所述车价值得到该车型的降价百分比,然后将所述降价百分比乘以预设值作为该车型的所述降价指标。如图2所示是一个汽车网站上关于“帕萨特2016款”的相关数据,同时该款车标出了“降价2.5万元,降价百分比为14%”,一般地,汽车相关网站均会标明一款汽车的降价信息,本实施例的获取模块100首先统计该车型的所有车款的降价的均值,再与该车型的所有车款的厂商指导价均值计算得出降价百分比,乘以预设值后作为该车型的降价指标,在本实施例中,所述预设值设为10000。

关注度是指用户行为数据中对某一车款的点击量/浏览量/搜索量,在本实施例中,以浏览量为例进行说明,用户通过不同的方式进入“xx车款”的信息展示界面,每刷新一次该信息展示界面,记为一次浏览量(或称pv流量),通过pv流量可以直观地得出每一款车的关注度,本实施例中,获取模块100首先获取每一个城市的每个车型的pv量,然后统计所有城市每个车型的pv量总和作为每一个车型的所述关注度指标。

同时,大多数的汽车网站/应用都提供了对比车型、车款的功能,用户可以更好地比较两款或多款车辆的不同信息,一般地,用户选取对比的多个车款后,相关网站/应用会记录用户对比过的车款字段,然后通过拆分该字段可以得到每一次用户对比的多个车款,再由该车款可以得到对应的车型,每一次用户对比的车款均记为对应车型的1次对比量,在本实施例中,获取模块100统计所有车型的对比量的综合作为每一个车型的所述对比数指标。

优选的,所述特征指标在预设时间内的汽车相关网站及应用的车辆基础数据及用户行为数据中获取得到,所述预设时间可以是1个月、2个月、半年等。

权重确定模块200:用于根据主成分分析规则确定每个所述特征指标的权重,为每一个车型生成包含所述特征指标对应数值的数组。

不同特征指标对于预测竞品车型的影响程度不同,本实施例的权重确定模块200通过主成分分析规则确定每一个特征指标对于竞品车型预测的权重,主成分分析是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关,通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。具体的,主成分分析的步骤如下:

1.原始指标数据的标准化采集p维随机向量x=(x1,x2,x3,...xp)t,n个样品xi=(xi1,xi2,...,xip)t,i=1,2,...n,n>p,构造样本阵,对样本阵元进行如下标准化变换:

其中,,

2.对标准化阵z求相关系数矩阵

其中,

3.解样本相关矩阵r的特征方|r-λip|个特征p,确定主成分按确定m值,使信息的利用率达到85%以上,对每一个λj,j=1,2,...m,解方程组rb=λj。得单位特征向量

4.将标准化的指标变量转化为主成分

u1称为第一主成分,u2称为第二主成分,...,up称为第p主成分。

5.对m个主成分进行综合评价

对m个主成分进行加权求和,即得到最终评价值,权重为每个主成分的方差贡献率。

权重确定模块200经过上述计算,得到销售线索指标、降价指标、关注度指标、对比数指标的权重分别为0.33、0.04、0.31、0.32,再为每一个车型生成一个包含所述特征指标对应数值的数组,该数组由权重乘以各自的特征指标数值,得到一个包含4个变量的数组。

关联度确定模块300:用于以每一所述数组确定对应坐标系上的一个特征点,并计算任意两个所述特征点的关联程度,以此构建竞品车型预测模型。

本实施例中,关联度确定模块300采用聚类分析来描述两个点的关联程度,在聚类分析中,常用的研究对象之间的联系的紧密程度可以用“距离”或“相关系数”指标,在一种实施例中,将“距离”较小的点或“相似系数”较大的点归为同一类,将“距离”较大的点或“相似系数”较小的点归为不同的类,在本实施例中,采用距离来研究对象之间的关联程度,在一种实施方式中,测量距离的方法选取欧式距离,对于任意两个点xi=(xi1,xi2...,xik)、xj=(xj1,xj2…,xjk),k=1,2,3...n,这两点的欧式距离为至此,以坐标系上的每一个特征点代表一个不同的车型,以此构建了一个竞品车型预测模型。

车型确定模块400:用于当输入一个车型时,根据所述竞品车型预测模型获取与该车型对应的特征点的关联程度在预设范围内的目标特征点,由该目标特征点确定相应的竞品车型。

当在这个模型中输入某一“车型”信息时,车型确定模块400将输入的车型信息转化为该模型上对应的特征点,然后查找与该特征点的关联程度在预设范围内的目标特征点,然后输出由该目标特征点确定的相应的竞品车型。进一步的,所述竞品车型按照关联程度从大到小进行排列,关联程度越大说明互为竞品车型的可能性越高。例如,当输入的车型信息为“帕萨特”时,得到的竞品车型为“丰田凯美瑞”、“本田雅阁”、“别克君越”等。

本发明选出的特征指标均可以很好地表现车型的特征,并且竞品车之间这些特征均有着相似的情况,其中,车型的销售线索指标是反应该车受用户欢迎程度的重要指标;降价指标是考虑到竞品车型在销售策略上有着相似的模式;关注度指标是考虑到用户对竞品车型的浏览情况是近似相同的;对比数指标是反应竞品的最直观的指标之一,通过用户对车型的对比情况更能直观的看出用户关注的本品车以及其相关的竞品车;同时,本模型运用聚类的思想以及用主成分分析的方法来确定特征的权重,使得模型有着很好的数学理论支持;再者,本模型可以灵活、动态地调整特征指标数据的来源,使得所获得的竞品车型能更好地适应市场环境、适应用户需求。

虽然上面已经示出了本发明的一些示例性实施例,但是本领域的技术人员将理解,在不脱离本发明的原理或精神的情况下,可以对这些示例性实施例做出改变,本发明的范围由权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1