一种营销策略的识别方法、服务器和计算机存储介质与流程

文档序号:17696930发布日期:2019-05-17 21:38阅读:152来源:国知局
一种营销策略的识别方法、服务器和计算机存储介质与流程

本发明涉及大数据技术,尤其涉及一种营销策略的识别方法、服务器和计算机存储介质。



背景技术:

目前,为了吸引用户进行消费,为用户提供产品/服务的公司往往都会推出一些营销活动。为了更好的推出营销活动,需要对营销活动进行分析,以便基于分析结果更好的开展营销活动,满足用户的需求。

通常,搜集到的营销活动的信息以文字形式记载在文本文件中。举例来说,文本文件中用于描述营销活动的文字内容比如为“300分钟全国主叫、国内被叫免费,还赠12个月20gb不限速流量”,这样的文字内容,记载的是营销活动的一个营销策略。同一文本文件,可能会记载营销活动的一个或多个营销策略。

如何从文本文件中识别出营销策略,是现有技术亟待解决的问题。



技术实现要素:

有鉴于此,本发明实施例期望提供一种营销策略的识别方法、服务器和计算机存储介质,以解决现有技术中存在的如何从文本文件中识别出营销策略的问题。

本申请的技术方案是这样实现的:

第一方面,本申请实施例提供了一种营销策略的识别方法,所述方法包括:

获取记载有第一营销活动的信息的文本文件;

调用预先训练好的条件随机场模型,对所述文本文件进行识别,以从所述文本文件中识别出所述第一营销活动所包含的第一营销策略;其中,所述训练好的条件随机场模型,采用下述方式训练得到:

将记载有第二营销活动的信息的样本文本文件转换成历史状态序列;所述历史状态序列,由所述第二营销活动包含的各第二营销策略的状态转换序列首尾相连构成;所述第二营销策略的状态转换序列,由所述第二营销策略的状态参数构成;

通过对所述历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列;

利用所述处理后的历史状态序列对条件随机场模型进行优化训练,以得到所述训练好的条件随机场模型。

在上述方法中,通过对所述历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列,具体包括:

计算锚点状态序列与所述历史状态序列的点乘结果,作为所述处理后的历史状态序列;

所述锚点状态序列,由分别对应所述各第二营销策略的状态转换序列的锚点状态转换序列首位相连构成;

其中,锚点状态转换序列由锚点状态参数构成;锚点状态参数与营销策略的状态参数相对应;

锚点状态转换序列中分别与各第二营销策略的最后一个有效状态的值相对应的锚点状态参数,为用以区分标记所述各第二营销策略的状态转换序列的指定值。

在上述方法中,所述第二营销策略的状态参数包括以下一项或多项:

产品名称的状态参数,产品属性的状态参数,产品数量的状态参数,产品单位的状态参数,特定状态的状态参数,空状态的状态参数。

在上述方法中,所述锚点状态参数采用下列方式设置:

针对每个第二营销策略的每个状态参数,执行下述步骤:

判断该状态参数是否为该第二营销策略的最后一个有效状态的值;

若是,则将与该状态参数相对应的锚点状态参数设置为1;

若否,则将与该状态参数相对应的锚点状态参数设置为0。

在上述方法中,从所述文本文件中识别出所述第一营销活动所包含的第一营销策略之后,所述方法还包括:

根据所述第一营销策略,确定所述第一营销策略中所包括的营销特征;

将所述第一营销策略中所包括的营销特征的特征值组成所述第一营销策略的营销特征向量;

将所述第一营销策略的营销特征向量中的每个元素进行平方,得到处理后的第一营销策略的营销特征向量;

将所述处理后的第一营销策略的营销特征向量,输入至所述训练好的逻辑回归函数模型,得到所述第一营销策略所对应的分数值;

其中,所述第一营销策略所对应的分数值用于表征所述第一营销活动的活动力度。

在上述方法中,所述训练好的逻辑回归函数模型,采用如下方式训练:

获取经过训练好的条件随机场模型训练得到的各第三营销活动所包括的第三营销策略的营销特征向量样本,和每个第三营销策略所对应的分数值;

将各每个第三营销策略的营销特征向量中的每个元素进行平方,得到处理后的每个第三营销策略的营销特征向量;

利用所述处理后的每个第三营销策略的营销特征向量和每个第三营销策略所对应的分数值,对逻辑回归函数模型进行训练,得到训练好的逻辑回归函数模型。

在上述方法中,所述营销特征的特征值包括以下一项或多项:营销活动发布方的公司级别的特征值,营销活动的持续时间的特征值,营销活动的数量价格比的特征值和营销活动的性价比的特征值。

第二方面,本发明实施例提供了一种服务器,所述服务器包括:

获取单元,用于获取记载有第一营销活动的信息的文本文件;

识别单元,用于调用训练好的条件随机场模型,对所述文本文件进行识别,以从所述文本文件中识别出所述第一营销活动所包含的第一营销策略;

其中,所述训练好的条件随机场模型由服务器的训练单元采用下述方式训练得到:

将记载有第二营销活动的信息的样本文本文件转换成历史状态序列;所述历史状态序列,由所述第二营销活动包含的各第二营销策略的状态转换序列首尾相连构成;所述第二营销策略的状态转换序列,由所述第二营销策略的状态参数构成;

通过对所述历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列;

利用所述处理后的历史状态序列对条件随机场模型进行优化训练,以得到所述训练好的条件随机场模型。

在上述服务器中,所述训练单元通过对所述历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列中,具体用于:

计算锚点状态序列与所述历史状态序列的点乘结果,作为所述处理后的历史状态序列;

所述锚点状态序列,由分别对应所述各第二营销策略的状态转换序列的锚点状态转换序列首位相连构成;

其中,锚点状态转换序列由锚点状态参数构成;锚点状态参数与营销策略的状态参数相对应;

锚点状态转换序列中分别与各第二营销策略的最后一个有效状态的值相对应的锚点状态参数,为用以区分标记所述各第二营销策略的状态转换序列的指定值。

在上述服务器中,所述第二营销策略的状态参数包括以下一项或多项:

产品名称的状态参数,产品属性的状态参数,产品数量的状态参数,产品单位的状态参数,特定状态的状态参数,空状态的状态参数。

在上述服务器中,所述训练单元还用于采用下列方式设置所述锚点状态参数:

针对每个第二营销策略的每个状态参数,执行下述步骤:

判断该状态参数是否为该第二营销策略的最后一个有效状态的值;

若是,则将与该状态参数相对应的锚点状态参数设置为1;

若否,则将与该状态参数相对应的锚点状态参数设置为0。

在上述服务器中,所述服务器还包括:

确定单元,用于从所述文本文件中识别出所述第一营销活动所包含的第一营销策略之后,之后,根据所述第一营销策略,确定所述第一营销策略中所包括的营销特征;

将所述第一营销策略中所包括的营销特征的特征值组成所述第一营销策略的营销特征向量;

将所述第一营销策略的营销特征向量,输入至所述训练好的逻辑回归函数模型,得到所述第一营销策略所对应的分数值;

其中,所述第一营销策略所对应的分数值用于表征所述第一营销活动的活动力度。

在上述服务器中,所述训练单元采用如下方式进行训练得到训练好的逻辑回归函数模型:

获取经过训练好的条件随机场模型训练得到的各第三营销活动所包括的第三营销策略的营销特征向量样本,和每个第三营销策略所对应的分数值;

将各每个第三营销策略的营销特征向量中的每个元素进行平方,得到处理后的每个第三营销策略的营销特征向量;

利用所述处理后的每个第三营销策略的营销特征向量和每个第三营销策略所对应的分数值,对逻辑回归函数模型进行训练,得到训练好的逻辑回归函数模型。

在上述服务器中,所述营销特征的特征值包括以下一项或多项:营销活动发布方的公司级别的特征值,营销活动的持续时间的特征值,营销活动的数量价格比的特征值和营销活动的性价比的特征值。

第三方面,本申请实施例还提供了一种服务器,所述服务器包括:处理器以及存储有所述处理器可执行指令的存储介质,所述存储介质通过通信总线依赖所述处理器执行操作,当所述指令被所述处理器执行时,执行上述一个或多个实施例所述营销策略的识别方法。

本申请实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行上述一个或多个实施例所述营销策略的识别方法。

本发明实施例所提供的一种营销策略的识别方法、服务器和计算机存储介质,该方法包括:首先,获取记载有第一营销活动的信息的文本文件,然后,调用预先训练好的条件随机场模型,对文本文件进行识别,最后,通过识别从文本文件中识别出第一营销活动所包含的第一营销策略,其中,训练好的条件随机场模型,采用下述方式训练得到:将记载有第二营销活动的信息的样本文本文件转换成历史状态序列;历史状态序列,由第二营销活动包含的各第二营销策略的状态转换序列首尾相连构成;第二营销策略的状态转换序列,由第二营销策略的状态参数构成,通过对历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列,利用处理后的历史状态序列对条件随机场模型进行优化训练,以得到训练好的条件随机场模型;也就是说,在本发明实施例中,通过对第二营销活动的信息的样本文本文件进行转换得到历史状态序列,然后对历史状态序列进行区分标记得到处理后的历史状态序列,再利用处理后的历史状态序列对条件随机场进行优化训练,得到一个训练好的条件随机场模型,并基于优化后的模型来识别第一营销活动的信息的文本文件,这样,不需要人工筛选和识别,就能够从文本文件中识别出第一营销活动所包含的营销策略,如此,通过训练好的条件随机场模型,智能化地对营销活动的信息的文本文件进行识别,从而能够智能化的分析识别出营销策略,进而有利于运营商进行营销活动的分析和推广。

附图说明

图1为本发明实施例中的一种可选的营销策略的识别方法的流程示意图;

图2为本发明实施例中的另一种可选的营销策略的识别方法的流程示意图;

图3为本发明实施例中的再一种可选的营销策略的识别方法的流程示意图;

图4为本发明实施例中的服务器的结构示意图一;

图5为本发明实施例中的服务器的结构示意图二。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

本发明实施例提供一种营销策略的识别方法,该方法可以应用于一服务器中,图1为本发明实施例中的一种可选的营销策略的识别方法的流程示意图,如图1所示,该营销策略的识别方法可以包括:

s101:获取记载有第一营销活动的信息的文本文件;

目前,运营商各地的分公司会经常不定期的在微博、微信、官网等渠道推出各种营销活动的优惠套餐,其中,推广的力度、范围和持续时间各不相同,大量不定期变化的舆情信息给分析人员造成很大的困扰。

分析人员利用一些人工分析出的数据不仅要花费很多时间和人力成本,而且分析的效果还会受到所采用的算法等的局限,不利于运营商对市场的分析。

为了实现对营销活动的智能化分析,首先,可以从微博、微信、官网等渠道获取记载有营销活动的信息,即为上述第一营销活动的信息的文本文件,例如,某运营商在自己的微博账号上发布的文本文件的内容为“300分钟全国主叫、国内被叫均免费;还赠12个月20gb不限速流量”。

这样,便获取到了记载有第一营销活动的信息的文本文件。

s102:调用预先训练好的条件随机场模型,对文本文件进行识别,以从文本文件中识别出第一营销活动所包含的第一营销策略。

在获取到记载有第一营销活动的信息的文本文件之后,直接将文本文件输入至预先训练好的条件随机场模型,从而可以识别出第一营销策略,得到的识别出的第一营销策略可以用预设的结构化字段来表示。

图2为本发明实施例中的另一种可选的营销策略的识别方法的流程示意图,参考图2所示,上述训练好的条件随机场模型,可以采用下述方式训练得到:

s201:将记载有第二营销活动的信息的样本文本文件转换成历史状态序列;

这里,历史状态序列,由第二营销活动包含的各第二营销策略的状态转换序列首尾相连构成;第二营销策略的状态转换序列,由第二营销策略的状态参数构成。

其中,第二营销策略的状态参数包括以下一项或多项:

产品名称的状态参数,产品属性的状态参数,产品数量的状态参数,产品单位的状态参数,特定状态的状态参数,空状态的状态参数。

具体来说,在服务器中预先设置有营销策略的状态参数,也就是说,在服务器中,设置有若干个状态参数,并且,每个状态参数可以用一个状态标识来表示,这样,服务器可以根据营销策略的状态参数,将获取到的第二营销活动的信息的文本文件先分成各第二营销策略,然后,将每个营销策略用营销策略的状态参数来表示,得到第二营销策略的状态转换序列,最后,将个营销策略的状态转换序列首尾相连得到历史状态序列,即,将第二营销活动的信息的文本文件用若干个状态参数来表示。

在实际应用中,先对第二营销活动的信息的文本文件分别进行识别,得到营销活动所包含的各第二营销策略,然后针对每个第二营销策略用对应的状态参数来表示,就可以得到历史状态序列

在实际应用中,营销活动的信息的文本文件中产品名称可以包括:话费、流量、宽带、靓号和通话分钟,设置产品名称为对应的状态参数为g;营销信息中产品属性可以包括:国际、国内省内,设置产品属性对应的状态参数为p;营销信息中营销内容可以包括:*m和*分钟,营销信息中价格可以包括:*元和免费,可见,营销信息中营销内容和价格都是以数字加单位的形式表示,所以,设置产品数量对应的状态参数为c,设置产品单位对应的状态参数为u,营销信息中营销内容可以包括特定状态,特定状态可以包括免费或者不限量等特殊情况;还有一个营销状态为空状态,设置空状态对应的状态参数为n,表示缺省。

例如,针对营销信息为“300分钟全国主叫、国内被叫均免费;还赠12个月20gb不限速流量”,得到的转换序列为cupgpgscug。

s202:通过对历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列;

在得到历史状态序列之后,需要对历史状态序列中各第二营销策略的状态转换序列进行标记,以区分两个相邻的状态转换序列。

为了实现历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,在具体实施过程中,s202可以包括:

计算锚点状态序列与历史状态序列的点乘结果,作为处理后的历史状态序列。

其中,锚点状态序列,由分别对应所述各第二营销策略的状态转换序列的锚点状态转换序列首位相连构成;

锚点状态转换序列由锚点状态参数构成,锚点状态参数与营销策略的状态参数相对应;

锚点状态转换序列中分别与各第二营销策略的最后一个有效状态的值相对应的锚点状态参数,为用以区分标记各第二营销策略的状态转换序列的指定值。

上述点乘是指用分别用历史状态序列中的状态参数,分别乘以相对应的每个锚点状态参数,得到的结果为处理后的历史状态序列的状态参数。

为了确定出锚点状态序列,在一种可选的实施例中,锚点状态参数采用下列方式设置:

针对每个第二营销策略的每个状态参数,执行下述步骤:

判断该状态参数是否为该第二营销策略的最后一个有效状态的值;

若是,则将与该状态参数相对应的锚点状态参数设置为1;

若否,则将与该状态参数相对应的锚点状态参数设置为0。

也就是说,针对历史状态序列,对每个状态参数进行识别,判断哪个状态参数为所属的营销策略的结束状态,若为该营销策略的结束状态,将该状态参数可以用一个特定的标识来进行区分,例如,用0乘以该标识得以区分两个相邻的状态转换序列,这样,如果历史状态序列中的0就表示该营销策略结束。

这样,将历史状态序列中每个营销策略的最后一个状态参数用0代替,从而得到处理后的历史状态转换序列。

在实际应用中,历史状态序列为cupgpgscug,确定的锚点状态序列为1111111110,则点乘为c×1,u×1,p×1,g×1,p×1,g×1,s×1,c×1,u×1,g×0。

s203:利用处理后的历史状态序列对条件随机场模型进行优化训练,以得到训练好的条件随机场模型。

最后,对历史状态序列进行处理,并利用处理后的历史状态序列对条件随机场进行训练,得到的训练好的条件随机场模型对于识别营销策略的效果更佳。

在从所述文本文件中识别出第一营销策略之后,在一种可选的实施例中,s102之后,上述方法还可以包括:

根据第一营销策略,确定第一营销策略中所包括的营销特征;

将第一营销策略中所包括的营销特征的特征值组成第一营销策略的营销特征向量;

将第一营销策略的营销特征向量中的每个元素进行平方,得到处理后的第一营销策略的营销特征向量;

将处理后的第一营销策略的营销特征向量,输入至训练好的逻辑回归函数模型,得到第一营销策略所对应的分数值;

其中,第一营销策略所对应的分数值用于表征第一营销活动的活动力度。

具体来说,利用训练好的逻辑回归函数模型,并根据识别出的第一营销策略,例如营销策略用结构化字段来表示,该结构化字段是按照营销特征来存储的字段,这样,可以获取到第一营销策略中所包含的营销特征,从而根据营销特征的特征值组成第一营销策略的营销特征向量,从而将第一营销策略的营销特征向量输入至训练好的逻辑回归函数模型中,从而得到第一营销策略所对应的分数值,这样,将识别出的第一策略可以用一个分数值来表示,为分析人员提供一个参考依据,有利于营销活动的分析和推广。

为了得到训练好的逻辑回归函数模型,在一种可选的实施例中,训练好的逻辑回归函数模型,采用如下方式训练:

获取经过训练好的条件随机场模型训练得到的各第三营销活动所包括的第三营销策略的营销特征向量样本,和每个第三营销策略所对应的分数值;

将各每个第三营销策略的营销特征向量中的每个元素进行平方,得到处理后的每个第三营销策略的营销特征向量;

利用处理后的每个第三营销策略的营销特征向量和每个第三营销策略所对应的分数值,对逻辑回归函数模型进行训练,得到训练好的逻辑回归函数模型。

具体来说,用逻辑回归预测以上各营销特征下的第一营销策略所对应的分数值,逻辑回归函数的定义为:

其中,特征函数z=[a1,a2,a3...an][x1,x2,x3...xn],xi为第i维特征,ai为第i维特征的权重,i的取值范围为[1,n](注意此处的xi是总公司、子公司,持续时间,活动力度,性价比等维度的特征,与下文中的状态没有关系,仅仅为了描述的方便;同理,此处的特征函数z也与下文的z不是同一对象,仅仅为了描述的方便)。

由于活动发布方有总公司,有分公司,活动力度,活动持续时间等不仅是权重大小的不同还有权重维度的不同,所以对特征函数z线性加权的方式作出改进,改为使用二次函数非线性加权,用非线性函数取代作为逻辑回归系数替换线性逻辑回归系数z。为减小计算量采用二次函数模型正态分布给予不同的维度不同程度的加权。

已知线性函数表达式为z=ax+b,其中a为向量[a1,a2...an],x为向量[x1,x2...xn],则经过计算得到下列公式:

z=a1x1+a2x2+a3x3+...+anxn(2)

令a0=b,x0=1,则可以得到下式:

其中,a为向量[a0,a1,a2,...an],x为向量[x0,x1,x2,...xn]。

同理,多维的二次函数z=ax2+bx+c分解为两个线性函数的乘积(ax+b)(cx+d)后可转化为ax*cx,其中,ac为常数,可用a代替,x的平方用新的变量x代替再代入逻辑回归函数式(1),这样训练和预测的时候都可以同样的利用和一维函数式一样的逻辑回归函数的特性,但是得到的权重系数在物理含义变为每一个变量的平方的权重。

在实现时,通过已评分的训练样本计算每一维特征(如总公司,分公司,活动力度,性价比,活动持续时间等)的特征值,然后平方得到新的特征向量,再训练出模型,预测得分时的输入特征向量同样也需要先对每一维求平方再利用训练出的模型进行预测,这样计算所得的总公司与分公司发布的活动,不同的重要程度的活动,权重系数不再是线性加权,而是二次加权,重要的活动内容就得到了更大程度的加权。

其中,营销特征的特征值包括以下一项或多项:营销活动发布方的公司级别的特征值,营销活动的持续时间的特征值,营销活动的数量价格比的特征值和营销活动的性价比的特征值。

也就是说,确定识别出的第一营销策略中每种营销特征,每种营销特征对应一个特征值,并且,需要说明的是,在实际应用中,营销策略中营销活动发布方的公司级别,公司级别越高权重越大;营销策略中营销活动的持续时间,天为时间单位,计算活动力度随时间变化的导数,即计算活动力度随时间的变化量,变化量越大权重越大;营销策略中营销活动的数量价格比,数量价格比越大权重越大;营销策略中营销活动的性价比,性价比越大权重越大;

这样,经过将获取样本向量x和向量x对应的分数值,并将向量x中的每个元素进行平方,将向量x的平方和向量x对应的分数值输入至逻辑回归函数模型中,得到向量a,向量b和向量c等权重值,以此得到训练好的逻辑回归函数模型;然后将得到的第一营销策略的营销特征向量输入至训练好的逻辑回归函数模型中,得到第一营销策略所对应的分数值。

图3为本发明实施例中的再一种可选的营销策略的识别方法的流程示意图,参考图3所示,可以通过下述方式训练得到训练好的条件随机场模型:

s301:服务器获取运营商的第二营销活动的信息的样本文本文件(相当于图3中的训练数据),对运营商的主要产品形式进行分析;

s302:服务器对第二营销活动的信息的样本文本文件进行数学抽象和建模,得到训练模型(相当于上述训练好的条件随机场模型)。

具体来说,为了得到识别出的第一营销策略所对应的分数值,参考图3所示,上述营销策略的识别方法可以包括:

s303:服务器将运营商的第二营销活动的信息的样本文本文件输入至状态序列抽取器;

s304:服务器对第二营销活动的信息的样本文本文件进行状态参数标注;

也就是说,分别标注其中的每一个状态分别属于什么营销活动,即,将营销活动中的各个运营商产品,产品属性,营销活动数量,营销活动内容,价格等分别状态参数标注出来。

具体来说,按照产品名称对应的状态参数为g,产品属性对应的状态参数为p,产品数量对应的状态参数为c,产品单位对应的状态参数为u。特定状态对应的状态参数为s,空状态对应的状态参数为n。

各状态按序组合成一个状态转移序列,一条营销消息即抽象为了由多个状态转换序列组成的状态序列。

比如“300分钟全国主叫、国内被叫均免费;还赠12个月20gb不限速流量”这样一条营销信息,抽取出运营商电信产品的状态序列为:300(产品数量)分钟(单位)全国(产品属性)拨打(产品名称)全国(产品属性)接听(产品名称)免费(特定状态)20(产品数量)g(产品单位)流量(产品名称),因为产品种类是可枚举的,每一个产品的属性是可枚举的,单位是可枚举的,所以,这条营销信息可抽象出的状态序列为cupgpgscug。

s305:服务器用标注出来的数据经过处理来训练条件随机场模型。

具体来说,由于营销活动通常会同时推出几种不同的营销策略这种特殊性,所以一个营销活动的描述文本中,一般可能会包含多个状态转换序列。条件随机场的定义为一个状态序列的出现概率:

其中,π(xi)=p(x1x2x3...xi-1)为xi的上文的状态序列;i为该营销活动的描述文本中的一个状态转换序列xi的序号,i的取值范围为[1,n],n为该营销活动的描述文本中包含的状态转换序列的总量。

公式(4)右侧的条件概率满足下式:

p(yv|x,yw,w≠v)=p(yv|x,yww~v)(5)

条件随机场是一种无向概率图模型,以x1,x2,x3...xn这n个状态的序列,表示营销活动信息中包含的n个抽象出来的产品名称、产品属性、营销内容、营销价格等状态。

由于x1,x2,x3...xn状态序列是包含多个活动的状态转换序列,需要区分出每个活动才能实现将描述字符串转换为活动内容的结构化字段表示,所以实际上的状态序列是一个矩阵:

其中,xij是活动i的j状态,将每行首尾相连组成一个向量:

x11x12x13...x21x22x23...x31x32x33...xn(7)

为区分出每一个活动引入锚点状态序列z1,z2,z3...zn,锚点状态数与营销活动中的状态数一致,由此得到锚点状态向量:

z11z12z13...z21z22z23...z31z32z33...zn(8)

其中zij表示活动i的j状态是否为活动i的最后一个状态,对于不是最后一个状态的锚点令zij=1;对于是最后一个状态的锚点令zij=0。

然后对(7)和(8)两个向量求进行计算得到新的序列如下所示:

x11x12x13...x1ez1e...x21x22x23...x2ez2e...x31x32x33...x3ez3e(9)

基于第一步中定义的六种活动内容的状态:g:产品名称状态,p:产品属性状态,c:数量状态,u:单位状态,s:特殊状态描述状态,n:缺省空状态,再扩展得到六种状态:

ge:产品名称结束活动状态,pe:产品属性结束活动状态,ce:数量结束活动状态,ue:单位结束活动状态,se:特殊状态描述结束活动状态,ne:缺省空状态结束活动状态。

则xiezie可用一个变量来表示,如用yie来表示。这样,公式(9)中的每位都可以用一个新的状态yij(活动i的j状态,12种状态取值)表示。y和x都只是一种变量命名方式,将y命名为x,所有活动的状态依次递增排序为1到n,得到新的状态序列x1,x2,x3...xn,代入公式(4)的经典的条件随机场模型。

至此,就通过两个状态序列的向量的计算,将一个有多个活动的状态矩阵转化成了使用经典条件随机场模型训练和识别的状态序列向量。

假设x与y是随机变量(注意此处的y与上文描述中的状态y没有任何关系,仅仅是一种描述方式),p(y|x)是在给定x的条件下y的条件概率分布。若随机变量y构成一个由无向图g=(v,e)表示的马尔可夫随机场,即

对任意结点v成立,则称条件概率分布p(y|x)为条件随机场,公式(5)中w~v表示在图g=(v,e)中与结点v有边连接的所有结点w,w≠v表示结点v以外的所有结点,yv,yw为节点v,w对应的随机变量。

实际的工程应用中通常采用条件随机场的简化形式,将条件随机场写成向量w与全局特征向量f(y,x)的点积形式:

其中,w为当前状态序列特征向量,f(y,x)为全局特征向量。

那么,学习的优化目标函数为:

其梯度函数为:

采用梯度下降以及牛顿法可以计算出优化的模型参数。

s306:服务器得到训练好的条件随机场模型。

s307:服务器每天例行爬取移动、电信、联通的微信、微博、官网数据,爬取到的第一营销活动的信息的文本文件的状态序列;

s308:服务器调用训练好的条件随机场模型识别出第一营销策略的结构化字段。

条件随机场的预测是给定条件随机场p(y|x)和输入序列(观测序列)x,求条件概率最大的输出序列。其中,这里所说的输入序列x,即为上述抽取出来的状态转移序列。至于条件随机场p(y|x)为上述训练好的条件随机场模型,其中,条件随机场的预测算法是著名的维特比算法。

仍然以“300分钟全国主叫、国内被叫均免费;还赠12个月20gb不限速流量”这个营销活动消息为例,调用模型预测状态转移序列为,并将该序列转化为结构化字段为:

[{产品数量:300,单位:分钟,产品属性:全国,产品名:拨打},

{产品属性:全国,产品名:接听,特定状态:免费},

{产品数量:20,产品单位:g,产品名称:流量}]

s309:服务器用训练好的逻辑回归函数模型对第一营销策略打分。

具体来说,每一种活动即为一维特征,如上例中拨打,接听,流量分别为一维特征,同时结合:按照活动发布方的权重,总公司权重大,分公司权重小,按照发布同一活动的各省公司,分公司数量加权,按照活动力度加权,以数量价格比定义活动的力度,数量价格比越高权重越大,活动力度按时间求导再加权,以天为时间单位,计算活动力度随时间变化的导数,即计算活动力度随时间的变化量(如流量价格比、话费价格比相对于前一天的变化量)作为一个特征维度加权。

根据第一营销策略,确定第一营销策略中所包括的营销特征;

将第一营销策略中所包括的营销特征的特征值组成第一营销策略的营销特征向量;

将第一营销策略的营销特征向量,输入至训练好的逻辑回归函数模型,得到第一营销策略所对应的分数值。

本发明实施例所提供的一种营销策略的识别方法,该方法包括:首先,获取记载有第一营销活动的信息的文本文件,然后,调用预先训练好的条件随机场模型,对文本文件进行识别,最后,通过识别从文本文件中识别出第一营销活动所包含的第一营销策略,其中,训练好的条件随机场模型,采用下述方式训练得到:将记载有第二营销活动的信息的样本文本文件转换成历史状态序列;历史状态序列,由第二营销活动包含的各第二营销策略的状态转换序列首尾相连构成;第二营销策略的状态转换序列,由第二营销策略的状态参数构成,通过对历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列,利用处理后的历史状态序列对条件随机场模型进行优化训练,以得到训练好的条件随机场模型;也就是说,在本发明实施例中,通过对第二营销活动的信息的样本文本文件进行转换得到历史状态序列,然后对历史状态序列进行区分标记得到处理后的历史状态序列,再利用处理后的历史状态序列对条件随机场进行优化训练,得到一个训练好的条件随机场模型,并基于优化后的模型来识别第一营销活动的信息的文本文件,这样,不需要人工筛选和识别,就能够从文本文件中识别出第一营销活动所包含的营销策略,如此,通过训练好的条件随机场模型,智能化地对营销活动的信息的文本文件进行识别,从而能够智能化的分析识别出营销策略,进而有利于运营商进行营销活动的分析和推广。

基于同一发明构思,本实施例提供一种服务器,图4为本发明实施例中的服务器的结构示意图一,如图4所示,该服务器包括:获取单元41和识别单元42;

其中,获取单元41,用于获取记载有第一营销活动的信息的文本文件;

识别单元42,用于调用训练好的条件随机场模型,对文本文件进行识别,以从文本文件中识别出第一营销活动所包含的第一营销策略;

其中,训练好的条件随机场模型由服务器的训练单元采用下述方式训练得到:

将记载有第二营销活动的信息的样本文本文件转换成历史状态序列;历史状态序列,由第二营销活动包含的各第二营销策略的状态转换序列首尾相连构成;第二营销策略的状态转换序列,由第二营销策略的状态参数构成;

通过对历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列;

利用处理后的历史状态序列对条件随机场模型进行优化训练,以得到训练好的条件随机场模型。

在一种可选的实施例中,训练单元通过对历史状态序列中各第二营销策略的状态转换序列分别进行区分标记,得到处理后的历史状态序列中,具体用于:

计算锚点状态序列与历史状态序列的点乘结果,作为处理后的历史状态序列;

锚点状态序列,由分别对应各第二营销策略的状态转换序列的锚点状态转换序列首位相连构成;

其中,锚点状态转换序列由锚点状态参数构成;锚点状态参数与营销策略的状态参数相对应;

锚点状态转换序列中分别与各第二营销策略的最后一个有效状态的值相对应的锚点状态参数,为用以区分标记各第二营销策略的状态转换序列的指定值。

在一种可选的实施例中,第二营销策略的状态参数包括以下一项或多项:

产品名称的状态参数,产品属性的状态参数,产品数量的状态参数,产品单位的状态参数,特定状态的状态参数,空状态的状态参数。

在一种可选的实施例中,训练单元采用下列方式设置锚点状态参数:

针对每个第二营销策略的每个状态参数,执行下述步骤:

判断该状态参数是否为该第二营销策略的最后一个有效状态的值;

若是,则将与该状态参数相对应的锚点状态参数设置为1;

若否,则将与该状态参数相对应的锚点状态参数设置为0。

在一种可选的实施例中,服务器还包括:

确定单元,用于在从文本文件中识别出第一营销活动所包含的第一营销策略之后,根据第一营销策略,确定第一营销策略中所包括的营销特征;

将第一营销策略中所包括的营销特征的特征值组成第一营销策略的营销特征向量;

将第一营销策略的营销特征向量中的每个元素进行平方,得到处理后的第一营销策略的营销特征向量;

将处理后的第一营销策略的营销特征向量,输入至训练好的逻辑回归函数模型,得到第一营销策略所对应的分数值;

其中,第一营销策略所对应的分数值用于表征第一营销活动的活动力度。

在一种可选的实施例中,训练单元还用于,采用如下方式进行训练得到训练好的逻辑回归函数模型:

获取经过训练好的条件随机场模型训练得到的各第三营销活动所包括的第三营销策略的营销特征向量样本,和每个第三营销策略所对应的分数值;

将各每个第三营销策略的营销特征向量中的每个元素进行平方,得到处理后的每个第三营销策略的营销特征向量;

利用处理后的每个第三营销策略的营销特征向量和每个第三营销策略所对应的分数值,对逻辑回归函数模型进行训练,得到训练好的逻辑回归函数模型。

在一种可选的实施例中,营销特征的特征值包括以下一项或多项:营销活动发布方的公司级别的特征值,营销活动的持续时间的特征值,营销活动的数量价格比的特征值和营销活动的性价比的特征值。

在实际应用中,上述获取单元41、识别单元42、训练单元和确定单元可由位于服务器上的处理器实现,具体为中央处理器(cpu,centralprocessingunit)、微处理器(mpu,microprocessorunit)、数字信号处理器(dsp,digitalsignalprocessing)或现场可编程门阵列(fpga,fieldprogrammablegatearray)等实现。

图5为本申请实施例提供的一种服务器的结构示意图二,如图5所示,本申请实施例提供了一种服务器500,包括:

处理器51以及存储有所述处理器51可执行指令的存储介质52,所述存储介质52通过通信总线53依赖所述处理器41执行操作,当所述指令被所述处理器51执行时,执行上述实施例一所述的营销策略的识别方法。

需要说明的是,实际应用时,终端中的各个组件通过通信总线53耦合在一起。可理解,通信总线53用于实现这些组件之间的连接通信。通信总线53除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为通信总线53。

本申请实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行实施例一所述的营销策略的识别方法。

其中,计算机可读存储介质可以是磁性随机存取存储器(ferromagneticrandomaccessmemory,fram)、只读存储器(readonlymemory,rom)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory,eprom)、电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,eeprom)、快闪存储器(flashmemory)、磁表面存储器、光盘、或只读光盘(compactdiscread-onlymemory,cd-rom)等存储器。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1