基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化的制作方法

文档序号:12550863阅读:来源:国知局

技术特征:

1.基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化,本发明涉及语义网络技术领域,具体涉及基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化,其特征是,包括如下步骤:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维,其具体计算过程如下:

这里相关关键词个数为m,既有下列矩阵:

依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维

为四维,即

为搜索效能,为价值率,即为下式:

步骤4:基于VSM的模糊c均值聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:利用基于领域的k-means算法初始化为c类

步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;

步骤4.3:初始化每一个领域目标函数,构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果;

步骤4.4:利用下式判定函数的结果,重新计算各簇中心;

步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

2.根据权利要求1中所述的基于VSM的模糊c均值聚类算法实现搜索引擎关键词优化,其特征是,以上所述步骤4中的具体计算过程如下:

步骤4:基于VSM的模糊c均值聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:利用基于领域的k-means算法初始化为c类

步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件;其具体计算过程如下:

根据领域初始化数据对象集合D划分为C类;

初始化隶属矩阵J为

为关键词i属于j类的程度系数,即隶属的整个约束条件为:

步骤4.3:初始化每一个领域目标函数,构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果,其具体计算过程如下:

上式为j类内领域内数据对象的个数,为每一个领域内波动系数,分别为数量、波动系数的影响系数,且,其值可以根据实验迭代出合适的值

上式

为属于j类的第i个关键词的空间向量,为j类簇中心向量,h为向量对应元素的个数

构建c类总目标函数

综合隶属约束条件,构建m个方程组:

是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使达到最大的必要条件

上式为关键词i所对应的向量;

步骤4.4:利用下式判定函数的结果,重新计算各簇中心,其具体计算过程如下:

为新的总目标函数,为上一次迭代得出的总目标函数,为一个足够小的数,只有满足上述条件,则找到了最佳分类

步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果

基于VSM的模糊c均值聚类算法具体结构流程如图2。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1