改进的基于约束条件的聚类算法实现搜索引擎关键词优化的制作方法

文档序号:12719913阅读:455来源:国知局
改进的基于约束条件的聚类算法实现搜索引擎关键词优化的制作方法与工艺

本发明涉及语义网络技术领域,具体涉及改进的基于约束条件的聚类算法实现搜索引擎关键词优化。



背景技术:

搜索引擎对提高网站访问量起着至关重要的作用,由于用户在互联网检索信息,通常的手段是使用搜索引擎进行搜索。因此,在网络推广领域,SEO(Search Engine Optimization,搜索引擎优化)就具有了举足轻重的作用,从而备受广大网站的重视。搜索引擎优化技术包括黑帽技术和白帽技术,其中黑帽技术表示违反搜索引擎优化规则的恶意优化技术,在关键词优化技术中表现为在页面中堆砌关键词或放置无关关键词以提高在搜索引擎中的排名,目前各搜索引擎已经引入相关技术和规则对使用黑帽技术的网站进行惩罚;白帽技术则表示被搜索引擎认可的优化技术。真正的SEO是通过采用易于搜索引擎索引的合理手段,使网站对用户和搜索引擎更友好(Search Engine Friendly),从而更容易被搜索引擎收录及优先排序。

目前国外的搜索引擎优化理论已经非常成熟,国内的理论也已形成。但是就国内企业应用搜索引擎优化来看还不是很理想,还正处于一种正在兴起的状态,针对企业网站的实际情况所建立起来的优化策略理论还没有形成,还只是一些零零散散的研究成果和理论,并且发展也极为不成熟,导致了一些企业滥用优化理论,追求眼前暂时的利益而进行作弊。这对于企业网站的信息化推广来说极为不利,必须对这些“散落”的企业级优化策略理论进行有效的整合,使之成为一整套企业级的优化策略理论来指导企业网站进行相关的优化。基于上述需求,本发明提供了改进的基于约束条件的聚类算法实现搜索引擎关键词优化。



技术实现要素:

针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了改进的基于约束条件的聚类算法实现搜索引擎关键词优化。

为了解决上述问题,本发明是通过以下技术方案实现的:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。

步骤4:改进的基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:利用基于ε领域的k-means算法初始化为c类。

步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件。

步骤4.3:初始化每一个领域目标函数构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果

步骤4.4:利用下式判定函数Δ(g)的结果,重新计算各簇中心;

步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果。

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

本发明有益效果是:

1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。

2,此算法的运行时间复杂度低,处理速度更快。

3、此算法具有更大的利用价值。

4、能帮助网站在短时间内快速提升其关键词的排名。

5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。

6、此算法精准的分配每个领域占比与局部领域内相关度的权重系数使得分类结果更加符合经验值。

7、减小了孤立点对聚类结果的影响。

8、数据光滑度处理的更好,降低了人为误差。

附图说明

图1改进的基于约束条件的聚类算法实现搜索引擎关键词优化结构流程图

图2改进的基于约束条件的聚类算法在聚类分析中的应用流程图

具体实施方式

为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:

这里相关关键词个数为m,既有下列m×5矩阵:

Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。

再降维为四维,即

Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:

步骤4:改进的基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:利用基于ε领域的k-means算法初始化为c类。

步骤4.2:用值[0,1]间的随机数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:

根据ε领域初始化数据对象集合D划分为C类;

初始化隶属矩阵J为m×C:

wij为关键词i属于j类的程度系数,即j∈(1,2,…,C)、i∈(1,2,…,m)。

隶属的整个约束条件为:

步骤4.3:初始化每一个领域目标函数构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果,其具体计算过程如下:

上式nεj为j类ε领域内数据对象的个数,为j类ε领域内总的紧凑度,α、β分别为数量nεj、紧凑度的影响系数,且α+β=1,其值可以根据实验迭代出合适的值。

构建c类总目标函数

a为一个处理常数,a>1;

上式

为空间中的第i个关键词向量与其簇中心向量的内积。

综合隶属约束条件,构建m个方程组:

λi(i=1,…,m)是m个约束式的拉格朗日算子,对上述式子进行求导,对所有输入参量求导,即可求得使达到最大的必要条件ci、wij

上式为关键词i所对应的向量;

步骤4.4:利用下式判定函数Δ(g)的结果,重新计算各簇中心,其具体计算过程如下:

为新的总目标函数,为上一次迭代得出的总目标函数,θ为一个足够小的数,只有满足上述条件,则找到了最佳分类。

步骤4.5:如果簇中心发生变化,则转到步骤4.2,重新计算隶属矩阵J,否则迭代结束,输出聚类结果。

改进的基于约束条件的聚类算法的具体结构流程如图2。

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

改进的基于约束条件的聚类算法实现搜索引擎关键词优化,其伪代码过程

输入:网站提取的核心关键词,基于ε领域初始化为c簇。

输出:总目标函数最大的c个簇。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1