基于改进的均值中心算法实现搜索引擎关键词优化的制作方法

文档序号:12122016阅读:302来源:国知局
基于改进的均值中心算法实现搜索引擎关键词优化的制作方法与工艺

本发明涉及语义网络技术领域,具体涉及一种基于改进的均值中心算法实现搜索引擎关键词优化。



背景技术:

搜索引擎已成为广大网民获取信息的一个重要工具。搜索引擎优化(Search Engine Optimization,简称SEO)是指采用相关技术对网站进行一系列优化,从而提高相应关键词在搜索引擎上的排名,最终达到网站营销的目的。SEO归根结底是关键词的优化。在市场多元化以及各行业消费主体个性化需求的影响下,涌现出大量新的关键词(特别是长尾关键词),一方面,这些数量庞大的关键词给网站运营者带来潜在的商机;另一方面,针对这些关键词的分析和优化,也让大部分SEO工作人员承担巨大的工作量。关键词优化策略一般包括关键词的选择、关键词的分布及密度控制等等,关键词的使用是否得当,直接关系到网站在搜索引擎的搜索结果中的位置。在研究网络搜索关键词搜索量数据与相关问题的关系时,选择哪些关键词是首先要解决的关键问题,阅读文献,笔者发现,对于关键词的选取大多凭借经验和主观因素,也没有一个完善的机制来管理关键词优化策略和进度。为使关键词的选取更具科学性和客观性,基于上述需求,本发明提供了基于改进的均值中心算法实现搜索引擎关键词优化。



技术实现要素:

针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种基于改进的均值中心算法实现搜索引擎关键词优化。

为了解决上述问题,本发明是通过以下技术方案实现的:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。

步骤4:利用改进的均值中心算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:初始化簇的数目k,从数据对象集合D中随机选择k个初始簇中心,初始化目标函数f(U);

步骤4.2:对每类关键词i(i∈(1,2,…,m))进行重新分配,按函数p(i)选择聚类中心j;

步骤4.3:根据判定函数f(U)的结果,重新计算各簇中心;

步骤4.4:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果。

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

本发明有益效果是:

1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。

2,此算法的运行时间复杂度低,处理速度更快。

3、此算法具有更大的利用价值。

4、能帮助网站在短时间内快速提升其关键词的排名。

5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。

6、此算法分类结果的准确度更符合经验值;

附图说明

图1基于改进的均值中心算法实现搜索引擎关键词优化结构流程图

图2改进的均值中心算法在聚类分析中的应用流程图

具体实施方式

为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:

这里相关关键词个数为m,既有下列m×5矩阵:

Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。

再降维为四维,即

Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:

步骤4:利用改进的均值中心算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:初始化簇的数目k,从数据对象集合D中随机选择k个初始簇中心,初始化目标函数f(U),其具体计算过程如下:

上式i∈wj为关键词i属于类中心wj,d(i,wj)为关键词i到类中心wj的距离。

步骤4.2:对每类关键词i(i∈(1,2,…,m))进行重新分配,按函数p(i)选择聚类中心j,其具体计算过程如下:

使函数p(i)最大的对应聚类中心j,d(i,wq)为关键词i到全局最佳位置wq的距离,d(i,wj∈(1,2,…,k))为关键词i到聚类中心j的距离。

上式xir与分别为关键词i、聚类中心对象j的4维向量,即

xir∈(Xi,Zi,NiS,NiY)、

这里选择使p(i)值最大,即选择d(i,wj∈(1,2,…,k))最小的聚类中心j,有下式:

d(i,wj∈(1,2,…,k))min=min(d(i,w1),d(i,w2),…,d(i,wk))

步骤4.3:根据判定函数dis(U)的结果,重新计算各簇中心,其具体计算过程如下:

dis(U)=f(U)new-f(U)old<0

f(U)new为新分类后目标函数的值,f(U)old为初始化目标函数或上一次迭代出的目标函数。

步骤4.4:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果。

改进的均值中心算法具体结构流程如图2。

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

基于改进的均值中心算法实现搜索引擎关键词优化,其伪代码过程

输入:网站提取的核心关键词,初始化簇的数目k,初始化目标函数f(U)

输出:一系列优化后的高质量关键词。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1