改进的c‑均值算法实现搜索引擎关键词优化的制作方法

文档序号:12466046阅读:465来源:国知局
改进的c‑均值算法实现搜索引擎关键词优化的制作方法与工艺

本发明涉及语义网络技术领域,具体涉及一种改进的c-均值算法实现搜索引擎关键词优化。



背景技术:

近年来,随着国家对互联网产业的大力支持,网速大幅提升,网络资费下降,知识经济和信息化建设迅猛发展,网络信息呈现爆炸式增长,人类逐渐进入了大数据时代。众多网络信息丰富了人们的信息来源,也给人们快速获取信息造成了困扰。搜索引擎精准化、人性化的信息检索服务被广大使用者认可。用户对搜索引擎的使用率提高,使得搜索引擎快速发展。

目前不少研究发现,搜索引擎用户一般只会关注搜索结果页面中排名靠前的网站,这些网站的点击率也相对高些。因此,提高网站在关键词搜索结果中的排名是企业积极思考的,众企业为提高网站在搜索引擎搜索结果中的排名且获得访问量主动进行搜索引擎营销。搜索引擎优化(Search Engine Optimization,简称SEO)是指采用相关技术对网站进行一系列优化,从而提高相应关键词在搜索引擎上的排名,最终达到网站营销的目的,SEO归根结底是关键词的优化。然而对于关键词的选取大多凭借经验和主观因素,也没有一个完善的机制来管理关键词优化策略和进度。为使关键词的选取更具科学性和客观性,基于上述需求,本发明提供了改进的c-均值算法实现搜索引擎关键词优化。



技术实现要素:

针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了一种改进的c-均值算法实现搜索引擎关键词优化。

为了解决上述问题,本发明是通过以下技术方案实现的:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。

步骤4:利用改进的c-均值算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:利用基于ε领域的k-means算法初始化簇为c类。

步骤4.2:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件。

步骤4.3:初始化每一个领域目标函数L(S2)start,构建c类总目标函数。

步骤4.4:利用下式判定函数Δ(S2)判定上述结果的准确性。

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

本发明有益效果是:

1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。

2,此算法的运行时间复杂度低,处理速度更快。

3、此算法具有更大的利用价值。

4、能帮助网站在短时间内快速提升其关键词的排名。

5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。

6、避免聚类结果过早收敛;

7、减少孤立点对聚类结果的影响,提高数据结果的信噪比。

附图说明

图1改进的c-均值算法实现搜索引擎关键词优化结构流程图

图2改进的c-均值算法在聚类分析中的应用流程图

具体实施方式

为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:

步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。

步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;

步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:

这里相关关键词个数为m,既有下列m×5矩阵:

Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。

再降维为四维,即

Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:

步骤4:利用改进的c-均值算法,对上述关键词进行聚类处理,其具体子步骤如下:

步骤4.1:利用基于ε领域的k-means算法初始化簇为c类。

步骤4.2:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:

上式wij为关键词i属于j类的程度系数,即j∈(1,2,…,c)、i∈(1,2,…,m)。dij为关键词i到j类中心的距离。

初始化隶属矩阵J为m×c:

隶属的整个约束条件为:

步骤4.3:初始化每一个领域目标函数L(S2)start,构建c类总目标函数,其具体计算过程如下:

上式Nεj为j类ε领域内数据对象的个数,xih为j类ε领域内数据对象所对应的向量,yih为j类ε领域内对应的簇中心数据对象向量。

构建c类总目标函数L(S2∑j∈c为:

综合约束条件,构造如下新目标函数,可求得使L(S2)∑j∈c达到最大值的必要条件:

上式λi(i=1,2,…,m)是隶属的整个约束条件的拉格朗日乘子。对所有参量求导,使式达到最大的必要条件为:

上式为关键词i所对应的向量;

步骤4.4:利用下式判定函数Δ(S2)判定上述结果的准确性,其具体计算过程如下:

判定函数Δ(S2):

Δ(S2)=L(S2)new∑j∈c-L(S2)old∑j∈c<θ

上式L(S2)new∑j∈c为新的总目标函数,L(S2)old∑j∈c为上一次迭代得出的总目标函数。θ为一个足够小的数,只有满足上述条件,则找到了最佳分类,否则没有找到。

改进的C-均值算法的具体结构流程如图2。

步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。

改进的c-均值算法实现搜索引擎关键词优化,其伪代码过程

输入:网站提取的核心关键词,基于ε领域初始化c类

输出:一系列优化后的高质量关键词。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1