本发明涉及语义网络技术领域,具体涉及基于改进的群智能算法实现搜索引擎关键词优化技术。
背景技术:
人们在互联网上获取信息很大程度上依赖着搜索引擎,网站能被其收录并排名相对靠前,能获得更多用户访问,随着百度、谷歌的著名搜索引擎的迅速发展,它们各自形成了比较成熟的排序算法。搜索引擎优化(SEO)是指在搜索引擎许可的优化原则下,通过对网站中代码链接和文字描述的重组优化,以及后期对网站进行合理的反向链接操作,最终实现被优化的网站在搜索引擎的检索结果中得到排名提升。而搜索引擎优化中,关键词优化策略尤为重要,关键词始终贯穿于搜索引擎优化的整个过程。关键词优化策略一般包括关键词的选择、关键词的分布及密度控制等等,关键词的使用是否得当,直接关系到网站在搜索引擎的搜索结果中的位置。在研究网络搜索关键词搜索量数据与相关问题的关系时,选择哪些关键词是首先要解决的关键问题,阅读文献,笔者发现,对于关键词的选取大多凭借经验和主观因素,缺少系统的方法和总结。为使关键词的选取更具科学性和客观性,基于上述需求,本发明提供了基于改进的群智能算法实现搜索引擎关键词优化技术。
技术实现要素:
针对于关键词优化实现搜索引擎优化的技术问题以及具备系统的方法不足,本发明提供了基于改进的群智能算法实现搜索引擎关键词优化技术。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词就是一个五维向量;
步骤4:利用改进的蚁群算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:初始化迭代次数nc=0,根据k-means中心聚类算法初始化各个关键词信息量Iij;
步骤4.2:对每个关键词i(i∈(1,2,…,m)),按目标函数f(i)选择聚类中心j,并记录当前最好的解;
步骤4.3:按下列更新方程更新各个关键词的信息量,nc=nc+1;
步骤5:聚类结果为下式,即为当前最优解,再采用改进的模拟退火算法找到全局最优解,其具体子步骤如下:
步骤5.1:设定初始温度T,最低温度T0,使得当前最优解作为初始解;
步骤5.2:检查是否到达最低温度,如果达到,则转向步骤4,否则转向下一步;
步骤5.3:检查是否达到平衡,如果达到,则转向步骤5.6,否则转向下一步;
步骤5.4:对当前解进行随机扰动,产生变异解;
步骤5.5:以下式判定函数接受新解为当前最优解,转向步骤5.3;
步骤5.6:按照降温公式计算下次迭代温度,转向步骤4;
步骤6:结束搜索过程,输出最终聚类结果;
步骤7:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1、此算法克服了蚁群算法容易陷入局部最优解导致算法停滞的不足。
2、蚁群算法具有收敛速度快的优点,这也提高了模拟退火的速度。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
附图说明
图1基于改进的群智能算法实现搜索引擎关键词优化技术结构流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题和实现系统的方法,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体描述如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:利用改进的蚁群算法,对上述关键词进行分类处理,其具体子步骤如下:
步骤4.1:初始化迭代次数nc=0,根据k-means中心聚类算法初始化各个关键词信息量为Iij。
步骤4.2:对每个关键词i(i∈(1,2,…,m)),按目标函数f(i)选择聚类中心j,并记录当前最好的解,其具体计算过程如下:
目标函数
上式IijNEW为聚类为j类的信息量,k为聚类种类的个数,α、β为权重系数,一般关键词的搜索效能与价值率的影响比首页页面数和总页面数的影响要大,即α>β,这个可以根据经验数据测试得出。
选择使f(i)值最大的聚类中心j,同时记录当前最好的解。
步骤4.3:按下列更新方程更新各个关键词的信息量,nc=nc+1,其具体计算过程如下:
IijNEW′=ρIijold+IijNEW
上式ρ为每次迭代,路径信息挥发的系数,这个可以根据蚁群实验,测试得出。
步骤5:聚类结果为下式,即为当前最优解,再采用改进的模拟退火算法找到全局最优解,其具体子步骤如下:
步骤5.1:设定初始温度T,最低温度T0,使得当前最优解IijNEW′作为初始解即
步骤5.2:检查是否到达最低温度T0,如果达到,则转向步骤4,否则转向下一步;
步骤5.3:检查是否达到平衡,如果达到,则转向步骤5.6,否则转向下一步;
步骤5.4:对当前解进行随机扰动,产生变异解其具体过程如下:
变异解:
上式ΔE(ΔT)为温度的变化引起能量变化,ΔE(ΔT)与温度变化成正比,根据热运动很容易得到此函数,T′为温度迭代一次后的值。
步骤5.5:以下式判定函数接受新解为当前最优解,转向步骤5.3,其具体计算过程如下:
判定函数为:
满足上式,则接受新解
步骤5.6:按照降温公式计算下次迭代温度,转向步骤4,其具体计算过程如下:
降温公式:T′=T+LΔT
上式L为模拟退火的迭代次数,当迭代次数为L时,找到全局最优解,ΔT为每次迭代温度的变化。
步骤6:结束搜索过程,输出最终聚类结果;
步骤7:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
基于改进的群智能算法实现搜索引擎关键词优化技术,其伪代码过程
输入:网站提取的核心关键词
输出:一系列优化后的高质量关键词。