本发明涉及语义网络技术领域,具体涉及基于约束条件的聚类算法实现搜索引擎关键词优化。
背景技术:
搜索引擎已成为广大网民获取信息的一个重要工具。搜索引擎优化(Search Engine Optimization,简称SEO)是指采用相关技术对网站进行一系列优化,从而提高相应关键词在搜索引擎上的排名,最终达到网站营销的目的。其实,搜索引擎优化就是开展网络营销的一种形式,让企业在利用主要的搜索引擎优化策略,对网页中的关键词、内容以及链接等各种因素策略进行相关的优化,使得应用策略之后的企业网站能被各大主流搜索引擎优先抓取并收录,在索引目标页面中排名靠前、吸引点击率,从而可达到提高企业形象、推广网站的目的。就目前所有网络营销的形式中,搜索引擎优化无疑是能在短时间内扩大影响、提升企业网站形象的最好途径。SEO归根结底是关键词的优化。关键词是用户在搜索相关页面时使用的单词或短语,也是搜索引擎在建立索引表使用的单词。利用关键词有助于获得较高的搜索引擎查询排名,要注意关键词研究旨在找出最有价值的关键词。目前国内外对关键词优化的理论研究和技术应用比较多,但暂未提出一个有效的方法来简化关键词分析流程,也没有一个完善的机制来管理关键词优化策略和进度。基于上述需求,本发明提供了基于约束条件的聚类算法实现搜索引擎关键词优化。
技术实现要素:
针对于关键词优化实现搜索引擎优化的技术问题,本发明提供了基于约束条件实现搜索引擎关键词优化。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的。
步骤4:基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化簇;
步骤4.2:初始化每一个ε领域的信息量函数从数据对象集合D中按下述判定条件选择k个初始簇中心;
步骤4.3:对每类关键词i(i∈(1,2,…,m))进行重新分配,按概率函数p(i)选择聚类中心j′;
步骤4.4:根据判定函数Δ(I)的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤4.2,否则迭代结束,输出聚类结果。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
本发明有益效果是:
1,此算法可以精简关键词分析流程,进而减少整个网站优化工作量。
2,此算法的运行时间复杂度低,处理速度更快。
3、此算法具有更大的利用价值。
4、能帮助网站在短时间内快速提升其关键词的排名。
5、为企业网站带来一定的流量和询盘,从而达到理想的网站优化目标。
6、此算法局部从相关度来区分每个类,分类结果的准确度更符合经验值。
7,全局考虑了每个的领域的占比,这样可以降低孤立点对聚类结果的影响。
8、数据处理的效果更好。
附图说明
图1基于约束条件的聚类算法实现搜索引擎关键词优化结构流程图
图2基于约束条件的聚类算法在聚类分析中的应用流程图
具体实施方式
为了解决关键词优化实现搜索引擎优化的技术问题,结合图1-图2对本发明进行了详细说明,其具体实施步骤如下:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等。
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列m×5矩阵:
Ni、Ldi、CPCi、NiS、NiY依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数。
再降维为四维,即
Xi∈(1,2,…,m)为搜索效能,Zi∈(1,2,…,m)为价值率,即为下式:
步骤4:基于约束条件的聚类算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于ε领域的k-means算法初始化为c簇。
步骤4.2:用值[0,1]间的数初始化隶属矩阵J,使其满足隶属的整个约束条件,其具体计算过程如下:
上式为空间中的第i个关键词向量与簇中心向量的内积,μij为关键词i隶属于类j的程度系数,其满足下列隶属约束条件:
初始化隶属矩阵J为m×c:
步骤4.3:初始化每一个领域目标函数构建c类总目标函数,综合隶属约束条件,构建m个方程组,对其进行求解,即可得聚类结果,其具体计算过程如下:
上式nεj为j类ε领域内数据对象的个数。
c类总目标函数为
综合隶属约束条件,构建m个方程组:
这里λi(i∈(1,2,…,m))是m个约束式的拉格朗日乘子。对所有输入参量求导,即可求得使达到最大的必要条件cj、μij;
上式xi为关键词i所对应的向量;
步骤4.4:利用下式判定函数Δ(I)的结果,重新计算各簇中心,其具体计算过程如下:
判定函数Δ(I):
上式为新的总目标函数,为上一次迭代得出的总目标函数。θ为一个足够小的数,只有满足上述条件,则找到了最佳分类,否则没有找到。
基于约束条件的聚类算法的具体结构流程如图2。
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
基于约束条件的聚类算法实现搜索引擎关键词优化,其伪代码过程
输入:网站提取的核心关键词,基于ε领域初始化为c类
输出:全局总目标函数的总和最大的c个簇。