1.基于领域离散度算法实现搜索引擎关键词优化,本发明涉及语义网络技术领域,具体涉及一种基于领域离散度算法实现搜索引擎关键词优化,其特征是,包括如下步骤:
步骤1:根据企业业务确定核心关键词,利用搜索引擎搜集相关关键字,这些关键字在搜索引擎中有相应数据项,如本国每月搜索量、竞争程度和估算每次点击费用(CPC)等
步骤2:结合企业产品和市场分析,筛选降维上述搜索到的相关关键字集合;
步骤3:针对筛选降维后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页网页数和总搜索页面数,即每个关键词由五维向量再降维为四维的,其具体计算过程如下:
这里相关关键词个数为m,既有下列矩阵:
、、、、依次为第i个关键词对应的本国每月搜索量、竞争程度、估算每次点击费用(CPC)、首页网页数、总搜索页面数再降维
为四维,即
为搜索效能,为价值率,即为下式:
步骤4:利用基于领域离散度算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇
步骤4.2:初始化每一个领域离散度函数,从数据对象集合D中按下述判定条件选择k个初始簇中心
步骤4.3:对每类关键词进行重新分配,按概率函数p(i)选择聚类中心j;
步骤4.4:根据判定函数的结果,重新计算各簇中心;
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果
步骤5:根据企业具体情况,综合关键词效能优化和价值率优化,选择合适的关键词优化策略达到网站优化目标。
2.根据权利要求1中所述的基于领域离散度算法实现搜索引擎关键词优化,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:利用基于领域离散度算法,对上述关键词进行聚类处理,其具体子步骤如下:
步骤4.1:利用基于领域的k-means算法初始化簇
步骤4.2:初始化每一个领域离散度函数,从数据对象集合D中按下述判定条件选择k个初始簇中心,其具体计算过程如下:
上式为领域内数据对象的个数,为领域内数据对象所对应的向量,为领域内对应的簇中心数据对象向量
利用判定条件,如下:
为设定好的阈值,只有满足这个阈值,初始化的k个簇准确度更高
步骤4.3:对每类关键词进行重新分配,按概率函数p(i)选择聚类中心j,其具体计算过程如下:
为第j类簇中心数据对象向量,为平滑系数,使概率函数p(i)值越大,就选择对应的簇中心j,即有下式:
令,则
步骤4.4:根据判定函数的结果,重新计算各簇中心,其具体计算过程如下:
判定函数:
上式为新的领域离散度函数,为上一次迭代得出的领域离散度函数,只有满足上式判定条件,即簇中心发生变化
步骤4.5:如果簇中心发生变化,则转到步骤(2),否则迭代结束,输出聚类结果
基于领域离散度算法的具体结构流程如图2。