一种基于鲸鱼优化算法的大数据智能搜索方法及系统与流程

文档序号:14403095阅读:3861来源:国知局

本发明属于大数据和智能计算的交叉应用领域,涉及一种智能优化算法在大数据领域的应用,尤其涉及一种在大数据智能搜索问题上的解决方法,具体涉及一种基于鲸鱼优化算法的大数据智能搜索方法及系统。



背景技术:

近几年,大数据在全球得到了迅猛发展,同时引起了学术、业界以及各国政府的高度重视。通过有效地管理大数据并通过分析获取其价值,能够提供高附加值的应用和服务,实现更多的经济和社会价值。但是,大数据时代的来临,既带来了重大的发展机遇又带来了技术挑战。传统的计算技术在解决大数据问题处理时会面临诸多的技术困难。因此,需要研究和寻找新的有效技术方法,以完成大数据的分析处理和价值发现。

不同于传统的数据库查询,网络搜索的一个特点是,用户往往不能一下子完全表达自己的需求,而是通过和搜索引擎的多次交互、逐步逼近,才能基本达到用户请求的目标。这样会导致效率很低。搜索系统能够在用户第一次提出查询请求时,就通过大数据分析洞察其含义,对查询表达式自动做语义扩展,一次中的就可大大提高效率,减轻用户负担。

网络搜索引擎是网上信息查询的一个有力的工具,是网络信息检索的关键技术。传统搜索引擎主要包括:目录类搜索引擎、全文搜索引擎、元搜索引擎、集合式搜索引擎和垂直搜索引擎。随着信息格式的多样化和信息数量的激增,传统搜索引擎面临着巨大的挑战,它已经不能满足用户更个性化、智能化以及多样化的需要。从信息的搜集到信息的组织与索引以及信息的检索与用户接口,智能搜索引擎在不断优化传统搜索引擎的各个方面。智能搜索引擎主要包括:基于本体的智能搜索引擎、基于知识库系统的智能搜索引擎和基于语义关联的智能搜索引擎。智能搜索引擎是将基于关键词层面检索的传统搜索引擎提高到基于知识或概念层面来检索的搜索引擎,它可以从知识和概念的角度来理解词语,表现出较强的智能化与个性化特色,它以一定的知识库技术基础,具有很高的自然语言理解与知识处理能力。

大数据搜索引擎经过了20多年的发展,在搜索速度及正确率都有较大的改善,但是其基本架构和技术都没有太大的改变,这也就造成了它的局限性。针对不同应用场合的搜索引擎,需要的信息也是千差万别的。非智能化检索缺乏识别用户感兴趣信息的能力,并且排序方式不能根据不同使用者做出相应的调整。为不同的人提供具有针对性的检索服务,是未来搜索引擎发展的道路之一,因而各种智能化搜索技术由此诞生。人工智能和计算智能等学科的诞生,是研究者们试图从人类思维和生物界的一些规律中得到启发,创建相应的计算模型,应用到信息科学中去。人工神经网络、群体智能、基因计算等都是运用到当前大数据挑战中的一些成功范例。结合本体特征来建立一个具有智能化的搜索引擎,既解决了目前搜索引擎不能很好地为用户提供感兴趣信息的问题,同时还提高了搜索效率。



技术实现要素:

为了解决大数据智能搜索问题,本发明提出了一种基于鲸鱼优化算法的大数据智能搜索方法及系统。

本发明的方法所采用的技术方案是:一种基于鲸鱼优化算法的大数据智能搜索方法,其特征在于,包括以下步骤:

步骤1:读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置xi,初始化鲸群的位置:n表示维度,n表示鲸群大小;

步骤2:初始化鲸鱼优化算法所需的参数,包括鲸群大小n,对数螺旋形状常数b,当前迭代次数j,最大迭代次数m,整个鲸群全局最优位置为g;

步骤3:计算鲸鱼优化算法中鲸群的初始位置的适应度函数值,将适应度函数值评价最高的大数据作为当前鲸群个体最佳空间位置

步骤4:计算系数向量a和c;

步骤5:产生一个取值范围为[0,1]的随机数p,并根据p的取值选择不同的更新鲸群空间位置的方式;

步骤6:将更新后鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,作为适应度函数值;找到并保存当前群体中最佳鲸群个体x*

步骤7:通过比较更新前后鲸群的位置向量对应的适应度函数值,确定下一代鲸群的位置;

步骤8:记录符合度最高的大数据对应的鲸群位置为全局最优解g以及其适应度函数值;

步骤9:判断用户是否在引擎中找到了需要的文本文档;

若否,则令j=j+1并回转执行步骤4;

若是,则输出最优鲸群个体适应度值及所处的位置x*对应的大数据。

本发明的系统所采用的技术方案是:其特征在于:包括输入模块、鲸鱼优化算法初始化模块、适应度函数值模块、系数向量计算模块、鲸群空间位置更新方式选择模块、更新后的鲸群空间位置向量适应度值计算模块、下一代鲸群的位置确定模块、鲸群位置为全局最优解g以及其适应度函数值记录模块、判断模块;

所述输入模块:用于读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置xi,初始化鲸群的位置:n表示维度,n表示鲸群大小;

所述鲸鱼优化算法初始化模块:用于初始化鲸鱼优化算法所需的参数,包括鲸群大小n,对数螺旋形状常数b,当前迭代次数j,最大迭代次数m,整个鲸群全局最优位置为g;

所述适应度函数值模块:用于计算鲸鱼优化算法中鲸群的初始位置的适应度函数值,将适应度函数值评价最高的大数据作为当前鲸群个体最佳空间位置

所述系数向量计算模块:用于计算系数向量a和c;

所述鲸群空间位置更新方式选择模块:用于产生一个取值范围为[0,1]的随机数p,并根据p的取值选择不同的更新鲸群空间位置的方式;

所述更新后的鲸群空间位置向量适应度值计算模块:用于将更新后鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,作为适应度函数值;找到并保存当前群体中最佳鲸群个体x*

所述下一代鲸群的位置确定模块:用于通过比较更新前后鲸群的位置向量对应的适应度函数值,确定下一代鲸群的位置;

所述鲸群位置为全局最优解g以及其适应度函数值记录模块:用于记录符合度最高的大数据对应的鲸群位置为全局最优解g以及其适应度函数值;

所述判断模块:用于判断用户是否在引擎中找到了需要的文本文档;

若否,则令j=j+1并回转执行步骤4;

若是,则输出最优鲸群个体适应度值及所处的位置x*对应的大数据。

本发明的有益效果是:鲸鱼优化算法具有调节参数少、收敛速度快、寻优精度高、全局寻优能力强以及收敛稳定性好的特点,利用鲸鱼优化算法对大数据智能搜索问题优化求解,从而快速地获得最接近用户需求的搜索结果,具有良好的正确率和效率。

附图说明

图1是本发明实施例的方法流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

请见图1,本发明提供的一种基于鲸鱼优化算法的大数据智能搜索方法,包括以下步骤:

步骤1:读入用户的搜索条件,根据用户的搜索条件从引擎数据库中得到和用户输入关键词匹配的大数据,每个大数据是一头鲸鱼,鲸群中的第i个鲸鱼当前位置xi,初始化鲸群的位置:n表示维度,n表示鲸群大小;

步骤2:设置鲸鱼优化算法所需的参数,所述的初始化鲸鱼优化算法所需的参数包括鲸群大小n,对数螺旋形状常数b,当前迭代次数j,最大迭代次数m,整个鲸群全局最优位置为g。

步骤3:将鲸鱼优化算法中鲸群的初始位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,即为适应度函数值。引擎将适应度函数值评价最高的大数据作为当前鲸群个体最佳空间位置

步骤4:计算系数向量a和c。

系数向量a的计算公式为:

a=2a×r-a

其中,m为最大迭代次数,r为取值范围在[0,1]之间的随机向量。

系数向量c的计算公式为:

c=2r

其中,r为随机向量,取值范围为[0,1]。

步骤5:产生一个随机数p,取值范围为[0,1],并根据p的取值选择不同的更新鲸群空间位置的方式。

当p<0.5时,若a<1,更新当前鲸群个体的空间位置的公式为:

xj+1=xj-a×d

其中,j为当前的迭代次数,xj为当前鲸群个体空间位置,a和c为系数向量,为当前鲸群个体最佳空间位置。

当p<0.5时,若a≥1,则从当前群体中随机选择鲸群个体位置xrand,并更新当前鲸群个体的空间位置。更新当前鲸群个体的空间位置公式为:

x=xrand-a×d

d=|c×xrand,j-xj|

其中,xrand为当前鲸群中随机选择的位置,即随机鲸群个体;xrand,j为当前鲸群中第j维随机选择的位置;

当p≥0.5时,更新当前鲸群个体的空间位置公式为:

其中,d′为鲸群第i头鲸目前最佳位置到猎物之间的距离,b为定义的对数螺旋形状常数,l为[-1,1]之间的随机数,xj为当前鲸群个体空间位置,为当前鲸群个体最佳空间位置。

步骤6:将更新后鲸群的位置向量解码成相应的大数据展现给用户,用户根据自己的搜索条件,为得到的大数据打分,作为适应度函数值。找到并保存当前群体中最佳鲸群个体x*

步骤7:通过比较更新前后鲸群的位置向量对应的适应度函数值,确定下一代鲸群的位置。确定规则为:若更新后的鲸群的位置向量对应的适应度函数值高于更新前,则替换原先的鲸群;否则,保留更新前的鲸群。适应度函数值的计算方法同步骤3。

步骤8:记录符合度最高的大数据对应的鲸群位置为全局最优解g以及其适应度函数值。

步骤9:判断用户是否在引擎中找到了需要的文本文档;

若否,则令j=j+1并回转执行步骤4;

若是,则输出最优鲸群个体适应度值及所处的位置x*对应的大数据。

本发明通过利用鲸鱼优化算法对大数据智能搜索问题优化求解,从而快速地获得最接近用户需求的搜索结果,该方法可用于大数据和智能计算相关技术领域中。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1