一种基于大数据的智能检索方法及系统与流程

文档序号:37426924发布日期:2024-03-25 19:15阅读:20来源:国知局
一种基于大数据的智能检索方法及系统与流程

本技术涉及智能检索,尤其涉及一种基于大数据的智能检索方法及系统。


背景技术:

1、随着互联网和数字化的普及,大量的文本、图像、音频、视频等多媒体数据被产生和存储,传统的基于关键词的检索方式已经无法满足人们对于快速、准确地获取所需信息的需要,因此,基于大数据的智能检索应运而生。基于大数据的智能检索是一种利用大数据技术和人工智能算法来提高检索效率和准确度的方法。

2、现有的基于大数据的智能检索方法通常包括:分布式计算框架、机器学习算法、深度学习模型、自然语言处理技术和索引构建方法等。但现有的基于大数据的智能检索方法在实际应用过程中,仍存在一定的局限性和不足,需要进一步研究和改进,例如:检索数据的规模大且混杂,索引效率低,对检索请求内容的分析准确性低,以及获得的检索结果的准确性低。


技术实现思路

1、本技术的目的在于提供一种基于大数据的智能检索方法及系统,能够提高检索效率和检索准确性。

2、为达到上述目的,本技术提供一种基于大数据的智能检索方法,包括如下步骤:s1:接收请求数据,其中,请求数据至少包括:用户信息、检索时间和检索内容;s2:利用预先构建的多个检索类别对请求数据中的检索内容进行分析,并从多个检索类别中确定一个检索类别作为目标类别;s3:根据请求数据获取校核数据,根据校核数据对目标类别进行校核,获得校核结果,其中,校核结果为无校核、准确或不准确;若校核结果为无校核或准确,则将目标类别作为检索类别;若校核结果为不准确,则重新确定检索类别;s4:根据检索类别获取多个检索数据并发送,接收根据多个检索数据发送的检索结果,并根据检索结果更新历史数据库。

3、如上的,其中,利用预先构建的多个检索类别对请求数据中的检索内容进行分析,并从多个检索类别中确定一个检索类别作为目标类别的子步骤如下:s21:对请求数据中的检索内容进行词语提取,获得多个词语特征;s22:遍历预先构建的多个检索类别,利用多个词语特征分别与每个检索类别的检索特征集合进行相关性分析,获得多个原始相关值;s23:对多个词语特征进行词义扩展,获得多个词语特征的扩展特征;s24:遍历预先构建的多个检索类别,利用多个扩展特征分别与每个检索类别的检索特征集合进行相关性分析,获得多个扩展相关值;s25:根据原始相关值和扩展相关值获得检索相关值,并将所有检索相关值中的最大值所对应的检索类别作为目标类别。

4、如上的,其中,检索相关值的表达式为:;其中,为请求数据中的检索内容与第个检索类别的检索特征集合之间的检索相关值;为词语特征与第个检索类别的检索特征集合之间的原始相关值;为扩展特征与第个检索类别的检索特征集合之间的扩展相关值;为原始相关值的权重;为扩展相关值的权重。

5、如上的,其中,根据请求数据获取校核数据,根据校核数据对目标类别进行校核,获得校核结果的子步骤如下:s31:根据请求数据中的用户信息对多个历史数据库进行遍历,将历史用户信息与请求数据中的用户信息一致的历史数据库中的多个历史数据均作为初选数据,其中,初选数据至少包括:历史检索时间、历史检索内容、历史检索类别、历史检索数据和历史检索结果,历史检索结果为准确或不准确;s32:遍历多个初选数据,利用多个词语特征分别对每个初选数据的多个历史词语特征进行相关性分析,获得多个校核相关值,通过预设的校核相关阈值对每个校核相关值进行判断,若存在至少一个大于校核相关阈值的校核相关值,则将大于校核相关阈值的校核相关值所对应的初选数据作为校核数据,执行s33;若所有校核相关值均小于校核相关阈值,则生成校核结果,且校核结果为无校核;s33:利用校核数据对目标类别进行校核分析,获得综合校核值,利用预设的综合校核阈值对综合校核值进行判断,生成校核结果;若综合校核值大于综合校核阈值,则生成的校核结果为准确;若综合校核值小于综合校核阈值,则生成的校核结果为不准确。

6、如上的,其中,若校核结果为不准确,则将目标类别从预先构建的多个检索类别中剔除后,利用剩余的多个检索类别对请求数据中的检索内容进行分析,并从剩余的多个检索类别中确定一个检索类别作为目标类别。

7、如上的,其中,每个预先构建的检索类别均包括:一个检索名称、一个检索特征集合和一个检索地址,其中,检索特征集合包括:多个检索特征,每个检索特征分别对应一个特征频率值;一个检索地址对应一个检索数据库。

8、如上的,其中,检索特征集合根据从多个受信数据源获取的文本数据进行实时更新,其中,检索特征集合的更新内容至少包括:对检索特征的个数和/或内容进行增加、修改和/或删除,以及对每个检索特征对应的特征频率值进行更新。

9、如上的,其中,根据检索类别获取多个检索数据并发送,接收根据多个检索数据发送的检索结果,并根据检索结果更新历史数据库的子步骤如下:s41:根据检索类别中的检索地址对相应的检索数据库进行访问,从相应的检索数据库中获取多个检索数据,并发送;s42:接收根据多个检索数据发送的检索结果,将检索时间作为历史检索时间,将检索内容作为历史检索内容,将检索类别作为历史检索类别,将检索数据作为历史检索数据,将检索结果作为历史检索结果;并将历史检索时间、历史检索内容、历史检索类别、历史检索数据和历史检索结果作为历史数据存储于相应的历史数据库。

10、本技术还提供一种基于大数据的智能检索系统,包括:多个用户端和大数据智能检索中心;其中,用户端:用于发送请求数据;接收检索数据,并发送检索结果;大数据智能检索中心:用于执行上述的基于大数据的智能检索方法。

11、如上的,其中,大数据智能检索中心至少包括:收发单元、分析单元、校核单元、检索单元、更新单元和存储单元;其中,收发单元:用于接收请求数据,并将请求数据发送至分析单元;分析单元:用于对存储单元进行遍历,利用预先构建的多个检索类别对请求数据中的检索内容进行分析,并从多个检索类别中确定一个检索类别作为目标类别;校核单元:用于根据请求数据获取校核数据,根据校核数据对目标类别进行校核,获得校核结果,其中,校核结果为无校核、准确或不准确;若校核结果为无校核或准确,则将目标类别作为检索类别并发送至检索单元;若校核结果为不准确,则重新确定检索类别并发送至检索单元;检索单元:根据检索类别获取多个检索数据并发送,接收根据多个检索数据发送的检索结果,并将检索结果发送至更新单元;更新单元:用于对存储单元中存储的检索类别、检索数据和/或历史数据进行更新;存储单元:用于存储多个检索类别、多个检索数据库和多个历史数据库。

12、本技术实现的有益效果如下:

13、(1)本技术的基于大数据的智能检索方法及系统,能够提高检索效率和检索准确性。

14、(2)本技术的基于大数据的智能检索方法及系统,通过综合考虑多个校核数据与本次请求数据的相关度、用户端个人的历史检索热度和历史检索准确性,进一步提高了检索类别的准确性,从而保障了检索结果的准确性。

15、(3)本技术的基于大数据的智能检索方法及系统,通过实时更新检索类别、检索数据和/或历史数据,提高了对请求数据进行分析的过程所使用的检索类别、检索数据和/或历史数据的实时性、准确性和完整性,能够进行一步提高分析的准确性和检索的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1