一种基于人工智能推荐的智能搜索方法与流程

文档序号:37493103发布日期:2024-04-01 14:01阅读:29来源:国知局
一种基于人工智能推荐的智能搜索方法与流程

本发明涉及一种智能搜索方法,尤其涉及一种基于人工智能推荐的智能搜索方法。


背景技术:

1、智能搜索方法可以根据用户输入的查询,在搜索结果中提供并展示与输入查询相关的实体建议,帮助用户便捷地发现与其都多需求相关的其他实体,让用户高效的获得丰富的信息内容,有效提升用户的信息发现体验,但是传统的相关试题推荐任务方法存在以下缺点和不足:

2、一、实体推荐存在无关性:部分搜索引擎中展现的一些推荐实体与用户输入的搜索查询语句包含的实体无关联,与用户搜索意图不相匹配,这类推荐实体对用户完全无意义,甚至降低用户的参与度及搜索体验性;

3、二、推荐领域的单一性:传统的实体推荐任务中对用户推荐的实体通常限定于同一领域,如商品或电影,而用户期望获得的实体推荐是没有限定领域的,它可以来自知识库中的任何一个领域。

4、综上,现有的实体推荐方法中为用户展示的相关实体与用户输入的搜索查询语句包含的实体可能存在无关性,或相关性较弱,并非用户所关注的内容,无法引起用户的探索欲和兴趣,也不能引导用户进行再次搜索,甚至导致用户体验下降。


技术实现思路

1、为了解决上述技术所存在的不足之处,本发明提供了一种基于人工智能推荐的智能搜索方法。

2、为了解决以上技术问题,本发明采用的技术方案是:一种基于人工智能推荐的智能搜索方法,包括以下步骤:

3、步骤s1:接受用户输入的查询q,使用数据获取工具爬取重点应用平台、web站点的数据,并存储到对应的数据库中;对采集的数据均进行预处理,并构建本体库,将本体库中本体模型与通用知识图谱融合,得到知识图谱并存储至图数据库中;

4、步骤s2:针对查询q对应的查询实体进行相关实体发现,获取与查询实体相关的候选实体,进而得到相关实体集合;

5、步骤s3:基于构建实体无向带权图模型计算查询实体与候选实体间的相似度,根据查询实体和各个候选实体的相似度得分对候选实体进行排序,相似度得分越高,查询实体与各个候选实体的相似度得分的排序越高,相关程度越大;

6、步骤s4:基于排序结果获得相关实体推荐结果,排序结果越高,相关实体推荐结果的优先级越高。

7、进一步地,步骤s1中数据包括结构化数据、半结构化数据、文本类非结构化数据和开放领域的其他第三方数据。

8、进一步地,步骤s1中本体库的本体是描述客观世界的抽象模型,用于指导用户在特定的领域范围内,对真实世界存在的事物和领域内的术语及概念,进行认知建模;基于构建本体库进而构建知识图谱的具体步骤如下:

9、s11:针对结构化数据构建本体库:基于关系型数据库中的语义信息,按照关系模型与本体模型之间的映射规则,将关系模型转化为本体模型;关系模型与本体模型之间的映射规则包括本体概念映射规则、本体属性映射规则和本体概念之间关系映射规则;关系型数据库包含完整的表结构信息,并隐含着相关领域的关系及概念模型;

10、s12:针对半结构化数据构建本体库:首先将半结构化数据转为结构化数据,抽取关系模型,通过s11中关系模型与本体模型之间的映射规则将关系模型转化为本体模型;

11、s13:将s11、s12中得到的本体模型与通用知识图谱中的实体进行对齐,采用word2vec判断新提取出的实体与通用知识图谱中的实体是否一致,将指向同一对象的实体进行合并,并用唯一的id对该实体进行标记,最后将实体抽取出的新关系增加到知识图谱中,将知识图谱存储至图数据库中;

12、s14:构建文本类的非结构化数据的知识图谱,采用无监督的文本三元组提取法,提取句子中符合一定语法规则的关系组,最终将文本提取为多个三元组的集合,提取文本的具体过程如下:

13、s141:文本由多个句子组成,拆解每个文本里的句子,得到n个拆解句子;

14、s142:对每个拆解句子进行分词处理,将拆解句子变为一系列的词汇和标点符号集;

15、s143:通过词性标注得到向量即把拆解句子变为一系列的词汇和标点组成的向量;

16、s144:对拆解句子进行句法分析,得到句法依存关系,提取到三元组即本体模型;

17、s145:将三元组与通用知识图谱进行融合;进行实体对齐,并用唯一的id对该实体进行标记,最终将实体抽取出的新关系增加到知识图谱中,将知识图谱存储至图数据库中。

18、进一步地,步骤s2中获取与查询实体相关的候选实体的方法为基于知识图谱来获取查询实体的相关候选实体,包括以下步骤:

19、a1:基于知识图谱抽取出与查询q有关的查询实体eq;

20、a2:在知识图谱中抽取与eq存在关联关系的其他实体即候选实体e,将e作为q的相关实体集合,记为k(eq);

21、计算查询q与候选实体e∈k(eq)间的相关性得分,公式为:

22、

23、其中,p1为a方法的相关性得分;e为候选实体;eq为查询实体。

24、进一步地,步骤s2中获取与查询实体相关的候选实体的方法为在基于知识图谱获取查询实体的相关候选实体的基础上,再基于搜索会话共现补齐查询q的其他相关候选实体。

25、进一步地,搜索会话共现是基于用户的搜索日志来挖掘实体及其关系,搜索日志为用户在搜索引擎中进行搜索时,在同一搜索会话中多次搜索不同的查询,该搜索行为的累积形成了用户的搜索日志;包括以下步骤:

26、b1:在搜索日志中查找出与eq在同一搜索会话中多次共现的共现实体;

27、b2:按照共现次数由高至低,取满足条件的前n个共现实体作为q的相关实体集合,记为s(eq);并采用点互信息计算查询q与候选实体e∈k(eq)间的相关性得分,公式为:

28、

29、其中,

30、e′∈s(eq);

31、

32、cnt(e,eq)为e与eq共同出现即共现过的搜索会话个数,而cnt(e)为含有e的搜索会话个数。

33、进一步地,合并基于知识图谱获取查询实体的相关候选实体方法得到的相关实体集合和基于搜索会话共现补齐查询q的其他相关候选实体方法得到的相关实体集合,最终得到查询q的相关实体集合v′(q),公式为:

34、v′(q)≈k(eq)∪s(eq);

35、其中,k(eq)为基于知识图谱获取查询实体eq的相关候选实体的实体集合;s(eq)为基于搜索会话共现补齐查询实体eq的相关候选实体的实体集合。

36、进一步地,步骤s3中基于构建实体无向带权图模型计算查询实体与候选实体间的相似度,包括以下步骤:

37、s31:在无向带权图模型中根据知识图谱中查询实体的节点和候选实体的节点之间的关系来构造无向边;再根据候选实体之间的余弦相似度构造各候选实体之间的无向边;

38、s32:按照候选实体在知识图谱中的向量相关性,计算无向带权图模型边上的权重,得到候选实体之间的相关度;

39、s33:提出一个候选实体打分函数,通过遍历无向带权图模型中查询实体与各个候选实体之间的路径,进而计算候选实体的相似度得分,根据相似度得分由高至低,选取一定数量的前n个候选实体进行排序并推荐。

40、进一步地,s31中任意选择两个候选实体,若两个候选实体对应向量间的余弦相似度为正,则在无向带权图模型中构造一条两个候选实体的无向边,表示两个候选实体为相关;若两个候选实体对应向量间的余弦相似度不为正,表示两个候选实体为不相关;余弦相似度的计算公式为:

41、

42、其中,vi、vj为任意两个候选实体。

43、进一步地,s33中计算候选实体的相似度得分的公式即每条路径上权重的平均值中最大值的公式为:

44、

45、其中,zi为查询实体eq到候选实体vi所有的路径集合;zj为第j条路径需要经历的所有实体集合;为第j条路径中的第a个实体。

46、本发明公开了一种基于人工智能推荐的智能搜索方法,基于人工智能算法模型,对查询实体和知识图谱中连接到候选相关实体集进行相似度计算打分并排序,提升排名靠前的一定数量的相关实体返回并展现给用户,提升推荐实体的相关性;通过对领域内的多源数据信息进行采集、知识提取、知识融合、知识存储、知识编辑、知识标注等数据处理流程,构建互为关联的领域知识图谱体系,通过知识图谱技术,实现多领域相关实体的发现与推荐展现,提高推荐领域的多样性。基于知识图谱、相似度计算等人工智能技术,为用户提供一种基于人工智能推荐的智能搜索方法,将知识信息进行有效的关联加工,构建知识图谱库,通过相关实体发现、相关实体排序及推荐等技术为用户推荐其感兴趣的相关实体,重点提升推荐实体与用户输入的查询语句包含实体的相关性,以提升用户的搜索体验性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1