一种数字金融服务的大数据挖掘方法、装置及存储介质与流程

文档序号:37412108发布日期:2024-03-25 19:00阅读:11来源:国知局
一种数字金融服务的大数据挖掘方法、装置及存储介质与流程

本发明属于大数据挖掘,具体涉及一种数字金融服务的大数据挖掘方法、装置及存储介质。


背景技术:

1、随着生活水平的提高,越来越多的用户倾向于购买数字金融服务,来进行金融投资或享受保险服务,其中,数字金融服务是指通过互联网及信息技术手段与传统金融服务业态相结合的方式,如网上贷款、网上保险、网上基金等服务,其作为新一代的金融服务,已得到了快速的发展;目前,金融系统主要通过被动方式接收用户发送的金融服务请求,并基于请求中要进行购买的金融服务产品进行相应的交易处理(如用户基于自己的需求,选择相应保险服务,然后,由自己去咨询相应的保险公司销售人员,从而来完成本次保险的购买);同时,金融系统还可基于每个用户已经购买的金融服务产品,来推荐相似的产品给该用户,从而来实现产品的销售;但是,前述推荐方法存在以下不足:由于只能被动接收用户请求,或者分散性的对已购买产品的用户进行相类似金融产品的推荐,如此,则会导致推荐的金融服务产品较为单一,不能给用户带来更多样化的选择;因此,如何提供一种能够针对用户,来进行多样化金融服务产品推荐的数字金融服务的大数据挖掘方法,已成为一个亟待解决的问题。


技术实现思路

1、本发明的目的是提供一种数字金融服务的大数据挖掘方法、装置及存储介质,用以解决现有技术中所存在的推荐的金融服务产品较为单一,不能给用户带来更多样化的选择的问题。

2、为了实现上述目的,本发明采用以下技术方案:

3、第一方面,提供了一种数字金融服务的大数据挖掘方法,包括:

4、获取目标用户的网络搜索语料库,其中,所述网络搜索语料库包括在预设历史时间段内,所述目标用户的金融服务搜索记录;

5、对所述网络搜索语料库进行分类处理,以将属于搜索语句的金融服务搜索记录作为待切分文本,以及将属于搜索关键词的金融服务搜索记录,作为第一关键词;

6、对各个待切分文本进行关键词提取处理,以得到各个待切分文本的第二关键词;

7、基于各个第一关键词和各个第二关键词,确定出金融搜索关键词,并对所述金融搜索关键词进行关键词挖掘处理,以得到至少一个扩展关键词;

8、根据所述金融搜索关键词和所述至少一个扩展关键词,进行金融服务匹配处理,以匹配出与金融搜索关键词相对应的第一金融服务,以及与各个扩展关键词相对应的第二金融服务;

9、将所述第一金融服务和所述第二金融服务,作为推荐金融服务,并将所述推荐金融服务,推送至所述目标用户对应的用户终端。

10、基于上述公开的内容,本发明先爬取目标用户在预设历史时间段内的金融服务搜索记录,并基于爬取的搜索记录,来生成网络搜索语料库;而后,则对网络搜索语料库进行分类,以将该语料库中属于搜索关键词的搜索记录,作为第一关键词,以及将该语料库中属于搜索语句的搜索记录,作为待切分文本;接着,本发明再对各个待切分文本进行关键词提取处理,以得到各个待切分文本的第二关键词;如此,前述第一关键词和第二关键词,则是用户感兴趣的金融服务对应的关键词;基于此,即可基于前述关键词,来进行金融服务产品的匹配;具体的,本发明先根据第一关键词和第二关键词,来确定出金融搜索关键词;同时,本发明还对该金融搜索关键词进行了挖掘处理,得到了扩展关键词;最后,即可基于用户感兴趣的金融服务的关键词和其对应扩展关键词,来进行金融服务的匹配,以得出用户感兴趣的金融服务,并推送至该目标用户。

11、通过上述设计,本发明利用大数据挖掘技术,来挖掘出用户最近时间的金融服务搜索记录,并通过对其进行关键词提取处理,来得出用户感兴趣的金融服务的关键词;同时,本发明还设置有关键词扩展步骤,如此,即可得出金融服务关键词的扩展关键词;而后,基于前述金融服务关键词及其扩展关键词,即可匹配出用户感兴趣的多个金融服务;由此,本发明相比于传统技术,不仅提高了推荐的多样性,还提高了推荐的精准性,能够给用户带来更多样化的选择,适用于大规模应用与推广。

12、在一个可能的设计中,对各个待切分文本进行关键词提取处理,以得到各个待切分文本的第二关键词,包括:

13、对于任一待切分文本,对所述任一待切分文本进行分词处理,以得到若干分词;

14、利用所述若干分词,构建出所述任一待切分文本的语义网络图,其中,所述语义网络图中包括若干节点,每个节点分别对应所述若干分词中的一个分词,且当任意两节点对应的分词之间具有关联关系时,该任意两节点之间采用关联边进行连接;

15、基于各个待切分文本和所述语义网络图,计算出所述若干分词中每个分词相对于所述任一待切分文本的相关度;

16、根据每个分词相对于所述任一待切分文本的相关度,从若干分词中,确定出所述任一待切分文本的第二关键词。

17、在一个可能的设计中,基于各个待切分文本和所述语义网络图,计算出所述若干分词中每个分词相对于所述任一待切分文本的相关度,包括:

18、对于所述语义网络图中的任一节点,基于各个待切分文本,计算出所述任一节点对应的分词的词频-逆向文件频率值;

19、根据语义网络图,计算出所述任一节点对应的分词在语义网络图中的重要度和聚类贡献度;

20、根据所述任一节点对应的分词的词频-逆向文件频率值,以及所述任一节点对应的分词在语义网络图中的重要度和聚类贡献度,计算出所述任一节点对应的分词相对于所述任一待切分文本的相关度。

21、在一个可能的设计中,基于各个待切分文本,计算出所述任一节点对应的分词的词频-逆向文件频率值,包括:

22、按照如下公式(1),计算出所述任一节点对应的分词的词频-逆向文件频率值;

23、(1)

24、上述公式(1)中,表示所述任一节点对应的分词的词频-逆向文件频率值,表示任一节点对应的分词在所述任一待切分文本d中的出现次数,表示所述任一待切分文本d中出现次数最多的分词的次数,表示各个待切分文本中包含有所述任一节点对应的分词的文本个数,表示待切分文本的总数。

25、在一个可能的设计中,根据语义网络图,计算出所述任一节点对应的分词在语义网络图中的重要度和聚类贡献度,包括:

26、按照如下公式(2),计算出所述任一节点对应的分词在语义网络图中的重要度,以及按照如下公式(3),计算出所述任一节点对应的分词在语义网络图中的聚类贡献度;

27、(2)

28、上述公式(2)中,表示任一节点对应的分词在语义网络图中的重要度,表示所述语义网络图中各个第一目标路径的平均长度,表示所述语义网络图中各个第二目标路径的平均长度,其中,任一第一目标路径为包含有所述任一节点的路径,任一第二目标路径为不包含所述任一节点的路径;

29、(3)

30、上述公式(3)中,表示所述任一节点对应的分词在语义网络图中的聚类贡献度,表示所述语义网络图中第i个节点对应分词的聚类系数,表示目标语义网络图中第j个节点对应分词的聚类系数,其中,,q表示所述语义网络图中与第i个节点直接连接的节点的数目,v表示语义网络图中,第i个节点与各个目标节点之间的关联边,以及各个目标节点之间的关联边的总数,各个目标节点为与第i个节点直接连接的节点,n为所述语义网络图中的节点总数,k为所述目标语义网络图中的节点总数,且所述目标语义网络为删除所述任一节点后的语义网络图;

31、相应的,根据所述任一节点对应的分词的词频-逆向文件频率值,以及所述任一节点对应的分词在语义网络图中的重要度和聚类贡献度,计算出所述任一节点对应的分词相对于所述任一待切分文本的相关度,则包括:

32、按照如下公式(4),计算出所述任一节点对应的分词相对于所述任一待切分文本的相关度;

33、(4)

34、上述公式(4)中,表示所述任一节点对应的分词相对于所述任一待切分文本的相关度,表示所述任一节点对应的分词的词频-逆向文件频率值,表示调节因子。

35、在一个可能的设计中,根据每个分词相对于所述任一待切分文本的相关度,从若干分词中,确定出所述任一待切分文本的第二关键词,包括:

36、按照相关度从大至小的顺序,对各个分词进行排序处理,以得到初始关键词序列;

37、基于所述任一待切分文本,对所述初始关键词序列中的初始关键词进行关键词合并处理,以在关键词合并处理后,得到若干候选关键词;

38、从若干候选关键词中,选取出前p位的候选关键词,作为所述任一待切分文本的第二关键词,其中,p为大于1的正整数。

39、在一个可能的设计中,对所述金融搜索关键词进行关键词挖掘处理,以得到至少一个扩展关键词,包括:

40、获取扩展词语数据库以及所述金融搜索关键词的语义向量,其中,所述扩展词语数据库中存储有海量扩展词语以及每个扩展词语的语义向量;

41、计算所述金融搜索关键词的语义向量,与所述扩展词语数据库中各个扩展词语的语义向量之间的向量距离;

42、根据所述金融搜索关键词的语义向量,与各个扩展词语的语义向量之间的向量距离,确定出所述搜索关键词的至少一个扩展关键词。

43、第二方面,提供了一种数字金融服务的大数据挖掘装置,包括:

44、爬取单元,用于获取目标用户的网络搜索语料库,其中,所述网络搜索语料库包括在预设历史时间段内,所述目标用户的金融服务搜索记录;

45、分类单元,用于对所述网络搜索语料库进行分类处理,以将属于搜索语句的金融服务搜索记录作为待切分文本,以及将属于搜索关键词的金融服务搜索记录,作为第一关键词;

46、关键词提取单元,用于对各个待切分文本进行关键词提取处理,以得到各个待切分文本的第二关键词;

47、关键词扩展单元,用于基于各个第一关键词和各个第二关键词,确定出金融搜索关键词,并对所述金融搜索关键词进行关键词挖掘处理,以得到至少一个扩展关键词;

48、金融服务匹配单元,用于根据所述金融搜索关键词和所述至少一个扩展关键词,进行金融服务匹配处理,以匹配出与所述金融搜索关键词相对应的第一金融服务,以及与各个扩展关键词相对应的第二金融服务;

49、推送单元,用于将所述第一金融服务和所述第二金融服务,作为推荐金融服务,并将所述推荐金融服务,推送至所述目标用户对应的用户终端。

50、第三方面,提供了另一种数字金融服务的大数据挖掘装置,以装置为电子设备为例,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意一种可能设计的所述数字金融服务的大数据挖掘方法。

51、第四方面,提供了一种存储介质,存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意一种可能设计的所述数字金融服务的大数据挖掘方法。

52、有益效果:

53、本发明利用大数据挖掘技术,来挖掘出用户最近时间的金融服务搜索记录,并通过对其进行关键词提取处理,来得出用户感兴趣的金融服务的关键词;同时,本发明还设置有关键词扩展步骤,如此,即可得出金融服务关键词的扩展关键词;而后,基于前述金融服务关键词及其扩展关键词,即可匹配出用户感兴趣的多个金融服务;由此,本发明相比于传统技术,不仅提高了推荐的多样性,还提高了推荐的精准性,能够给用户带来更多样化的选择,适用于大规模应用与推广。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1