一种基于关键词的科技成果精准推送方法及装置与流程

文档序号:20839673发布日期:2020-05-22 17:20阅读:208来源:国知局
一种基于关键词的科技成果精准推送方法及装置与流程

本发明涉及科技成果推送技术领域,尤其涉及一种基于关键词的科技成果精准推送方法及装置。



背景技术:

随着时代的发展,科技成果对于一个企业来说,也越来越重要,企业可以通过科技成果来明确自身的发展方向,了解最新的科技发展进度,所以一般企业都会安排专门的工作人员去搜集最新的科技成果。

但是,目前企业搜集科技成果的方法都是靠工作人员手动通过网站采集,然后将采集到的科技成果进行筛选,这种方式不仅要耗费大量时间,而且还需要大量的人力资源,而且工作人员在筛选过程中也无法做到精确筛选出企业需要的科技成果,所以,亟需一种科技成果的精准自推送方法,能够自动向企业精准推送科技成果,节省企业的人力资源。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。



技术实现要素:

有鉴于此,本发明提出了一种基于关键词的科技成果精准推送方法及装置,旨在解决现有技术无法通过自动向企业精准推送科技成果的技术问题。

本发明的技术方案是这样实现的:

一方面,本发明提供了一种基于关键词的科技成果精准推送方法,所述基于关键词的科技成果精准推送方法包括以下步骤:

s1,获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词;

s2,根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为各科技成果的关键词;

s3,建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果。

在以上技术方案的基础上,优选的,

步骤s1中,获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词,还包括以下步骤,获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式计算客户历史浏览记录中各词语的权重,将权重数值最大的词语作为客户关键词。

在以上技术方案的基础上,优选的,所述词语权重计算公式为:

其中,w代表当前词语的权重,t代表这个词语在一篇文档中的出现频率,n代表历史记录中文档总数目,nk代表出现过当前词语的文档数目,k代表文档的索引下标。

在以上技术方案的基础上,优选的,步骤s2中,根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为科技成果的关键词,还包括以下步骤,根据客户关键词获取相关的科技成果,设定权重阈值,根据该词语权重计算公式确定各科技成果中权重最大的词语,将词语的权重与权重阈值进行比较,当词语的权重大于权重阈值时,将该词语作为各科技成果的关键词;当词语的权重小于权重阈值时,重新选择词语的权重进行比较。

在以上技术方案的基础上,优选的,步骤s3中,建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果,还包括以下步骤,建立吻合度公式,设定吻合度阈值,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,将吻合度与吻合度阈值进行比较,当吻合度超过吻合度阈值时,将对应的科技成果推送给客户;当吻合度未超过吻合度阈值时,重新选择科技成果关键词进行计算。

在以上技术方案的基础上,优选的,当吻合度超过吻合度阈值时,将对应的科技成果推送给客户,还包括以下步骤,当吻合度超过吻合度阈值时,获取各科技成果关键词对应的吻合度数值,将各吻合度数值两两进行比较,筛选出吻合度数值最大的科技成果关键词,并将该科技成果关键词标记为优先推送。

在以上技术方案的基础上,优选的,所述吻合度公式为:

其中,m代表吻合度,hi代表客户历史记录中第i个关键词,gi代表所有的科技成果中第i个科技成果对应关键词,e代表自然数e,x代表关键词总数,y代表科技成果总数。

更进一步优选的,所述基于关键词的科技成果精准推送装置包括:

客户关键词获取模块,用于获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词;

科技成果关键词确定模块,用于根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为各科技成果的关键词;

推送模块,用于建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果。

第二方面,所述基于关键词的科技成果精准推送方法还包括一种设备,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于关键词的科技成果精准推送方法程序,所述基于关键词的科技成果精准推送方法程序配置为实现如上文所述的基于关键词的科技成果精准推送方法的步骤。

第三方面,所述基于关键词的科技成果精准推送方法还包括一种介质,所述介质为计算机介质,所述计算机介质上存储有基于关键词的科技成果精准推送方法程序,所述基于关键词的科技成果精准推送方法程序被处理器执行时实现如上文所述的基于关键词的科技成果精准推送方法的步骤。

本发明的一种基于关键词的科技成果精准推送方法相对于现有技术具有以下有益效果:

(1)通过词语权重计算公式能够精确计算出用户真正感兴趣的技术对应的关键词,然后根据这个关键词可以获取科技成果,通过词语权重计算公式也可以提高科技成果的精度,提高整个科技成果推送过程的精准度;

(2)通过建立吻合度公式,利用吻合度公式可以计算出客户关键词与科技成果关键词之间的吻合度,根据这个吻合度可以精确计算出两者是不是在同一个领域,指同一种技术,之后便可以精准给客户进行科技成果推送,减少人力资源的消耗。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例方案涉及的硬件运行环境的设备的结构示意图;

图2为本发明基于关键词的科技成果精准推送方法第一实施例的流程示意图;

图3为本发明基于关键词的科技成果精准推送方法第一实施例的功能模块示意图。

具体实施方式

下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

如图1所示,该设备可以包括:处理器1001,例如中央处理器(centralprocessingunit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(randomaccessmemory,ram)存储器,也可以是稳定的非易失性存储器(non-volatilememory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对设备的限定,在实际应用中设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于关键词的科技成果精准推送方法程序。

在图1所示的设备中,网络接口1004主要用于建立设备与存储基于关键词的科技成果精准推送方法系统中所需的所有数据的服务器的通信连接;用户接口1003主要用于与用户进行数据交互;本发明基于关键词的科技成果精准推送方法设备中的处理器1001、存储器1005可以设置在基于关键词的科技成果精准推送方法设备中,所述基于关键词的科技成果精准推送方法设备通过处理器1001调用存储器1005中存储的基于关键词的科技成果精准推送方法程序,并执行本发明实施提供的基于关键词的科技成果精准推送方法。

结合图2,图2为本发明基于关键词的科技成果精准推送方法第一实施例的流程示意图。

本实施例中,所述基于关键词的科技成果精准推送方法包括以下步骤:

s10:获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词。

应当理解的是,系统会自动获取客户历史浏览记录,客户历史浏览记录可以是客户浏览的网页数据或者打开的文章数据,根据这些历史浏览记录,系统会自动计算出客户感兴趣的领域或者技术,然后系统从客户感兴趣的领域或者技术中提取相关的关键词,这个关键词用于代表这个领域或者这项技术,系统会根据这个关键词获取与这个关键词相关的科技成果。

应当理解的是,系统从客户感兴趣的领域或者技术中提取相关的关键词需要用到词语权重计算公式,根据该词语权重计算公式计算客户浏览的网页数据或者打开的文章数据中各词语的权重,将权重数值最大的词语作为客户关键词,所述词语权重计算公式为:

其中,w代表当前词语的权重,t代表这个词语在一篇文档中的出现频率,n代表历史记录中文档总数目,nk代表出现过当前词语的文档数目,k代表文档的索引下标。

应当理解的是,权重是一个汉语词语,指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。通常,权重可通过划分多个层次指标进行判断和计算,常用的方法包括层次分析法、模糊法、模糊层次分析法和专家评价法等。

s20:根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为各科技成果的关键词。

应当理解的是,跟从客户历史浏览记录中提取关键词的步骤相同,确定各科技成果的关键词也需要用到词语权重计算公式,但不同的是,系统首先会根据用户的关键词获取很多科技成果,这些科技成果不一定都是客户想要的,即含有很多杂质,所以需要删除客户不想要的那些科技成果。

应当理解的是,系统会设定权重阈值,然后根据该词语权重计算公式确定各科技成果中权重最大的词语,将词语的权重与权重阈值进行比较,当词语的权重大于权重阈值时,将该词语作为各科技成果的关键词;当词语的权重小于权重阈值时,重新选择词语的权重进行比较,因为权重的性质,所以一个词的权重越大,表示这个词在文中出现的频率也就越高,与客户关键词的相似度也就越高。通过这样,可以提高推送过程的精准度。

s30:建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果。

应当理解的是,系统还会建立吻合度公司,用于计算客户关键词与科技成果关键词之间的吻合度,吻合度越高,就表示客户关键词与科技成果关键词越相近或者相同,通过这样的方式,可以实现自动将客户感兴趣的科技成果推送的全过程,不需要耗费大量的人力资源,而且推送准确度高。

应当理解的是,因为客户感兴趣的领域或者技术往往不止一个,所以系统会设定一个吻合度阈值,用于筛选出客户最感兴趣的领域或者技术,然后将对应的科技成果关键词进行标记,优先推送该领域的科技成果,提高用户体验。

应当理解的是,所述吻合度公式为:

其中,m代表吻合度,hi代表客户历史记录中第i个关键词,gi代表所有的科技成果中第i个科技成果对应关键词,e代表自然数e,x代表关键词总数,y代表科技成果总数。

需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。

通过上述描述不难发现,本实施例通过获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词;根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为各科技成果的关键词;建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果。本发明通过这种方式,能够获取用户的兴趣,根据用户的兴趣精准推送对应的科技成果,提高了推送效率与精确度。

此外,本发明实施例还提出一种基于关键词的科技成果精准推送装置。如图3所示,该基于关键词的科技成果精准推送装置包括:客户关键词获取模块10、科技成果关键词确定模块20、推送模块30。

客户关键词获取模块10,用于获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词;

科技成果关键词确定模块20,用于根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为各科技成果的关键词;

推送模块30,用于建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果。

此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。

另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于关键词的科技成果精准推送方法,此处不再赘述。

此外,本发明实施例还提出一种介质,所述介质为计算机介质,所述计算机介质上存储有基于关键词的科技成果精准推送方法程序,所述基于关键词的科技成果精准推送方法程序被处理器执行时实现如下操作:

s1,获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式确定客户历史浏览记录中权重最大的词语,将该词语作为客户关键词;

s2,根据客户关键词获取相关的科技成果,根据该词语权重计算公式确定各科技成果中权重最大的词语,将该词语作为各科技成果的关键词;

s3,建立吻合度公式,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,根据吻合度向客户推送对应的科技成果。

进一步地,所述基于关键词的科技成果精准推送方法程序被处理器执行时还实现如下操作:

获取客户历史浏览记录,建立词语权重计算公式,根据该词语权重计算公式计算客户历史浏览记录中各词语的权重,将权重数值最大的词语作为客户关键词。

进一步地,所述基于关键词的科技成果精准推送方法程序被处理器执行时还实现如下操作:

所述词语权重计算公式为:

其中,w代表当前词语的权重,t代表这个词语在一篇文档中的出现频率,n代表历史记录中文档总数目,nk代表出现过当前词语的文档数目,k代表文档的索引下标。

进一步地,所述基于关键词的科技成果精准推送方法程序被处理器执行时还实现如下操作:

根据客户关键词获取相关的科技成果,设定权重阈值,根据该词语权重计算公式确定各科技成果中权重最大的词语,将词语的权重与权重阈值进行比较,当词语的权重大于权重阈值时,将该词语作为各科技成果的关键词;当词语的权重小于权重阈值时,重新选择词语的权重进行比较。

进一步地,所述基于关键词的科技成果精准推送方法程序被处理器执行时还实现如下操作:

建立吻合度公式,设定吻合度阈值,通过吻合度公式计算客户关键词与科技成果关键词之间的吻合度,将吻合度与吻合度阈值进行比较,当吻合度超过吻合度阈值时,将对应的科技成果推送给客户;当吻合度未超过吻合度阈值时,重新选择科技成果关键词进行计算。

进一步地,所述基于关键词的科技成果精准推送方法程序被处理器执行时还实现如下操作:

当吻合度超过吻合度阈值时,获取各科技成果关键词对应的吻合度数值,将各吻合度数值两两进行比较,筛选出吻合度数值最大的科技成果关键词,并将该科技成果关键词标记为优先推送。

进一步地,所述基于关键词的科技成果精准推送方法程序被处理器执行时还实现如下操作:

所述吻合度公式为:

其中,m代表吻合度,hi代表客户历史记录中第i个关键词,gi代表所有的科技成果中第i个科技成果对应关键词,e代表自然数e,x代表关键词总数,y代表科技成果总数。

以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1