一种用户兴趣模型生成方法、职位推荐方法及计算设备与流程

文档序号:14403137阅读:145来源:国知局
一种用户兴趣模型生成方法、职位推荐方法及计算设备与流程
本发明涉及互联网
技术领域
,特别涉及一种用于职位推荐的用户兴趣模型生成方法、职位推荐方法及计算设备。
背景技术
:随着互联网技术的快速发展,越来越多的人开始享受互联网为工作和生活带来的各种便利。以传统的招聘行业为例,现在人们可以通过招聘网站来搜索职位信息、投递简历、与心仪的用人单位联系等。当用户登录后,招聘网站会通过收集用户行为来获取用户求职意向,根据用户求职意向来向用户推荐相关的职位。一般而言,如何给找工作的用户推荐满意的候选职位,很大程度上取决于招聘系统下推荐模块对服务对象的认知,用户画像和用户标签则是通常采用的技术手段。用户画像是初期定位用户的较好方式,但随着用户兴趣的变迁或者信息的变动,用户画像不够动态精确,不能很好地实时调整。而用户行为往往具有周期性,即在时间线上是跳跃式的,用户标签虽然能够及时地刻画用户兴趣,但是从时间维度上并不能很好地表征用户的信息变迁,同时也因为其本身的抽象性,存在遗漏互补信息的可能。技术实现要素:为此,本发明提供一种用于职位推荐的用户兴趣模型生成方案,并提出了基于该用户兴趣模型的职位推荐方案,以力图解决或者至少缓解上面存在的问题。根据本发明的一个方面,提供一种用于职位推荐的用户兴趣模型生成方法,适于在计算设备中执行,计算设备包括数据存储装置,数据存储装置中存储有初始求职信息集和行为权重集,初始求职信息集包括多条用户初始求职信息,每条用户初始求职信息关联于其对应的一个用户,行为权重集包括多个求职行为权重,该方法包括如下步骤:首先,根据从初始求职信息集中获取的当前用户关联的用户初始求职信息,初始化相应的用户兴趣模型,用户兴趣模型关联有一个或多个第一求职特征,每个第一求职特征包括一个或多个第二求职特征;收集当前用户在预设的时间段内的一个或多个求职行为;对收集到的每一个求职行为,将该求职行为映射成相应的一个或多个第一求职特征;将映射出的各第一求职特征分解成其所包括的一个或多个第二求职特征,并获取所分解出的各第二求职特征的一个或多个属性;对获取到的每一个属性,从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重,以计算该属性的权重;根据分解出的各第二求职特征的属性及属性的权重,更新用户兴趣模型。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,用户初始求职信息包括用户的个人信息、在线简历、附件简历和/或位置信息。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,第一求职特征为职位标签、职位要求、职位薪资、职位城市、职位类型和公司要求中的任一种。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,求职行为包括投递、收藏、浏览、约谈、评论、订阅、期望、工作经历和/或搜索。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,每个求职行为权重关联于其对应的一种求职行为类型,从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重的步骤包括:判断该属性所源于的求职行为的求职行为类型;从行为权重集中查找与该求职行为类型关联的求职行为权重,作为该求职行为对应的求职行为权重。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,计算该属性的权重的步骤包括:生成该属性所源于的求职行为对应的时间衰减参数;根据该属性所源于的求职行为对应的求职行为权重,以及时间衰减参数,计算该属性的权重。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,还包括:监控当前用户的求职行为,以判断该求职行为是否可触发用户兴趣模型的实时更新;若是,则基于该求职行为实时更新用户兴趣模型。可选地,在根据本发明的用于职位推荐的用户兴趣模型生成方法中,基于该求职行为实时更新用户兴趣模型的步骤包括:将该求职行为映射成相应的一个或多个第一求职特征;将映射出的各第一求职特征分解成其所包括的一个或多个第二求职特征,并获取所分解出的各第二求职特征的一个或多个属性;对获取到的每一个属性,从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重,结合预设的调整因子计算该属性的权重;根据分解出的各第二求职特征的属性及属性的权重,实时更新用户兴趣模型。根据本发明的又一个方面,提供一种职位推荐方法,适于在计算设备中执行,计算设备包括数据存储装置,数据存储装置中存储有用户兴趣模型集,用户兴趣模型集包括多个用于职位推荐的用户兴趣模型生成方法中、更新后的用户兴趣模型,每个用户兴趣模型关联于其对应的一个用户,该方法包括如下步骤:首先,从用户兴趣模型集中获取当前用户所关联的用户兴趣模型;根据该用户兴趣模型所关联的一个或多个第一求职特征,召回相应的一个或多个候选职位;通过预设的职位过滤规则对召回的各候选职位进行筛选;分别计算筛选出的各候选职位与该用户兴趣模型的相似度,按照相似度从高到低的顺序将各候选职位推荐给当前用户。可选地,在根据本发明的职位推荐方法中,还包括:判断各相似度与预设的相似度阈值的大小关系;对不小于相似度阈值的相似度所对应的各候选职位,按照相似度从高到低的顺序进行排序;结合预设的调整规则,对排序后的各候选职位进行次序调整,将调整后的各候选职位按序推荐给当前用户。根据本发明的又一个方面,提供一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行根据本发明的用于职位推荐的用户兴趣模型生成方法和/或根据本发明的职位推荐方法的指令。根据本发明的又一个方面,还提供一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据本发明的用于职位推荐的用户兴趣模型生成方法和/或根据本发明的职位推荐方法。根据本发明的用于职位推荐的用户兴趣模型生成的技术方案,首先初始化用户兴趣模型,将当前用户的各求职行为映射成相应的一个或多个第一求职特征,将各第一求职特征分解为其包括的一个或多个第二求职特征,获取分解出的各第二求职特征的一个或多个属性,计算各属性的权重,最后基于分解出的各第二求职特征的属性及属性的权重,更新用户兴趣模型。在上述技术方案中,从求职行为中抽取的信息即为求职特征,而求职特征的变化表现为用户兴趣的变化,进而在计算第二求职特征的各属性的权重时,先生成该属性所源于的求职行为对应的时间衰减参数,再基于该属性所源于的求职行为对应的求职行为权重,以及该时间衰减参数进行权重计算,将求职行为投射到时间轴上,根据用户的所作所为动态调整用户的求职特征,随着时间推移逐步完善用户兴趣模型。此外,在上述定期更新用户兴趣模型的基础上,对当前用户的求职行为进行监控,以确定是否需要实时更新用户兴趣模型,从而实现增量式更新,提高模型的可用性和准确度。进而,根据本发明的职位推荐的技术方案,通过用户兴趣模型所关联的一个或多个第一求职特征,召回相应的一个或多个候选职位,对各候选职位进行筛选,将筛选出的候选职位进行相似度计算后,按照相似度从高到低的顺序进行推荐,实现了当用户存在推荐需求时,可预测出用户最有可能感兴趣的职位,极大地提升了职位推荐的可靠性,用户体验较好。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本发明的一个实施例的计算设备100的示意图;图2示出了根据本发明的一个实施例的用于职位推荐的用户兴趣模型生成方法200的流程图;图3示出了根据本发明的一个实施例的职位推荐方法300的流程图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个程序122以及程序数据124。在一些实施方式中,程序122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个a/v端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个i/o端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。计算设备100可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和web服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(pda)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100实现为网络服务器,并被配置为执行根据本发明的用于职位推荐的用户兴趣模型生成方法和/或职位推荐方法。其中,计算设备100的一个或多个程序122包括用于执行根据本发明的用于职位推荐的用户兴趣模型生成方法200和/或职位推荐方法300的指令。图2示出了根据本发明一个实施例的用于职位推荐的用户兴趣模型生成方法200的流程图。用于职位推荐的用户兴趣模型生成方法200适于在计算设备(例如图1所示的计算设备100)中执行。根据本发明的一个实施例,计算设备100包括数据存储装置(图中未示出),该数据存储装置可以是如图1中所示的系统存储器106,对此并不限制。数据存储装置中存储有初始求职信息集和行为权重集,初始求职信息集包括多条用户初始求职信息,每条用户初始求职信息关联于其对应的一个用户,行为权重集包括多个求职行为权重。其中,用户初始求职信息包括用户的个人信息、在线简历、附件简历和/或位置信息。在该实施方式中,用户的个人信息包括姓名、性别、出生日期、民族、籍贯、联系方式、电子邮箱、学历、毕业院校和/或专业,在线简历为用户在招聘网站或招聘类应用自动生成的简历模板内、填入相应内容后生成的简历,附件简历为用户自行上传的自己制作的简历,格式可支持doc、docx、wps和pdf等,位置信息则是当用户开启gps(globalpositioningsystem,全球定位系统)定位时所获取到的当前地理位置,通常以经纬度表示。如图2所示,方法200始于步骤s210。在步骤s210中,根据从初始求职信息集中获取的当前用户关联的用户初始求职信息,初始化相应的用户兴趣模型,用户兴趣模型关联有一个或多个第一求职特征,每个第一求职特征包括一个或多个第二求职特征。其中,第一求职特征为职位标签、职位要求、职位薪资、职位城市、职位类型和公司要求中的任一种。根据本发明的一个实施例,将当前用户记为用户a,先从初始求职信息集中获取用户a所关联的用户初始求职信息,该用户初始求职信息仅包括用户a的个人信息,该个人信息包括用户a的姓名、性别、出生日期、民族、籍贯、联系方式、电子邮箱、学历、毕业院校和专业,说明用户a暂未填写简历模板以生成在线简历,也没有上传附件简历,且未开启或未授权定位服务。表1示出了根据本发明的一个实施例的用户a的个人信息示例,具体如下所示:表1进而,根据如表1中所示的个人信息来初始化相应的用户兴趣模型。为了能够尽量通过用户兴趣模型来展示出用户的求职意向,设定最先初始化的用户信息模型就关联有职位标签、职位要求、职位薪资、职位城市、职位类型和公司要求这6个第一求职特征。在该实施方式中,职位标签包括关键字、职级和头衔这3个第二求职特征,分别表示职位标题关键字、职位职级信息和职位头衔信息,职位要求包括工龄、学历和附加这3个第二求职特征,分别表示工龄要求、学历要求和附加要求,公司要求包括行业、融资阶段和公司规模这3个第二求职特征,而职位薪资、职位城市和职位类型这3个第一求职特征,所包括的第二求职特征即为本身。其中,对每一个第二求职特征而言,其具有一个或多个属性,属性可理解为用于表征第二求职特征的内容或性质,每个属性还应具有相应的权重,但一般初始的用户兴趣模型不考虑属性的权重。表2示出了根据本发明的一个实施例的用户a初始的用户兴趣模型,具体如下所示:表2如表2所示,“/”表示第二求职特征与第一求职特征一致,“-”表示属性内容为空,若无特别指出,上述符号所代表的含义在下文中沿用。由于用户a的用户初始求职信息只有其个人信息,而从个人信息中无法提取相应内容来映射出职位标签、职位要求和职位薪资这3个第一求职特征,但根据籍贯和毕业院校可以将职位城市初始化为北京,考虑到用户a已经毕业,可将职位类型初始化为全职,而非兼职和实习,最后还可由专业确定行业为it业,但融资阶段和公司规模暂时缺省。需要说明的是,对于用户初始求职信息、第一求职特征和第二求职特征所包括的内容以及关联关系,可根据实际情况来进行调整,这些对于了解本发明方案的技术人员来说是可以容易想到的,并且也在本发明的保护范围之内,此处不予以赘述。考虑到用户在一段时间内的求职行为会影响用户兴趣模型的结构,在构建好初始的用户兴趣模型后,进入步骤s220,收集当前用户在预设的时间段内的一个或多个求职行为,以便后续用于用户兴趣模型的定期更新。根据本发明的一个实施例,时间段一般预设为用户兴趣模型初始化的时刻至当前时刻的时间范围,也就是说当前时刻若需要定期更新,则收集当前用户的用户兴趣模型初始化的时刻至当前时刻这一时间长度内、该用户的所有求职行为。既然已经要对用户兴趣模型进行定期更新,则这里的当前时刻可理解为定期更新时间,即每隔预设的时间间隔就会收集当前时刻向前推算至用户兴趣模型初始化的时刻的求职行为,启动定期更新来完善用户兴趣模型。例如,定期更新时间设置为每天上午8点,时间间隔相应设置为24小时,每隔24小时就会收集当前时刻向前推算至用户兴趣模型初始化的时刻的求职行为,所收集到的求职行为包括当前时刻向前推算24小时内当前用户的求职行为,以及上一次定期更新所使用的求职行为,上一次定期更新所使用的求职行为一般存储于数据库中,可直接读取。当然,时间间隔和定期更新时间的设置可根据具体情况来设定,并不限于上述示例。而求职行为包括投递、收藏、浏览、约谈、评论、订阅、期望、工作经历和/或搜索。在该实施方式中,当前时刻为2017年10月9日早上8点,用户a的用户兴趣模型初始化的时刻为2017年9月28日,用户a在2017年9月28日至2017年10月9日的时间段内只执行了投递这1个求职行为,投递行为包括如下内容:投递职位:java开发工程师期望薪酬:1万~2万工作地点:北京投递公司:百度招聘要求:经验3~5年、学历本科及以上、全职工作系统标签:中级企业数据仓库研oracle库hadoop大数据数据挖掘随后,在步骤s230中,对收集到的每一个求职行为,将该求职行为映射成相应的一个或多个第一求职特征。根据本发明的一个实施例,求职行为可根据行为与职位的关联性分为三大类,第一大类为与职位信息相关的行为,记为s1类求职行为,包括投递、收藏、浏览、约谈和评论等,第二大类为仅与纯文本数据相关的行为,记为s2类求职行为,包括订阅、期望和工作经历等,第三大类为与搜索相关的行为,记为s3类求职行为,包括搜索以及设置的筛选条件等。进一步的,s1类求职行为可映射成职位标签、职位要求、职位薪资、职位城市、职位类型和公司要求这6个第一求职特征。而s2类求职行为中的订阅行为所包括的信息有职位名称、工作地点、发展阶段、行业领域以及月薪范围,可映射成职位标签、职位要求、职位薪资、职位城市和公司要求这5个第一求职特征,期望行为所包括的信息有职位名称、期望城市和期望薪资,可映射成职位标签、职位薪资和职位城市这3个第一求职特征,工作经历行为所包括的信息有工作职位、工作公司和工作内容,可映射成职位标签和公司要求这2个第一求职特征。s3类求职行为中的搜索行为所包括的信息有搜索关键词、薪资、行业、类型和工龄等,可映射成职位标签、职位要求、职位薪资、职位城市、职位类型和公司要求这6个第一求职特征。基于此,在该实施方式中,投递行为属于s1类求职行为,则将将用户a的投递行为映射成职位标签、职位要求、职位薪资、职位城市、职位类型和公司要求这6个第一求职特征。从投递职位和系统标签可映射出职位标签为java开发工程师、大数据、数据挖掘和中级,从招聘要求可映射出职位要求为经验3~5年、学历本科及以上,还可映射出职位类型为全职,从期望薪酬可映射出职位薪资为1万~2万,从工作地点可映射出职位城市为北京,从投递公司和系统标签可映射出公司要求为互联网行业、数据服务、无需融资和2000人以上。表3示出了根据本发明的一个实施例的投递行为映射成第一求职特征的示例,具体如下所示:第一求职特征内容职位标签java开发工程师、大数据、数据挖掘、中级职位要求经验3~5年、学历本科及以上职位薪资1万~2万职位城市北京职位类型全职公司要求互联网行业、数据服务、无需融资、2000人以上表3接下来,执行步骤s240,将映射出的各第一求职特征分解成其所包括的一个或多个第二求职特征,并获取所分解出的各第二求职特征的一个或多个属性。根据本发明的一个实施例,将步骤s230中基于用户a的投递行为所映射出的各第一求职特征进行分解,则职位标签分解成关键字、职级和头衔这3个第二求职特征,可得关键字的属性为java、大数据和数据挖掘,职级的属性为中级,头衔的属性为空,职位要求分解为工龄、学历和附加这3个第二求职特征,工龄的属性为3~5年,学历的属性为本科、硕士研究生和博士研究生,附加的属性为空,公司要求分解成行业、融资阶段和公司规模这3个第二求职特征,行业的属性为互联网和数据服务,融资阶段的属性为无需融资,公司规模的属性为2000人以上,而职位薪资、职位城市和职位类型这3个第一求职特征,所分解成的第二求职特征即为本身。值得注意的是,在获取关键词的属性时,需要对第一求职特征所包括的内容进行分词处理,考虑到分词技术为现有较为成熟的处理手段,此处不予以赘述。表4示出了根据本发明的一个实施例的投递行为映射成第二求职特征的示例,具体如下所示:表4在步骤s250中,对获取到的每一个属性,从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重,以计算该属性的权重。根据本发明的一个实施例,行为权重集中的每个求职行为权重关联于其对应的一种求职行为类型,求职行为类型为一个求职行为所抽象出的行为统称,比如用户a投递了百度的java开发工程师职位,这个求职行为的求职行为类型即为投递类型。表5示出了根据本发明的一个实施例的求职行为权重的存储示例,具体如下所示:表5从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重时,先判断该属性所源于的求职行为的求职行为类型,再从行为权重集中查找与该求职行为类型关联的求职行为权重,作为该求职行为对应的求职行为权重。在该实施方式中,如表5所示的各属性所源于的求职行为的求职行为类型均为投递类型,从行为权重集中查找投递类型所关联的求职行为权重为100,则可知表5中各属性所源于的求职行为对应的求职行为权重均为100。从表5中可以看出,期望类型的求职行为的权重最高,表明期望行为对用户兴趣模型的影响较大,基于这一现象,根据本发明的又一个实施例,对步骤s220收集到的各求职行为,判断当前时刻向前推算预设的时间间隔内当前用户的所有求职行为是否存在期望行为,若存在,则获取行为发生时刻最早的期望行为及其之后发生的其他求职行为,结合上一次定期更新所使用的求职行为作为收集到的行为,以执行步骤s230及后续的处理。若不存在,则以当前时刻为时间基准,对每一种求职行为类型,获取对应于该求职行为类型的所有求职行为中、行为发生时刻最近的第一数量个求职行为,结合上一次定期更新所使用的求职行为作为收集到的行为。在该实施方式中,第一数量优选为50。进而,在计算各属性的权重时,对每一个属性,先生成该属性所源于的求职行为对应的时间衰减参数,再根据该属性所源于的求职行为对应的求职行为权重,以及该时间衰减参数,计算该属性的权重。具体的,时间衰减参数和求职行为的发生时间与当前时间间隔的天数相关,可以如下公式表示:decay=ρ-elapsedays其中,decay表示该属性所源于的求职行为对应的时间衰减参数,ρ是与求职行为相关的大于1的底数,不同的求职行为,甚至于不同的属性都可具有不同的ρ,elapsedays为求职行为的发生时间与当前时间间隔的天数。当然,时间衰减参数的计算方式并不限于如上指数型衰减机制,可根据需要加以调整,这些对于了解本发明方案的技术人员来说是可以容易想到的,并且也在本发明的保护范围之内,此处不予以赘述。而后,在计算该属性的权重时,先对该属性所来源于的每一个求职行为,计算该求职行为对应的求职行为权重与时间衰减参数的乘积,再将各乘积相加之和作为该属性的权重。在该实施方式中,由于用户a的求职行为只有一个投递行为,因此在计算每一个属性的权重时,只需计算该属性所源于的投递行为对应的求职行为权重与时间衰减参数的乘积,该乘积即为该属性的权重。考虑到关键字的属性涉及文本分词自身的重要性,在计算关键字的各属性的权重时,追加了该属性在分词处理上的分词权重,则在计算该属性的权重时,先对该属性所来源于的每一个求职行为,计算该求职行为对应的求职行为权重、时间衰减参数与分词权重的乘积,再将各乘积相加之和作为该属性的权重。此外,需要说明的是,对于职位薪资而言,每一个涉及职位薪资的求职行为对应的求职行为权重是用于计算最终薪资的,因此职位薪资只有1个属性,该属性即为最终薪资,最终薪资包括最终薪资上限和最终薪资下限,无需考虑该属性的权重。在一个涉及职位薪资的求职行为中,默认薪资上限和薪资下限的权重是一样的,则在计算最终薪资上限时,对每一个涉及职位薪资的求职行为,先计算该求职行为对应的求职行为权重与薪资上限的乘积,再将各乘积相加之和除以各涉及职位薪资的求职行为对应的求职行为权重之和,得到的商为最终薪资上限。同样的,在计算最终薪资下限时,对每一个涉及职位薪资的求职行为,先计算该求职行为对应的求职行为权重与薪资下限的乘积,再将各乘积相加之和除以各涉及职位薪资的求职行为对应的求职行为权重之和,得到的商为最终薪资下限。表6示出了根据本发明的一个实施例的属性及其权重值的示例,具体如下所示:属性权重java1.4大数据0.8数据挖掘0.2中级0.33~5年0.3本科0.3硕士研究生0.3博士研究生0.31万~2万-北京0.3全职0.3互联网0.3数据服务0.3无需融资0.32000人以上0.3表6最后,执行步骤s260,根据分解出的各第二求职特征的属性及属性的权重,更新用户兴趣模型。根据本发明的一个实施例,基于表4和表6的内容来更新如表2所示的用户兴趣模型,并将更新后的用户兴趣模型存储于数据存储装置中。表7示出了根据本发明的一个实施例的更新后的用户兴趣模型的示例,具体如下所示:表7为进一步提高用户兴趣模型的可用性和准确性,在上述定期更新用户兴趣模型的基础上,根据本发明的又一个实施例,监控当前用户的求职行为,以判断该求职行为是否可触发用户兴趣模型的实时更新,若是,则基于该求职行为实时更新用户兴趣模型。具体的,在基于该求职行为实时更新用户兴趣模型时,先将该求职行为映射成相应的一个或多个第一求职特征,将映射出的各第一求职特征分解成其所包括的一个或多个第二求职特征,并获取所分解出的各第二求职特征的一个或多个属性,对获取到的每一个属性,从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重,结合预设的调整因子计算该属性的权重,根据分解出的各第二求职特征的属性及属性的权重,实时更新用户兴趣模型。在该实施方式中,可触发用户兴趣模型的实时更新的求职行为通常具有较大的求职行为权重,包括期望、订阅、工作经历、投递和收藏。此时,监控到用户a在当前时刻的求职行为为订阅行为,该求职行为可触发用户兴趣模型的更新,则先将该求职行为映射成职位标签、职位要求、职位薪资、职位城市和公司要求这5个第一求职特征,再将职位标签分解成关键字、职级和头衔这3个第二求职特征,职位要求分解为工龄、学历和附加这3个第二求职特征,公司要求分解成行业、融资阶段和公司规模这3个第二求职特征,职位薪资和职位城市这2个第一求职特征,所分解成的第二求职特征即为本身,获取分解出的各第二求职特征的相应属性。表8示出了根据本发明的一个实施例的订阅行为映射成第二求职特征的示例,具体如下所示:表8对获取到的每一个属性,在计算该属性的权重时,先求取当前时刻的求职行为对应的求职行为权重与预设的调整因子的乘积,再计算该属性的当前权重与当前时刻的求职行为对应的时间衰减参数的乘积,将这两个乘积之和作为该属性的新的权重。其中,调整因子一般设置为大于1的常量,以保障当前的实时求职行为能够及时反馈到用户兴趣模型中。在计算出如表8所示的各属性的权重后,根据分解出的各第二求职特征的属性及属性的权重,实时更新如表7所示的用户兴趣模型。表9示出了根据本发明的一个实施例的实时更新后的用户兴趣模型的示例,具体如下所示:表9关于实时更新用户兴趣求职模型的具体过程,相应技术细节可参见如上定期更新用户求职模型中涉及映射、分解、属性的权重计算等相关内容,此处不予以赘述。需要说明的是,上述技术方案中对用户初始求职信息、求职行为等文本数据进行处理时,会使用对应的文本处理方法,比如文本清洗、同义词扩展、分词等,可通过现有的成熟技术来实现,此处不再赘述。图3示出了根据本发明一个实施例的职位推荐方法300的流程图。职位推荐方法300适于在计算设备(例如图1所示的计算设备100)中执行,计算设备100包括数据存储装置(图中未示出),数据存储装置中存储有用户兴趣模型集,用户兴趣模型集包括多个用于职位推荐的用户兴趣模型生成方法中、更新后的用户兴趣模型,每个用户兴趣模型关联于其对应的一个用户。如图3所示,方法300始于步骤s310,从用户兴趣模型集中获取当前用户所关联的用户兴趣模型。根据本发明的一个实施例,当前用户为用户a,则从用户兴趣模型集中获取用户a所关联的用户兴趣模型,可得如表8所示的用户兴趣模型。随后,进入步骤s320,根据该用户兴趣模型所关联的一个或多个第一求职特征,召回相应的一个或多个候选职位。根据本发明的一个实施例,根据如表8所示的用户兴趣模型所关联的职位标签包括的关键字以及职位城市的属性,召回相应的候选职位,将召回的5个候选职位依次记为c1、c2、c3、c4和c5。接下来,在步骤s330中,通过预设的职位过滤规则对召回的各候选职位进行筛选。根据本发明的一个实施例,职位过滤规则可预设为已投递过的职位删除、黑名单中的职位删除、用户喜好公司的职位保留等,经过该职位过滤规则的筛选后,保留下来的候选职位分别为c1、c3、c4和c5。最后,执行步骤s340,分别计算筛选出的各候选职位与该用户兴趣模型的相似度,按照相似度从高到低的顺序将各候选职位推荐给当前用户。根据本发明的一个实施例,相似度的计算方式选用计算余弦相似度,得出候选职位c1、c3、c4和c5与该用户兴趣模型的相似度分别为0.75、0.87、0.35和0.65,按照相似度从高到低的顺序向用户a推荐的候选职位依次为c3、c1、c5和c4。考虑到相似度过低的候选职位不具备较高的可推荐性,根据本发明的又一个实施例,在推荐候选职位之前,先判断各相似度与预设的相似度阈值的大小关系,对不小于相似度阈值的相似度所对应的各候选职位,按照相似度从高到低的顺序进行排序,结合预设的调整规则,对排序后的各候选职位进行次序调整,将调整后的各候选职位按序推荐给当前用户。在该实施方式中,相似度阈值预设为0.5,调整规则可预设为新发布的职位次序前调、兴趣度较高的城市的职位次序前调等,由于不小于0.5的相似度所对应的候选职位为c1、c3和c5,且候选职位c5是新发布的职位,则最终向用户a所推荐的候选职位依次为c3、c5和c1。现有的职位推荐方法通常是采用用户画像和用户标签这两类技术手段,用户画像是初期定位用户的较好方式,但随着用户兴趣的变迁或者信息的变动,用户画像不够动态精确,不能很好地实时调整,而用户标签虽然能够及时地刻画用户兴趣,但是从时间维度上并不能很好地表征用户的信息变迁,存在遗漏互补信息的可能。根据本发明实施例的用于职位推荐的用户兴趣模型生成的技术方案,首先,初始化用户兴趣模型,将当前用户的各求职行为映射成相应的一个或多个第一求职特征,将各第一求职特征分解为其包括的一个或多个第二求职特征,获取分解出的各第二求职特征的一个或多个属性,计算各属性的权重,最后基于分解出的各第二求职特征的属性及属性的权重,更新用户兴趣模型。在上述技术方案中,从求职行为中抽取的信息即为求职特征,而求职特征的变化表现为用户兴趣的变化,进而在计算第二求职特征的各属性的权重时,先生成该属性所源于的求职行为对应的时间衰减参数,再基于该属性所源于的求职行为对应的求职行为权重,以及该时间衰减参数进行权重计算,将求职行为投射到时间轴上,根据用户的所作所为动态调整用户的求职特征,随着时间推移逐步完善用户兴趣模型。此外,在上述定期更新用户兴趣模型的基础上,对当前用户的求职行为进行监控,以确定是否需要实时更新用户兴趣模型,从而实现增量式更新,提高模型的可用性和准确度。a8.如a7所述的方法,所述基于该求职行为实时更新所述用户兴趣模型的步骤包括:将该求职行为映射成相应的一个或多个第一求职特征;将映射出的各第一求职特征分解成其所包括的一个或多个第二求职特征,并获取所分解出的各第二求职特征的一个或多个属性;对获取到的每一个属性,从行为权重集中获取与该属性所源于的求职行为对应的求职行为权重,结合预设的调整因子计算该属性的权重;根据分解出的各第二求职特征的属性及属性的权重,实时更新所述用户兴趣模型。b10.如b9所述的方法,还包括:判断各相似度与预设的相似度阈值的大小关系;对不小于所述相似度阈值的相似度所对应的各候选职位,按照相似度从高到低的顺序进行排序;结合预设的调整规则,对排序后的各候选职位进行次序调整,将调整后的各候选职位按序推荐给当前用户。进而,根据本发明实施例的职位推荐的技术方案,通过用户兴趣模型所关联的一个或多个第一求职特征,召回相应的一个或多个候选职位,对各候选职位进行筛选,将筛选出的候选职位进行相似度计算后,按照相似度从高到低的顺序进行推荐,实现了当用户存在推荐需求时,可预测出用户最有可能感兴趣的职位,极大地提升了职位推荐的可靠性,用户体验较好。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组间可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组间组合成一个模块或单元或组间,以及此外可以把它们分成多个子模块或子单元或子组间。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、cd-rom、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的用于职位推荐的用户兴趣模型生成方法和/或职位推荐方法。以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本
技术领域
内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本
技术领域
的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1