一种在线面试的方法与系统的制作方法_4

文档序号:9911873阅读:来源:国知局
字信息记录并存储在数据处理装置上; 调用数据处理装置中的注册信息记录和文字信息记录,筛选人物关键词并将所述人物 关键词发送到检索引擎; 接收检索引擎返回的首次检索数据,根据预定的时间过滤规则滤除发布时间不合法的 网络信息,将首次检索数据中的毕业学校信息数据、工作单位信息数据、违法违纪信息数 据、家庭背景信息数据作为行踪数据,将所述行踪数据作为下一轮检索的入口参数,并结合 所述人物关键词发送到检索引擎; 接收检索引擎返回的初步检索结果,在出现检索结果缺失或者结果不符时,将异常数 据反馈到招聘客户端; 接收招聘客户端发送的更新后的行踪数据和人物关键词,进行下一轮检索; 重复预定轮数,获得最终检索结果页面; 采用统一资源定位符提取器分析最终检索结果页面,读取规定字段记录结果的页数, 依次下载每一页,并提取其中包含的网页链接,将网页链接存储进下载队列中; 采用网页文档下载器读取下载队列中的每个统一资源定位符的地址,使用网络协议下 载所述统一资源定位符对应的网页文档并存储到数据处理装置中; 对网页文档进行包括分词、人名提取、词项过滤、特征词项权重计算以及特征词项选择 的预处理操作,其中特征词权重计算公式为:其中,a是行踪数据中的一个或多个词串,b是人物关键词串,t是候选的多词串,111是 多词串的长度,f (t)是多词串t在整个文档集合中出现的频次,Tt是以多词串t为字串的多 词串集合,P(Ta)是集合T t中的候选多词串个数; 为预处理后的每个文档生成一个向量,所述向量为根据特征选择条件选择的特征词 项,所述向量构成向量集合,使用层次聚类算法对所述向量集合中的向量按照相似度进行 分类,得到最终聚类结果,其中,所述层次聚类算法为: (1) 将网页文档集合D = {cU,d2,…,dn}中的每一个文档di都视为一个文本簇Ci,这样D就 被初始化为C={ci,C2, ···,~}; (2) 计算C中Cj(i〈j < η)与Ci(l < i < η)的聚类中心相似度sim(ci,cj),所述聚类中心相 似度通过文本特征向量的余弦夹角计算而得; (3) 如果sim(ci,cj)大于给定的阈值,那么认为Cj(i〈j < η)属于类Ci(l < i < η),将前者 合并入Ci中,从C= {ci,C2,···,cn}中删除Cj(i〈j <η),并重新计算Ci的聚类中心向量; (4) 重复步骤(2)和(3),使所有除(^外的类都和Cl进行过相似度计算,然后将(^进行输 出并从类簇中将C删除; (5) 如果C不为空,则将其中的类进行排序,然后重复步骤(2)至(4),直至C或者不存任 意两个类的聚类中心距离小于给定阈值为止; 选择最终聚类结果中成员最多的一个类,对所述类对应的人物进行背景关系构建,获 得该求职者的背景调查数据; 分类统计背景调查数据,评估背景信息的真实性得到真实性数据; 将背景调查数据及其真实性数据远程推送到招聘客户端; 数据处理装置接收并存储招聘客户端发送的满意度数据,按照职位类型汇总该满意度 数据。3. -种在线面试方法,其特征在于,包括: 接收招聘终客户端和求职客户端发送的待识别身份信息,并与预先设置的合法身份信 息进行比对;所述合法身份信息存储于数据处理装置的数据库;在待识别身份信息合法时 向招聘客户端和求职客户端返回用户数据;所述用户数据包括用户ID和用户在在线面试系 统的统计数据; 在招聘客户端与求职客户端之间建立音视频信息通道和文字信息通道;接收招聘客户 端与求职客户端之间的音视频信息记录和文字信息记录并存储在数据处理装置上; 调用数据处理装置中的注册信息记录和文字信息记录,筛选人物关键词并将所述人物 关键词发送到检索引擎; 接收检索引擎返回的首次检索数据,根据预定的时间过滤规则滤除发布时间不合法的 网络信息,将首次检索数据中的毕业学校信息数据、工作单位信息数据、违法违纪信息数 据、家庭背景信息数据作为行踪数据,将所述行踪数据作为下一轮检索的入口参数,并结合 所述人物关键词发送到检索引擎; 接收检索引擎返回的初步检索结果,在出现检索结果缺失或者结果不符时,将异常数 据反馈到招聘客户端; 接收招聘客户端发送的更新后的行踪数据和人物关键词,进行下一轮检索; 重复预定轮数,获得最终检索结果页面; 采用统一资源定位符提取器分析最终检索结果页面,读取规定字段记录结果的页数, 依次下载每一页,并提取其中包含的网页链接,将网页链接存储进下载队列中; 采用网页文档下载器读取下载队列中的每个统一资源定位符的地址,使用网络协议下 载所述统一资源定位符对应的网页文档并存储到数据处理装置中; 对网页文档进行包括分词、人名提取、词项过滤、特征词项权重计算以及特征词项选择 的预处理操作,其中特征词权重计算公式为:其中,a是行踪数据中的一个或多个词串,b是人物关键词串,t是候选的多词串,111是 多词串的长度,f (t)是多词串t在整个文档集合中出现的频次,Tt是以多词串t为字串的多 词串集合,P(Ta)是集合T t中的候选多词串个数; 为预处理后的每个文档生成一个向量,所述向量为根据特征选择条件选择的特征词 项,所述向量构成向量集合,使用层次聚类算法对所述向量集合中的向量按照相似度进行 分类,得到最终聚类结果,其中,所述层次聚类算法为: (1) 将网页文档集合D = {cU,d2,…,dn}中的每一个文档di都视为一个文本簇Ci,这样D就 被初始化为C={ci,C2, ···,~}; (2) 计算C中Cj(i〈j < η)与Ci(l < i < η)的聚类中心相似度sim(ci,cj),所述聚类中心相 似度通过文本特征向量的余弦夹角计算而得; (3) 如果sim(ci,cj)大于给定的阈值,那么认为Cj(i〈j < η)属于类Ci(l < i < η),将前者 合并入Ci中,从C= {ci,C2,···,cn}中删除Cj(i〈j <η),并重新计算Ci的聚类中心向量; (4) 重复步骤(2)和(3),使所有除(^外的类都和Cl进行过相似度计算,然后将(^进行输 出并从类簇中将C删除; (5) 如果C不为空,则将其中的类进行排序,然后重复步骤(2)至(4),直至C或者不存任 意两个类的聚类中心距离小于给定阈值为止; 选择最终聚类结果中成员最多的一个类,对所述类对应的人物进行背景关系构建,获 得该求职者的背景调查数据; 分类统计背景调查数据,评估背景信息的真实性得到真实性数据; 将背景调查数据及其真实性数据远程推送到招聘客户端; 数据处理装置接收并存储招聘客户端发送的满意度数据,按照职位类型汇总该满意度 数据。4. 根据权利要求3所述的在线面试方法,其特征在于,还包括: 接收招聘客户端发送的调用已存储的满意度数据的请求信号,在得到数据处理装置授 权后,调用数据处理装置存储的满意度数据发送到招聘客户端。5. 根据权利要求3所述的在线面试方法,其特征在于,还包括: 接收招聘客户端发送的对求职者的一项或多项专业素质的数字化评分,并存储在数据 处理装置上。6. 根据权利要求3所述的在线面试方法,其特征在于,还包括: 接收求职客户端发送的对招聘单位的一项或多项标准的数字化评分,并存储在数据处 理装置上。7. 根据权利要求3所述的在线面试方法,其特征在于,还包括: 接收招聘客户端发送的对求职者的评价数据,并存储在数据处理装置上。8.根据权利要求3所述的在线面试方法,其特征在于,还包括: 接收求职客户端发送的对招聘单位的评价数据,并存储在数据处理装置上。
【专利摘要】本发明提供了一种在线面试的方法与系统,接收招聘客户端和求职客户端发送的待识别身份信息,在招聘客户端与求职客户端之间建立信息通道,接收招聘客户端和求职客户端之间的信息记录并存储,处理信息记录并将背景调查数据及真实性数据发送到招聘客户端。通过对求职者的合法的网络印记进行整理分析,经由一定的算法分析得到该求职者的背景信息和过往经历,以供企业参考。本发明所提供的方法利用了网络大数据技术,使企业不必经由人工探访、核实求职者的过往经历和过往单位,就可通过网络信息获取求职者的可靠过往信息,节省了成本和人力,并使核实结果和过程更加迅速便捷。
【IPC分类】G06Q10/10
【公开号】CN105678510
【申请号】CN201511031749
【发明人】关永奎
【申请人】北京擎宇信息技术有限公司
【公开日】2016年6月15日
【申请日】2015年12月31日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1