一种在线面试的方法与系统的制作方法

文档序号:9911873阅读:635来源:国知局
一种在线面试的方法与系统的制作方法
【技术领域】
[0001] 本发明涉及数据处理领域,尤其涉及一种在线面试的方法与系统。
【背景技术】
[0002] 随着互联网应用的普及,越来越多的人通过网络找工作,面对海量的在线求知者, 即使经过面试筛选,企业也往往不清楚求职者的个人信息是否完全真实或者是否存在隐 瞒。而现代人几乎都曾上网,网络上会留有许多合法信息。

【发明内容】

[0003] 本发明的目的在于提供一种在线面试的方法与系统,对网络求职者的背景进行自 动分析,旨在解决企业面试中无法确定求职者个人信息的真实性和完整性的问题。
[0004] 本发明解决其技术问题所采用的技术方案是:
[0005] -种在线面试系统,包括:
[0006] 数据处理装置,用于接收招聘客户端和求职客户端发送的待识别身份信息;在招 聘客户端与求职客户端之间建立信息通道;接收招聘客户端和求职客户端之间的信息记录 并存储;处理信息记录并将背景调查数据及真实性数据发送到招聘客户端;
[0007] 招聘客户端,用于接收用户输入的待识别身份信息并发送到数据处理装置;接收 用户输入的信息并发送到信息通道;接收数据处理装置发送的背景调查数据及真实性数 据;
[0008] 求职客户端,用于接收用户输入的待识别身份信息并发送到数据处理装置;接收 用户输入的信息并发送到信息通道。
[0009] 在此基础上,进一步地,所述数据处理装置用于:
[0010] 接收招聘终客户端和求职客户端发送的待识别身份信息,并与预先设置的合法身 份信息进行比对;所述合法身份信息存储于数据处理装置的数据库;在待识别身份信息合 法时向招聘客户端和求职客户端返回用户数据;所述用户数据包括用户ID和用户在在线面 试系统的统计数据;
[0011] 在招聘客户端与求职客户端之间建立音视频信息通道和文字信息通道;接收招聘 客户端与求职客户端之间的音视频信息记录和文字信息记录并存储在数据处理装置上;
[0012] 调用数据处理装置中的注册信息记录和文字信息记录,筛选人物关键词并将所述 人物关键词发送到检索引擎;
[0013] 接收检索引擎返回的首次检索数据,根据预定的时间过滤规则滤除发布时间不合 法的网络信息,将首次检索数据中的毕业学校信息数据、工作单位信息数据、违法违纪信息 数据、家庭背景信息数据作为行踪数据,将所述行踪数据作为下一轮检索的入口参数,并结 合所述人物关键词发送到检索引擎;
[0014] 接收检索引擎返回的初步检索结果,在出现检索结果缺失或者结果不符时,将异 常数据反馈到招聘客户端;
[0015] 接收招聘客户端发送的更新后的行踪数据和人物关键词,进行下一轮检索;
[0016] 重复预定轮数,获得最终检索结果页面;
[0017] 采用统一资源定位符提取器分析最终检索结果页面,读取规定字段记录结果的页 数,依次下载每一页,并提取其中包含的网页链接,将网页链接存储进下载队列中;
[0018] 采用网页文档下载器读取下载队列中的每个统一资源定位符的地址,使用网络协 议下载所述统一资源定位符对应的网页文档并存储到数据处理装置中;
[0019] 对网页文档进行包括分词、人名提取、词项过滤、特征词项权重计算以及特征词项 选择的预处理操作,其中特征词权重计算公式为:
[0020]
[0021]其中,a是行踪数据中的一个或多个词串,b是人物关键词串,t是候选的多词串,|t 是多词串的长度,f(t)是多词串t在整个文档集合中出现的频次,Tt是以多词串t为字串的 多词串集合,P(T a)是集合Tt中的候选多词串个数;
[0022]为预处理后的每个文档生成一个向量,所述向量为根据特征选择条件选择的特征 词项,所述向量构成向量集合,使用层次聚类算法对所述向量集合中的向量按照相似度进 行分类,得到最终聚类结果,其中,所述层次聚类算法为:
[0023] (1)将网页文档集合. .,dn}中的每一个文档di都视为一个文本簇ci,这 样D就被初始化为C={C1,C2, . . .,Cn};
[0024] (2)计算C中Cj(i〈j < η)与Ci(l < i < η)的聚类中心相似度sim(ci,cj),所述聚类中 心相似度通过文本特征向量的余弦夹角计算而得;
[0025] (3)如果sim(ci,cj)大于给定的阈值,那么认为Cj(i〈j < η)属于类Ci(l < i < η),将 前者合并入Ci中,从C={ci,c2,. . .,cn}中删除Cj(i〈j <η),并重新计算Ci的聚类中心向量;
[0026] (4)重复步骤(2)和(3),使所有除(^外的类都和Cl进行过相似度计算,然后将(^进 行输出并从类簇中将C删除;
[0027] (5)如果C不为空,则将其中的类进行排序,然后重复步骤(2)至(4),直至C或者不 存任意两个类的聚类中心距离小于给定阈值为止;
[0028]选择最终聚类结果中成员最多的一个类,对所述类对应的人物进行背景关系构 建,获得该求职者的背景调查数据;
[0029]分类统计背景调查数据,评估背景信息的真实性得到真实性数据;
[0030] 将背景调查数据及其真实性数据远程推送到招聘客户端;
[0031] 数据处理装置接收并存储招聘客户端发送的满意度数据,按照职位类型汇总该满 意度数据。
[0032] 一种在线面试方法,包括:
[0033]接收招聘终客户端和求职客户端发送的待识别身份信息,并与预先设置的合法身 份信息进行比对;所述合法身份信息存储于数据处理装置的数据库;在待识别身份信息合 法时向招聘客户端和求职客户端返回用户数据;所述用户数据包括用户ID和用户在在线面 试系统的统计数据;
[0034] 在招聘客户端与求职客户端之间建立音视频信息通道和文字信息通道;接收招聘 客户端与求职客户端之间的音视频信息记录和文字信息记录并存储在数据处理装置上;
[0035] 调用数据处理装置中的注册信息记录和文字信息记录,筛选人物关键词并将所述 人物关键词发送到检索引擎;
[0036] 接收检索引擎返回的首次检索数据,根据预定的时间过滤规则滤除发布时间不合 法的网络信息,将首次检索数据中的毕业学校信息数据、工作单位信息数据、违法违纪信息 数据、家庭背景信息数据作为行踪数据,将所述行踪数据作为下一轮检索的入口参数,并结 合所述人物关键词发送到检索引擎;
[0037] 接收检索引擎返回的初步检索结果,在出现检索结果缺失或者结果不符时,将异 常数据反馈到招聘客户端;
[0038] 接收招聘客户端发送的更新后的行踪数据和人物关键词,进行下一轮检索;
[0039] 重复预定轮数,获得最终检索结果页面;
[0040] 采用统一资源定位符提取器分析最终检索结果页面,读取规定字段记录结果的页 数,依次下载每一页,并提取其中包含的网页链接,将网页链接存储进下载队列中;
[0041] 采用网页文档下载器读取下载队列中的每个统一资源定位符的地址,使用网络协 议下载所述统一资源定位符对应的网页文档并存储到数据处理装置中;
[0042] 对网页文档进行包括分词、人名提取、词项过滤、特征词项权重计算以及特征词项 选择的预处理操作,其中特征词权重计算公式为:
[0043]
[0044]其中,a是行踪数据中的一个或多个词串,b是人物关键词串,t是候选的多词串,|t 是多词串的长度,f(t)是多词串t在整个文档集合中出现的频次,Tt是以多词串t为字串的 多词串集合,P(T a)是集合Tt中的候选多词串个数;
[0045] 为预处理后的每个文档生成一个向量,所述向量为根据特征选择条件选择的特征 词项,所述向量构成向量集合,使用层次聚类算法对所述向量集合中的向量按照相似度进 行分类,得到最终聚类结果,其中,所述层次聚类算法为:
[0046] (1)将网页文档集合DHU. . .,dn}中的每一个文档di都视为一个文本簇ci,这 样D就被初始化为C={ci,C2, . . .,Cn};
[0047] (2)计算C中Cj(i〈j < η)与Ci(l < i < η)的聚类中心相似度sim(ci,c
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1