公开招聘标准化和重复数据删除的制作方法

文档序号:11635534阅读:283来源:国知局
公开招聘标准化和重复数据删除的制造方法与工艺

优先权要求

本pct申请案要求2014年9月30日提交的发明名称为“公开招聘标准化和重复数据删除(jobpostingstandardizationanddeduplication)”的第14/502,224号美国专利申请案的优先权权益,并且要求2014年9月30日提交的发明名称为“公开招聘标准化和重复数据删除(jobpostingstandardizationanddeduplication)”的第14/502,261号美国专利申请案的优先权权益,两个申请案全部以引用方式并入本文中。

本发明大体上涉及用于托管公开招聘的数据处理系统,并且在一些实施例中,涉及用于对存在于不同第三方系统上的公开招聘进行标准化和重复数据删除的技术。



背景技术:

在典型的工作托管服务中,公司代表将公开招聘发布到工作托管服务,使得工作托管服务的用户可以搜索、浏览以及在一些情况下,申请与具体公开招聘相关联的工作。作为可向工作托管服务的用户呈现公开招聘的交换,发布公开招聘的公司通常将支付一些费用。

附图说明

在附图的各图中借助于实例而非限制性地说明一些实施例。

图1是说明根据一些实例实施例的适用于社交网络服务的网络环境的网络图。

图2是说明根据一些实例实施例的社交网络系统的组件的框图。

图3a是说明根据一些实例实施例的在执行用于标准化从第三方系统获得的公开招聘的方法时工作捕获模块和工作标准化模块的操作的流程图。

图3b是说明根据一些实例实施例的在执行用于标准化从第三方系统获得的公开招聘的方法时工作标准化模块的任选操作的流程图。

图4a是说明根据一些实例实施例的在执行用于对从第三方系统获得的公开招聘进行重复数据删除的方法时工作重复数据删除模块,以及任选地工作捕获模块和/或工作标准化模块的操作的流程图。

图4b是说明根据一些实例实施例的在执行用于对从第三方系统获得的公开招聘进行重复数据删除的方法时工作重复数据删除模块的任选操作的流程图。

图5是说明其上可以实施一个或多个实施例的机器的实例的框图。

具体实施方式

本发明描述单独地提供工作托管服务的方法、系统和计算机程序产品,所述工作托管服务向付费和未付费公开招聘(有时称为工作公告)提供不同水平的服务。在以下详细描述中,出于解释的目的,阐述众多特定细节以便提供对本发明所揭示的主题各个方面的透彻理解。然而,本领域的技术人员将明白,可以在没有这些特定细节的情况下实践本发明所揭示的主题。在其它情况下,尚未详细描述众所周知的方法、程序和组件,以免混淆本发明所揭示的主题。

根据一些实施例,工作托管服务(例如,与社交网络系统相关联)托管付费和未付费公开招聘两者。例如,通过工作托管服务的公开招聘模块,工作托管服务的用户可以提供关于具体职位空缺的信息并且生成付费公开招聘。公开招聘通常由可获得职位空缺的公司或组织的名称、职位空缺的职位名称、工作职能的描述、所需或建议技能、教育程度以及证书和/或专长等组成。作为支付一些费用的交换,付费公开招聘将有资格呈现给用户(例如,工作托管服务与其集成的社交网络系统的人员)。

在一些实施例中,工作托管服务可以托管付费公开招聘和未付费公开招聘。在一些情况下,付费公开招聘可以直接列在工作托管服务上,而未付费公开招聘可以从第三方系统接收。然而,从第三方系统接收的公开招聘的数据格式可能与工作托管服务对于其公开招聘使用的数据格式不匹配。此外,从第三方系统接收的公开招聘可以表示已由工作托管服务列出的公开招聘。

除了付费公开招聘之外,工作托管服务可以从不同的外部托管的第三方招聘网站摄取公开招聘。在一些实施例中,自动计算机程序(例如,“bot”或“spider”)自动“抓取”相关互联网网站并且发现供摄入的公开招聘。在一些实施例中,从由一个或多个第三方合作伙伴保持的数据馈送中获得公开招聘。工作托管服务存储付费公开招聘和未付费公开招聘两者或使另一实体代表其存储付费公开招聘和未付费公开招聘两者,即,已通过公开招聘模块生成并且已向社交网络系统支付费用的公开招聘以及从第三方网站获得且尚未向社交网络系统支付费用的公开招聘。

在一些实施例中,未付费公开招聘仅有资格通过工作搜索接口向社交网络服务的人员呈现。因此,未付费或免费公开招聘通常将仅呈现给可以称为“积极的求职候选人”或“积极的求职者”的社交网络服务人员。这些积极的求职者是通常积极地参与寻找新就业机会的人员。付费公开招聘还有资格通过搜索接口呈现给社交网络服务的人员,但是还通过各种不同其它信道呈现给这些人员。例如,工作推荐引擎可以将人员简档与公开招聘匹配,目标是基于人员的简档数据而将相关公开招聘(即,可能是人员所关注的公开招聘)呈现给社交网络服务的人员。

在一些实施例中,从第三方系统接收的公开招聘的数据格式可能与社交网络系统的工作托管服务对于其公开招聘使用的数据格式不匹配。在此类实施例中,工作托管服务标准化从第三方系统接收的公开招聘,使得公开招聘可以集成到工作托管服务中。

在一些实施例中,从第三方系统接收的公开招聘表示已集成到工作托管服务中的公开招聘。在此类实施例中,工作托管服务执行公开招聘重复数据删除,并且如果确定新的公开招聘优于(例如,更具权威性)已集成的公开招聘,那么用新的公开招聘代替已集成的公开招聘。

可以至少部分由一个或多个处理器执行本文所描述的实例方法的不同操作,所述处理器暂时性地被配置成(例如,通过软件指令)或永久性被配置成执行相关操作。无论暂时性地配置还是永久性地配置,此类处理器可以构成用于执行一个或多个操作或功能的处理器实施的模块或物体。在一些实例实施例中,本文提及的模块和物体可以包括处理器实施的模块和/或物体。

类似地,本文所描述的方法可以至少部分是处理器实施的。例如,方法的操作中的至少一些可以由一个或多个处理器或处理器实施的模块执行。某些操作的执行可以分布在一个或多个处理器之中,不仅驻留在单个机器或计算机内,而且跨越多个机器或计算机部署。在一些实例实施例中,一个或多个处理器可以位于单个位置中(例如,在家庭环境、办公室环境内,在服务器群处等),而在其它实施例中,处理器可以跨越多个位置分布。

一个或多个处理器还可以用于支持“云计算”环境中或软件即服务(“saas”)的上下文内的相关操作的性能。例如,操作中的至少一些操作可以由计算机的(例如,包含处理器的机器的)群组执行,这些操作可通过网络(例如,因特网)以及通过一个或多个合适接口(例如,应用程序接口(api))访问。

图1是说明根据一些实例实施例的适用于社交网络服务的网络环境100的网络图。网络环境100包含服务器机器110、数据库115和用于用户152的装置150,所有都通过网络190以通信方式耦合到彼此。服务器机器110可以形成基于网络的系统105的全部或一部分(例如,基于云的服务器系统被配置成将一个或多个服务提供到装置130和150)。数据库115可以存储用于社交网络服务的公开招聘。服务器机器110、第一装置130和第二装置150可以各自完全或部分实施于计算机系统中,如下文相对于图5所描述。

图1中还示出用户152。用户152可以是人类用户(例如,人类)、机器用户(例如,通过软件程序配置以与装置150交互的计算机)或其任何合适的组合(例如,由机器辅助的人类或由人类监督的机器)。用户152不是网络环境100的一部分,但是与装置150相关联。在一些实施例中,装置150是桌上型电脑、车辆计算机、平板电脑、导航装置、便携式媒体装置、智能电话或由用户152操作的可穿戴式装置(例如,智能手表或智能眼镜)。

图1中所示的机器、数据库或装置中的任一个可以实施于由软件(例如,一个或多个软件模块)修改(例如,配置或编程)为专用计算机的通用计算机中,以执行用于所述机器、数据库或装置的本文所描述的功能中的一个或多个。例如,下文相对于图5论述能够实施本文中所描述的方法中的任一个或多个的计算机系统。如本文所使用,“数据库”是数据存储资源并且可以存储构造为文本文件、表格、电子表格、关系型数据库(例如,对象关系型数据库)、三元组仓库、分层数据存储装置或其任何合适的组合的数据。此外,图1中所说明的机器、数据库或装置中的任两个或更多个可以组合成单个机器,并且用于任何单个机器、数据库或装置的本文中所描述的功能可以在多个机器、数据库或装置中细分。

网络190可以是实现机器、数据库和装置(例如,服务器机器110和装置130)之间或之中的通信的任何网络。因此,网络190可以是有线网络、无线网络(例如,移动或蜂窝网络)或其任何合适的组合。网络190可以包含构成专用网络、公用网络(例如,因特网)或其任何合适组合的一个或多个部分。因此,网络190可以包含并入有局域网(lan)、广域网(wan)、因特网、移动电话网络(例如,蜂窝网络)、有线电话网络(例如,简易老式电话系统(pots)网络)、无线数据网络(例如,wifi®或wimax®网络)或其任何合适组合的一个或多个部分。网络190的任何一个或多个部分可以通过传输媒体传送信息。如本文所使用,“传输媒体”是指能够传送(例如,传输)指令以供机器(例如,供此机器的一个或多个处理器)执行的任何无形(例如,暂时性)媒体,并且包含数字或模拟通信信号或其它无形媒体以促进此软件的通信。

图2是说明根据一些实例实施例的社交网络系统210的组件的框图。社交网络系统210是图1的基于网络系统105的实例。在一些实施例中,社交网络系统210包含工作捕获模块202、应用程序服务器模块204、工作标准化模块206和工作重复数据删除模块208,所有模块都被配置成彼此通信(例如,通过互连件、总线、共享存储器、开关等)。

尽管图2将公开招聘数据库220说明为单个数据库,但是公开招聘数据库220可以包含多个数据库,所述数据库可以位于一个位置或多个位置中。类似地,尽管图2将公开招聘数据库220说明为不同于社交网络系统210,但在一些实施例中,公开招聘数据库220并入社交网络系统210内。

在一些实施例中,工作捕获模块202从第三方系统170捕获、接收或以其它方式获取公开招聘。如图3a和3b中所描述,在一些实施例中,在将公开招聘集成到公开招聘数据库220中之前,工作标准化模块206标准化公开招聘。如在图4a和4b中所描述,如果此集成不会产生替代优良公开招聘的较差公开招聘,那么工作重复数据删除模块208将公开招聘集成到公开招聘数据库220中。

在一些情况下,工作捕获模块202、工作标准化模块206和/或工作重复数据删除模块208被配置成脱机和/或周期性地处理数据。例如,工作捕获模块202可以包含服务器,所述服务器周期性地从相关第三方因特网网站获取公开招聘。对第三方公开招聘进行标准化和重复数据删除可以是计算密集型的;因此,可以脱机完成工作标准化和/或重复数据删除。

如将相对于图3a至3b进一步描述,工作捕获模块202结合工作标准化模块206可以获得和标准化未付费公开招聘以集成到公开招聘数据库220中。

可以使用硬件(例如,机器的一个或多个处理器)或硬件和软件的组合来实施本文中描述的模块中的任一个或多个。例如,本文所描述的任何模块可以配置处理器(例如,在机器的一个或多个处理器之中),以执行用于所述模块的本文中所描述操作。此外,这些模块中的任何两个或更多个可以组合成单个模块,并且用于单个模块的本文中所描述功能可以在多个模块之中细分。此外,根据不同实例实施例,本文中描述为在单个机器、数据库或装置内实施例的模块可以跨越多个机器、数据库或装置分布。

在一些实施例中,公开招聘数据库220含有由工作托管服务识别的一组预定义职位名称。例如,所述组预定义职位名称可以包含例如“客户经理”、“系统工程师”、“销售经理”等的职位名称。在一些实施例中,公开招聘数据库220含有由工作托管服务识别的一组预定义工作资历水平。例如,所述组预定义工作资历水平可以包含例如“实习生”、“初级”、“中级”、“高级”、“管理”、“经理”等的资历水平。

图3a是说明根据一些实例实施例的在执行用于标准化从第三方系统获得的公开招聘的方法300时工作捕获模块202和工作标准化模块206的操作的流程图。可以使用上文相对于图2描述的模块由基于网络的系统105执行方法300中的操作。如图3a中所示,方法300包含操作302、304、306、308和310。

通过获得和标准化来自第三方系统的公开招聘,除了社交网络系统付费向其用户呈现的公开招聘之外,社交网络系统210的工作托管服务还可以向其用户呈现来自其它工作来源的公开招聘。

在操作302处,第一实体(例如,社交网络系统210的工作托管服务)获得(例如,使用工作捕获模块202)表示第三方系统170上的公开招聘的数据。公开招聘包含职位名称和职位描述。在一些实施例中,公开招聘还包含以下项中的至少一个:用人单位名称、招聘行业、工作的地理位置和所需技能。

在操作304处,标准化公开招聘的职位名称(例如,使用工作标准化模块206)以匹配由第一实体识别的预定义职位名称。在一些实施例中,图3b中所说明的方法350的一个或多个操作352至362执行为职位名称标准化过程的一部分。

在操作306处,标准化职位描述以符合由第一实体识别的数据格式。在一些实施例中,标准化职位描述包含对职位描述执行拼写检查/校正和/或语法检查/校正。

在操作308处,标准化职位名称和标准化职位描述组合到标准化公开招聘中。在一些实施例中,例如元数据的额外信息还包含在标准化公开招聘中。

在操作310处,标准化公开招聘集成到第一实体(例如,社交网络系统210)的招聘系统(例如,工作托管服务)中。在一些实施例中,在标准化公开招聘的集成之前,对标准化公开招聘执行工作重复数据删除过程(例如,图4a的方法400)。

图3b是说明根据一些实例实施例的在执行用于标准化从第三方系统获得的公开招聘的方法350时工作标准化模块206的任选操作的流程图。可以使用上文相对于图2描述的模块由基于网络的系统105执行方法350中的操作。如图3b中所示,方法350包含操作352、354、356、358、360、362、364和366。

在操作352处,清除在职位名称中出现的不合需要的字符。例如,在一些实施例中,句点在职位名称中是不合需要的。如果公开招聘中的职位名称是“s.e.insanfrancisco,c.a.”,则清除句点将产生“seinsanfrancisco,ca”的修改后职位名称。在一些实施例中,通过应用于职位名称的正规表达式来清除不合需要的字符。

在操作354处,地理位置确定在职位名称内并且从职位名称清除。例如,如果输入此操作的职位名称是“seinsanfrancisco,ca”,那么输出的职位名称将是“se”。

在操作356处,在表示缩写时,用第一实体识别的单词或词组替代职位名称内的缩写。例如,如果输入此操作的职位名称是“se”,那么职位名称将是“systemsengineer”。

在一些实施例中,使用职位名称内的上下文和/或职位描述内的上下文消除缩写的歧义。在一些实施例中,通过参考职位描述内多次出现的单词来消除缩写的歧义。例如,缩写“se”可以表示例如“系统工程师”、“销售工程师”、“体育新闻编辑”、“清洁工”、“结构工程师”、“高级工程师”等的预定义职位名称。在一些实施例中,如果在职位描述内出现与预定义职位名称的潜在匹配,那么这会增加此潜在匹配时正确匹配的概率。

在操作358处,职位名称的单词分成单词的列表。例如,如果输入此操作的职位名称是“系统工程师”,那么此操作的输出将是单词“系统”和“工程师”的列表。

在操作360处,产生单词列表中的单词的所有可能排列。例如,如果单词的列表是“系统”和“工程师”,那么可能排列将是“系统工程师”和“工程师系统”。

在操作362处,选择单词的排列作为与由第一实体识别的至少一个预定义职位名称最紧密匹配的标准化职位名称。例如,如果可能排列是“系统工程师”和“工程师系统”,那么“系统工程师”将选择作为标准化职位名称。

在操作364处,确定对应于标准化职位名称的职位名称编号。例如,如果标准化职位名称是“系统工程师”,那么在具体工作托管服务内的对应职位名称编号可以是525。

此外,在操作364处,确定对应于职位名称编号的工作资历水平。例如,对应于“系统工程师”的职位名称编号525的工作资历水平可以是“中级”。

在操作366处,职位名称编号和工作资历水平包含在标准化公开招聘中。在一些实施例中,在将标准化公开招聘集成到公开招聘数据库220中之前,职位名称编号和工作资历水平包含在标准化公开招聘中。

图4a是说明根据一些实例实施例的在执行用于对从第三方系统获得的公开招聘进行重复数据删除的方法400时工作重复数据删除模块208,以及任选地工作捕获模块202和/或工作标准化模块206的操作的流程图。可以使用上文相对于图2描述的模块由基于网络的系统105执行方法400中的操作。如图4a所示,方法400包含操作402、404、406、408、410和412。

通过对来自第三方系统的公开招聘进行重复数据删除,社交网络系统210的工作托管服务可以组织向其用户呈现相同工作的重复公开招聘。

在操作402处,任选地,第一实体(例如,社交网络系统210的工作托管服务)获得(例如,使用工作捕获模块202)表示第三方系统170上的公开招聘的数据。在一些实施例中,公开招聘包含以下项中的至少一个:职位名称、职位描述、用人单位名称、招聘行业、工作的地理位置和所需技能。在一些实施例中,方法400的操作402基本上类似于方法300的操作302。

在操作404处,任选地,标准化公开招聘的职位名称(例如,使用工作标准化模块206)以匹配由第一实体识别的预定义职位名称。在一些实施例中,图3b中所说明的方法350的一个或多个操作352至362执行为职位名称标准化过程的一部分。

在操作406处,将第一源值分配到标准化公开招聘。在一些实施例中,至少部分由第三方系统的源类型确定第一源值。例如,在一些实施例中,识别三个第三方源类型:工作用人单位的网站、电子求职者跟踪系统(ats)和电子招聘网站。ats的实例包含taleo®、adp®等。电子招聘网站的实例包含monster.com®、indeed®、craigslist®等。

在一些实施例中,存在源类型的层级。例如,工作用人单位的网站在源类型层级中视为最高,电子ats在源类型层级中视为第二高,并且电子招聘网站在源类型层级中视为最低。因此,从用人单位自有网站获得的公开招聘具有比从电子ats获得的公开招聘高的源值,从电子ats获得的公开招聘进而具有比从电子招聘网站获得的公开招聘高的源值。

此外,对于从相同源类型内的源获得的公开招聘,源值可以不同。例如,从dice.com获得的公开招聘可以具有比从craigslist®获得的公开招聘高的源值。在一些实施例中,工作托管服务的管理员能够将源值分配到不同类型的源(例如,通过用户接口)。

在操作408处,产生标准化公开招聘的散列值并且将所述散列值分配到标准化公开招聘。在一些实施例中,基于标准化职位名称、地理位置和用人单位名称而产生散列值。

在一些实施例中,使用除了散列之外的比较数据的方法,例如,校验和、统计分析方法和机器学习方法,例如神经网络或其它监督学习方法。

在操作410处,确定与标准化公开招聘基本上类似的公开招聘是否存在于社交网络系统210的工作托管服务中。在使用散列的一些实施例中,通过将散列值与社交网络系统210的工作托管服务内的公开招聘的多个散列值相比较来作出此确定,在操作408处针对标准化公开招聘产生所述散列值。

在使用散列的一些实施例中,如果标准化公开招聘的散列值与已集成到工作托管服务中的公开招聘的散列值足够匹配,那么标准化公开招聘和已集成的公开招聘被认为基本上类似。在一些实施例中,如果标准化公开招聘的散列值与已集成到工作托管服务中的公开招聘的散列值足够匹配,那么执行两个公开招聘的职位描述的正文的比较。在一些实施例中,比较涉及计算或比较两个公开招聘的已计算出的相似性测量。例如,杰卡德相似系数可以用于比较两个公开招聘之间的相似性。

在使用除了散列之外的比较方法的一些实施例中,不同比较技术可以用于确定公开招聘之间的大量相似性。例如,可以执行公开招聘的类似属性和/或公开招聘内的关键词的比较以确定大量相似性。

在一些实施例中,如果标准化公开招聘和已集成的公开招聘基本上相似,那么具有最高源值的公开招聘存储于工作托管服务中,而具有较低源值的公开招聘被舍弃。在两个公开招聘具有相同源值的情况下,将保存最早的公开招聘。

在一些实施例中,如果标准化公开招聘和已集成的公开招聘基本上相似,那么保存两个公开招聘并且在显示公开招聘时或仅在显示公开招聘之前确定向用户显示的公开招聘。例如,如果在显示具体工作的公开招聘时,工作的付费公开招聘已到期并且先前尚未向用户显示付费公开招聘,那么实际上将显示标准化公开招聘。如果到期的付费公开招聘先前已向用户显示,那么到期的付费公开招聘作为具体工作的公开招聘向用户显示。

在一些实施例中,如果确定工作托管服务中不存在基本上类似的公开招聘,那么标准化公开招聘集成到工作托管服务中。

在操作412处,在工作托管服务内,用标准化公开招聘替代基本上类似的公开招聘。在一些实施例中,响应于基本上类似的公开招聘已识别为不是付费公开招聘并且标准化公开招聘的源值大于工作托管服务中的基本上类似的公开招聘的源值而执行替代。在符合这些条件时的替代防止未付费公开招聘替代工作托管服务内的付费公开招聘,并且防止较低权威性的未付费公开招聘替代工作托管服务内的更具权威性的未付费公开招聘。

图4b是说明根据一些实例实施例的在执行用于对从第三方系统获得的公开招聘进行重复数据删除的方法450时工作重复数据删除模块208的任选操作的流程图。方法450中的操作可以使用上文相对于图2描述的模块由基于网络的系统105执行。如图4b所示,方法450包含操作452和454。

在操作452处,确定基本上类似的公开招聘是付费公开招聘。在一些实施例中,至少部分基于社交网络系统210是否收取报酬而由社交网络系统210的至少一个客户作出此确定,以向社交网络系统210的工作托管服务的至少一个用户152呈现基本上类似的公开招聘。在一些实施例中,作出此确定以防止未付费公开招聘替代社交网络系统210的工作托管服务内的付费公开招聘。

在操作454处,在接收用户152提交的相关工作搜索之后,向社交网络系统210的用户152呈现标准化公开招聘。在一些实施例中,社交网络系统210的用户152在社交网络系统210内提交工作搜索。在此类系统中,社交网络系统210向用户152呈现与所提交工作搜索相关的一组公开招聘。在一些实施例中,呈现的公开招聘可以包含付费公开招聘、未付费公开招聘,或其某一组合。

图5说明其上可以执行本文所论述的技术(例如,方法)中的任一个或多个的实例机器500的框图。在替代实施例中,机器500可以充当独立装置或可以连接(例如,联网)到其它机器。在联网部署中,机器500可以在服务器机器、客户端机器或服务器-客户端网络环境两者的能力中操作。在实例中,机器500可以充当同级间(p2p)(或其它分布式)网络环境中的同级机器。机器500可以是个人计算机(pc)、平板pc、机顶盒(stb)、个人数字助理(pda)、移动电话、网络器具、网络路由器、开关或桥接器,或能够执行(依序或以其它方式)指定将由所述机器采取的动作的指令的任何机器。此外,虽然仅说明单一机器,但术语“机器”也将被视为包含个别地或共同地执行指令集(或多个集合)以执行本文中所论述的方法中的任何一个或多和(例如,云计算、软体即服务(saas)、其它计算机集群配置)的任何机器集合。

如本文中所描述,实例可以包含逻辑或多个组件或机构,或可以由逻辑或多个组件或机构操作。电路组是在包含硬件(例如,简单电路、门、逻辑等)的有形实体中实施的电路集合。电路组成员可以随时间和基础硬件可变性为灵活的。电路组包含在操作时可以单独或组合地执行指定操作的成员。在实例中,电路组的硬件可以被永恒地设计成执行特定操作(例如,硬接线)。在实例中,电路组的硬体可以包含可变地连接的物理组件(例如,执行单元、晶体管、简单电路等),所述物理组件包含以物理方式修改(例如,不变集中式粒子的磁性、电气可移动放置等)以编码特定操作的指令。在连接物理组件时,硬件构成的基础电特性例如从绝缘体改变成导体或反之亦然。指令使嵌入式硬件(例如,执行单元或负载机构)能够经由可变连接而产生硬件中的电路组的成员,以当在操作中时执行特定操作的部分。因此,计算机可读媒体在装置正在操作时以通信方式耦合到电路组成员的其它组件。在实例中,物理组件中的任一个可以用于多于一个电路组中的多于一个成员中。例如,在操作中,执行单元在一个时间点处可以用于第一电路组的第一电路中,且由第一电路组中的第二电路或由第二电路组中的第三电路在不同时间重新使用。

机器(例如,计算机系统)500可以包含硬件处理器502(例如,中央处理单元(cpu)、图形处理单元(gpu)、硬件处理器核心,或其任何组合)、主存储器504和静态存储器506,所述元件中的一些或全部元件可以经由互连件(例如,总线)508彼此通信。机器500可以进一步包含显示单元510、字母数字输入装置512(例如,键盘)和用户接口(ui)导航装置514(例如,鼠标)。在实例中,显示单元510、输入装置512和ui导航装置514可以是触摸屏显示器。机器500可以另外包含存储装置(例如,驱动单元)516、信号产生装置518(例如,扬声器)、网络接口装置520和一个或多个传感器521,例如,全球定位系统(gps)传感器、指南针、加速计或其它传感器。机器500可以包含输出控制器528,例如,串行(例如,通用串行总线(usb))、并行或其它有线或无线(例如,红外(ir)、近场通信(nfc)等)连接以与一个或多个外围装置(例如,打印机、读卡器等)通信或控制所述一个或多个外围装置。

存储装置516可以包含其上存储体现本文中所描述的技术或功能中的任何一个或多个或由本文中所描述的技术或功能中的任何一个或多个利用的一组或多组数据结构或指令524(例如,软件)的机器可读媒体522。指令524还可以在其由机器500执行期间完全或至少部分地驻留于主存储器504内、静态存储器506内或硬件处理器502内。在实例中,硬件处理器502、主存储器504、静态存储器506或存储装置516中的一个或任何组合可以构成机器可读媒体。

虽然将机器可读媒体522说明为单一媒体,但术语“机器可读媒体”可以包含被配置成存储一个或多个指令524的单一媒体或多个媒体(例如,集中式或分布式数据库,和/或相关联的高速缓存器和服务器)。

术语“机器可读媒体”可以包含能够存储、编码或载送用于由机器500执行且使机器500执行本发明的技术中的任何一个或多个的指令,或能够存储、编码或载送由此类指令使用或与此类指令相关联的数据结构的任何媒体。非限制性机器可读媒体实例可以包含固态存储器以及光学和磁性媒体。在实例中,集中式机器可读媒体包括具有多个粒子的机器可读媒体,所述粒子具有不变(例如,静止)质量。因此,集中式机器可读媒体是非暂时性传播信号。集中式机器可读媒体的具体实例可以包含:非易失性存储器,例如半导体存储器装置(例如,电可编程只读存储器(eprom)或电可擦除可编程只读存储器(eeprom))和闪存存储器装置;磁盘,例如内部硬盘和可移动盘;磁光碟;以及cd-rom和dvd-rom盘。

指令524可以进一步利用多个传输协议中的任一个(例如,帧中继、因特网协议(ip)、传输控制协议(tcp)、用户数据报协议(udp)、超文本传输协议(http)等)经由网络接口装置520使用传输媒体在通信网络526上传输或接收。实例通信网络可以包含局域网(lan)、广域网(wan)、分组数据网络(例如,因特网)、移动电话网络(例如,蜂窝网络)、简易老式电话(pots)网络和无线数据网络(例如,称为wi-fi®的电气电子工程师学会(ieee)802.11系列标准、称为wimax®的ieee802.16系列标准)、ieee802.15.4系列标准、同级间(p2p)网络,以及其它网络。在实例中,网络接口装置520可以包含一个或多个物理插口(例如,以太网、同轴或电话插口)或一个或多个天线以连接到通信网络526。在实例中,网络接口装置520可以包含多个天线以使用单输入多输出(simo)、多输入多输出(mimo)或多输入单输出(miso)技术中的至少一个无线地通信。术语“传输媒体”应被视为包含能够存储、编码或载送指令以由机器500执行的任何无形媒体,且包含数字或模拟通信信号或用以促进此软件的通信的其它无形媒体。

附加注释和实例实施例:

实例1包含包括以下项的主题(例如,方法、用于执行动作的构件,或包含指令的机器可读媒体,所述指令在由机器执行时使机器执行动作):通过第一实体获得表示第三方招聘系统上的公开招聘的数据,所述数据包含职位名称和职位描述;标准化职位名称以匹配由第一实体识别的多个预定义职位名称中的至少一个;标准化职位描述以符合由第一实体识别的数据格式;将标准化职位名称和标准化职位描述组合成标准化公开招聘;以及将标准化公开招聘集成到第一实体的招聘系统中。

实例2可以包含实例1的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含清除出现的不合需要的字符,使用至少一个正规表达式来执行所述清除。

实例3可以包含实例1至2中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含以下项中的至少一个:确定职位名称内的地理位置并且从职位名称中清除所确定的地理位置;或确定职位名称内的用人单位名称并且从职位名称中清除所确定的用人单位名称。

实例4可以包含实例1至3中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含在表示缩写时用第一实体识别的单词或词组替代职位名称内的缩写。

实例5可以包含实例1至4中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中替代包含使用职位名称内的上下文和职位描述内的上下文中的至少一个消除缩写的歧义。

实例6可以包含实例1至5中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含:将包括有序的多个单词的职位名称分成单词的列表;根据单词的列表产生单词的多个排列;以及从单词的多个排列中选择最紧密匹配由第一实体识别的多个预定义职位名称中的至少一个的单词的排列。

实例7可以包含实例1至6中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称进一步包含确定对应于标准化职位名称的职位名称编号和工作资历水平,并且其中职位名称编号和工作资历水平包含在标准化公开招聘中。

实例8可以包含实例1至7中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化公开招聘包含地理位置、用人单位名称、招聘行业和工作技能的识别中的至少一个。

实例9可以包含实例1至8中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,主题(例如,设备、装置或系统)包括:包含存储器和至少一个处理器的机器;可由机器执行的工作捕获模块,其被配置成通过第一实体获得表示第三方招聘系统上的公开招聘的数据,所述数据包含职位名称和职位描述;以及可由机器执行的工作标准化模块,其被配置成:标准化职位名称以匹配由第一实体识别的多个预定义职位名称中的至少一个;标准化职位描述以符合由第一实体识别的数据格式;将标准化职位名称和标准化职位描述组合成标准化公开招聘;以及将标准化公开招聘集成到第一实体的招聘系统中。

实例10可以包含实例9的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含清除出现的不合需要的字符,使用至少一个正规表达式来执行所述清除。

实例11可以包含实例9至10中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含以下项中的至少一个:确定职位名称内的地理位置并且从职位名称中清除所确定的地理位置;或确定职位名称内的用人单位名称并且从职位名称中清除所确定的用人单位名称。

实例12可以包含实例9至11中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含在表示缩写时用第一实体识别的单词或词组替代职位名称内的缩写。

实例13可以包含实例9至12中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中替代包含使用职位名称内的上下文和职位描述内的上下文中的至少一个消除缩写的歧义。

实例14可以包含实例9至13中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称包含:将包括有序的多个单词的职位名称分成单词的列表;根据单词的列表产生单词的多个排列;以及从单词的多个排列中选择最紧密匹配由第一实体识别的多个预定义职位名称中的至少一个的单词的排列。

实例15可以包含实例9至14中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化职位名称进一步包含确定对应于标准化职位名称的职位名称编号和工作资历水平,并且其中职位名称编号和工作资历水平包含在标准化公开招聘中。

实例16可以包含实例9至15中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中标准化公开招聘包含地理位置、用人单位名称、招聘行业和工作技能的识别中的至少一个。

实例17可以包含实例1至16中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,主题(例如,方法、用于执行动作的构件,或包含指令的机器可读媒体,所述指令在由机器执行时使机器执行动作)包括:通过第一实体获得表示第三方系统上的公开招聘的数据;标准化数据以产生标准化公开招聘;将第一源值分配到标准化公开招聘,所述第一源值至少部分由第三方系统的源类型确定;产生标准化公开招聘的第一散列值并且将所述第一散列值分配给标准化公开招聘;确定具有第二源值和第二散列值的基本上类似的公开招聘存在于第一实体的招聘系统中;以及在第一实体的招聘系统内用标准化公开招聘替代基本上类似的公开招聘,所述替代响应于以下项执行:基本上类似的公开招聘已识别为不是付费公开招聘并且第一源值大于第二源值。

实例18可以包含实例17的主题,或可以任选地与所述主题组合以包含,其中表示第三方系统上的公开招聘的数据包含职位名称、地理位置和用人单位名称,其中标准化公开招聘包含标准化职位名称,并且其中基于标准化职位名称、地理位置和用人单位名称而产生标准化公开招聘的第一散列值。

实例19可以包含实例17至18中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中第三方系统的源类型是用人单位的网站、电子求职者跟踪系统和电子招聘网站中的至少一个。

实例20可以包含实例17至19中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中用人单位的网站的源值大于电子求职者跟踪系统的源值,并且其中电子求职者跟踪系统的源值大于电子招聘网站的源值。

实例21可以包含实例17至20中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中确定基本上类似的公开招聘存在于第一实体的招聘系统中包含将第一散列值与第一实体的招聘系统内的公开招聘的多个散列值相比较,所述多个散列值包含第二散列值。

实例22可以包含实例17至21中的一个或任何组合的主题,或可以任选地与所述主题组合以包含基于第一实体是否收取报酬而由第一实体的至少一个客户确定基本上类似的公开招聘是付费公开招聘,以向第一实体的招聘系统的至少一个用户呈现基本上类似的公开招聘。

实例23可以包含实例17至22中的一个或任何组合的主题,或可以任选地与所述主题组合以包含在接收由第一实体的招聘系统的用户提交的相关工作搜索之后,向用户呈现标准化公开招聘。

实例24可以包含实例1至23中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,主题(例如,设备、装置或系统)包括:包含存储器和至少一个处理器的机器;可由机器执行的工作捕获模块,其被配置成通过第一实体获得表示第三方招聘系统上的公开招聘的数据;可由机器执行的工作标准化模块,其被配置成标准化公开招聘;以及可由机器执行的工作重复数据删除模块,其被配置成:将第一源值分配到标准化公开招聘,所述第一源值至少部分由第三方系统的源类型确定;产生标准化公开招聘的第一散列值并且将所述第一散列值分配到标准化公开招聘;确定具有第二源值和第二散列值的基本上类似的公开招聘存在于第一实体的招聘系统中;以及在第一实体的招聘系统内用标准化公开招聘替代基本上类似的公开招聘,所述替代响应于以下项执行:基本上类似的公开招聘已识别为不是付费公开招聘并且第一源值大于第二源值。

实例25可以包含实例24的主题,或可以任选地与所述主题组合以包含,其中表示第三方系统上的公开招聘的数据包含职位名称、地理位置和用人单位名称,其中标准化公开招聘包含标准化职位名称,并且其中基于标准化职位名称、地理位置和用人单位名称而产生标准化公开招聘的第一散列值。

实例26可以包含实例24至25中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中第三方系统的源类型是用人单位的网站、电子求职者跟踪系统和电子招聘网站中的至少一个。

实例27可以包含实例24至26中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中用人单位的网站的源值大于电子求职者跟踪系统的源值,并且其中电子求职者跟踪系统的源值大于电子招聘网站的源值。

实例28可以包含实例24至27中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中工作重复数据删除模块被配置成通过将第一散列值与第一实体的招聘系统内的公开招聘的多个散列值相比较而至少部分确定基本上类似的公开招聘存在于第一实体的招聘系统中,所述多个散列值包含第二散列值。

实例29可以包含实例24至28中的一个或任何组合的主题,或可以任选地与所述主题组合以包含,其中工作重复数据删除模块被配置成至少部分基于第一实体是否收取报酬而由第一实体的至少一个客户确定基本上类似的公开招聘是付费公开招聘,以向第一实体的招聘系统的至少一个用户呈现基本上类似的公开招聘。

实例30可以包含实例24至29中的一个或组合的主题,或可以任选地与所述主题组合以包含,呈现模块被配置成在接收用户提交的相关工作搜索之后向第一实体的招聘系统的用户呈现标准化公开招聘。

这些非限制性实例中的每一个可以独立存在,或可以各种排列或组合与其它实例中的一个或多个组合。

本文中使用在计算机网络和计算机系统的领域中的常规术语。所述术语在本领域中已知并且为方便起见,仅提供为非限制性实例。因此,除非另外说明,否则权利要求书中的对应术语的解释不限于任何特定定义。因此,权利要求书中使用的术语应给予最广泛的合理解释。

尽管本文中已说明且描述具体实施例,但本领域普通技术人员将了解,计算出实现相同目的的任何布置可以取代所示的具体实施例。本领域普通技术人员将明白许多修改。因此,本申请案预期涵盖任何修改或变化。

以上详细描述包含对附图的参考,所述附图形成详细描述的一部分。附图借助于说明示出可以实践的具体实施例。这些实施例在本文中还称为“实例”。此类实例可以包含除了所示出或所描述的那些元件之外的元件。然而,本发明人还预期其中仅提供所示出或所描述的那些元件的实例。此外,本发明人还预期使用相对于具体实例(或其一个或多于一个方面)或相对于本文所示出或所描述的其它实例(或其一个或多于一个方面)而示出或描述的那些元件的任何组合或排列的实例(或其一个或多于一个方面)。

在此文献中参考的所有公开案、专利和专利文献以全文引用的方式并入本文中,就如同以引用的方式个别地并入一般。在此文献与以引用方式并入的那些文献之间发生用法不一致的情况下,所并入的参考文献中的用法应被视为补充此文献的用法;对于不可调和的不一致,此文献中的用法起主导作用。

在此文献中,如专利文献中所常见而使用术语“一”以包含一个或多于一个,这与“至少一个”或“一个或多个”的任何其它例子或使用无关。在此文献中,术语“或”用于指代非排它性或,使得除非另有指示,否则“a或b”包含“a而非b”、“b而非a”以及“a和b”。在此文献中,术语“包含”和“其中(inwhich)”用作相应术语“包括”和“其中(wherein)”的通俗等效术语。此外,在所附权利要求书中,术语“包含”和“包括”为开放式的,也就是说,包含除权利要求书中在此术语之后列出的那些元件之外的元件的系统、装置、物品或过程仍被视为在权利要求书的范围内。此外,在所附权利要求书中,术语“第一”、“第二”和“第三”等仅用作标记,且并不意图对其对象施加数字要求。

本文中所描述的方法实例可以至少部分地由机器或计算机实施。一些实例可以包含编码有可用于配置电子装置以执行如在以上实例中描述的方法的指令的计算机可读媒体或机器可读媒体。此类方法的实施方案可以包含代码,例如微码、汇编语言代码、高级语言代码等等。此代码可以包含用于执行各种方法的计算机可读指令。所述代码可以形成计算机程序产品的部分。此外,在实例中,代码可以例如在执行期间或在其它时间有形地存储在一个或多个易失性、非暂时性或非易失性有形计算机可读媒体上。这些有形计算机可读媒体的实例可以包含,但不限于,硬盘、可移动磁盘、可移动光盘(例如,光盘和数字视频磁盘)、盒式磁带、存储卡或棒、随机存取存储器(ram)、只读存储器(rom)等。

以上描述预期为说明性的而非限制性的。例如,上述实例(或其一个或多个方面)可以彼此组合使用。例如一般技术人员在查阅以上描述后可以使用其它实施例。提供符合37c.f.r.§1.72(b)的摘要以允许读者快速确定技术公开内容的本质并且通过摘要不用于解释或限制权利要求书的范围或意义的理解来提交所述摘要。此外,在以上具体实施方式中,可以将各种特征分组在一起以简化本发明。不应将此情况解释为期望未主张的揭示特征对任何权利要求来说是必需的。相反地,本发明主题可以在于比特定所揭示实施例的所有特征要少。因此,特此将所附权利要求书并入到具体实施方式中,其中每一权利要求作为单独实施例而独立存在,且预期此类实施例可以各种组合或排列彼此组合。实施例的范围应该通过参考所附权利要求书以及此权利要求书所授予的等效物的完整范围来确定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1