一种更新企业数据的方法及服务器与流程

文档序号:13282223阅读:206来源:国知局
一种更新企业数据的方法及服务器与流程

本发明实施例涉及企业数据更新技术领域,具体涉及一种更新企业数据的方法及服务器。



背景技术:

在商业调查中,常常需要及时更新的企业数据。

全国的企业数量大约为1亿2千万左右,现有技术中,更新时依次按企业名称或所处区域顺序获取更新的企业数据。这种更新方式的问题在于,对于一般公司,没有那么强的更新处理能力,即不可能在很短时间内处理约1亿2千万个企业的更新的企业数据,而实际上每天只能处理数百万(如300万)家企业的更新的企业数据,并且基本上是按照名称或区域的顺序更新企业的企业数据,这样,一个全企业更新周期需要一个多月左右,故而用户经常不能及时得到所需要的企业的更新的企业数据。

因此,如何能够及时获取到更新的企业数据,并使得获取到的更新的企业数据更有针对性,成为亟须解决的问题。



技术实现要素:

针对现有技术存在的问题,本发明实施例提供一种更新企业数据的方法及服务器。

第一方面,本发明实施例提供一种更新企业数据的方法,所述方法包括:

获取企业的标识和在预设时段内所述企业的被访问次数;

根据所述标识和第一预设规则,获取所述企业所属的企业类型;

根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;

根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

第二方面,本发明实施例提供一种更新企业数据的服务器,所述服务器包括:

第一获取模块,用于获取企业的标识和在预设时段内所述企业的被访问次数;

第二获取模块,用于根据所述标识和第一预设规则,获取所述企业所属的企业类型;

第三获取模块,用于根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;

更新模块,用于根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

第三方面,本发明实施例提供另一种更新企业数据的服务器,包括:处理器、存储器和总线,其中,

所述处理器和所述存储器通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:

获取企业的标识和在预设时段内所述企业的被访问次数;

根据所述标识和第一预设规则,获取所述企业所属的企业类型;

根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;

根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:

所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:

获取企业的标识和在预设时段内所述企业的被访问次数;

根据所述标识和第一预设规则,获取所述企业所属的企业类型;

根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;

根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

本发明实施例提供的更新企业数据的方法及服务器,能够及时获取更新的企业数据,并使得获取到的更新的企业数据更有针对性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例更新企业数据的方法流程示意图;

图2为本发明实施例更新企业数据的服务器结构示意图;

图3为本发明实施例提供的服务器实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例更新企业数据的方法流程示意图,如图1所示,本发明实施例提供的一种更新企业数据的方法,包括以下步骤:

s1:获取企业的标识和在预设时段内所述企业的被访问次数。

具体的,服务器获取企业的标识和在预设时段内所述企业的被访问次数。企业的标识可以包括企业名称、id等,企业名称还可以包括类型关键字,类型关键字可以表征不同类型的企业,企业类型可分为公司类型(第一企业类型)即:企业名称带有“公司”(公司对应于第一类型关键字)字样;合伙类型(第二企业类型)即:企业名称带有“合伙”(合伙对应于第二类型关键字)字样、且不包含第一类型关键字(公司);其它类型(第三企业类型),即:企业名称都不包含公司(第一类型关键字)字样或合伙(第二类型关键字)字样,第三企业类型可以包括个体户类型等。目前全国公司记录数量约1.2亿,其中公司类型约占25%,合伙企业不足1%,个体户约占70%。经统计,用户访问公司和合伙企业详情的数量远远大于查看其余类型的数量,而对每个企业的数据维度的访问也各有不同。所以应重点更新公司和合伙企业的访问频率高的数据维度,同时降低其他类型企业的更新频率。预设时段可以根据实际情况自主设置,可以选择当前月份的上一个月份,但不作具体限定。可以从服务器上获取上一个月份访问日志中的企业详情页面url,记录对应的企业名称、id(企业的标识),并统计每个企业在上一个月份中的被访问次数。

s2:根据所述标识和第一预设规则,获取所述企业所属的企业类型。

具体的,服务器根据所述标识和第一预设规则,获取所述企业所属的企业类型。标识可以包括类型关键字,如果标识为第一类型关键字(公司),则将包含有第一类型关键字的标识对应的企业类型作为企业所属的第一企业类型(公司类型)。如果标识为第二类型关键字(合伙),且不包含第一类型关键字(公司),则将包含有第二类型关键字,且不包含第一类型关键字的标识对应的企业类型作为所述企业所属的第二企业类型(合伙类型)。如果将不包含第一类型关键字或第二类型关键字的标识对应的企业类型作为所述企业所属的第三企业类型(除公司类型和合伙类型以外的其它企业类型)。

s3:根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合。

具体的,服务器根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合。将被访问次数大于等于第一预设次数的第一企业类型的企业作为第一候选企业集合,第一预设次数可以根据实际情况自主设置,举例说明如下(第一预设次数f1=20):第一企业类型的企业有a、b、c,其分别对应的被访问次数为25、22、19,则第一候选企业集合为{a、b}。将被访问次数大于等于第二预设次数的第二企业类型的企业作为第二候选企业集合,其中,第二预设次数小于第一预设次数,第二预设次数可以根据实际情况自主设置,举例说明如下(第二预设次数f2=14):第二企业类型的企业有d、e、f,其分别对应的被访问次数为21、13、8,则第二候选企业集合为{d}。将被访问次数大于等于第三预设次数的第三企业类型的企业作为第三候选企业集合,其中,第三预设次数小于第一预设次数或小于第二预设次数,第三预设次数可以根据实际情况自主设置,举例说明如下(第三预设次数f3=12):第三企业类型的企业有g、h,其分别对应的被访问次数为16、9,则第三候选企业集合为{g}。需要说明的是:第一预设次数f1的确定可以根据以下方法:先获取第一企业类型的企业数量,根据第一企业类型的企业数量和第一预设比例,确定第一预设次数,其中,第一预设比例可以根据实际情况自主设置,可选为0.2,举例说明如下:第一企业类型的企业数量为100个,则第一预设次数f1确定为20(100*0.2);根据第二预设比例和第一预设次数,确定第二预设次数f2,其中,第二预设比例可以根据实际情况自主设置,可选为0.7,举例说明如下:第一预设次数f1确定为20,第二预设比例选为0.7,则第二预设次数f2确定为14(0.7*f1)。根据第三预设比例和第一预设次数,确定第三预设次数,其中,第三预设比例可以根据实际情况自主设置,可选为0.5,举例说明如下:第一预设次数f1确定为20,第三预设比例选为0.5,则第三预设次数f3确定为10(0.5*f1)。

s4:根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

具体的,服务器根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。第一目标企业集合可以包括上述的第一候选企业集合、第二候选企业集合和第三候选企业集合,即:第一目标企业集合cp1为{a、b、d、g},对第一目标企业集合的数据进行更新,以获得最新的企业数据。

本发明实施例提供的更新企业数据的方法,能够及时获取更新的企业数据,并使得获取到的更新的企业数据更有针对性。

在上述实施例的基础上,所述标识包括类型关键字;相应的,所述根据所述标识和第一预设规则,获取所述企业所属的企业类型,包括:

若所述标识为第一类型关键字,则将包含有所述第一类型关键字的标识对应的企业类型作为所述企业所属的第一企业类型。

具体的,服务器若判断获知所述标识为第一类型关键字,则将包含有所述第一类型关键字的标识对应的企业类型作为所述企业所属的第一企业类型。可参照上述实施例,不再赘述。

若所述标识为第二类型关键字,且不包含所述第一类型关键字,则将包含有所述第二类型关键字,且不包含所述第一类型关键字的标识对应的企业类型作为所述企业所属的第二企业类型。

具体的,服务器若判断获知所述标识为第二类型关键字,且不包含所述第一类型关键字,则将包含有所述第二类型关键字,且不包含所述第一类型关键字的标识对应的企业类型作为所述企业所属的第二企业类型。可参照上述实施例,不再赘述。

将不包含所述第一类型关键字或所述第二类型关键字的标识对应的企业类型作为所述企业所属的第三企业类型。

具体的,服务器将不包含所述第一类型关键字或所述第二类型关键字的标识对应的企业类型作为所述企业所属的第三企业类型。可参照上述实施例,不再赘述。

本发明实施例提供的更新企业数据的方法,能够合理地获取到企业所属的企业类型,能够有针对性地区分企业类型。

在上述实施例的基础上,所述根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合,包括:

将被访问次数大于等于第一预设次数的第一企业类型的企业作为第一候选企业集合。

具体的,服务器将被访问次数大于等于第一预设次数的第一企业类型的企业作为第一候选企业集合。可参照上述实施例,不再赘述。

将被访问次数大于等于第二预设次数的第二企业类型的企业作为第二候选企业集合,其中,所述第二预设次数小于所述第一预设次数。

具体的,服务器将被访问次数大于等于第二预设次数的第二企业类型的企业作为第二候选企业集合,其中,所述第二预设次数小于所述第一预设次数。可参照上述实施例,不再赘述。

将被访问次数大于等于第三预设次数的第三企业类型的企业作为第三候选企业集合,其中,所述第三预设次数小于所述第一预设次数或小于所述第二预设次数。

具体的,服务器将被访问次数大于等于第三预设次数的第三企业类型的企业作为第三候选企业集合,其中,所述第三预设次数小于所述第一预设次数或小于所述第二预设次数。可参照上述实施例,不再赘述。

本发明实施例提供的更新企业数据的方法,通过获取每一企业类型对应的候选企业集合,进一步能够及时获取更新的企业数据,并使得获取到的更新的企业数据更有针对性。

在上述实施例的基础上,所述方法还包括:

获取第一企业类型的企业数量。

具体的,服务器获取第一企业类型的企业数量。可参照上述实施例,不再赘述。

根据所述第一企业类型的企业数量和第一预设比例,确定所述第一预设次数。

具体的,服务器根据所述第一企业类型的企业数量和第一预设比例,确定所述第一预设次数。可参照上述实施例,不再赘述。

根据第二预设比例和所述第一预设次数,确定所述第二预设次数。

具体的,服务器根据第二预设比例和所述第一预设次数,确定所述第二预设次数。可参照上述实施例,不再赘述。

根据所述第三预设比例和所述第一预设次数,确定所述第三预设次数。

具体的,服务器根据所述第三预设比例和所述第一预设次数,确定所述第三预设次数。可参照上述实施例,不再赘述。

本发明实施例提供的更新企业数据的方法,通过合理地确定每个预设次数,更合理性地获取更新的企业数据。

在上述实施例的基础上,所述根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据的步骤之后,所述方法还包括:

分别计算被访问次数小于每一预设次数对应的每一企业类型的企业集合。

具体的,服务器分别计算被访问次数小于每一预设次数对应的每一企业类型的企业集合。参照上述实施例进行举例说明如下:对于第一企业类型(第一预设次数f1=20):第一企业类型的企业有a、b、c,其分别对应的被访问次数为25、22、19,则第一企业类型的企业集合为{c}。对于第二企业类型(第二预设次数f2=14):第二企业类型的企业有d、e、f,其分别对应的被访问次数为21、13、8,则第二企业类型的企业集合为{e、f}。对于第三企业类型(第三预设次数f3=12):第三企业类型的企业有g、h,其分别对应的被访问次数为16、9,则第三企业类型的企业集合为{h}。

将所述每一企业类型的企业集合组合,并将组合后的企业集合作为第二目标企业集合。

具体的,服务器将所述每一企业类型的企业集合组合,并将组合后的企业集合作为第二目标企业集合。参照上述实施例进行举例说明如下:组合后的企业集合(第二目标企业集合)cp2为{c、e、f、h}。

更新所述第二目标企业集合的数据。

具体的,服务器更新所述第二目标企业集合的数据。对上述组合后的企业集合(第二目标企业集合){c、e、f、h}进行数据更新。

本发明实施例提供的更新企业数据的方法,通过更新第二目标企业集合的数据,能够获取全面更新的企业数据。

在上述实施例的基础上,所述标识还包括企业名称;相应的,所述方法还包括:

将在所述预设时段内所有未被访问过的企业作为第三目标企业集合。

具体的,服务器将在所述预设时段内所有未被访问过的企业作为第三目标企业集合。举例说明如下:在上一个月份(预设时段)内未被访问过的企业为{i、j、k、l、m、n},则将{i、j、k、l、m、n}作为第三目标企业集合cp3。

根据所述第三目标企业集合的企业名称的排序,更新所述第三目标企业集合的数据。

具体的,服务器根据所述第三目标企业集合的企业名称的排序,更新所述第三目标企业集合的数据。可以按照企业名称对应的拼音首字母的排序,对第三目标企业集合的数据进行有序更新。

本发明实施例提供的更新企业数据的方法,通过更新第三目标企业集合的数据,进一步能够获取全面更新的企业数据。

在上述实施例的基础上,所述方法还包括:

在第一预设周期内更新所述第一目标企业集合的数据、所述第二目标企业集合的部分数据和所述第三目标企业集合的部分数据,以完成所述第一目标企业集合的全部企业数据的更新。

具体的,服务器若判断获知在第一预设周期内更新所述第一目标企业集合的数据、所述第二目标企业集合的部分数据和所述第三目标企业集合的部分数据,以完成所述第一目标企业集合的全部企业数据的更新。第一预设周期可以是上述预设时段(上一个月份)以后的当前月份的第一个星期,可以自主设置,但不作具体限定。第二目标企业集合的部分数据可以根据需要选择其中的一部分作为部分数据,为了保证后续每个星期处理数据数量的均衡,可以选择第二目标企业集合数据总量中的50%作为第二目标企业集合的部分数据。同理,第三目标企业集合的部分数据也可以选择第三目标企业集合数据总量中的50%作为第三目标企业集合的部分数据。

在下一个第一预设周期内重复更新所述第一目标企业集合的数据,再更新所述第二目标企业集合的另一部分数据和所述第三目标企业集合的另一部分数据,以完成所述第二目标企业集合的全部企业数据的更新。

具体的,服务器判断获知在下一个第一预设周期内重复更新所述第一目标企业集合的数据,再更新所述第二目标企业集合的另一部分数据和所述第三目标企业集合的另一部分数据,以完成所述第二目标企业集合的全部企业数据的更新。下一个第一预设周期可以理解为上述的当前月份的第一个星期后的第二个星期,由于第一目标企业集合的数据相对重要,因此还要再次重复更新,还可以根据需要选择第二目标企业集合中的另一部分数据(对应于上述第二目标企业集合的部分数据),可以选择第二目标企业集合数据总量中另外的50%作为第二目标企业集合的另一部分数据。同理,第三目标企业集合的部分数据也可以选择第三目标企业集合数据总量中另外的50%作为第三目标企业集合的另一部分数据,第三个星期和第四个星期进行重复以上第一个星期和第二个星期的过程。到下一个月份时,重新执行获取企业的标识和在预设时段内所述企业的被访问次数至上述实施例中已作说明的步骤。通过以上方法,在一个月中,每周都可以更新一遍被高频访问的企业数据,同时也能更新被中低频访问的一些企业和未被访问的一些企业数据,基本上每两周更新一次被中低频访问的企业数据,而未被访问的企业数据则每周只可以更新一部分,若本月未更新完毕,则下月继续更新。

本发明实施例提供的更新企业数据的方法,通过重复更新地获取企业数据,不仅能够保证重要企业数据获取的实时性,而且还能够保证次要企业数据获取的全面性,实现各种类型的企业数据更新的平衡性,极大地缩短了更新周期。

图2为本发明实施例更新企业数据的服务器结构示意图,如图2所示,本发明实施例提供了一种更新企业数据的服务器,包括第一获取模块1、第二获取模块2、第三获取模块3和更新模块4,其中:

第一获取模块1用于获取企业的标识和在预设时段内所述企业的被访问次数;第二获取模块2用于根据所述标识和第一预设规则,获取所述企业所属的企业类型;第三获取模块3用于根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;更新模块4用于根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

具体的,第一获取模块1用于获取企业的标识和在预设时段内所述企业的被访问次数;第二获取模块2用于根据所述标识和第一预设规则,获取所述企业所属的企业类型;第三获取模块3用于根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;更新模块4用于根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

本发明实施例提供的更新企业数据的服务器,能够及时获取更新的企业数据,并使得获取到的更新的企业数据更有针对性。

本发明实施例提供的更新企业数据的服务器具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。

图3为本发明实施例提供的服务器实体结构示意图,如图3所示,所述服务器包括:处理器(processor)301、存储器(memory)302和总线303;

其中,所述处理器301、存储器302通过总线303完成相互间的通信;

所述处理器301用于调用所述存储器302中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取企业的标识和在预设时段内所述企业的被访问次数;根据所述标识和第一预设规则,获取所述企业所属的企业类型;根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取企业的标识和在预设时段内所述企业的被访问次数;根据所述标识和第一预设规则,获取所述企业所属的企业类型;根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取企业的标识和在预设时段内所述企业的被访问次数;根据所述标识和第一预设规则,获取所述企业所属的企业类型;根据所述被访问次数和第二预设规则,获取每一企业类型对应的候选企业集合;根据所述候选企业集合获取第一目标企业集合,并更新所述第一目标企业集合的数据。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的服务器等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的实施例各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1