识别新商业伙伴的系统和方法

文档序号:6608417阅读:219来源:国知局
专利名称:识别新商业伙伴的系统和方法
技术领域
本发明涉及一种识别新商业伙伴的系统和方法。
背景技术
商业能够与成百上千的商业伙伴进行合作。这些商业伙伴可以是客户、供应商、或服务提供商,并且可以是公司或个人。这样的商业通常使用执行各种企业管理应用的计算机系统来管理他们的活动。在这些计算机系统中,商业产生存储例如关于其商业伙伴的信息的数据记录。例如,商业伙伴记录可以包括商业伙伴代码以及关于该商业伙伴的各种属性的数据。这样的商业伙伴记录可能被记录在所述应用所使用的内部商业伙伴数据库中。
在所述内部商业伙伴数据库中的数据的管理会涉及大量费用。商业可以有若干雇员代表来定期地(regularly)寻求(solicit)新的商业伙伴。这些工作中的一些可能是多余的。例如,一个雇员可能寻求到与伙伴的新的联系,并认为该伙伴是新的,但是实际上它已经被注册在内部商业伙伴数据库中。显然,如果商业在数据库中保存了代表同一商业伙伴的多个数据记录,则可能出现问题。但是,如果系统没有保存一个新的商业伙伴的新的伙伴记录,则可能出现另外的问题并造成收入损失。对于很大的实现来讲,系统用户必须花费相当可观的时间来确定新找到的商业伙伴是否涉及到已经保存在数据库中的已有的商业伙伴记录,或者该新找到的商业伙伴还没有存储在该数据库中的任何伙伴记录中。如果新找到的商业伙伴是“真是新的”,则应当在数据库中创建新的商业伙伴记录,并应当分配新的商业伙伴代码。
假定手动浏览巨大的商业伙伴记录数据库的费用很高,则本领域需要一种方法和系统,用于自动识别已有的商业伙伴,并从已有的商业伙伴中区分出新的商业伙伴。

发明内容
根据本发明的一个方面,提供一种用于识别商业伙伴的方法,包括接收第一实体的至少一个属性;比较所述第一实体的所述至少一个属性与先前存储在已有数据库中的第二实体的对应属性;计算所述第一实体和所述第二实体之间的差别率,并且如果所述差别率超过第一预定阈值,则将所述第一实体作为新商业伙伴进行存储。
根据本发明的另一个方面,提供一种用于识别商业伙伴的系统,包括存储器单元,用于临时存储第一实体的至少一个属性;已有数据库,用于存储第二实体的至少一个属性;和商业伙伴识别单元,用于比较所述第一实体的至少一个属性与所述第二实体的对应属性,并计算在所述第一实体和所述第二实体之间的差别率。
根据本发明的再一个方面,提供一种确定是否允许新数据记录进入数据库的方法,包括接收代表潜在的新的商业伙伴的数据,比较所接收的数据与先前存储的商业伙伴的数据记录,其中所述潜在的新的商业伙伴的数据和所述数据记录,每一个包括各组属性,并且其中当各个属性中的数据非空时,所述比较对来自所述接收的数据和所述数据记录的相似类型的属性进行比较;基于所述比较,确定在所接收的数据和至少一个所述记录之间是否存在相似性;并且如果所接收的数据与所有先前存储的数据记录不同,则将所接收的数据存储到数据库中。


图1例示了根据本发明的实施例的用于识别新的商业伙伴的系统的框图。
图2例示了根据本发明的实施例的用于识别新的商业伙伴的方法的流程图。
具体实施例方式
本发明提供了一种方法,用于确定被商业伙伴数据库的用户相信为新的、新找到的商业伙伴是否与已经保存在内部商业伙伴数据库中的已有商业伙伴记录匹配,或者新找到的商业伙伴可能真是新的,因此需要作为新的记录被存储到商业伙伴数据库中。关于新找到的商业伙伴的信息被存储在称为“资源池”(sourcing pool)的临时存储器中。商业伙伴识别单元比较存储在资源池中的信息与已经存储在商业伙伴数据库中的每个已有商业伙伴记录的信息,并计算它们之间的差别率(difference rate)。商业伙伴识别单元然后将该差别率与经验值进行比较。基于经验值,商业伙伴识别单元决定是否从资源池中将该信息自动导入数据库中。
图1例示了根据本发明的实施例的系统100的框图。系统100可以包括资源池101、商业伙伴识别单元102和商业伙伴数据库103。如图所示,资源池101可以临时存储关于新找到的商业伙伴的信息。商业伙伴数据库可以存储关于已经注册在系统中的已有商业伙伴的伙伴记录1031。商业伙伴识别单元102可以执行在资源池101中的数据与数据库103中的伙伴记录1031之间的比较,以确定资源池101中的信息是否可能代表新的商业伙伴。
如以下更加具体地讲,商业伙伴识别单元102可以比较资源池101中的信息与存储在商业伙伴数据库103中的每个已有的商业伙伴记录,并计算每次比较的差别率。商业伙伴识别单元102可以比较每次比较的差别率与阈值,由此来确定是否将资源池中的信息自动导入数据库103。
请注意,数据库103存储代表已有商业伙伴的信息的伙伴记录。伙伴记录可以包括诸如像商业伙伴代码的识别号码、联络信息等的数据。
在一个实施例中,资源池可以从自动的外部数据源接收关于新识别的商业伙伴的数据。示范的数据源可以包括例如因特网、搜索引擎、B2B网站、应用程序、文件或另一个数据库。在这个实施例中,系统100可以是一个全自治系统,其能够填充(populate)商业伙伴数据库103而人工监督(manualoversight)最少或没有人工监督。
图2例示了根据本发明的实施例的用于识别新的商业伙伴的方法200的流程图。在步骤201,商业伙伴识别单元102可以在资源池中采用关于新找到的商业伙伴的信息。从步骤202a、202b到202n,商业伙伴识别单元102在数据库103中搜索具有类似或相关于所采样的伙伴数据的信息的已有商业伙伴记录。在一个实施例中,在步骤202a,商业伙伴识别单元102可以识别在资源池中可用的最特有的(distinctive)识别信息(例如,邓氏(Data UniversalNumbering System)编号或纳税ID),并在数据库103中搜索对应项(correspondence)。如果来自数据库的已有商业伙伴记录匹配来自资源池101的特有识别符,则处理前进到方框203。否则,在步骤202b,商业伙伴识别单元102可以用在资源池101中可用的下一个最特有的识别信息(例如,伙伴的名称)在数据库103中进行搜索。同样,如果出现匹配,处理前进到方框203。否则,商业伙伴识别单元102可以用资源池101中的其它特有的识别信息(例如,电话号码、传真号码、网站地址、联络人、以注册的投资、和/或地址)在数据库103中搜索对应项。如果没有找到类似于资源池中的新识别的商业伙伴数据的已有商业伙伴记录,则在205,该资源池中的伙伴数据可以被分配商业伙伴代码并作为新的伙伴记录而被存储在数据库中。
在图2的实施例中,即使新找到的商业伙伴与内部数据库中的已有商业伙伴有相同的DUNS编号或相同的名称,商业伙伴识别单元不需要将它们自动看作同一个公司。取而代之的是,商业伙伴识别单元可以通过计算在资源池101中新找到的商业伙伴的采样数据与已有商业伙伴记录之间的差别率来验证DUNS编号的精确度,来证明(account for)在新找到的商业伙伴的DUNS编号或名称中的可能错误。在步骤202a到202n的搜索是为了在内部数据库103中寻找已有商业伙伴,以便将其与资源池中新找到的商业伙伴进行比较。
另一方面,如果数据库中的已有商业伙伴具有一些与新找到的商业伙伴的信息类似的信息,在步骤203,商业伙伴识别单元102可以计算两者之间的差别率。如表1所示,商业伙伴识别单元可以将商业伙伴的信息放到特定的序列中,并匹配新找到的商业伙伴与已有商业伙伴的信息。在方框203,商业伙伴识别单元比较新找到的商业伙伴与已有商业伙伴的相同类型的信息,即,公司名称与公司名称比较,行业与行业比较等。

表1在字段的基础上,值α表示在新识别的商业伙伴的采样数据的字段数据与已有商业伙伴记录的相应字段数据之间存在匹配的实例数量。例如,如果新找到的商业伙伴的公司名称匹配已有商业伙伴的公司名称,则α可以被分配值0(即,α=0)。否则,α=1。
在一个实施例中,不同的字段(例如,不同类型的伙伴信息)可以根据它们的特有性和/或重要性被分配不同的加权等级。例如,DUNS数据通常被认为是公司可用的最特有的识别信息,所以它的加权等级被设置为DIF=5。公司的行业通常可以被认为比DUNS编号的特有性低,因此可以被分配加权等级DIF=4。类似的,公司名称可以被分配加权等级DIF=3,地址数据被分配加权等级DIF=2,而电话和传真号码码被分配加权等级DIF=1。
这里给出的加权等级只是为了示例。应当理解可以使用不同的识别信息,例如,公司网站、联系人、注册的投资。此外,可以不同地分配加权等级DIF。
然后商业伙伴识别单元102可以计算两组商业伙伴数据之间的差别率。
在一个实施例中,根据以下公式计算差别率SigmaSigma=(Σ(DIF*α)2)...(1)]]>其中DIF代表加权等级,而α代表资源池中的新识别的商业伙伴的特定类型信息和数据库中的已有商业伙伴的特定类型信息是否相同。
在一个实施例中,数据库中的已有商业伙伴具有类似于新找到的商业伙伴的名称,如表2所示。

表2在这个例子中,可用于新找到的商业伙伴的唯一信息是它的名称,其类似于数据库中的已有商业伙伴。由于两个名字不是完全相同,所以α=1,并且公司名称的加权等级为3。因此,两个商业伙伴之间的差别率为Sigma=(Σ(DIF*α)2)=(Σ(3*1)2)=3]]>在这个实施例中,如果缺少特定类型的信息,则商业伙伴识别单元不需要考虑它。
在图3所示的例子中,新找到的商业伙伴具有与数据库中的已有商业伙伴相同的名称,但是两个商业伙伴具有不同的DUNS编号。

表3两个商业伙伴具有相同的公司名称,因此对于公司名称来说,α=0。公司名称的加权等级DIF=3。
两个商业伙伴具有不同的DUNS编号,因此对于DUNS编号来说,α=1。DUNS编号的加权等级为5。因此,两个商业伙伴之间的差别率为Sigma=(Σ(DIF*α)2)=(Σ(3*0)2,(5*1)2)=5]]>在表4所示的例子中,新找到的商业伙伴和数据库中的已有商业伙伴具有相同的行业、电话号码和传真号码,但是具有不同的名称和地址。

表4根据对表2和表3的相同的分析,两个公司的差比率为Sigma=(Σ(DIF*α)2)=(Σ(3*1)2,(4*0)2,(2*1)2,(1*0)2,(1*1)2)=3.74]]>应当理解,计算差别率的公式只是为了举例。可以使用其它类型的公式。
在步骤204,差别率可以与经验数值(empirical number)比较。在一个实施例中,经验数值为5。如果差别率不小于5,则两个商业伙伴被认为绝对不同,则在步骤205,新找到的商业伙伴被分配商业伙伴代码,并且其信息被自动导入数据库。如果差别率小于5,在步骤206,商业伙伴识别单元可以将两个商业伙伴的信息示出给商业伙伴数据库的用户,以便他可以自己看这些信息,并决定是否将资源池中的新识别的商业伙伴的信息导入数据库。
为了进一步支持用户的做决定,在一个实施例中,如果5>Sigma>3,商业伙伴识别单元可以将两个商业伙伴的信息示出给用户,并提示用户考虑资源池102中的数据是否应当被作为新商业伙伴而被保存到数据库103中。如果差别率不大于3,则商业伙伴识别单元判定两个商业伙伴可能是相同的,所以不需要将它们的信息示出给用户。
虽然以上参考一些实施例详细描述了本发明,但是在本发明的范围和精神内的各种变化对本领域技术人员来讲都是清楚的。例如,虽然以公司来描述实施例,但是所说的商业伙伴也可以是个人。如果商业伙伴是个人,则识别信息可以是它们的姓名、ID号码、职业等。
权利要求
1.一种用于识别商业伙伴的方法,包括接收第一实体的至少一个属性;比较所述第一实体的所述至少一个属性与先前存储在已有数据库中的第二实体的对应属性;计算所述第一实体和所述第二实体之间的差别率,并且如果所述差别率超过第一预定阈值,则将所述第一实体作为新商业伙伴进行存储。
2.如权利要求1所述的方法,还包括给所述至少一个属性分配加权等级。
3.如权利要求2所述的方法,其中用所述至少一个属性的加权等级来计算所述差别率。
4.如权利要求2所述的方法,其中所述至少一个属性是公司的邓氏(DataUniversal Numbering System,DUNS)编号。
5.如权利要求2所述的方法,其中所述至少一个属性是个人的识别号码。
6.如权利要求2所述的方法,其中所述第一预定阈值是经验值。
7.如权利要求2所述的方法,还包括在差别率在所述第一预定阈值和第二预定阈值之间时,将所述第一和第二实体的属性呈现给已有数据库的用户,以使用户能够决定所述第一实体是否是新的商业伙伴。
8.一种用于识别商业伙伴的系统,包括存储器单元,用于临时存储第一实体的至少一个属性;已有数据库,用于存储第二实体的至少一个属性;和商业伙伴识别单元,用于比较所述第一实体的至少一个属性与所述第二实体的对应属性,并计算在所述第一实体和所述第二实体之间的差别率。
9.如权利要求8所述的系统,其中所述商业伙伴识别单元还分配加权等级给所述至少一个属性。
10.如权利要求9所述的系统,其中所述商业伙伴识别单元用所述至少一个属性的加权等级来计算所述差比率。
11.如权利要求9所述的系统,其中所述商业伙伴识别单元还比较所述差别率和经验值。
12.如权利要求11所述的系统,其中所述商业伙伴识别单元还在所述差别率和所述经验值满足第一要求时,确定所述第一实体是新的商业伙伴。
13.如权利要求12所述的系统,其中如果所述第一实体是新的商业伙伴,则所述商业伙伴识别单元还将其保存到已有数据库中。
14.如权利要求11所述的系统,其中所述商业伙伴识别单元还在所述差别率和所述经验值满足第二要求时,确定所述第一实体不是新的商业伙伴。
15.如权利要求11所述的系统,其中所述商业伙伴识别单元还将所述第一和第二实体的属性呈现给用户,以使用户能够决定所述第一实体是否是新的商业伙伴。
16.一种确定是否允许新数据记录进入数据库的方法,包括接收代表潜在的新的商业伙伴的数据,比较所接收的数据与先前存储的商业伙伴的数据记录,其中所述潜在的新的商业伙伴的数据和所述数据记录,每一个包括各自的属性集,并且其中当各个属性中的数据非空时,所述比较对来自所述接收的数据和所述数据记录的相似类型的属性进行比较;基于所述比较,确定在所接收的数据和至少一个所述记录之间是否存在相似性;并且如果所接收的数据与所有先前存储的数据记录不同,则将所接收的数据存储到数据库中。
17.如权利要求16所述的方法,还包括在将所接收的数据存储到所述数据库中时,给所接收的数据分配新的商业伙伴代码。
18.如权利要求16所述的方法,还包括给属性分配加权等级。
19.如权利要求18所述的方法,其中通过以下面的等式计算差别率来确定所述相似性(Σ(DIF*α)2),]]>其中DIF为属性的加权等级,并且当潜在的新的商业伙伴的属性不同于先前存储的数据记录的相似类型的属性时,α=1。
20.如权利要求19所述的方法,其中如果所述差别率超过了预定阈值,则所接收的数据不同于先前存储的数据记录。
全文摘要
一种用于在将由外部资源新找到的商业伙伴的信息输入内部数据库之前,确定新找到的商业伙伴是否与保存在内部数据库中的已有商业伙伴相同的方法。关于来自外部资源的新找到的商业伙伴的信息被临时存储在资源池中。商业伙伴识别单元比较新找到的商业伙伴的信息与存储在内部数据库中的已有商业伙伴的信息,并计算差别率。然后商业伙伴识别单元比较差别率与经验值。根据在差别率与经验值之间的关系,商业伙伴识别单元决定是否将关于新找到的商业伙伴的信息导入数据库中。
文档编号G06F17/30GK101046874SQ20071009212
公开日2007年10月3日 申请日期2007年4月2日 优先权日2006年3月31日
发明者陈方宁, 徐天 申请人:Sap股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1