用于监视公司的方法及装置的制作方法

文档序号:6360706阅读:149来源:国知局
专利名称:用于监视公司的方法及装置的制作方法
用于监视公司的方法及装置技术领域
本发明是一种用于匹配和找到两个或更多个企业之间相似性与特征并且还发现 企业的变化的全新方法。该方法使用针对企业的数学表示式模型并且非常适合于针对计算 机程序自动地进行大量的比较。本发明的市场是本地企业和全球企业,这些本地企业和全 球企业希望找到新的客户、合作伙伴、经销商或其他商务联系人并且还发现它们的客户、合 作伙伴或其他商务联系人中的变化,使得他们能够获得将对关系有重大影响的较大变化的 预警。例如,预警可以是你的一些客户陷入财务困难,其导致你希望以不同的方式处理付 款。本发明将适用于所有规模的企业和他们的员工。企业可以是国有的或个人的。本发明 经由互联网上的门户网站被提供给用户。
背景技术
如今为找到具有一定特征集合(例如与另一个企业的相似性)的其他公司或者发 现变化的传统方法通常是非常手动的,并且包括查找多个信息源以及其中你必须亲自进行 手动比较。典型的情况是
目录中的条目
当今,存在许多目录服务项目,一个人能够从中找到企业的名称、地址、电话号码 等。这些目录服务项目中的一些还具有根据行业类型进行排序和编目的能力。这些服务 项目的例子有Yellow Pages (黄页)、1881、Kompass (康帕斯)、Your District (你的区 域)、Su_a (胜马),等等。针对这些的典型情况是它们基于公共注册机构(register)(例 如,来自Br0nn0ysund中的挪威商业注册机构)。这些目录服务项目通常缺乏特征(产品、服务项目、市场、规模、财务、...)的详细说明。还存在许多针对纯粹金融条目的目录服 务项目,所述纯粹金融条目倾向于依赖已递交的账目。这些目录服务项目的例子有例如 Purehelp. no 和 Proff. no。
这些目录检索所带来的许多挑战是相对耗时并且在寻找它们以及将它们进行比 较时需要大量的手工劳动。此外,这些目录服务项目通常缺乏与企业的特征有关的必要细 节,这意味着一个企业无法发现在其之后是什么企业。对于非常多的企业,这导致的结果是 他们很少进行系统的搜索,因为太耗费资源。
可以利用互联网搜索引擎(例如G00gle、Bing等)来根据关键字通过搜索来查阅 和搜索具有一定特征集合的企业。此处的优势是与目录搜索相比,一个企业可以进行更 详细地搜索,因为互联网搜索引擎通常已经对企业的所有网页编入索引。此外,此处的挑战 是通常获得如此多的命中(hits),以致这些命中被认为是噪声并且将它们区分开是非常 耗时的。另一个巨大的挑战是通常无法同时针对太多特征进行搜索,因为使用的词的组 合出现在企业的网页上的可能性是很小的。这通常导致失去许多命中,因为企业很可能已 经使用其他的词而不是你所使用的关键字组合来描述它的特征。同时,它们缺乏与财务、规 模、行业类别有关的信息,这意味着你以后必须尝试目录。这也是一个非常耗时并且手动的 过程。
展览会和展示会
通常而言,这已经成为了一种用于找到新的客户、合作伙伴或其他商务联系人的 场所。如果一个公司是展出者,那么经过的人将看到你正在做什么并且与你联系。或者,你 可以自己在附近徘徊去看看其他人正在做什么,以便如果他们具有合适的特征而与他们联 系。这也是非常人工并且耗时的,同时能从现有的这些人中进行选择。如今,企业将观察许 多行业类型中的趋势,这是通过搜索引擎由互联网上的可见性(visibility)以及人工搜 索所代替。
市场营销
这是另一种用于找到新的客户、合作伙伴或其他商务联系人的传统手段。例如,一 个公司尝试通过市场营销(例如,广告)的方式,以寻找具有相同期望特征的其他公司。然 后,这些公司将联系你并且你可以自己判断他们是否具有所期望的特征。这种做法的挑战 是其通常非常昂贵。
社交媒体
如今,存在许多针对个人的约会门户网站,其中,一个人能够通过许多问题描述 他自己并且随后获得与你相匹配的其他人的自动建议,因为他们同样已经答复了相同的 问题。这些匹配方法通常基于编入其中的一套“人工规则”。此处的挑战是每一个人 都必须首先已经答复了问题,并且在很小程度上存在具有他们具有的所有特征的企业。 US2003/0131120中描述了这样的方案。
发现企业的特征的变化
当今,通过任何其他方式而不是如以上所述的人工搜索来发现企业的特征中的变 化的方法很少。例外的情况是在纯粹的财务监控中,其中存在将最近递交的账目与以前递 交的账目进行比较的程序。这样,你可以订阅服务项目,如果一个企业不再是有信誉价值的 等,那么所述服务项目将给你警告。利用该服务的挑战是它仅针对财务特征并且它们通常 有点旧,其中对于许多企业而言,账目通常是每年被递交的。US2009/0327914a中描述了一 种用于检测与互联网网页有关的信息中的变化的系统。发明内容
基于当今可用的用于找到具有给定的特征集合的企业的不同方法,本发明包含一 种全新的方法,其能够通过使用数学模型来匹配并且找到具有所需特征的企业,该数学模 型非常适合于在两个或多个企业之间进行自动匹配。同一个模型还提供了更容易发现变化 的可能性,并且从而借助于企业的特征的变化,有助于检测新的客户、合作伙伴、竞争者或 其他商务联系人或者基于针对其他企业在市场和产品方面的变化的趋势来检测新的市场。
因此,本发明的目的是通过上文所给出的并且其特征如独立权利要求中所描述的 方法和系统来实现的。
总之,由此实现了一种用于通过利用数学模型对企业进行匹配并且针对企业的变 化进行检测的方法和系统,该数学模型使得在企业之间匹配并且找到相似性以及还发现企 业的变化成为可能。该方法使用针对企业的数学表示模型,并且适合于自动地进行大量的 比较。企业的特征是由不同的向量(74)来表示的。
向量的方向和长度是通过在这些向量(76)之间取标量积来进行比较的。企业的特征的变化来自于向量在方向和长度上的变化。通过连续地监视企业的特征的导数 (derivative),这显示了已经发生多大和多迅速的变化(78)。本发明的市场是本地企业和 全球企业,这些本地企业和全球企业希望找到新的客户、合作伙伴、经销商或其他商务联系 人并且还发现他们的客户、合作伙伴或其他商务联系人中的变化,使得他们能够获得将对 关系有重大影响的较大变化的预警。


下面结合借助于实例描述本发明的附图,将详细地描述本发明。
图1为包含本发明的系统的概况;
图2阐明了用于对来自不同的源的信息进行搜索和比较的方法;
图3为一种针对企业的产品特征的实例。所述实例是一个企业,所述企业制作用 于针对挪威存档标准(NOARK)处理JAVA形式的文档的软件并且正在托管中;
图4示例了在两个企业的特征之间进行数学比较;
图5示例了企业的特征中的数学变化。
必要的手段
本发明在新的组合中采用向量数学,以表示借助于搜索引擎技术所收集的与企业 有关的信息。
工业实用性
本发明可以导致一种在两个或多个企业之间匹配并且找到相似性以及还发现企 业的变化的全新方法。与正被用于获得新的业务的方法相比而言,这意味着显著地节约成 本。当今存在非常多的人工并且耗时的方法,其现在可以被系统并且自动的方法所替代。
具体实施方式
基于以上所述,需要一种能在两个或多个企业之间进行匹配并且找到相似性和特 征以及还发现企业的变化的更有效率的方法。上述提及的问题通过在下文中描述的本发明 而得以解决。
本发明是通过利用数学模型和社交媒体的结合,以数据库、高级搜索与匹配技术 的使用为基础的。从图1开始,本发明包括服务器群(server farm),所述服务器群包括用 于爬网程序(Crawler) (80)、搜索与匹配(70)、数据库(60)、社交媒体(social media) (50) 和网页服务器(40)的服务器。爬网程序(80)的目的起初是读取所有的信息源(90、100、 110、120、130、140),并且其中,搜索与匹配(70)将制作每一个企业的特征的数学模型。此 后,爬网程序(80)将不断地读取所有的信息源(90、100、110、120、130、140)以得到变化和 更新。这些改变和更新对数学模型进行调整,并且这些变化和更新被存储在数据库(60) 中。
信息源(90、100、110、120、130、140)包括企业的网页(90),企业的网页以与从标 准搜索引擎相同的方式被抓取(crawled)。公共注册机构(Public register) (100)和财 务注册机构(Financial register) (110)都是针对地址、联系人和财务信息(诸如账目数 据和信用信息)的可访问的注册机构。这些注册机构中的一些注册机构是公用的,而这些 注册机构中的其他注册机构可以是私有的并且必须购买访问权。在每个信息源(100、110)内可能存在数个注册机构。用户(120)可以是对某一公司提供反馈意见的其他的企业、员 工或者个人。新闻(130)包括新闻流,新闻流利用来自报纸、杂志、广播、电视、团体、地方政 府、董事会、政党等的新闻而被不断地更新。该服务通过市场中可用的第三方供应商(例 如,MoreOver> Retriever、Cyberwatcher 等)被交付。
以与新闻(30)相同的方式,任何人还将获得来自第三方供应商交付的论坛、博 客、社交网络(140)的一连串的新闻。本发明的用户(10、20、30)将通过互联网门户网站 (internet portal)来实现本发明,该互联网门户网站可经由网页服务器(40)提供。当数 据库(60)已经接收来自除了用户(120)以外的信息源(90、100、110、130、140)的所有信息 时,在途中的来自用户(120)的信息将在使用本发明时到达,所有的用户(10、20)将(从来 自企业的网页(90)和/或公共注册机构(100)的电子邮件地址)接收到个性化的电子邮 件。该电子邮件链接到企业的简档(profile),该企业的简档被事先建立并且能够使你在一 些点击的过程中变成一个用户。作为本发明的用户,你现在可以邀请你的客户、合作伙伴或 者其他商务联系人成为你已经建立的客户群、合作伙伴群或其他群的一部分。在针对个人 的其他社交媒体中可以相同的方式进行处理。这样你就建立了你的商务联系人的网络。本 发明的独特的特性之一是利用所有这些来自所有的信息源(90、100、110、120、130、140) 的信息,你的网络能够自动地推荐与你的需求相匹配的新的客户、合作伙伴或其他商务联 系人,该网络是你已经通过社交媒体(50)并且利用搜索与匹配(70)和数据库(60)的结合 来建立的。
在图2、图3、图4和图5中描述了本发明的搜索与匹配方法和装置,下文将对这些 附图进行描述。在图2中,搜索与匹配概述是与来自爬网程序(80)的企业有关的信息。根 据该信息来自哪里以及它是哪种类型来对其进行分类(72)。它可以是与企业所处位置、它 们在哪个行业类型/市场中运营、它们提供的哪种类型的产品和服务项目、机构/财务或者 其他类别有关的信息。现在被分类(72)的这些特征中的每一个现在都借助于它自己的向 量被数学上地表示,向量在多维空间(74)中具有方向和长度。通过采用两个向量(76)之 间的标量积来比较方向和长度,企业的特征现在能够而被容易地进行比较。在图3 (企业的 特征的数学表示)中,我们看到如何建立这样的特征向量。
图3示出了企业的产品特征的一个示例。该图示出了描述产品的每一个词是如何 使用它自己的向量(74a、74b、74c、74d、74e)来表示的。独特的词(unique words)(部分特 征)的每一个在多维空间(在该图中仅示例了三维)中具有它自己的方向。这些部分向量 (74a、74b、74c、74d、74e)中的每一个向量的长度都取决于每一个词是如何独特的。具有最 大的独特性的词(部分特征)为最长长度的向量。
在图3中,我们看到N0ARK(17a)是最长的向量,因为这是最独特的词。为了保持每 一个词(部分特征)的独特程度的顺序,制作自适应的词表(adaptive wordlist) (74g),其 针对所有的企业将来自所有的信息源(图1中的90-140)的被抓取的所有的词进行排列。 该自适应的词表(74g)针对所有的企业对词(部分特征)出现的次数进行统计。差异与出 现的次数成反比例。出现次数最少的词(部分特征)是最独特的。在自适应的词表(74g) 中,我们看到NOARK由于10是最独特的,而软件(software)是最不独特的,其具有相对值2。除了词的独特性外,还对某个企业内词的出现次数进行统计。如果出现很多次,那么向 量的长度也增大。如果词在文本的更中心处,例如在标题中或者具有特大号的字母,那么这可以被给予额外的重要性,使得向量还可以增大它的长度。还可以将几个词组合在某一个 向量中。这意味着在现实中一个向量能获得几个更多的方向,但是原理是相同的。为了对 企业的特征进行数学表示,将所有的部分特征向量(74a、74b、74c、74d、74e)相加,以给出 合成向量(74f),合成向量(74f)是所有其他向量的和。合成向量(74f)是企业的特征的指 纹或数学表示。还可以对几个特征进行组合,以针对特征的组合制作新的指纹。例如,可以 将所有的不同特征向量(74)(例如,针对产品、市场、机构/财务或其他相关的特征)加在 一起,成为针对整个企业的主向量。
在图4 (两个企业的特征之间的数学比较)中,示出了两个企业如何被它们自己的 向量a(76a)和b(76b)表示,以及利用图4中的数学公式(76d)通过采用所示的向量之间的 标量积进行比较。标量积是针对向量的方向(向量之间的角度)和长度的表示。指向同一 方向并且相对地具有相同的长度的两个企业的特征是具有相同特征的两个企业。通过搜索 企业并且在它们之间进行匹配,利用被转化为0-100 %的表示式所给出的相似性对应于来 自标量积的结果。这使用户能够更容易地读取两个企业彼此之间的相似程度。在图3中, 我们看到企业的特征是如何借助于数学向量被表示的。
图5示出了企业的特征的变化,其中向量发生了变化。该变化以长度和/或方向 变化的形式发生。通过考虑企业的特征(向量)的“导数”(derivative),可以看到变化的程度。
由于图1中的信息源(90-140)被连续地读取,并且相关的向量被连续地被计算, 因此所有的变化将会企业特征的方向和长度产生影响。通过连续地跟踪这些变化有多快和 有多大,这将反映出该变化的本质。这是通过连续地对企业的特征“求导数”或者测量向量 的变化有多大来执行的。这在图5中示出了,在图5中,下面的虚线(78b)给出的方向和长 度或者由上面的虚线(78a)给出的方向和长度给出了向量a (78c)在长度和方向上的变化。 偏差(78c)的幅值是由向量的导数给出的,并且是对于一个企业的变化有多大的表示。例 如,该变化可以是企业发布新产品,改变财务状况,改变市场或地点或者其他的变化。如果 这些变化涉及到你已经放入到你的社交网络(50)中某些合作伙伴、客户或其他商务联系 人,那么你将能够接收到有关他们的预警。这样,你可以非常迅速地动态地获得有关变化的 提示,并且如果这是需要的,那么你能够采取行动。
概括而言,本发明涉及一种用于通过使用数学模型对企业进行匹配并且针对企业 的变化进行检测的方法和装置,数学模型使在企业之间匹配并且找到相似性以及还发现企 业的变化成为可能。优选地,方法和装置可以包括
a)通过搜索引擎技术来收集企业信息的组合,并且借助于通过信息的数学分析所 开发的向量数学表示企业的特征。总的来说,该分析可以通过已知的多变量分析的方案来 实现。
b)所述搜索引擎不断地读取企业的网页(90)、公共企业注册机构(100)、财务注 册机构(110)、新闻(130)、论坛(140)、博客(140)、社交网络(50)和来自用户(120)的反馈。信息可以被存储,用于更久的保存或直接进一步处理。
c)在分类单元中,将所搜集和存储的信息分类(72)成在区域(例如地点)、行业 类别、市场、产品、服务项目、机构、财务或其他的相关类别之内的特征,所述区域、行业类 别、市场、产品、服务项目、机构、财务或其他的相关类别可以取决于系统被限定并且包含企业的操作的常见指示器。
d)在计算单元中,对所搜集的信息进行分析,以提供表示企业的特征(74)的数学向量。
e)通过计算企业的特征向量之间的标量积并且对特征向量的方向和长度进行比较,从而可以在比较单元中对不同的企业进行比较。
在本发明的优选实施例中,还可以包括企业的特征的变化可以被表示为具有速度、长度和方向的特征向量(78)的变化。
本方法和布置进一步包括企业的特征可以被表示为多维空间中的向量(74),其中每一个方向表示独特的词(部分特征)。企业的特征向量可以包括每一个部分特征的和, 所述每一个部分特征包含由一个或多个独特的词或合成物(74f)表示的向量。
部分特征向量(74a)例如可以具有长度,所述长度与由自适应的词表(74g)所给出的所有词的出现成反比并且与企业内的出现、位置、大小或在企业内的含义成正比。
由于特殊领域的分析的结果或者用户或操作者的直接选择,不同的词还可以被给予不同的权重。例如,通过采用标量积(76d)来进行一个或多个企业之间的比较,标量积 (76d)被转换为0-100%之间的可读值。
企业的变化被表示为企业的特征向量在方向和长度上的变化,企业的变化由有关向量(78)的导数来创建。因此,与起始点相关的变化的大小和方向还可以作为特征被包含在分析中。企业的向量的变化能够导致预警,预警被作为消息发送给用户。如果向量变化例如通过对企业的经济变化、市场趋势和市场变化的状态进行检查来反映针对企业的正方向或负方向,这可能是特别有用的。
企业的向量优选地是基于来自论坛、博客、社交网络(140)、新闻(130)或用户 (120)的信息的,并且能够通过与已定义的正向量或负向量进行比较来为企业的产品、服务项目和品牌状态以及它在正方向或负方向上的发展提供现场指示。
企业的特征通过存储在数据库¢0)中而表示为具有归一化长度的向量,并且长度本身在比较时被自动地计算出,以自始自终反映自适应的词表(74g),自适应的词表 (74g)通过抓取信息源(90-140)被一直更新。企业向量可以包括企业的一个或多个特征向量(74)。
企业(优选地,为网络的成员)可以因为其他优先级而否决由自适应的词表(74g) 给出的向量的长度,其他优先级对于企业是重要的,例如竞选、策略变化、可见性或其他商业原因。
企业匹配可以将向量比较和几个其他参数(例如,规程、外界影响、策略或对企业或它的外界有意义的其他愿望)进行组合。其还可以局限于系统的成员,使得它们能够控制在网络中被使用的标准。系统还可以被建立,使得具有相对地同一方向和长度的企业的向量能够自动地构成群,群包括具有许多共同特点的企业。这可以导致群中的企业之间的进行接触的建议,或者这可以被用作针对其他企业进行评估的标准,例如,关于与他们中的一个或多个可能进行合作。
权利要求
1.一种用于通过使用数学模型对企业进行匹配并且针对企业的变化进行检测的方法,所述数学模型使得在企业之间匹配并且找到相似性以及还发现企业的变化成为可能, 其特征在于,所述方法包括以下步骤 a)通过搜索引擎技术来收集与企业有关的信息的组合,并且其中,所述企业的特征是借助于向量数学来表示的; b)所述搜索引擎不断地读取企业的网页(90)、公共企业注册机构(100)、财务注册机构(110)、新闻(130)、论坛(140)、博客(140)、社交网络(50)和来自用户(120)的反馈; c)并且其中,所述信息被分类(72)成地点、行业类别、销售额、产品、服务项目、机构、财务或其他的相关类别之内的特征; d)将这些特征转化成数学向量,所述数学向量表示所述企业的特征(74);以及 e)通过比较所述企业的特征向量之间的标量积(76)来对企业进行比较。
2.根据权利要求1所述的方法,其中,企业的特征的变化被表示为具有速度、长度和方向的特征向量(78)的变化。
3.根据权利要求1所述的方法,其中,企业的特征被表示为多维空间中的向量(74),其中,每一个方向表示独特的词(部分特征)。
4.根据权利要求3所述的方法,其中,企业的特征向量包括每一个部分特征之和,所述每一个部分特征包含由一个或多个独特的词或合成物(74f)表示的向量。
5.根据权利要求4所述的方法,其中,部分特征向量(74a)具有长度,所述长度与由自适应的词表(74g)所给出的所有词的出现成反比并且与企业内的出现、位置、大小或含义成正比。
6.根据权利要求1所述的方法,其中,一个或多个企业之间的比较是通过采用标量积(76d)来进行的,所述标量积(76d)被转换为0-100%之间的可读值。
7.根据权利要求1所述的方法,其中,企业的变化被表示为企业的特征向量在方向和长度上的变化,所述企业的变化由有关向量(78)的导数来创建。
8.根据权利要求1所述的方法,其中,企业的特征被通过存储在数据库¢0)中而表示为具有归一化长度的向量,并且所述长度本身在比较时被自动地计算出,以自始自终反映自适应的词表(74g),所述自适应的词表(74g)通过抓取信息源(90-140)被一直更新。
9.根据权利要求1所述的方法,其中,企业向量可以包括企业的一个或多个特征向量(74)。
10.根据权利要求1所述的方法,其中,企业可以因为其他优先级而否决由自适应的词表(74g)给出的向量的长度,所述其他优先级对于所述企业是重要的,例如竞选、策略变化、可见性或其他商业原因。
11.根据权利要求1所述的方法,其中,企业匹配可以将向量比较和几个其他参数进行组合,所述几个其他参数例如是规程、外界影响、策略或对所述企业或其环境重要的愿望。
12.根据权利要求1所述的方法,其中,企业向量的变化可以导致预警,所述预警作为消息发送给用户。
13.根据权利要求1所述的方法,其中,具有相对地同一方向和长度的企业向量可以自动地构成群,所述群包括具有许多共同特点的企业。
14.根据权利要求1所述的方法,其中,企业的向量的变化可以检测市场趋势和市场变化。
15.根据权利要求1所述的方法,其中,企业的向量的变化可以检测企业的正方向或负方向。
16.根据权利要求1所述的方法,其中,企业的向量的变化可以检测新的客户、合作伙伴、竞争者或其他商务联系人。
17.根据权利要求1所述的方法,其中,企业的向量的变化可以基于其他企业在市场和产品方面的变化中的趋势来检测新的市场。
18.根据权利要求1所述的方法,其中,基于来自论坛、博客、社交网络(140)、新闻(130)或用户(120)的信息的企业的向量可以通过与已定义的正向量或负向量进行比较来为企业的产品、服务项目和品牌状态以及它在正方向或负方向上的发展提供现场指示。
19.一种用于通过使用数学模型来对企业进行匹配并且针对企业的变化进行检测的系统,所述数学模型使在企业之间匹配和找到相似性并且还发现企业的变化成为可能, 其特征在于,所述系统包括 a)搜索引擎,其连接到为收集企业信息而建立的网络上; b)所述搜索引擎被建立,以大体上不断地读取企业的网页(90)、公共企业注册机构(100)、财务注册机构(110)、新闻(130)、论坛(140)、博客(140)、社交网络(50)和来自用户(120)的反馈; c)分类单元,其被建立以用于将由所述搜索引擎所收集的信息在地点、行业类别、市场、产品、服务项目、机构、财务或其他相关的类别内进行分类; d)计算单元,其被建立以用于将经分类的信息制作成数学向量,所述数学向量表示企业的特征(74); e)比较单元,其用于通过采用所述企业的特征向量之间的标量积(76)来对存储在存储器中的所述企业进行比较。
20.根据权利要求19所述的系统,其中,企业的特征的变化被表示为具有速度、长度和方向的特征向量(78)的变化。
全文摘要
本申请公开了一种用于通过使用数学模型对企业进行匹配并且针对企业的变化进行检测的方法和装置,所述数学模型使得在企业之间匹配和找到相似性并且还发现企业的变化成为可能。该方法使用针对企业的数学表示式模型并且适合于自动地进行大量的比较。企业的特征是由不同的向量(74)来表示的。向量的方向和长度是通过在它们(76)之间取标量积来进行比较的。通过连续地监视企业的特征的导数,这显示了已经出现多大和多迅速的变化(78)。本发明的市场是本地企业和全球企业,这些本地企业和全球企业希望找到新的客户、合作伙伴、经销商或其他商务联系人并且还发现他们的客户、合作伙伴或其他商务联系人中的变化,使得他们能够获得将对关系有重大影响的较大变化的预警。
文档编号G06Q10/00GK103026373SQ201180026082
公开日2013年4月3日 申请日期2011年3月29日 优先权日2010年3月29日
发明者哈拉尔德·杰卢姆 申请人:图书有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1