信息处理方法和装置与流程

文档序号:12063699阅读:243来源:国知局
信息处理方法和装置与流程

本发明涉及互联网技术,尤其是一种信息处理方法及装置。



背景技术:

随着经济发展速度不断加快,企业不会再选择单一的盈利模式,而是不断的转型来适应未来市场,导致企业间的竞争关系也日趋复杂。多变的竞争格局,跨行业竞争关系,随之出现。因此,如何在第一时间发现潜在的竞争对手,是企业的基本诉求。

传统的方法是通过人工的方式收集其他企业信息,对其他企业的产品、服务进行了解,以及对比自身企业的产品、服务,确认竞争关系。

然而,人工搜集的企业信息很有限,不足以判断该企业新增的业务方向;信息的及时性差,通常收集的是一些陈旧的信息;信息整合困难,仅是大量信息的简单堆砌,需要人工梳理才能联系在一起,耗时耗力。

针对相关技术中人工搜集竞争对手的信息量有限、信息及时性差以及整合难度大、耗时耗力的技术问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请实施例提供了一种信息处理方法和装置,以解决现有技术中人工搜集竞争对手的信息量有限、信息及时性差以及整合难度大、耗时耗力的技术问题。

根据本申请实施例的一个方面,提供了一种信息处理方法,该信息处理 方法包括:利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息,所述指定关键词包括所述指定品牌所属的行业、所述指定品牌所应用的产品名称和所述指定品牌所应用的服务名称中的一种或多种以及所述指定品牌的名称;在每一条所述指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的所述其他品牌与所述指定品牌生成对应的一个品牌组合;统计所生成的各个品牌组合的出现频次;根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。

进一步地,利用爬虫技术,通过指定关键词从互联网中的自媒体平台或/和搜索引擎抓取指定品牌的相关信息。

进一步地,在利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息之后,所述信息处理方法还包括:依据时间范围或/和地域范围对所述从互联网中抓取的指定品牌的相关信息进行筛选。

进一步地,在每一条所述指定品牌的相关信息中查找品牌库中的其他品牌,具体包括:获取与所述指定品牌对应的品牌库;在每一条所述指定品牌的相关信息中查找是否存在所述品牌库中的其他品牌。

进一步地,在根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌之后,所述信息处理方法还包括:排除所述指定品牌的竞争品牌中已知竞争品牌,以获取所述指定品牌的潜在竞争品牌。

根据本申请实施例的另一方面,还提供了一种信息处理装置,该信息处理装置包括:

爬取单元,用于利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息,所述指定关键词包括所述指定品牌所属的行业、所述指定品牌所应用的产品名称和所述指定品牌所应用的服务名称中的一种或多种以及所述指定品牌的名称;

存储单元,用于存储所述指定品牌的相关信息以及与所述指定品牌对应的品牌库;

处理单元,用于在每一条所述指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的所述其他品牌与所述指定品牌生成对应的一个品牌组合;

统计单元,用于统计所生成的各个品牌组合的出现频次;

解析单元,用于根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。

进一步地,所述爬取单元利用爬虫技术,通过指定关键词从互联网中的自媒体平台或/和搜索引擎抓取指定品牌的相关信息。

进一步地,所述存储单元还用于存储预设的时间范围或/和地域范围信息;所述处理单元还用于依据时间范围或/和地域范围对所述指定品牌的相关信息进行筛选。

进一步地,所述处理单元在每一条所述指定品牌的相关信息中查找品牌库中的其他品牌时包括:所述处理单元于所述存储单元中获取所述指定品牌的相关信息以及与所述指定品牌对应的品牌库;所述处理单元在每一条所述指定品牌的相关信息中查找是否存在所述品牌库中的其他品牌。

进一步地,所述存储单元还用于存储所述指定品牌的已知竞争品牌信息;所述信息处理装置还包括:筛选单元,用于排除所述指定品牌的竞争品牌中的已知竞争品牌,以获取所述指定品牌的潜在竞争品牌。

在本申请实施例中,先利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息;接着在每一条指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的其他品牌与指定品牌生成对应的一个品牌组合;再接着统计所生成的各个品牌组合的出现频次;最后根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。由于越来越多的企业倾向于采用互联网推广其产品和服务,互联网中信息更全面、及时,本信息处理方法从互联网中获取指定品牌的竞争品牌时,所获取竞争品牌的信息也更加准确;另外,该信息处理方法能够基于互联网中公开 的企业信息进行自动化搜索,竞争品牌的获取更加快速便捷,大大降低了获取竞争品牌信息的成本。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本发明一实施例中的信息处理方法的流程图;

图2为本发明一实施例中的信息处理装置的示意图;

图3为本发明另一实施例中的信息处理装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例,提供了一种信息处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1为本发明一实施例中的信息处理方法的流程图。图1中信息处理方法包括:

S102,利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息;

在S102中,所述指定关键词包括指定品牌所属的行业、指定品牌所应用的产品名称和指定品牌所应用的服务名称中的一种或多种以及指定品牌的名称。

S104,在每一条指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的其他品牌与指定品牌生成对应的一个品牌组合;

S106,统计所生成的各个品牌组合的出现频次;

S108,根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。

对于一个指定品牌,其可能提供多种产品或服务,而对于同一个指定品牌的不同产品或服务,其对应的竞争品牌也可能不同。因此,在S102中,除了将指定品牌的名称作为指定关键词,还将指定品牌所属的行业、指定品牌所应用的产品名称和指定品牌所应用的服务名称中的一种或多种作为指定关键词,从互联网中爬取指定品牌的相关信息。

现有互联网通常参照信息的重要程度和发布日期形成公布信息原则,依据公布信息原则公布信息,以方便用户从互联网中高效的抓取所需要的信息。考虑到后续操作的实现效率,在S102中,仅抓取预设条数的指定品牌的相关信息。而通常情况下,互联网中一个页面中包含信息条数固定,因此,在S102操作中,可以通过抓取预设个页面中的信息来抓取预设条数指定品牌 的相关信息。

例如,每个页面提供25条信息,而指定品牌的相关信息的预设条数为50条,则可以通过抓取两个页面中的信息来抓取50条指定品牌的相关信息。通常越重要、日期越近的信息在页面中显示越靠前,故S102中通常抓取前两个页面的信息。

对于一条指定品牌的相关信息,其除了包括指定品牌外,还可能包括一个以上指定品牌以外的其它品牌信息。因此,在S104中,由一条指定品牌的相关信息所形成的品牌组合可能为多组。例如,一条指定品牌的相关信息包括品牌A、品牌B和品牌C三种品牌,其中品牌A为指定品牌,则形成的品牌组合包括:品牌A品牌B、品牌B品牌C和品牌A品牌C。在通过本实施例中信息处理方法获取品牌A于某一产品或服务的竞争品牌时,需要分别统计品牌A品牌B和品牌A品牌C两个品牌组合的出现频次。至于品牌B品牌C的品牌组合,其可根据客户需要用于分析品牌B和品牌C之间的竞争关系。

对于所生成的品牌组合,其出现频次越高,说明越受到客户关注或者越受到推广企业的重视,因此出现频次的高低实际上反应了市场中品牌组合中两个品牌的竞争激烈程度。故在S106中对各个品牌组合的出现频次进行统计。然后,在S108中根据各个品牌组合的出现频次,获取指定品牌的竞争品牌。

本实施例中,先利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息;接着在每一条指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的其他品牌与指定品牌生成对应的一个品牌组合;再接着统计所生成的各个品牌组合的出现频次;最后根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。由于越来越多的企业倾向于采用互联网推广其产品和服务,互联网中信息更全面、及时,本信息处理方法从互联网中获取指定品牌的竞争品牌时,所获取竞争品 牌的信息也更加准确;另外,该信息处理方法能够基于互联网中公开的企业信息进行自动化搜索,竞争品牌的获取更加快速便捷,大大降低了获取竞争品牌信息的成本。

为了提高所获取竞争品牌的准确度,优选的,从互联网中自媒体平台和搜索引擎中抓取指定品牌的相关信息。具体的,自媒体平台可为微博(如新浪微博、腾讯微博等)、论坛(如中国电子信息技术论坛等),但不限于此。搜索引擎可为各个网络服务方提供的搜索引擎(如百度搜索引擎、谷歌搜索引擎等)。互联网中选择的自媒体平台和搜索引擎的个数可根据需要进行设定。

从互联网中的自媒体平台和搜索引擎抓取指定品牌的相关信息之后,可分别统计基于从自媒体平台和搜索引擎中抓取的指定品牌的相关信息生成的各个品牌组合的出现频次,然后将各个品牌组合的出现频次进行求和,并将所有的品牌组合根据出现频次的高低进行排序,从而根据各个品牌组合的出现频次,获取指定品牌的竞争品牌。

由于利用爬虫抓取企业公开在互联网上的营销信息以及消费者公开在自媒体平台上的评价信息,所获取竞争品牌的产品或/和服务信息更加全面,所获取竞争品牌更加准确,对竞争品牌的监控范围更大。

对于不同的产品或服务,其面向的消费群体不同。从不同的互联网平台中,所抓取指定品牌的相关信息的信息量也不同。例如,日用品、移动终端、家用电器等设备,其消费群体主要集中于普通人,普通人于自媒体平台中发布的评价信息相对于互联网上发布的营销信息更多。而对于交换机、动车等设备,其消费群体主要集中于企业,企业于自媒体平台中发布的评价信息相对于互联网上发布的营销信息更少。

考虑到上述因素,为了提高所获取竞争品牌的效率,对于消费群体为普通人的产品或服务,优选的,仅从互联网中的自媒体平台抓取指定品牌的相关信息;而对于消费群体为企业的产品或服务,优选的,仅从互联网中的搜 索引擎抓取指定品牌的相关信息。从而有效减少信息处理量,提高获取竞争品牌的效率,降低成本。

为了提高所获取竞争品牌的时效性,优选的,在利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息(即S102)之后,该信息处理方法还包括:依据时间范围对指定品牌的相关信息进行筛选;相应的,S104中在每一条指定品牌的相关信息中查找是否存在品牌库中的其他品牌具体为:针在筛选出的每一条指定品牌的相关信息中查找品牌库中的其他品牌,从而仅从预设的时间范围内的指定品牌的相关信息(例如,近一年内指定品牌的相关信息)中,查找每一条指定品牌的相关信息中包含的其他品牌,然后根据查找到的每一条记录生成对应的一个品牌组合,利于确定指定品牌在预设时间范围内的竞争品牌,提高所获取的竞争品牌的及时性。

不同产品或服务所销售的地域范围也不同,例如考虑到运输成本或人力成本等因素,某些品牌的产品仅于中国的一个区域销售。为了获取指定品牌的产品或服务于其销售区域的竞争品牌,优选的,在利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息(即S102)之后,该信息处理方法还包括:依据地域范围对指定品牌的相关信息进行筛选;相应的,S104中在每一条指定品牌的相关信息中查找品牌库中的其他品牌具体为:针对筛选出的指定品牌的相关信息,在每一条筛选出的指定品牌的相关信息中查找品牌库中的其他品牌。从而仅从预设的地域范围内(例如,销售区域在北京市范围内)的指定品牌的相关信息中,查找每一条指定品牌的相关信息中包含的其他品牌,然后根据查找到的每一条记录生成对应的一个品牌组合,利于确定指定品牌在预设地域范围内的竞争品牌,提高所获取的竞争品牌的准确性。

对于需同时考虑时效性和地域性的指定品牌,优选的,在利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息(即S102)之后,该信息处理方法还包括:依据时间范围和地域范围对指定品牌的相关信息进 行筛选;相应的,S104中在每一条指定品牌的相关信息中查找品牌库中的其他品牌具体为:针对筛选出的指定品牌的相关信息,查找每一条指定品牌的相关信息中包含的其他品牌。从而提高所获取竞争品牌的及时性和准确性。

另外,对于指定品牌的产品或者服务,其在销售量的研究过程中,通常能够直接获得对其具有较大竞争的竞争品牌(即已知竞争品牌)。为了获取潜在竞争品牌,以促进指定品牌的市场监控或业务调整,优选的,在根据各个品牌组合的出现频次,获取指定品牌的竞争品牌之后,该信息处理方法还包括:排除指定品牌的竞争品牌中已知竞争品牌,以获取指定品牌的潜在竞争品牌。从而使得指定品牌能够及时确定其潜在竞争品牌,提早进行市场布局或业务调整。

下面根据本申请实施例,提供了一种信息处理装置。

需要说明的是,根据本申请实施例的信息处理装置可以用于执行根据本申请实施例的信息处理方法,根据本申请实施例的信息处理方法也可以通过根据本申请实施例的信息处理装置来执行。

图2为本发明一实施例中的信息处理装置的示意图。图2中信息处理装置包括:

爬取单元202,用于利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息,所述指定关键词包括指定品牌所属的行业、指定品牌所应用的产品名称和指定品牌所应用的服务名称中的一种或多种以及指定品牌的名称;

存储单元204,用于存储所述指定品牌的相关信息以及与所述指定品牌对应的品牌库;

处理单元206,用于用于在每一条指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的其他品牌与指定品牌生成对应的一个品牌组合;

统计单元208,用于统计所生成的各个品牌组合的出现频次;

解析单元210,用于根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。

本实施例中,爬取单元202利用爬虫技术,通过指定关键词从互联网中的自媒体平台或/和搜索引擎抓取指定品牌的相关信息。与所述指定品牌对应的品牌库为指定品牌所属行业的品牌的集合。

由于越来越多的企业倾向于采用互联网推广其产品和服务,互联网中信息更全面、及时,本实施例中信息处理装置从互联网中获取指定品牌的竞争品牌时,所获取竞争品牌的信息也更加准确;另外,该信息处理装置能够基于互联网中公开的企业信息进行自动化搜索,竞争品牌的获取更加快速便捷,大大降低了获取竞争品牌信息的成本。

于本发明另一个实施例中,图2中存储单元204还用于存储预设的时间范围或/和地域范围信息;处理单元206还用于依据时间范围或/和地域范围对从互联网中抓取的指定品牌的相关信息进行筛选;处理单元206在每一条指定品牌的相关信息中查找是否存在品牌库中的其他品牌时包括:处理单元206于存储单元204中获取指定品牌的相关信息以及与指定品牌对应的品牌库;所述处理单元206在每一条所述指定品牌的相关信息中查找是否存在所述品牌库中的其他品牌。从而提高所获取竞争品牌的及时性或/和准确性。

图3为本发明另一实施例中的信息处理装置的示意图。与图2相比,图3中存储单元204还用于存储指定品牌的已知竞争品牌信息;信息处理装置还包括:筛选单元212,用于排除指定品牌的竞争品牌中的已知竞争品牌,以获取指定品牌的潜在竞争品牌。从而使得指定品牌能够及时确定其潜在竞争品牌,提早进行市场布局或业务调整。

所述信息处理装置包括处理器和存储器,上述爬取单元202、存储单元204、处理单元206、统计单元208、解析单元210和筛选单元212等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:利用爬虫技术,通过指定关键词从互联网中抓取指定品牌的相关信息,所述指定关键词包括所述指定品牌所属的行业、所述指定品牌所应用的产品名称和所述指定品牌所应用的服务名称中的一种或多种以及所述指定品牌的名称;在每一条所述指定品牌的相关信息中查找是否存在品牌库中的其他品牌,并在每次查找到其他品牌时,根据查找到的所述其他品牌与所述指定品牌生成对应的一个品牌组合;统计所生成的各个品牌组合的出现频次;根据各个品牌组合的出现频次,获取所述指定品牌的竞争品牌。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功 能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1