确定词组关联度的方法、品牌竞争度的方法及其装置与流程

文档序号:12034596阅读:180来源:国知局
确定词组关联度的方法、品牌竞争度的方法及其装置与流程
本申请涉及互联网
技术领域
,尤其涉及确定词组关联度的方法、品牌竞争度的方法及其装置。
背景技术
:目前,在一些实际应用场景中,用户需要获取与已有词组关联度较高的同类词组,现有技术获取的方法通常是:根据已有词组的相关特性,并通过人为调研或经验,获取具有该相关特性或与该相关特性相似的其他特性的同类词组,则该同类词组被认为是与该已有词组关联度较高的词组。例如,用户想要获取与品牌“苹果”有竞争力的其他手机品牌,根据经验可认为“三星”等品牌是与“苹果”具有竞争力的手机品牌。上述现有技术,有时的确可以帮助用户快速的获取与已有词组关联度较高的同类词组,但是在实际应用中,同一词组在不同的地域,甚至同一词组在同一地域的不同时间段中,与该词组关联度较高的同类词组可能不相同,而现有技术通过人为调研或经验等方式,无法精确的获取在不同地域或不同时间段中与已有词组关联度较高的同类词组。技术实现要素:鉴于上述问题,本申请实施例提供一种确定词组关联度的方法,用于解决现有技术中无法精确的获取在不同地域或不同时段中与已有信息关联度较高的其他信息的问题。一种确定词组关联度的方法,该方法包括:从用户互联网操作行为数据中获取用户对第一词组和第二词组所指向的 内容的操作行为数据,所述操作行为数据包括所述用户对所述第一词组以及所述第二词组所指向的内容执行操作时的时间信息;从所述获取的操作行为数据中筛选出相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据;根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。优选地,所述操作行为数据还包括所述用户对所述第一词组以及所述第二词组所指向的内容执行操作时的地域信息,则所述方法具体包括:从用户互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操作行为数据;从所述获取的操作行为数据中筛选出在相同地域、相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据;根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。优选地,所述方法还包括:构建词库,所述词库包含所述第一词组及与所述第一词组具有相同含义的词组集合,以及所述词库包含所述第二词组及与所述第二词组具有相同含义的词组集合,则所述获取用户对第一词组和第二词组所指向的内容的操作行为数据具体包括:根据所述词库中包含的所述第一词组及与所述第一词组具有相同含义的词组集合获取所述第一词组所指向内容的操作行为数据,以及根据所述词库中包含的所述第二词组及与所述第二词组具有相同含义的词组集合获取所述第二词组所指向内容的操作行为数据。优选地,所述根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度具体包括:根据所述获取的操作行为数据确定所述相同时间段中对所述第一词组执行操作的第一用户数量,并根据所述筛选出的操作行为数据确定在所述相同时 间段中对所述第一词组以及第二词组执行操作的第二用户数量,通过计算所述第二用户数量与所述第一用户数量之间的比值,得到所述相同时间段中所述第一词组和第二词组之间的关联度;或,根据所述获取的操作行为数据确定所述相同时间段中对所述第二词组执行操作的第三用户数量,并根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一词组以及第二词组执行操作的第二用户数量,通过计算所述第二用户数量与所述第三用户数量之间的比值,得到所述相同时间段中所述第一词组和第二词组之间的关联度。优选地,所述操作行为包括以下至少一种:搜索;浏览;收藏;保存。优选地,所述获取的操作行为数据还包括:用户行为标识,所述用户行为标识表征用户对所述第一词组和第二词组所执行的操作行为。一种确定品牌竞争度的方法,该方法包括:从用户互联网操作行为数据中获取用户对第一品牌和第二品牌所指向的内容的操作行为数据,所述操作行为数据包括所述用户对所述第一品牌以及所述第二品牌所指向内容执行操作时的时间信息;从所述获取的操作行为数据中筛选出相同时间段中同一用户对所述第一品牌以及所述第二品牌所指向的内容的操作行为数据;根据所述筛选出的操作行为数据确定所述第一品牌和第二品牌之间的竞争度。优选地,所述操作行为数据还包括所述用户对所述第一品牌以及所述第二品牌所指向的内容执行操作时的地域信息,则所述方法具体包括:在用户互联网操作行为数据中获取用户对第一品牌和第二品牌所指向的内容的操作行为数据;从所述获取的操作行为数据中筛选出在相同地域、相同时间段中同一用户 对所述第一品牌以及所述第二品牌所指向的内容的操作行为数据;根据所述筛选出的操作行为数据确定所述第一品牌和第二品牌之间的竞争度。优选地,所述方法还包括:构建词库,所述词库包含所述第一品牌及与所述第一品牌具有相同含义的品牌词组集合,以及所述词库包含所述第二品牌及与所述第二品牌具有相同含义的品牌词组集合,则所述获取用户对第一品牌和第二品牌所指向内容的操作行为数据具体包括:根据所述词库中包含的所述第一品牌及与所述第一品牌具有相同含义的品牌词组集合获取所述第一品牌所指向内容的操作行为数据,以及根据所述词库中包含的所述第二品牌及与所述第二品牌具有相同含义的品牌词组集合获取所述第二品牌所指向内容的操作行为数据。优选地,所述根据所述筛选出的操作行为数据确定所述第一品牌和第二品牌之间的竞争度具体包括:根据所述获取的操作行为数据确定所述相同时间段中对所述第一品牌执行操作的第一用户数量,并根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一品牌以及第二品牌执行操作的第二用户数量,通过计算所述第二用户数量与所述第一用户数量之间的比值,得到所述第一品牌和第二品牌之间的竞争度;或,根据所述获取的操作行为数据确定所述相同时间段中对所述第二品牌执行操作的第三用户数量,并根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一品牌以及第二品牌执行操作的第二用户数量,通过计算所述第二用户数量与所述第三用户数量之间的比值,得到所述第一品牌和第二品牌之间的竞争度。优选地,所述操作行为包括以下至少一种:搜索;浏览;收藏;保存。优选地,所述获取的操作行为数据还包括:用户行为标识,所述用户行为标识表征用户对所述第一品牌和第二品牌所执行的操作行为。一种确定词组关联度的装置,该装置包括:获取单元、筛选单元和确定单元,其中:所述获取单元,用于从互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操作行为数据,所述操作行为数据包括所述用户对所述第一词组以及所述第二词组所指向的内容执行操作时的时间信息;所述筛选单元,用于从所述获取的操作行为数据中筛选出相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据;所述确定单元,用于根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。优选地,所述操作行为数据还包括所述用户对所述第一词组以及所述第二词组所指向的内容执行操作时的地域信息,则:所述筛选单元,用于从所述获取的操作行为数据中筛选出在相同地域、相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据;所述确定单元,用于根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。优选地,所述装置还包括构建单元,所述构建单元用于:构建词库,所述词库包含所述第一词组及与所述第一词组具有相同含义的词组集合,以及所述词库包含所述第二词组及与所述第二词组具有相同含义的的词组集合,则所述获取单元用于获取用户对第一词组和第二词组所指向的内容的操作行为数据具体包括:根据所述词库中包含的所述第一词组及与所述第一词组具有相同含义的词组集合获取所述第一词组所指向内容的操作行为数据,以及根据所述词库中包含的所述第二词组及与所述第二词组具有相同含义的词组集合获取所述第 二词组所指向内容的操作行为数据。优选地,所述确定单元具体包括:第一确定子单元、第二确定子单元和计算子单元,其中:所述第一确定子单元,用于根据所述获取的操作行为数据确定所述相同时间段中对所述第一词组执行操作的第一用户数量;所述第二确定子单元,用于根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一词组以及第二词组执行操作的第二用户数量;所述计算子单元,用于计算所述第二用户数量与所述第一用户数量之间的比值,得到所述第一词组和第二词组之间的关联度;或,所述第一确定子单元,用于根据所述获取的操作行为数据确定所述相同时间段中对所述第二词组执行操作的第三用户数量;所述第二确定子单元,用于根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一词组以及第二词组执行操作的第二用户数量;所述计算子单元,用于计算所述第二用户数量与所述第三用户数量之间的比值,得到所述第一词组和第二词组之间的关联度。本申请实施例提供了一种确定词组关联度的方法,该方法具体包括:首先,从用户互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操作行为数据,该操作行为数据包括用户对该第一词组及第二词组所指向的内容执行操作时的时间信息,然后,从该获取的操作行为数据中筛选出相同时间段中同一用户对该第一词组以及该第二词组所指向内容的操作行为数据,最后,根据筛选出的操作行为数据确定该第一词组和第二词组之间的关联度。应用本申请实施例通过获取用户对已有词组和与该已有词组属于同类的其他词组的操作行为数据,通过计算获得用户在预设时间段中该已有词组和与该已有词组属于同类的其他词组之间关联度,从而最终获得与该已有词组关联度较高的同类词组,相比于现有技术根据人为调查或经验获取与已有词组关联度较高的同类词组的方法,本申请实施例提供的方法可以比较精确地获得在不同时间 段或不同地域中与已有词组关联度较高的其他词组。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请实施例1提供的一种确定词组关联度的方法的流程示意图;图2为本申请实施例2提供的一种确定品牌竞争度的方法的流程示意图;图3为本申请实施例3提供的一种确定词组关联度的装置的结构示意图。具体实施方式在
背景技术
中提到,用户想要获取与已有信息关联度较高的其他信息,在现有技术中,通常是根据人为调研方式获取与已有信息关联度较高的其他信息,或者是根据用户日常经验获取与已有信息关联度较高的其他信息等等。但是同一信息在不同地域中,与该信息关联度较高的其他信息可能会不同,例如,在韩国,与信息“宝马”关联度较高的信息可能为“现代”,而在德国,与信息“宝马”关联度较高的信息可能为“奥迪”;而且同一信息在同一地域不同时间段中,与该信息关联度较高的其他信息可能也会不同,例如,在中国,一段时间中,与信息“苹果”关联度较高的信息可能是“小米”,在另一时间段中,与信息“苹果”关联度较高的信息可能是“华为”。而现有技术获取与已有信息关联度较高的信息时,无法做到精确的获取在不同地域或不同时间段中与已有信息关联度较高的其他信息。针对该问题,本申请实施例提供了一种确定词组关联度的方法,用于解决现有技术中用户无法精确获取与已有信息关联度较高的同类信息的问题。为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的 实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案,在说明本申请实施例之前,需要说明的是:本申请实施例中记载的“第一词组”、“第二词组”、“第一品牌”和“第二品牌”中的“第一”和“第二”不是序数词,而是为了区分不同的信息和不同的品牌。实施例1实施例1提供了一种确定词组关联度的方法,用于精确地获取与已有词组关联度较高的同类词组。该方法的具体流程如图1所示,包括下述步骤:步骤11:从用户互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操作行为数据。所述操作行为数据包括所述两个用户对所述第一词组以及所述第二词组所指向的内容执行操作时的时间信息。在本步骤中,用户想要获得与第一词组关联度较高的同类词组,需要从用户互联网操作行为数据中获取用户对该第一词组所指向内容的操作行为数据,以及获取与该第一词组属于同类的其他词组(第二词组)所指向内容的操作行为数据;这里的用户互联网操作行为数据包括:用户对该第一词组所指向的内容在互联网上执行操作时的时间信息,以及对该第二词组所指向的内容在互联网上执行操作时的时间信息。上述用户在互联网上对第一词组执行的操作行为有很多种,例如,可以是用户对该第一词组或第二词组所指向的内容进行搜索、浏览、收藏和保存等行为;相应地,操作行为数据可以包括:用户对该第一词组所指向的内容进行搜索、浏览、收藏或保存时的时间信息,以及用户对该第二词组所指向的内容进行搜索、浏览、收藏或保存时的时间信息。上述操作行为数据还可以包括:用户对该第一词组所指向的内容进行搜索、浏览、收藏或保存时的地域信息,以及用户对该第二词组所指向的内容进行搜索、浏览、收藏或保存时的地域信息。上述操作行为数据还可以包括:用户操作行为标识,该用户操作行为标识可以表示用户对于该第一词组或第二词组所指向的内容执行的操作方式,例如,根据用户操作行为标识,可以确定用户对第一词组所指向的内容执行的操作方式是“搜索”,或者确定用户对第一词组所指向的内容执行的操作方式是“收藏”等等。用户标识,该用户标识可以是ip地址等标识信息,可以根据该用户标识确定是同一用户对第一词组和第二词组所指向的内容执行操作,或者是不同用户分别对词组和第二词组所指向的内容执行操作等等。在获取用户对第一词组和第二词组所指向的内容的操作行为数据之前,可以建立该第一词组和第二词组对应的词库,该词库中包含该第一词组和与该第一词组具有相同含义的词组集合,该词组集合用于标识该第一词组,以及包含该第二词组和与该第二词组具有相同含义的词组集合,同理,该词组集合用于标识该第二词组。例如,假如第一词组是“宝马”,则与“宝马”具有相同含义的词组可以是“bmw”或“bmw”,或者是宝马汽车对应的众多型号等等。上述建立词库的具体步骤可以是:收集与第一词组具有相同含义的词组集合,并在计算机中将该词组集合中的每个词组均与该第一词组建立对应关系;同理,收集与第二词组具有相同含义的词组集合,并在计算机中将该词组集合中的每个词组均与该第二词组建立对应关系。且建立的词库应尽可能的全面,即:建立的该第一词组对应的词库中,应尽可能地包括全部与该第一词组具有相同含义的其他词组,同理,该第二词组对应的词库中,应尽可能地包括全部与该第二词组具有相同含义的其他词组,目的是根据该词库尽可能全面地获取用户对该第一词组和第二词组所指向的内容的操作行为数据。例如,用户在搜索“宝马”所述指向的内容时,用户可 以直接输入“宝马”进行搜索,也可以输入“bmw”进行搜索等等。如表1所示为获取的用户对第一词组和第二词组所指向内容的操作行为数据,且表1只是示例性的说明操作行为数据包含的具体内容,其中,表1中第二行中的数据表示:用户1在北京当天的9:00对词组a进行了搜索,第二行中的数据表示:用户1在北京当天的9:05对词组b也进行了搜索;以及其他用户对词组a以及对与词组a属于同类的其他词组的操作行为数据。表1用户词组操作行为时间地域用户1词组a搜索9:00北京用户1词组b搜索9:05北京用户2词组a搜索9:02上海用户3词组c访问10:02杭州……………在建立词库后,需要获取用户对该词库中包含的词组所指向内容的操作行为数据,例如,用户需要获得与“宝马”关联度高的其他词组,首先在“宝马”类别对应的词库中获取其他同类词组,比如,“奥迪”、“本田”、“大众”等与汽车品牌有关的词组,在获得与“宝马”属于同类的词组后,要获取用户对“宝马”所指向的内容的操作行为数据,还要获取用户对“奥迪”、“本田”、“大众”等这些同类词组所指向内容的操作行为数据。另外,为了保证获取的第一词组和第二词组所指向的内容的操作数据的准确性,要对建立的词库进行检验。例如,检验该第一词组对应的词库中的其他词组,是否与该第一词组具有相同含义,以及检验该第二词组对应的词库中的其他词组,是否与该第二词组具有相同含义。步骤12:从所述获取的操作行为数据中筛选出相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据。在获得用户对第一词组和第二词组所指向的内容的操作行为数据后,要从 该操作行为数据中筛选出相同时间段中同一用户对该第一词组和第二词组所指向内容的操作行为数据,具体地,根据获取的操作行为数据中包含的时间信息,获取同一用户在相同时间段中对该第一词组和第二词组所指向的内容的操作行为数据。这里相同的时间段可以是用户根据需要自行设定的时间段,例如,用户想要获取在当天早晨9:00到9:10这个时间段中,同一用户搜索第一词组和第二词组的搜索记录。本申请实施例提供的方法,还可以在获得用户对第一词组和第二词组所指向的内容的操作行为数据后,从该操作行为数据中筛选出相同地域、相同时间段中同一用户对该第一词组和第二词组所指向内容的操作行为数据,根据获取的操作行为数据中包含的时间信息和地域信息,获取同一用户在相同地域、相同时间段中对该第一词组和第二词组所指向的内容的操作行为数据。这里相同的地域同样也可以是用户根据需要自行设定的地域,例如,用户想要获取在北京当天早晨9:00到9:10这个时间段中,同一用户搜索第一词组和第二词组的搜索记录。上述获取同一用户对该第一词组和第二词组所指向的内容的操作行为数据,可以根据操作行为数据中的用户标识信息(ip地址)确定是否是同一用户对该第一词组和第二词组所指向内容的操作行为数据等。另外,筛选出同一用户对该第一词组和第二词组所指向内容的操作行为数据,其中,对于该第一词组和第二词作所执行的操作行为可以是相同的操作行为,或者是不同的操作行为,例如,在一段时间中,用户对第一词组所指向的内容进行了搜索,而该用户对第二词组所指向的内容进行了收藏等等。步骤13:根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。在筛选出同一用户在相同时间段中对第一词组和第二词组所指向的内容的操作行为数据之后,根据筛选出的操作行为数据确定在该相同时间段中该第一词组和第二词组之间的关联度,其中,获取两词组之间关联度的方法具体如 下:如果用户想要获得在预设时间段中与第一词组关联度较高的同类词组时,则确定在该时间段中该第一词组和第二词组之间的关联度的方法是:首先,根据步骤11中获取的操作行为数据,确定在预设时间段中用户对第一词组所指向的内容执行操作的用户数量,即第一用户数量,然后,根据步骤12中筛选出的操作行为数据,确定在该预设时间段中同一用户对该第一词组和第二词组执行操作的用户数量,即第二用户数量,最后,通过计算第二用户数量与第一用户数量的比值,得到该第一词组和第二词组之间的关联度。如果用户想要获得与第二词组关联度较高的同类词组时,首先,根据步骤11中获取的操作行为数据,确定在预设时间段中用户对第二词组所指向的内容执行操作的用户数量,即第三用户数量,然后,根据步骤12中筛选出的操作行为数据,确定在该预设时间段中同一用户对该第一词组和第二词组执行操作的用户数量,即第二用户数量,最后,通过计算第二用户数量与第三用户数量的比值,得到该第一词组和第二词组之间的关联度。如果用户想要获得在预设地域、预设时间段中与第一词组关联度较高的同类词组时,则确定在该预设地域、预设时间段中该第一词组和第二词组之间的关联度的方法是:同理,首先,通过步骤11中获得的操作行为数据,确定在预设地域、预设时间段中用户对第一词组或第二词组所指向的内容执行操作的用户数量,然后,根据步骤12中筛选出的操作行为数据,确定在该预设地域、预设时间段中同一用户对该第一词组和第二词组执行操作的用户数量,最后,根据两次确定的用户数量的比值,得到该第一词组和第二词组之间的关联度。在获得预设时间段中该第一词组和第二词组之间的关联度后,根据关联度获得与该第一词组或第二词组关联度较高的同类词组。具体地,如表2所示为在某地域、某时间段中用户对第一词组和第二词组所指向内容的搜索情况,这里的第一词组是指词组a,第二词组的数量为多个,为词组b、词组c和词组d,且词组b、词组c和词组d与词组a属于同类词组;表2的具体内容为: 在某地域、某时间段中搜索词组a所指向内容的用户数量为1000个,其中,在这1000用户数量中同一用户搜索词组a和词组b的用户数量为200个,同一用户搜索词组a和词组c的用户数量为300个,同一用户搜索词组a和词组d的用户数量为500个,则在该预设地域、预设时间段中:词组b与词组a之间的关联度为0.2(即:200/1000=0.2),词组c与词组a之间的关联度为0.3(即:300/1000=0.3),词组d与词组a之间的关联度为0.5(即:500/1000=0.5)。表2第一词组第二词组同一用户搜索两词组的用户数量搜索第一词组的用户数量词组a词组b2001000词组a词组c3001000词组a词组d5001000通过比较词组b、词组c和词组d与词组a之间关联度,发现与词组a关联度最高的为词组d;而在实际应用中,与一个词组具有关联性的词组的数量有很多,例如,与汽车品牌“宝马”具有关联性的汽车品牌词组有很多,表1中词组a的关联词组b、词组c和词组d只是示例性的说明。上述通过计算对第一词组以及第二词组所指向内容执行操作的用户数量与对第一词组执行操作的用户数量的比值,从而获得第一词组和第二词组之间的关联度,而在实际应用中,还有其他计算两词组之间相似度的方法。例如,在表2中,还可以直接将同一用户搜索两词组的用户数量作为关联度,即在预设地域、预设时间段中:词组b与词组a之间的关联度为200,词组c与词组a之间的关联度为300,词组d与词组a之间的关联度为500。以上只是示例性地说明了几种简单的计算两词组关联度的方法,而在实际应用中,计算两词组之间关联度的方法会更加的复杂,这里不对计算两词组之间关联度的方法作具体限定。本申请实施例提供了一种确定词组关联度的方法,该方法具体包括:首先,从互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操 作行为数据,该操作行为数据包括用户对该第一词组及该第二词组所指向的内容执行操作时的时间信息,然后,从该操作行为数据中筛选出相同时间段中同一用户对该第一词组以及该第二词组所指向内容的操作行为数据,最后,根据筛选出的操作行为数据确定该第一词组和第二词组之间的关联度。应用本申请实施例通过获取用户对已有词组和与该已有词组属于同类的其他词组的操作行为数据,通过计算获得用户在预设时间段中该已有词组和与该已有词组属于同类的其他词组之间关联度,从而最终获得与该已有词组关联度较高的同类词组,相比于现有技术根据人为调查或经验获取与已有词组关联度较高的同类词组的方法,本申请实施例提供的方法可以比较精确地获得在不同时间段或不同地域中与已有词组关联度较高的其他词组。实施例2实施例1提供了一种确定词组关联度的方法,基于相同的发明构思,实施例2提供了一种确定品牌竞争度的方法,用于精确地获取在不同时间段或不同地域中两品牌之间竞争度。现有技术中,获取已有品牌的竞争对手的方法通常是:根据该品牌对应商品的属性,获取具有该属性或类似属性的同类商品对应的品牌作为竞争对手,这里的属性可以是指商品的外观、功能、价格等等。例如,品牌a和品牌b对应的商品价格相近,同时,这两商品也具有相似的功能,且在市场销售中,通过调查发现品牌a和品牌b对应商品的销量也相差不多,这时,用户就认为品牌a和品牌b互为竞争对手。但是在实际应用中,同一品牌的竞争对手在不同地域可能不同,且同一品牌在同一地域、不同时间段中的竞争对手也可能不同。但现有技术获取品牌竞争对手的方法,无法精确地获取同一品牌在不同地域或不同时间段中的竞争对手。鉴于上述问题,本申请实施例提供了一种确定品牌竞争度的方法。该方法 的具体流程如图2所示,包括下述步骤:步骤21:从用户互联网操作行为数据中获取用户对第一品牌和第二品牌所指向的内容的操作行为数据。所述操作行为数据包括所述用户对所述第一品牌以及所述第二品牌所指向内容执行操作时的时间信息。在本步骤中,用户想要获取第一品牌的竞争品牌,需要获取用户在互联网上对该第一品牌所指向内容的操作行为数据,以及获取用户对与该第一品牌对应商品属于同类商品的品牌(第二品牌)所指向内容的操作行为数据;这里的操作行为数据包括:用户对该第一品牌所指向的内容执行操作时的时间信息,以及对该第二品牌所指向的内容执行操作时的时间信息。上述操作行为可以是搜索、浏览、收藏和保存等行为;相应地,操作行为数据包括:用户对该第一品牌所指向的内容进行搜索、浏览、收藏或保存时的时间信息,以及用户对该第二品牌所指向的内容进行搜索、浏览、收藏或保存时的时间信息。上述操作行为数据还可以包括:用户对该第一品牌所指向的内容进行搜索、浏览、收藏或保存时的地域信息,以及用户对该第二品牌所指向的内容进行搜索、浏览、收藏或保存时的地域信息。上述操作行为数据还包括:用户操作行为标识、用户标识等。在获取用户对该第二品牌所指向的内容的操作行为数据之前,建立品牌词库,该品牌词库的内容是:第一品牌以及与该第一品牌具有相同含义的品牌词组集合,第二品牌以及与该第二品牌具有相同含义的品牌词组集合。该品牌词库建立后,根据第一品牌对应词库中的词组,尽可能全面地获取用户对该第一品牌所指向的内容的操作行为数据,以及根据第二品牌对应词库中的词组,尽可能全面地获取用户对该第二品牌所指向的内容的操作行为数据。步骤22:从所述获取的操作行为数据中筛选出相同时间段中同一用户对所 述第一品牌以及所述第二品牌所指向的内容的操作行为数据。在获得用户对第一品牌和第二词牌所指向的内容的操作行为数据后,要从该操作行为数据中筛选出相同时间段中同一用户对该第一词牌和第二词牌所指向内容的操作行为数据。本申请实施例提供的方法还可以是:在获得用户对第一品牌和第二词牌所指向的内容的操作行为数据后,要从该操作行为数据中筛选出相同地域、相同时间段中同一用户对该第一词牌和第二词牌所指向内容的操作行为数据。步骤23:根据所述筛选出的操作行为数据确定所述第一品牌和第二品牌之间的竞争度。在筛选出同一用户在相同时间段中对第一品牌和第二品牌所指向的内容的操作行为数据之后,根据筛选出的操作行为数据确定在该相同时间段中该第一品牌和第二品牌之间的竞争度,其中,获取两词牌之间竞争度的方法具体如下:如果用户想要获得在预设时间段中与第一品牌竞争度高的品牌词组时,首先,根据步骤21中获取的操作行为数据,确定在预设时间段中用户对第一品牌所指向的内容执行操作的用户数量,即第一用户数量,然后,根据步骤22中筛选出的操作行为数据,确定在该预设时间段中同一用户对该第一品牌和第二品牌执行操作的用户数量,即第二用户数量,最后,通过计算第二用户数量与第一用户数量的比值,得到该第一品牌和第二品牌之间的竞争度。在筛选出同一用户在相同地域、相同时间段中对第一品牌和第二品牌所指向的内容的操作行为数据之后,根据筛选出的操作行为数据确定该第一品牌和第二品牌之间的竞争度。如果用户想要获得在预设地域、预设时间段中与第一品牌竞争度较高的品牌词组时,则确定在该预设地域、预设时间段中该第一品牌和第二品牌之间的竞争度的方法是:同理,首先,通过步骤11中获得的操作行为数据,确定在预设地域、预设时间段中用户对第一品牌或第二品牌所指向的内容执行操作的 用户数量,然后,根据步骤12中筛选出的操作行为数据,确定在该预设地域、预设时间段中同一用户对该第一品牌和第二品牌执行操作的用户数量,最后,根据两次确定的用户数量,得到第一品牌和第二品牌之间的竞争度。在获得第一品牌和第二品牌之间的竞争度后,通过比较竞争度,获得与第一品牌或第二品牌竞争度大的品牌,即:竞争度越大,则两品牌互为竞争对手的概率越大。本申请实施例提供了一种确定品牌竞争度的方法,该方法包括:首先,从用户互联网操作行为数据中获取用户对第一品牌和第二品牌所指向的内容的操作行为数据,该操作行为数据包括用户对该第一品牌及该第二品牌所指向的内容执行操作时的时间信息,然后,从该获取的操作行为数据中筛选出相同时间段中同一用户对该第一品牌以及该第二品牌所指向内容的操作行为数据,最后,根据筛选出的操作行为数据确定该第一品牌和第二品牌之间的竞争度。应用本申请实施例通过获取用户对第一品牌和第二品牌所指向内容的操作行为数据,通过计算获得用户在预设时间段中第一品牌和与第二品牌之间竞争度,从而最终获得与第一品牌竞争度较高的品牌,相比于现有技术根据人为调查或经验获取品牌竞争对手的方法,本申请实施例提供的方法可以比较精确地获得在不同时间段或不同地域中与已有品牌竞争度较高的其他品牌。实施例3实施例1提供了一种确定词组关联度的方法,相应地,本申请实施例提供了一种确定词组关联度的装置,用于精确地获取在不同地域或不同时间段中与已有词组关联度较高的同类词组。该装置的具体结构如图3所示,该装置具体包括:获取单元31、筛选单元32和确定单元33,其中:所述获取单元31,可以用于从用户互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操作行为数据,所述操作行为数据包括所述用 户对所述第一词组以及所述第二词组所指向的内容执行操作时的时间信息;所述筛选单元32,可以用于从所述获取的操作行为数据中筛选出相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据;所述确定单元33,可以用于根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。该装置实施例的具体工作流程是:首先,获取单元31从用户互联网操作行为数据中获取用户对第一词组和第二词组所指向的内容的操作行为数据,该操作行为数据包括用户分别对该第一词组及该第二词组所指向的内容执行操作时的时间信息,然后,筛选单元32从该获取的操作行为数据中筛选出相同时间段中同一用户对该第一词组以及该第二词组所指向的内容在相同时间段中的操作行为数据,最后,确定单元33根据筛选出的操作行为数据确定该第一词组和第二词组之间的关联度。上述装置实施例实现确定词组关联度的方式有很多种,例如,在一种实施方式中,所述操作行为数据还包括所述至少两个用户分别对所述第一词组执行操作时的地域信息,则:所述筛选单元32,可以从所述获取的操作行为数据中筛选出在相同地域、相同时间段中同一用户对所述第一词组以及所述第二词组所指向的内容的操作行为数据。所述确定单元33,可以用于根据所述筛选出的操作行为数据确定所述第一词组和第二词组之间的关联度。上述实施方式中,通过在获取的操作行为数据中筛选出相同地域、相同时间段中同一用户对该第一词组以及该第二词组所指向内容的操作行为数据,然后根据筛选出的操作行为数据可以获得在该第一词组和第二词组之间的关联度。在另一种实施方式中,所述装置还包括构建单元34,所述构建单元34可 以用于:构建词库,所述词库包含所述第一词组及与所述第一词组具有相同含义的词组集合,以及所述词库包含所述第二词组及与所述第二词组具有相同含义的的词组集合,则所述获取单元用于获取用户对第一词组和第二词组所指向的内容的操作行为数据具体包括:根据所述词库中包含的所述第一词组及与所述第一词组具有相同含义的词组集合获取所述第一词组所指向内容的操作行为数据,以及根据所述词库中包含的所述第二词组及与所述第二词组具有相同含义的词组集合获取所述第二词组所指向内容的操作行为数据。在又一种实施方式中,所述确定单元33具体包括:第一确定子单元331、第二确定子单元332和计算子单元333,其中:所述第一确定子单元331,可以用于根据所述获取的操作行为数据确定所述相同时间段中对所述第一词组执行操作的第一用户数量;所述第二确定子单元332,可以用于根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一词组以及第二词组执行操作的第二用户数量;所述计算子单元333,可以用于计算所述第二用户数量与所述第一用户数量之间的比值,得到所述第一词组和第二词组之间的关联度;或,所述第一确定子单元331,可以用于根据所述获取的操作行为数据确定所述相同时间段中对所述第二词组执行操作的第三用户数量;所述第二确定子单元332,可以用于根据所述筛选出的操作行为数据确定在所述相同时间段中对所述第一词组以及第二词组执行操作的第二用户数量;所述计算子单元333,可以用于计算所述第二用户数量与所述第三用户数量之间的比值,得到所述第一词组和第二词组之间的关联度。应用本申请实施例提供的装置所获得的有益效果与实施例1中的方法实施例的有益效果相同或相似,为避免重复,这里不再赘述。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任 何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1