一种地域性应用挖掘方法及装置与流程

文档序号:11144173阅读:598来源:国知局
一种地域性应用挖掘方法及装置与制造工艺

本发明涉及搜索领域,尤其涉及一种地域性应用挖掘方法及装置。



背景技术:

在App(Application,应用程序)应用市场,地域性App大量出现,这些App应用有地方性特色,提供本地化的服务,相比全国性App,地域性强的App比如O2O类的产品,餐饮类App,以及一些细分领域的应用,为当地人群提供本地交通,本地天气以及生活服务类的需求等。从地理位置角度更精准的定位潜在用户,能更好的给用户提供搜索下载服务,是实现应用搜索引擎功能搜索技术的重要方面。地域性App,一种是面向本地化服务的地域性Aapp,从功能上只提供本地化的服务,称为LBS_APP;另一种是使用地域差异显著的App,实际使用人群的地域化分布差异较大,称为HotSpot_APP。

现有的地域性app挖掘方法是基于关键字匹配,从app的名字以及摘要描述中寻找地点信息,适用于LBS_APP的挖掘,app摘要描述中的文字信息往往是很杂乱的,含有多个地方的名字,这种方法容易误召回,且不适用于HotSpot_APP,App的传播速度很快,这种关键字匹配方法不能及时发现更新后的App的地域性。可见,现有地域性app挖掘方法挖掘地域性App的准确性较低。



技术实现要素:

鉴于上述问题,本发明实施例提供了一种地域性应用挖掘方法及装置,准确识别出应用的地域性,从而准确挖掘地域性应用。

第一方面,本发明实施例提供了一种地域性应用挖掘方法,包括:

获取同一目标应用在N个地域各自的被操作次数,N为正整数;

根据所述同一目标应用在N个地域各自的被操作次数,确定所述目标应用在所述N个地域各自的地域性特征值,所述地域性特征值与所述被操作次数正相关;

如果所述目标应用在所述N个地域中至少一个地域的地域性特征值大于预设特征阈值,将所述目标应用标记为地域性应用。

可选的,所述获取同一目标应用在N个地域各自的被操作次数,包括:

按照预设周期获取应用搜索引擎的搜索引擎日志;

从所述搜索引擎日志中提取同一目标应用在M个地域的被操作记录,M为大于或等于N的正整数;

从所述被操作记录中确定出所述目标应用在所述N个地域各自的被操作次数。

可选的,所述从所述被操作记录中确定出所述目标应用在所述N个地域各自的被操作次数,包括:

从所述被操作记录中确定出所述目标应用在第n个地域被浏览详情的次数,以及所述目标应用在所述第n个地域被下载的次数,n取1至N;

将所述目标应用在所述第n个地域被浏览详情的次数基于预设折算比例进行折算;

将折算后被浏览详情的次数与所述目标应用在所述第n个地域被下载的次数之和确定为所述目标应用在所述第n个地域的被操作次数。

可选的,如果所述地域性特征值为相对局部密度值,所述根据所述同一目标应用在N个地域各自的被操作次数,确定所述目标应用在所述N个地域各自的地域性特征值,包括:

针对第n地域的被操作次数确定邻居区域半径,以及确定所述第n地域的被操作次数为圆心,n取1至N;

将所述第n地域的被操作次数,相对于所述邻居区域半径内的除所述第n地域之外的各个地域的被操作次数计算密度,作为所述第n地域的相对局部密度值。

可选的,所述将所述目标应用标记为地域性应用,包括:

从所述N个地域中,确定出所述地域性特征值大于所述预设特征阈值的P个地域,P为小于N的正整数;

将所述P个地域的应用地域标识标记在所述目标应用上。

可选的,所述将所述P个地域的应用地域标识标记在所述目标应用上,包括:

获取所述目标应用在所述P个地域被操作时各自对应的IP地址;

从所述目标应用在所述P个地域被操作时各自对应的IP地址中,解析出所述P个地域的标识,并标记在所述目标应用上。

可选的,在所述将所述目标应用标记为地域性应用之后,所述方法还包括:

接收来自搜索客户端的包含搜索关键字和表征所述搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含所述搜索关键字的应用;

从包含所述搜索关键字的应用中查找应用地域标识与所述请求地域标识匹配的地域性应用;

将查找到的应用地域标识与所述请求地域标识匹配的地域性应用,反馈给所述搜索客户端。

可选的,在在所述将所述目标应用标记为地域性应用之后,所述方法还包括:

接收来自搜索客户端的包含搜索关键字和表征所述搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含所述搜索关键字的应用;

从包含所述搜索关键字的应用中查找应用地域标识与所述请求地域标识匹配的地域性应用;

将查找到的包含所述搜索关键字的应用进行排序,其中,应用地域标识与所述请求地域标识匹配的地域性应用的排序在应用地域标识与所述请求地域标识不匹配的地域性应用、以及非地域性应用之前;

将排序后包含所述搜索关键字的应用反馈给所述搜索客户端。

第二方面,本发明实施例提供了一种地域性应用挖掘装置,包括:

次数获取单元,用于获取同一目标应用在N个地域各自的被操作次数,N为正整数;

特征值确定单元,用于根据所述同一目标应用在N个地域各自的被操作次数,确定所述目标应用在所述N个地域各自的地域性特征值,所述地域性特征值与所述被操作次数正相关;

地域标记单元,用于如果所述目标应用在所述N个地域中至少一个地域的地域性特征值大于预设特征阈值,将所述目标应用标记为地域性应用。

可选的,所述次数获取单元,包括:

日志获取子单元,用于按照预设周期获取应用搜索引擎的搜索引擎日志;

记录提取子单元,用于从所述搜索引擎日志中提取同一目标应用在M个地域的被操作记录,M为大于或等于N的正整数;

次数确定子单元,用于从所述被操作记录中确定出所述目标应用在所述N个地域各自的被操作次数。

可选的,所述次数确定子单元,具体用于:

从所述被操作记录中确定出所述目标应用在第n个地域被浏览详情的次数,以及所述目标应用在所述第n个地域被下载的次数,n取1至N;

将所述目标应用在所述第n个地域被浏览详情的次数基于预设折算比例进行折算;

将折算后被浏览详情的次数与所述目标应用在所述第n个地域被下载的次数之和确定为所述目标应用在所述第n个地域的被操作次数。

可选的,如果所述地域性特征值为相对局部密度值,所述特征值确定单元,具体用于:

针对第n地域的被操作次数确定邻居区域半径,以及确定所述第n地域的被操作次数为圆心,n取1至N;

将所述第n地域的被操作次数,相对于所述邻居区域半径内的除所述第n地域之外的各个地域的被操作次数计算密度,作为所述第n地域的相对局部密度值。

可选的,所述地域标记单元,包括:

确定子单元,用于从所述N个地域中,确定出所述地域性特征值大于所述预设特征阈值的P个地域,P为小于N的正整数;

地域标识标记子单元,用于将所述P个地域的应用地域标识标记在所述目标应用上。

可选的,所述地域标识标记子单元,具体用于:

获取所述目标应用在所述P个地域被操作时各自对应的IP地址;

从所述目标应用在所述P个地域被操作时各自对应的IP地址中,解析出所述P个地域的标识,并标记在所述目标应用上。

可选的,所述装置还包括:

第一应用查找单元,用于接收来自搜索客户端的包含搜索关键字和表征所述搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含所述搜索关键字的应用;

第二应用查找单元,用于从包含所述搜索关键字的应用中查找应用地域标识与所述请求地域标识匹配的地域性应用;

第一反馈单元,用于将查找到的应用地域标识与所述请求地域标识匹配的地域性应用,反馈给所述搜索客户端。

可选的,所述装置还包括:

第三应用查找单元,用于接收来自搜索客户端的包含搜索关键字和表征所述搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含所述搜索关键字的应用;

第四应用查找单元,用于从包含所述搜索关键字的应用中查找应用地域标识与所述请求地域标识匹配的地域性应用;

应用排序单元,用于将查找到的包含所述搜索关键字的应用进行排序,其中,应用地域标识与所述请求地域标识匹配的地域性应用的排序在应用地域标识与所述请求地域标识不匹配的地域性应用、以及非地域性应用之前;

第二反馈单元,用于将排序后包含所述搜索关键字的应用反馈给所述搜索客户端。

本发明实施例提供的一个或多个实施例,至少实现了如下技术效果或优点:

本发明实施例通过同一目标应用在N个地域各自的被操作次数,确定目标应用在所述N个地域各自的地域性特征值;如果目标应用在N个地域中至少一个地域的地域性特征值大于预设特征阈值,将目标应用标记为地域性应用。从而根据同一应用在不同地域的被操作次数的不同识别目标应用的地域性,又通过地域性特征值平滑了被操作次数识别目标应用的地域性时的一部分噪音信号,进而准确地确定了目标应用的地域性,不需要匹配关键字,因此避免了通过关键字匹配应用的名称、描述文字涉及到的地点信息来识别应用的地域性时的误召回,即使应用的名称、描述文字不包含地点信息,也能准确识别出其地域性,从而准确挖掘地域性应用。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1为本发明实施例中地域性应用挖掘方法的主流程图;

图2为图1中S101的细化流程图;

图3为本发明实施例中地域性应用挖掘装置的结构图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种地域性应用挖掘方法,运用在应用程序搜索引擎。参考图1所示,所述地域性应用挖掘方法包括:

S101、获取同一目标应用在N个地域各自的被操作次数,N为正整数;

S102、根据同一目标应用在N个地域各自的被操作次数,确定目标应用在N个地域各自的地域性特征值,地域性特征值与被操作次数正相关;

S103、如果目标应用在N个地域中至少一个地域的地域性特征值大于预设特征阈值,将目标应用标记为地域性应用。

下面,参考图1所示,详细介绍本发明实施例提供的地域性应用挖掘方法的实现步骤:

首先,执行S101:获取同一目标应用在N个地域各自的被操作次数,N为正整数。

在本发明实施例中,被操作次数包括被浏览详情的次数、被下载的次数中的一种或两种组合。

具体的,通过对应用搜索引擎的搜索引擎日志的分析,得出同一目标应用在N个地域各自的被操作次数。具体实现流程参考图2所示,包括如下步骤:

步骤S1011、按照预设周期获取应用搜索引擎(App Search Engine)的搜索引擎日志。

需要说明的是,预设周期设置为一周,则每周从应用搜索引擎中获取搜索引擎日志。当然,在具体实施过程中,可以调整预设周期为一天,更及时动态地更新目标应用的被操作次数,或者预设周期调整为一个月。

在搜索引擎日志中记录有用户的操作行为,具体的操作行为有:对目标应用的浏览详情行为、下载行为。记录有用户进行操作行为时的IP(Internet Protocol,网络协议)地址。将用户的操作行为与用户进行操作行为时客户端的IP地址关联。

步骤S1012、从搜索引擎日志中提取同一目标应用在M个地域的被操作记录,M为大于或等于N的正整数。

操作记录中包括多条操作项,每条操作项包括操作行为和与操作行为类型关联的IP地址。举例来讲,操作项为:171.217.34.155下载;192.168.10.122浏览详情;192.168.10.112下载,等等。

步骤S1013、从被操作记录中确定出目标应用在N个地域各自的被操作次数。

从操作记录中的IP地址中解析出操作行为进行时的地域,将操作记录中的各条操作项进行以地域为区分进行统计,统计出目标应用在各个地域各自的被操作次数。举例来讲,统计一个周期内在各个地域各自的被操作次数,形成目标应用的被操作分布统计文件,参考下表1所示。

表1应用XXX的被操作分布统计表

在具体实施过程中,通过上述步骤S1011~S1013,可以确定每个应用在各个地域各自的被操作次数,从而实现针对每个应用生成被操作分布统计文件,app_download_stat.txt,第一行格式:“app_id\t app_name\t total_count\t place:count…”。

针对被操作次数包括被浏览详情的次数与被下载的次数的组合,确定目标应用在各个地域各自的被操作次数,可以采用如下具体实施方式:

从被操作记录中确定出目标应用在第n个地域被浏览详情的次数,以及目标应用在第n个地域被下载的次数,n取1至N;将目标应用在第n个地域被浏览详情的次数基于预设折算比例进行折算;将折算后被浏览详情的次数与目标应用在第n个地域被下载的次数之和确定为目标应用在第n个地域的被操作次数。

需要说明的是,同一目标应用,针对不同地域所使用预设折算比例相同。通过将被浏览详情的次数折算之后与被下载次数叠加,从而将浏览行为相对于下载行为定义为弱信号,从而使得目标应用的被下载次数对挖掘结果影响更大,提高地域性应用标记的准确性。

在具体实施过程中,预设折算比例根据业务需求设定。可以设置为(0,100%)区间的任意值。举例来讲,预设折算比例设置可以90%、80%、70%、60%,50%、40%、30%、20%、10%中的一个。比如,预设折算比例为90%,针对预设周期内,目标应用在地域A的被浏览详情的次数为900次,被下载次数为800次,则目标应用在地域A的被操作次数=900Х90%+800=1601次。比如,预设折算比例为50%,针对预设周期内,目标应用在地域A的被浏览详情的次数为900次,被下载次数为800次,则目标应用在地域A的被操作次数=900Х50%+800=1250次。

接着,执行S102、根据同一目标应用在N个地域各自的被操作次数,确定目标应用在N个地域各自的地域性特征值,地域性特征值与被操作次数正相关。

在一实施例中,地域性特征值具体为相对局部密度值,通过LOF(Local Outlier Factor,局部异常因子算法)确定目标应用在N个地域各自的相对局部密度值。具体实现方式包括如下流程:

针对第n地域的被操作次数确定邻居区域半径,以及确定第n地域的被操作次数为圆心,n取1至N;将第n地域的被操作次数,相对于邻居区域半径内的除第n地域之外的各个地域的被操作次数计算密度,作为第n地域的相对局部密度值。

具体来讲,通过LOF计算N个地域各自的相对局部密度值,为了描述简洁,后续步骤1~步骤4中的描述,均以地域指代该目标应用在地域的被操作次数,比如,第n地域指代目标应用在地域的被操作次数这一参量,参考如下具体步骤得到N个地域各自的相对局部密度值:

步骤1、计算第n地域与第n地域之外的其他地域之间的欧氏距离,n取1至N,从而计算得到N个地域各自的欧氏距离,对N个地域各自的欧氏距离进行排序,计算第k距离以及第K距离领域。在本发明实施例中的邻居区域半径并非地理半径,对应着LOF(Local Outlier Factor,局部异常因子算法)中的第k距离邻域,第k距离邻域就是以第n地域为中心,第k距离为邻居区域半径的圆内的所有地域n',即:

Nk(n)={n'|n'inN,dist(n,n')≤dist(n)|};

其中,Nk(n)表示第k距离邻域,N为地域集合,dist(n,n')表示第n地域与地域n'之间的实际距离,distk(n)表示第n地域的第k距离。

比如,k可以设置为,4,5,6,7、8、9等等。

步骤2、计算N个地域各自的可达距离:

reachdistk(n←n')=max{(distk(n),dist(n,n')};

其中,reachdist(n←n')为第n地域的可达距离,如果第n地域远离地域n',则第n地域与地域n'之间的可达距离为第n地域与地域n'之间的实际距离:dist(n,n'),如果第n地域与地域n'足够近,则第n地域与地域n'之间的可达距离为第n地域的第k距离:distk(n)代替。

步骤3、根据N个地域各自的第k距离邻域和N个地域各自的可达距离、对应计算N个地域各自的局部可达密度lrdk(n):

步骤4、计算N个地域各自的相对局部密度值,其中,所需各个参数已经由步骤1~步骤3获得:

其中,lrdk(n')为地域n'的局部可达密度,lrdk(n)为第n地域的局部可达密度局部可达密度。

举例来讲,针对表1所示的应用XXX的被操作分布统计表,应用XXX在N个地域各自的相对局部密度值参考下表2所示。

表2.应用XXX的相对局部密度值表

同一目标应用在N个地域各自的相对局部密度值的计算结果如表2所示,各个地域的相对局部密度值均与所在地域的被操作次数正相关,应用XXX,“广东省”的相对局部密度值88.2332,远远大于其它地域的相对局部密度值,是一个局部离群点,其他地域的相对局部密度值构成一个聚类。

在具体实施过程中,通过重复上述步骤1~3,可以分别得到各个目标应用的相对局部密度值表。

接着,执行S103、如果目标应用在N个地域中至少一个地域的地域性特征值大于预设特征阈值,将目标应用标记为地域性应用。

如果地域性特征值为相对局部密度值,预设特征阈值为相对局部密度阈值,在本发明实施例中,相对局部密度阈值设置为10.0。则相对局部密度值大于10.0对应的地域。

当前,在具体实施过程中,可以其他算法获得的地域性特征值可替换相对局部密度值,比如基于序列异常技术、或者索引算法等,获得地域性特征值,具体可以参考现有技术。

具体的,将目标应用标记为地域性应用,包括:从N个地域中,确定出地域性特征值大于预设特征阈值的P个地域,P为小于N的正整数;将P个地域的应用地域标识标记在目标应用上。

其中,针对地域性特征值为相对局部密度值,从N个地域中,确定出相对局部密度值大于预设特征阈值的P个地域,P为小于N的正整数;将P个地域的应用地域标识标记在目标应用上。

在具体实施过程中,应用地域标识可以为所在地名称,或者所在地区号。

在一实施例中,获取目标应用在P个地域被操作时各自对应的IP地址;从目标应用在P个地域被操作时各自对应的IP地址中,解析出P个地域的标识,并标记在目标应用上。

从P个地域被操作时各自对应的IP地址中,解析出P个地域的标识可以参考前述S101中的描述,为了说明的简洁,本文不再赘述。

在另一实施例中,P个地域的应用地域标识记录在相对局部密度值表中,参考表2所示,将应用地域标识(所在地名称或者所在地区号)与被操作次数、相对局部密度值关联,将相对局部密度值大于预设特征阈值的地域的所在地名称标记在目标应用上。以表2举例来讲,“广东省”的相对局部密度值大于10.0,将“广东省”标记在目标应用上。

进一步的,在前述技术方案的基础上,本发明实施例还提供了如下技术特征,以更精准向搜索应用程序的用户呈现可下载的应用程序供用户下载。具体提供了两个实施方式:

实施方式一、在将目标应用标记为地域性应用之后,还包括如下步骤步骤1~步骤3:

步骤1、接收来自搜索客户端的包含搜索关键字和表征搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含搜索关键字的应用。

具体的,搜索关键字为用户在搜索输入框的输入内容,和/或从用户在搜索输入框的输入内容中提取的部分文字。比如,搜索输入框输入的为“能查公交路线”,接收到来自搜索客户端的“能查公交路线”后,提取“将能查公交线路”、“公交”、“公交线路”作为搜索关键字。通过应用搜索引擎搜索到包含搜索关键字的应用。

接着,执行步骤2、从包含搜索关键字的应用中查找应用地域标识与请求地域标识匹配的地域性应用。

具体的,对步骤2查找出的包含搜索关键字的应用进行遍历,确定出各个地域性应用,将确定出的各个地域性应用的应用地域标识与请求地域标识一一匹配,确定出匹配成功的地域性应用。

接着,执行步骤3、将查找到的应用地域标识与请求地域标识匹配的地域性应用,反馈给搜索客户端。从而使得客户端只展现应用地域标识与请求地域标识匹配的地域性应用

下面给出一交互实施例,以理解本实施方式:

用户输入在搜索输入框内输入“能查公交路线”后,搜索客户端将“能查公交路线”发送给应用搜索引擎。应用搜索引擎接收到“能查公交路线”,将提取搜索关键字:“将能查公交线路”、“公交”、“公交线路”,搜索包含搜索关键字“将能查公交线路”、“公交”、“公交线路”其中一种的应用,比如搜索到有搜索关键字的应用有:“北京公交Live”、“青岛公交查询”、“广州公交实时查询”、“公交地图”,接着,如果标记应用地域标识,就为地域性应用,从有搜索关键字的应用中确定出地域性应用为:北京公交Live”、“青岛公交查询”和“广州公交实时查询”。从发送应用查询请求的搜索客户端的IP地址中解析出搜索客户端请求地域标识,将请求地域标识与“北京公交Live”、“青岛公交查询”和“广州公交实时查询”的应用地域标识匹配。比如,从发送应用搜索请求的搜索客户端的IP地址中解析出搜索客户端在广州。则将“广州公交实时查询”反馈给搜索客户端进行呈现。

在另一实施方式中,步骤1和步骤2同上一实施方式,在步骤2之后,执行步骤3’和步骤4’。

步骤3’:将查找到的包含搜索关键字的应用进行排序,其中,应用地域标识与请求地域标识匹配的地域性应用的排序在应用地域标识与请求地域标识不匹配的地域性应用、以及非地域性应用之前;

步骤4’将排序后包含搜索关键字的应用反馈给搜索客户端。

针对本实施方式应用于上述交互实施例,将“广州公交实时查询”反馈给搜索客户端进行呈现,呈现由前至后依次为:“广州公交实时查询”、“公交地图”、“北京公交Live”、“青岛公交查询”、“广州公交实时查询”。其中,非地域性应用排序在应用地域标识与请求地域标识不匹配的地域性应用之前,不限定应用地域标识与请求地域标识不匹配的地域性应用之间的先后顺序。

基于同一发明构思,本发明实施例提供了一种地域性应用挖掘装置,可以运用于应用搜索引擎,参考图3所示,所述地域性应用挖掘装置包括:

次数获取单元201,用于获取同一目标应用在N个地域各自的被操作次数,N为正整数;

特征值确定单元202,用于根据所述同一目标应用在N个地域各自的被操作次数,确定所述目标应用在所述N个地域各自的地域性特征值,所述地域性特征值与所述被操作次数正相关;

地域标记单元203,用于如果所述目标应用在所述N个地域中至少一个地域的地域性特征值大于预设特征阈值,将所述目标应用标记为地域性应用。

可选的,所述次数获取单元201,包括:

日志获取子单元,用于按照预设周期获取应用搜索引擎的搜索引擎日志;

记录提取子单元,用于从所述搜索引擎日志中提取同一目标应用在M个地域的被操作记录,M为大于或等于N的正整数;

次数确定子单元,用于从所述被操作记录中确定出所述目标应用在所述N个地域各自的被操作次数。

可选的,所述次数确定子单元,具体用于:

从所述被操作记录中确定出所述目标应用在第n个地域被浏览详情的次数,以及所述目标应用在所述第n个地域被下载的次数,n取1至N;

将所述目标应用在所述第n个地域被浏览详情的次数基于预设折算比例进行折算;

将折算后被浏览详情的次数与所述目标应用在所述第n个地域被下载的次数之和确定为所述目标应用在所述第n个地域的被操作次数。

可选的,如果所述地域性特征值为相对局部密度值,所述特征值确定202单元,具体用于:

针对第n地域的被操作次数确定邻居区域半径,以及确定所述第n地域的被操作次数为圆心,n取1至N;

将所述第n地域的被操作次数,相对于所述邻居区域半径内的除所述第n地域之外的各个地域的被操作次数计算密度,作为所述第n地域的相对局部密度值。

可选的,所述地域标记单元203,包括:

确定子单元,用于从所述N个地域中,确定出所述地域性特征值大于所述预设特征阈值的P个地域,P为小于N的正整数;

地域标识标记子单元,用于将所述P个地域的应用地域标识标记在所述目标应用上。

可选的,所述地域标识标记子单元,具体用于:

获取所述目标应用在所述P个地域被操作时各自对应的IP地址;

从所述目标应用在所述P个地域被操作时各自对应的IP地址中,解析出所述P个地域的标识,并标记在所述目标应用上。

可选的,所述装置还包括:

第一应用查找单元,用于接收来自搜索客户端的包含搜索关键字和表征所述搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含所述搜索关键字的应用;

第二应用查找单元,用于从包含所述搜索关键字的应用中查找应用地域标识与所述请求地域标识匹配的地域性应用;

第一反馈单元,用于将查找到的应用地域标识与所述请求地域标识匹配的地域性应用,反馈给所述搜索客户端。

可选的,所述装置还包括:

第三应用查找单元,用于接收来自搜索客户端的包含搜索关键字和表征所述搜索客户端所在地的请求地域标识的应用查询请求时,查找出包含所述搜索关键字的应用;

第四应用查找单元,用于从包含所述搜索关键字的应用中查找应用地域标识与所述请求地域标识匹配的地域性应用;

应用排序单元,用于将查找到的包含所述搜索关键字的应用进行排序,其中,应用地域标识与所述请求地域标识匹配的地域性应用的排序在应用地域标识与所述请求地域标识不匹配的地域性应用、以及非地域性应用之前;

第二反馈单元,用于将排序后包含所述搜索关键字的应用反馈给所述搜索客户端。

由于本发明实施例所介绍的装置,为实施本发明实施例的地域性应用挖掘方法所采用的装置,故而基于本发明实施例所介绍的地域性应用挖掘方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例使用地域性应用挖掘方法所采用的装置都属于本发明所欲保护的范围。

本发明实施例提供的一个或多个实施例,至少实现了如下技术效果或优点:

本发明实施例通过同一目标应用在N个地域各自的被操作次数,确定目标应用在所述N个地域各自的地域性特征值;如果目标应用在N个地域中至少一个地域的地域性特征值大于预设特征阈值,将目标应用标记为地域性应用。从而根据同一应用在不同地域的被操作次数的不同识别目标应用的地域性,又通过地域性特征值平滑了被操作次数识别目标应用的地域性时的一部分噪音信号,进而准确地确定了目标应用的地域性,不需要匹配关键字,因此避免了通过关键字匹配应用的名称、描述文字涉及到的地点信息来识别应用的地域性时的误召回,即使应用的名称、描述文字不包含地点信息,也能准确识别出其地域性,从而准确挖掘地域性应用。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1