一种对呼叫进行分类的方法和装置与流程

文档序号:11254555阅读:756来源:国知局
本申请涉及通信
技术领域
:,尤其涉及一种对呼叫进行分类的方法和装置。
背景技术
::在进行网络优化时,运营商常常需要利用服务器等处理装置对获取的数据包中的各呼叫的移动状态进行分类。需要说明的是,使用手机、平板电脑(portableandroiddevice,pad)等通信终端进行通话时,我们认为一次通话过程对应两次呼叫,其中,发起通话的通信终端对应一次呼叫,接收通话的通信终端也对应一次呼叫。另外手机、pad等便携式通讯设备通过基站上网时,一次上网过程也对应一次呼叫。在服务器获取的数据包中,每次呼叫对应一个数据集合,每个数据集合包括在一次呼叫过程中通信终端发送给基站的所有测量报告(measurementreport,mr)。本申请的发明人发现,在对呼叫进行分类时,现有技术是对一次呼叫对应的数据集合进行简单处理,根据获取的小区数和切换数这两个参数进行分类的。以用户使用通信终端在某个区域来回走动这个场景对应的呼叫为例,数据集合中小区数和切换数可能都比较大,现有技术可能会将这次呼叫分到高速运动的类别,这显然是与呼叫的实际移动状态不一致。因此,现有技术对呼叫进行分类时不准确。技术实现要素:本申请实施例提供了一种对呼叫进行分类的方法和装置,用于提高对呼叫进行分类的精度。第一方面,本申请实施例提供了一种对呼叫进行分类的方法,所述方法包括:获取数据包,所述数据包包括与n个呼叫分别对应的n个数据集合,所述n个呼叫中的任一呼叫hi对应的数据集合包括通信终端在所述呼叫hi过程中依次向基站发送的所有测量报告mr,其中,所述n为大于1的整数,所述1≤i≤n;对所述n个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定所述每个呼叫经各预设时间窗切分后对应的特征集,所述特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值,所述自定义特征与呼叫的移动状态相关;根据所述每个呼叫经各预设时间窗切分后对应的特征集,对所述n个呼叫按照预设的移动状态的类别进行分类。本申请各实施例中,所述至少一个自定义特征,包括如下自定义特征中的至少一个:接收信号强度标准差、切换熵、室外小区占比、和站间距离速度;其中,所述接收信号强度标准差,是所述呼叫hj接收信号强度值的标准差;所述切换熵,用于表示所述呼叫hj接入小区的不确定度;所述室外小区占比,是所述呼叫hj接入室外类型小区的个数占所有接入小区总个数的百分比;所述站间距离速度,是所述呼叫hj获得的所有位置信息的均值与所述呼叫的所有位置的最远距离。在一些可能的实施方式中,,所述切换熵根据如下公式计算得到:其中,所述entropy为所述呼叫hj对应的切换熵,所述其中n表示所述呼叫hj接入的小区总数,i表示所述呼叫hj接入的第i个小区,#i表示所述呼叫hj接入第i个小区的次数,t表示接入不同小区的总次数,pi表示在这段时间内接入第i个小区的概率。可以看出,上述技术方案中,由于设置了与呼叫的移动状态相关的自定义特征,所以在对移动状态进行判断时,除了可以根据呼叫对应的小区数和切换数,还可以结合自定义特征进行判断,这样有利于提高对呼叫进行分类时的精度。在一些可能的实施方式中,根据接入小区性质的不同,所述呼叫hj对应的预设特征集中的所述接收信号强度标准差,包括:主服务小区的接收信号强度标准差、相邻小区的接收信号强度标准差和全部小区的接收信号强度标准差:所述呼叫hj对应的预设特征集中的所述切换熵,包括:主服务小区的熵、相邻小区的熵和全部小区的熵。在一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述n'个呼叫中的任一呼叫对应的预设特征集还包括:平均速度,其中,所述n'≥1。在一些可能的实施方式中,所述精确地理位置信息包括通过agps或ott定位服务获得的位置信息。在一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述对所述n个呼叫按照预设的移动状态的类别进行分类,包括:所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的平均速度确定所述呼叫hk的类别,其中,所述1≤k≤n';根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,对所述n个呼叫按照预设的移动状态的类别进行分类,包括:当所述n'个呼叫中包括地理信息(geographyinformationsystem,gis)信息时,获取所述gis信息中指定的地物信息的位置,所述指定的地物信息是与所述预设的移动状态强相关的地物信息;地物信息比如可以是:住宅、商场、公园、道路、路口、高速公路或者铁路等。所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的速度确定所述呼叫hk的类别,其中,所述1≤k≤n';确定所述任一呼叫hk匹配的地物信息;确定与所述n'个呼叫对应的地物信息的集合j;根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,以及所述地物信息的集合j使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,确定所述集合j中任一地物信息对应的所述n'个呼叫中呼叫的集合ji,若所述集合ji中包括n”个呼叫,所述n”个呼叫对应的移动状态的类型的集合为ji',所述集合ji'对应的移动状态的类型数为n”',若所述集合ji'中某一移动状态的类型对应的呼叫的个数小于则复制该移动状态的类型对应的呼叫对应的向量f。通过这种方式可以提高概率较小的类别的分类精度。根据所述n'个呼叫中的每个呼叫对应的移动状态的类别、所述向量f以及与每个呼叫对应的预设特征集对应的向量,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述预设特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的预设特征集得到该呼叫在所述m为空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,当所述n个呼叫中不包括精确地理位置信息时,所述对所述n个呼叫按照预设的移动状态的类别进行分类,包括:根据所述n个呼叫对应的所述预设特征集的集合,得到与所述n个呼叫分别对应的n个与所述预设特征集对应的向量;根据n个所述向量和非监督学习算法,将所述n个呼叫分为m个集合,所述m大于预设的移动状态的类别的个数;根据专家规则,将所述m个集合按照预设的移动状态的类别进行分类,则任一呼叫的类别与其所属集合的类别相同。第二方面,本申请实施例提供了一种对呼叫进行分类的装置,所述装置包括:获取单元,用于获取数据包,所述数据包包括与n个呼叫分别对应的n个数据集合,所述n个呼叫中的任一呼叫hi对应的数据集合包括通信终端在所述呼叫hi过程中依次向基站发送的所有测量报告mr,其中,所述n为大于1的整数,所述1≤i≤n;第一处理单元,用于对所述n个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定所述每个呼叫经各预设时间窗切分后对应的特征集,所述特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值,所述自定义特征与呼叫的移动状态相关;分类单元,用于根据所述每个呼叫经各预设时间窗切分后对应的特征集,对所述n个呼叫按照预设的移动状态的类别进行分类。本申请各实施例中,所述至少一个自定义特征,包括如下自定义特征中的至少一个:接收信号强度标准差、切换熵、室外小区占比、和站间距离速度;其中,所述接收信号强度标准差,是所述呼叫hj接收信号强度值的标准差;所述切换熵,用于表示所述呼叫hj接入小区的不确定度;所述室外小区占比,是所述呼叫hj接入室外类型小区的个数占所有接入小区总个数的百分比;所述站间距离速度,是所述呼叫hj获得的所有位置信息的均值与所述呼叫的所有位置的最远距离。在一些可能的实施方式中,所述切换熵可以根据如下公式计算得到:其中,所述entropy为所述呼叫hj对应的切换熵,所述其中n表示所述呼叫hj接入的小区总数,i表示所述呼叫hj接入的第i个小区,#i表示所述呼叫hj接入第i个小区的次数,t表示接入不同小区的总次数,pi表示在这段时间内接入第i个小区的概率。可以看出,上述技术方案中,由于设置了与呼叫的移动状态相关的自定义特征,所以在对移动状态进行判断时,除了可以根据呼叫对应的小区数和切换数,还可以结合自定义特征进行判断,这样有利于提高对呼叫进行分类时的精度。在一些可能的实施方式中,根据接入小区性质的不同,所述呼叫hj对应的预设特征集中的所述接收信号强度标准差,包括:主服务小区的接收信号强度标准差、相邻小区的接收信号强度标准差和全部小区的接收信号强度标准差:所述呼叫hj对应的预设特征集中的所述切换熵,包括:主服务小区的熵、相邻小区的熵和全部小区的熵。在一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述n'个呼叫中的任一呼叫对应的预设特征集还包括:平均速度,其中,所述n'≥1。在一些可能的实施方式中,所述精确地理位置信息包括通过agps或ott定位服务获得的位置信息。在一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述分类单元具体用于,所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的平均速度确定所述呼叫hk的类别,其中,所述1≤k≤n';根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,所述分类单元具体用于,当所述n'个呼叫中包括gis信息时,获取所述gis信息中指定的地物信息的位置,所述指定的地物信息是与所述预设的移动状态强相关的地物信息;所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的速度确定所述呼叫hk的类别,其中,所述1≤k≤n';确定所述任一呼叫hk匹配的地物信息;确定与所述n'个呼叫对应的地物信息的集合j;根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,以及所述地物信息的集合j使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,当所述n个呼叫中不包括精确地理位置信息时,所述分类单元具体用于,根据所述n个呼叫对应的所述预设特征集的集合,得到与所述n个呼叫分别对应的n个与所述预设特征集对应的向量;根据n个所述向量和非监督学习算法,将所述n个呼叫分为m个集合,所述m大于预设的移动状态的类别的个数;根据专家规则,将所述m个集合按照预设的移动状态的类别进行分类,则任一呼叫的类别与其所属集合的类别相同。第三方面,本申请实施例提供了一种存储介质,所述存储介质为非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有至少一个程序,每个所述程序包括指令,所述指令包括可被具有处理器的装置执行的本申请实施例提供的任意一种对呼叫进行分类的方法的部分或全部步骤的指令。第四方面,本申请实施例提供了一种对呼叫进行分类的装置,其特征在于,包括:相互耦合的处理器和存储部件;其中,所述处理器用于执行权利要求1至9任一项所述方法。附图说明为了更清楚地说明本申请实施例或
背景技术
:中的技术方案,下面将对本申请实施例或
背景技术
:中所需要使用的附图进行说明。图1是本申请实施例应用的一个场景示意图;图2是本申请的一个实施例提供的一种对呼叫进行分类的方法的流程示意图;图3是图1中各通信终端实际移动轨迹及对应站间距离速度示意图;图4是本申请的另一实施例提供的一种对呼叫进行分类的装置的结构示意图。具体实施方式下面结合本申请实施例中的附图对本申请实施例进行描述。请参见图1,图1是本申请实施例应用的一个场景示意图。如图1所示,对呼叫进行分类的装置101从多个基站(bts1、bts2、bts3、bts4、…、btsn)获取数据包,数据包包括与多个呼叫分别对应的数据集合,任一呼叫对应的数据集合包括通信终端在呼叫过程中依次向基站发送的所有测量报告(measurementreport,mr),mr是通信终端反馈给对呼叫进行分类的装置101的信息,在mr中包括本申请实施例要用到的终端接收的服务小区、邻区、及这些小区对应的信号强度等信息。图1中的通信终端a位于汽车上,随着汽车移动高速移动。通信终端b位于室内,处于静止状态。通信终端c随着用户步行低速移动。由图1可知在不同时刻t1、t2和t3时,不同通信终端移动距离不同,其中通信终端a移动最远,通信终端c其次,通信终端b未移动。现有技术中,在确定通信终端的移动状态时,通常根据通信终端呼叫时对应的小区数和切换数来确定。需要说明的是,当通信终端在小范围内快速移动时,根据现有技术,由于小区数及切换数较小,得到的通信终端的移动状态可能是慢速或者静止,因此现有技术对呼叫进行分类时不准确。为了提高对通信终端移动状态分类的精度,本申请实施例中引入了与呼叫的移动状态相关的自定义特征,进行分类的装置101获取多个呼叫对应的数据包,并对多个呼叫的移动状态进行分类。具体地,如图2所示,本申请实施例提供的对呼叫进行分类的方法,所述方法包括如下步骤:s201、获取数据包,所述数据包包括与n个呼叫分别对应的n个数据集合,所述n个呼叫中的任一呼叫hi对应的数据集合包括通信终端在所述呼叫hi过程中依次向基站发送的所有测量报告mr,其中,所述n为大于1的整数,所述1≤i≤n。s202、对所述n个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定所述每个呼叫经各预设时间窗切分后对应的特征集,所述特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值,所述自定义特征与呼叫的移动状态相关。其中,小区数是在一段时间(比如30秒、或者1分钟、或者5分钟等)内总共接入的小区数目。其中,切换数是在一端时间(比如30秒、或者1分钟、或者5分钟等)内总共发生的切换数目其中,所述至少一个自定义特征,包括如下自定义特征中的至少一个:接收信号强度标准差、切换熵、室外小区占比、和站间距离速度;其中,所述接收信号强度标准差,是所述呼叫hj接收信号强度值的标准差。具体地,可以是在一段时间(比如30秒、或者1分钟、或者5分钟等)内多次测量获得的接受信号强度值的标准差。可以理解的,按照接收信号发送端性质的不同,接收信号强度标准差可以分为主服务小区的接收信号强度标准差、相邻小区的接收信号强度标准差和全部小区的接收信号强度标准差。一般情况下,通信终端移动速度越快,接收信号强度标准差的值越大。所述切换熵,用于表示所述呼叫hj接入小区的不确定度。具体地,可以是在一段时间(比如30秒、或者1分钟、或者5分钟等)内通信终端接入不同小区的不确定度,取值在0到1之间。举例来说,若通信终端为静止状态,则它在这段时间内接入小区只有一个,其切换熵为0。可以理解的,通信终端移动速度越快,其在一段时间内接入小区数目及小区切换数越大,其切换熵越趋近于1。举例来说若切换熵为0.2,可以推断通信终端处于低速移动状态。若切换熵为0.9,可以推断通信终端处于高速移动状态。在一些可能的实施方式中,切换熵可以根据如下公式计算得到:其中,所述entropy为所述呼叫hj对应的切换熵,所述其中n表示所述呼叫hj接入的小区总数,i表示所述呼叫hj接入的第i个小区,#i表示所述呼叫hj接入第i个小区的次数,t表示接入不同小区的总次数,pi表示在这段时间内接入第i个小区的概率。根据接入小区性质的不同,所述切换熵,包括:主服务小区的熵、相邻小区的熵和全部小区的熵。所述室外小区占比,是所述呼叫hj接入室外类型小区的个数占所有接入小区总个数的百分比。可以理解的,若室外小区占比低于50%,则可以认为通信终端位于室内,为静止状态。所述站间距离速度,是所述呼叫hj获得的所有位置信息的均值与所述呼叫的所有位置的最远距离。具体地,可以是用户在一段时间内所获得的所有位置信息(包括mr定位,agps定位,ott定位)的均值与所有位置的最远距离。站间距离速度越大,则认为通信终端的移动速度越大。对于通信终端在一段时间内从一个位置出发又回到该位置的情况,站间距离速度比简单的速度计算模型,即起终点距离与时间差比值,更能表征该用户的运动速度。参见图3,其中各通信终端的实际移动轨迹如图3中虚线所示,图中带箭头的实线段的起始位置指示位置信息的均值,带箭头的线段的箭头指示的位置为在指定窗口时间内距离所述均值最远的点,带箭头的线段的距离为站间举例速度。由图3可知,左边通信终端的站间距离速度最大,中间通信终端的站间距离速度次之,右边通信终端的站间距离速度最小。s203、根据所述每个呼叫经各预设时间窗切分后对应的特征集,对所述n个呼叫按照预设的移动状态的类别进行分类。需要说明的是,先计算经任一预设时间窗切分得到的多个呼叫分别对应的特征集,然后确定多个特征集的平均值,作为该预设时间窗对应的特征集。比如一个呼叫h1经预设的30秒的时间窗切分为6个小的呼叫,则分别计算着6个小的呼叫对应的特征集,然后对得到的6个特征集中每个特征的平均值,将平均值做为该呼叫h1的特征集。可以看出,上述技术方案中,由于设置了与呼叫的移动状态相关的自定义特征,所以在对移动状态进行判断时,除了可以根据呼叫对应的小区数和切换数,还可以结合自定义特征进行判断,这样有利于提高对呼叫进行分类时的精度。在一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述对所述n个呼叫按照预设的移动状态的类别进行分类,包括:所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的平均速度确定所述呼叫hk的类别,其中,所述1≤k≤n'。比如若n为1000,n'为120,则在1000个呼叫中有120个呼叫对应的数据集合中包括精确地理位置信息。其中,精确地理位置信息包括通过辅助全球卫星定位系统(ssistedglobalpositioningsystem,agps)或通过互联网的应用服务(overthetop,ott)获取。根据所述120个带有精确地理位置信息的呼叫的地理位置信息可以获取这120个呼叫中每个呼叫的平均速度,根据预设的移动状态的类别对应的评价速度确定这些呼叫的移动状态的类别。根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,当所述n'个呼叫中包括gis信息时,获取所述gis信息中指定的地物信息的位置,所述指定的地物信息是与所述预设的移动状态强相关的地物信息;地物信息比如可以是:住宅、商场、公园、道路、路口、高速公路或者铁路等。所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的速度确定所述呼叫hk的类别,其中,所述1≤k≤n';确定所述任一呼叫hk匹配的地物信息;确定与所述n'个呼叫对应的地物信息的集合j;根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,以及所述地物信息的集合j使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数。举例来说在一些可能的实施方式中,在一些可能的实施方式中,确定所述集合j中任一地物信息对应的所述n'个呼叫中呼叫的集合ji,若所述集合ji中包括n”个呼叫,所述n”个呼叫对应的移动状态的类型的集合为ji',所述集合ji'对应的移动状态的类型数为n”',若所述集合ji'中某一移动状态的类型对应的呼叫的个数小于则复制该移动状态的类型对应的呼叫对应的向量f。通过这种方式可以提高概率较小的类别的分类精度。根据所述n'个呼叫中的每个呼叫对应的移动状态的类别、所述向量f以及与每个呼叫对应的预设特征集对应的向量,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述预设特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的预设特征集得到该呼叫在所述m为空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。举例来说,若gis对应的地物信息为公园,经过公园的包括精确地理位置的呼叫有150个,其中92个呼叫对应的移动状态为慢速移动,51个呼叫对应的移动状态为静止,7个呼叫对应的移动状态为高速运动。由于高速运动对应的呼叫数小于150/3=50,所以可以复制高速运动的呼叫对应的向量,复制后使高速运动对应的向量达到50或者50以上,然后在利用前面所述150个呼叫对应的预设特征集对应的向量,以及复制得到的43个(以复制后高速运动对应的呼叫数为50个为例)移动状态为高速运动的呼叫对应的向量,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围。对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。在一些可能的实施方式中,当所述n个呼叫中不包括精确地理位置信息时,根据所述n个呼叫对应的所述预设特征集的集合,得到与所述n个呼叫分别对应的n个与所述预设特征集对应的向量;根据n个所述向量和非监督学习算法,将所述n个呼叫分为m个集合,所述m大于预设的移动状态的类别的个数;举例来说,若预设的移动状态包括4种:静止、低速运动、中速运动、和高速运动。若n为1000,在本发明的一些可能的实施方式中,可以将1000个呼叫根据非监督学习算法分成20个集合,然后按照因子分析法、迭代算法、主成分分析法等专家算法确定所述20个集合中的每个集合的移动状态。比如将切换熵的值为0的集合的移动状态确定为静止。将切换熵为0.7以上且切换数大于5的集合中呼叫的移动状态确定为高速移动等。则任一呼叫的类别与其所属集合的类别相同。请参阅图4,为本申请实施例提供的一种对呼叫进行分类的装置400,具体地,图4所示的对呼叫进行分类的装置400可以包括:获取单元401、第一处理单元402、和分类单元403。其中,获取单元401用于执行本发明方法实施例图2中步骤s201的方法,获取单元401的实施方式可以参考本发明方法实施例图2中步骤s201对应的描述,在此不再赘述。第一处理单元402用于执行本发明方法实施例图2中步骤s202的方法,第一处理单元402的实施方式可以参考本发明方法实施例图2中步骤s202对应的描述,在此不再赘述。分类单元403用于执行本发明方法实施例图2中步骤s203的方法,分类单元403的实施方式可以参考本发明方法实施例图2中步骤s203对应的描述,在此不再赘述。可选的,在本发明一些可能的实施方式中,所述至少一个自定义特征,包括如下自定义特征中的至少一个:接收信号强度标准差、切换熵、室外小区占比、和站间距离速度;其中,所述接收信号强度标准差,是所述呼叫hj接收信号强度值的标准差;所述切换熵,用于表示所述呼叫hj接入小区的不确定度;所述室外小区占比,是所述呼叫hj接入室外类型小区的个数占所有接入小区总个数的百分比;所述站间距离速度,是所述呼叫hj获得的所有位置信息的均值与所述呼叫的所有位置的最远距离。可选的,在本发明一些可能的实施方式中,所述切换熵根据如下公式计算得到:其中,所述entropy为所述呼叫hj对应的切换熵,所述其中n表示所述呼叫hj接入的小区总数,i表示所述呼叫hj接入的第i个小区,#i表示所述呼叫hj接入第i个小区的次数,t表示接入不同小区的总次数,pi表示在这段时间内接入第i个小区的概率。可选的,在本发明一些可能的实施方式中,根据接入小区性质的不同,所述呼叫hj对应的预设特征集中的所述接收信号强度标准差,包括:主服务小区的接收信号强度标准差、相邻小区的接收信号强度标准差和全部小区的接收信号强度标准差:所述呼叫hj对应的预设特征集中的所述切换熵,包括:主服务小区的熵、相邻小区的熵和全部小区的熵。可选的,在本发明一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述n'个呼叫中的任一呼叫对应的预设特征集还包括:平均速度,其中,所述n'≥1。所述精确地理位置信息包括通过agps或ott定位服务获得的位置信息。可选的,在本发明一些可能的实施方式中,当所述n个呼叫中有n'个呼叫对应的数据集合中包括精确地理位置信息时,所述分类单元具体用于,所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的平均速度确定所述呼叫hk的类别,其中,所述1≤k≤n';根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。可选的,在本发明一些可能的实施方式中,所述分类单元具体用于,当所述n'个呼叫中包括gis信息时,获取所述gis信息中指定的地物信息的位置,所述指定的地物信息是与所述预设的移动状态强相关的地物信息;所述n'个呼叫中的任一呼叫hk根据其对应的平均速度按照预设的移动状态的类别分别对应的速度确定所述呼叫hk的类别,其中,所述1≤k≤n';确定所述任一呼叫hk匹配的地物信息;确定与所述n'个呼叫对应的地物信息的集合j;根据所述n'个呼叫中的每个呼叫对应的类别、以及所述n'个呼叫中的每个呼叫对应的所述特征集的集合,以及所述地物信息的集合j使用监督学习算法确定任意两个所述预设的移动状态的类别在m维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述m维空间分布的区域范围,所述m为所述呼叫hk对应的所述特征集中特征的个数;对于所述n个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(n-n')个呼叫,任一所述(n-n')个呼叫根据其对应的特征集的集合得到该呼叫在所述m维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述m维空间分布的区域范围,确定所述任一所述(n-n')个呼叫对应的移动状态。可选的,在本发明一些可能的实施方式中,当所述n个呼叫中不包括精确地理位置信息时,所述分类单元具体用于,根据所述n个呼叫对应的所述预设特征集的集合,得到与所述n个呼叫分别对应的n个与所述预设特征集对应的向量;根据n个所述向量和非监督学习算法,将所述n个呼叫分为m个集合,所述m大于预设的移动状态的类别的个数;根据专家规则,将所述m个集合按照预设的移动状态的类别进行分类,则任一呼叫的类别与其所属集合的类别相同。本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,所述程序执行时包括上述方法实施例中记载的任意一种对呼叫进行分类的方法的部分或全部步骤。本申请实施例还提供一种对呼叫进行分类的装置,包括:相互耦合的处理器和存储部件;其中,所述处理器用于执行上述方法实施例中记载的任意一种对呼叫进行分类的方法。本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-onlymemory,rom)或随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可存储程序代码的介质。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1