基站类型识别方法、装置、终端和计算机可读存储介质与流程

文档序号:17237153发布日期:2019-03-30 08:24阅读:322来源:国知局
基站类型识别方法、装置、终端和计算机可读存储介质与流程

本发明涉及终端技术领域,特别涉及一种基站类型识别方法、装置、终端和计算机可读存储介质。



背景技术:

伪基站是当前一种用于实施电信诈骗的设备,主要由主机和笔记本电脑组成或由主机和手机组成。伪基站通常是通过短消息群发器或短消息发信机等设备搜索以该伪基站为中心、半径为一定距离的范围内的手机信息,然后通过伪装成运营商基站,冒用他人的手机号码向搜索到的手机发送诈骗、广告等短消息。

目前识别伪基站的方法是通过基于预设关键字对短消息内容进行关键字提取,当提取的关键字的数量或组合符合预设条件,则认为该短消息为诈骗或广告等垃圾短消息,将发送该短消息的基站类型识别为伪基站。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:

对短消息内容进行识别时,如果关键字的设置的不够准确,很可能导致误识别,因此,基于上述识别方法的识别准确率较低。



技术实现要素:

本发明实施例提供了一种基站类型识别方法、装置、终端和计算机可读存储介质,可以解决现有技术中识别准确率低的问题。所述技术方案如下:

第一方面,提供了一种基站类型识别方法,应用于终端上,所述方法包括:

获取待识别的短消息的消息数据,所述消息数据包括发送所述短消息的基站信息和短消息内容;

分别对所述基站信息和短消息内容进行识别,得到基站识别结果和内容识别结果;

调用基站识别模型,将所述基站识别结果、所述内容识别结果输入所述基站识别模型,输出基站的基站类型,所述基站类型用于指示所述基站是否为伪基站;

其中,所述基站识别模型基于多个样本短消息的消息数据以及发送每个样本短消息的基站的已知基站类型训练得到。

第二方面,提供了一种基站类型识别装置,应用于终端上,所述装置包括:

获取模块,用于获取待识别的短消息的消息数据,所述消息数据包括发送所述短消息的基站信息和短消息内容;

识别模块,用于分别对所述基站信息和短消息内容进行识别,得到基站识别结果和内容识别结果;

所述类型识别模块,还用于调用基站识别模型,将所述基站识别结果、所述内容识别结果输入所述基站识别模型,输出基站的基站类型,所述基站类型用于指示所述基站是否为伪基站;

其中,所述基站识别模型基于多个样本短消息的消息数据以及发送每个样本短消息的基站的已知基站类型训练得到。

第三方面,提供了一种终端,所述终端包括:处理器;用于存放计算机程序的存储器;其中,所述处理器用于执行存储器上所存放的计算机程序,实现第一方面所述的方法步骤。

第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。

本发明实施例提供的技术方案带来的有益效果是:

本发明实施例先通过识别发送该短消息的基站信息初步判断该基站是否伪基站,还通过识别该消息的内容判断该短消息是否垃圾短消息,为该短消息进行分类,初步判断发送该短消息的基站是否伪基站,最后综合两种初步判断结果进行进一步的分析,最终判断该基站是否为伪基站,从而得到基站的基站类型,可以避免只对短消息的内容进行识别时,由于关键字设置的不准确可能导致的误识别,从而提高了识别准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种移动通信系统的示意图;

图2是本发明实施例提供的一种基站类型识别方法流程图;

图3是本发明实施例提供的一种基站类型识别装置的结构示意图;

图4是本发明实施例提供的一种基站类型识别装置的结构示意图;

图5是本发明实施例提供的一种基站类型识别装置的结构示意图;

图6是本发明实施例提供的一种基站类型识别装置的结构示意图;

图7是本发明实施例提供的一种基站类型识别装置的结构示意图;

图8是本发明实施例提供的一种终端800的结构示意图;

图9是本发明实施例提供的一种基站类型识别装置900的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种移动通信系统的示意图,参见图1,该移动通信系统包括:终端101和基站102。

终端101和基站102通过移动通信网络进行连接,可以互相进行通信。该终端101可以安装有用户身份识别卡(subscriberidentificationmodulecard,sim卡),该终端101的国际移动用户识别码(internationalmobilesubscriberidentificationnumber,imsi)存储在该sim卡中,基站102可以基于imsi与终端101进行数据交互。终端101可以接收基站102发送的数据,也可以发送数据至基站102。终端101与终端101之间的通信是通过基站102实现的。终端101与基站102建立网络连接后,也可以获取到该基站102的基站信息,该基站102的基站信息包括:移动国家代码(mobilecountrycode,mcc)、移动网络号码(mobilenetworkcode,mnc)、位置区码(locationareacode,lac)、小区识别码(cellidentity,cid)和基站信号强度(basestationsignalstrength,bsss)。例如,中国的mcc为460。mnc为2位数字,例如,中国移动系统使用00、02、04、07,中国联通系统使用01、06、09、10,中国电信系统使用03、05、11,中国铁通系统使用20。位置区码采用十六进制,范围为0001-fffe,小区识别码为16位的数据,范围为0-65535。当然,该通信系统中可能还包括伪装成基站的伪基站,该伪基站与终端101之间进行网络连接的过程与基站102与终端之间进行网络连接的过程类似,在此不多做赘述。在本发明实施例中,基站102发送短消息至终端101,终端101可以对该基站102的基站类型进行识别,以识别该基站102是否为伪基站。

图2是本发明实施例提供的一种基站类型识别方法流程图,该方法应用于终端上,参见图2,基站类型识别方法包括以下步骤:

201、终端获取待识别的短消息的消息数据。

终端之间进行短消息交互时,发送方终端将短消息发送至基站,由基站将短消息发送至接收方终端。当终端位于伪基站的覆盖范围内时,伪基站可以通过短消息群发器或短消息发信机等设备搜索到该终端,并强行与搜索到的终端建立连接,并将短消息发送至终端。终端接收到该短消息,可以对发送该短消息的基站进行识别,确定该基站为伪基站。

终端可以在接收到基站发送的短消息后,获取该短消息的消息数据。该消息数据包括基站的基站信息和短消息内容。其中,基站信息包括mcc、mnc、lac、cid和bsss。终端与基站建立网络连接,并接收到基站发送的短消息时,该短消息的特定字段会携带有该基站的mcc、mnc、lac和cid,终端可以直接从该短消息的特定字段中获取mcc、mnc、lac、cid以及该短消息的短消息内容,并通过实时计算获取bsss。

202、当终端根据基站信息确定基站符合多种预设条件中的至少一种预设条件时,输出第一基站识别结果。

该多种预设条件可以包括以下四种预设条件:

第一种预设条件、基站信息中任一项不在规定的取值范围内。

基站的mcc、mnc、lac和cid均具有规定的取值范围,终端可以判断获取到的基站信息中的mcc、mnc、lac和cid是否均在规定的取值范围内,当上述基站信息中任一项不在其规定的取值范围内时,也即是,当确定基站符合第一种预设条件时,可以确定该基站信息不是合法基站信息,从而可以初步确定该基站是伪基站,输出第一基站识别结果。而当基站的mcc、mnc、lac和cid均在规定的取值范围内时,也可以输出第二基站识别结果,并继续后续识别过程。需要说明的是,上述规定的取值范围为mcc、mnc、lac和cid的合法取值范围,该取值范围可以是由技术人员基于经验设置。

终端对该基站信息进行识别的过程可以使用一种用于识别伪基站的识别模型实现,该识别模型可以基于基站信息样本训练得到,其中,每个基站信息样本可以包括基站信息以及该基站信息的已知基站类型。终端可以将基站信息输入该识别模型,在该识别模型中对该基站信息进行识别,并输出基站识别结果。该基站识别结果可以是第一基站识别结果或第二基站识别结果,其中,第一基站识别结果用于指示该基站是伪基站,第二基站识别结果用于指示该基站不是伪基站。当然,在模型输出时可以输出1或0,以指示不同基站识别结果,具体以1来指示第一基站识别结果还是以0来指示第一基站识别结果,可以基于模型训练时的算法确定,在此不做具体限定。在本发明实施例中,以1来指示第一基站识别结果为例。

第二种预设条件、基站在预设时间内的信号强度变化大于指定强度值。

由于伪基站为了能够屏蔽掉正常基站的信号,并能够强行与终端建立连接,通常会采用信号增强器,因而伪基站的信号强度一般为高强度,但在其信号覆盖范围内的信号强度分布情况不均匀,因而当终端进行移动时,伪基站的信号强度可能会发生很大的变化,而正常基站的信号一般比较稳定,因而可以通过计算基站在预设时间内的信号强度变化大于指定强度值,确定该基站是否为伪基站。该预设时间是指最近一段时间,终端可以实时计算每一个时刻与其连接的基站的信号强度,得到该基站在预设时间内每一个时刻的信号强度,在该预设时间内信号强度中,用最大值减去最小值,得到该基站在预设时间内的信号强度变化,确定该信号强度变化是否大于指定强度值。当终端确定基站在预设时间内的信号强度变化大于指定强度值时,也即是,当终端确定基站符合第二种预设条件时,可以初步确定该基站为伪基站,输出第一基站识别结果。当终端确定基站在预设时间内的信号强度变化小于或等于指定强度值时,也即是,当终端确定基站不符合第二种预设条件时,可以输出第二基站识别结果。在上述识别过程中,终端也可以通过基于基站在预设时间内的信号强度变化和已知基站类型进行模型训练,来建立识别模型,并通过识别模型来实现该识别过程,在此不多做赘述。

第三种预设条件、基站在预设时间内的位置变化次数大于指定次数。

由于伪基站具有很强的流动性,例如,伪基站的lac可以经常变化,有些伪基站的lac也可以固定不变,而cid会经常变化,且,终端可以将自己接入的基站的lac和cid发送至服务器,由服务器根据接收到的该基站附近的基站的基站信息,来确定该基站在预设时间内的位置变化。终端可以将自己接入的伪基站的lac和cid发送至服务器,也可以将其在接入伪基站之前和之后接入的正常基站的lac和cid发送至服务器,这些正常基站均可以作为该伪基站附近的基站,服务器可以根据这个伪基站接入前后的正常基站是否是相邻的基站,从而可以确定该基站是否发生了位置变化,或者,在另一种实施方式中,由于多个终端可能将自己接入的正常基站和伪基站的lac和cid发送至服务器,因此,服务器还可以基于不同终端所发送的信息进行判断,对于一个基站来说,如果基于第一终端所发送的信息确定该基站的第一相邻基站,基于第二终端所发送的信息确定该基站的第二相邻基站,而第一相邻基站和第二相邻基站之间距离大于预设距离,则可以确定该基站为伪基站。服务器还可以统计该基站在预设时间内的位置变化次数,并将得到的统计结果发送至终端。终端可以根据该统计结果,确定该基站在预设时间内的位置变化次数是否大于指定次数。

预设时间是指最近一段时间,服务器可以将计算得到每个时刻该基站附近的基站进行比较,可以通过确定该基站附近的基站是否为相邻基站,来确定该基站在预设时间内是否发生了位置变化。当确定基站在预设时间内发生了位置变化时,还可以统计基站在预设时间内的位置变化次数,从而将该位置变化次数与指定次数进行比较,确定该基站在预设时间内的位置变化次数是否大于指定次数。当终端确定基站在预设时间内的位置变化次数大于指定次数时,也即是,当终端确定基站符合第三种预设条件时,可以初步确定该基站为伪基站,输出第一基站识别结果。当终端确定基站在预设时间内的位置变化次数小于或等于指定次数时,也即是,当该终端确定基站在预设时间内不符合第二预设条件时,可以输出第二基站识别结果。在上述识别过程中,终端也可以通过基于基站在预设时间内的位置变化次数和已知基站类型进行模型训练,来建立识别模型,并通过识别模型来实现该识别过程,在此不多做赘述。

第四种预设条件、基站在预设时间内的位置变化的最大距离大于指定距离。

由于正常基站的位置一般为固定不变的,即使通过lac和cid计算得到的基站的位置有一定误差,位置变化的距离也不会太大,因而可以通过判断该基站的位置变化的距离是否大于指定距离,确定该基站是否为伪基站。与第二种预设条件中同理,该预设时间是指最近一段时间,终端可以将该基站的lac和cid发送至服务器,由服务器计算得到基站在预设时间内的位置,并确定该基站在预设时间内是否发生了位置变化,终端还可以计算该基站在预设时间内的位置之间的距离,从而确定该基站在预设时间内的位置变化的最大距离,并将计算结果发送至终端。当终端确定基站在预设时间内的位置变化的最大距离大于指定距离时,也即是,当终端确定基站符合第四种预设条件时,可以初步确定该基站为伪基站,输出第一基站识别结果。当终端确定基站在预设时间内的位置变化的最大距离小于或等于指定距离时,也即是,当终端确定基站不符合第四种预设条件时,可以输出第二基站识别类型。在上述识别过程中,服务器可以通过基于基站在预设时间内的位置变化的最大距离和已知基站类型进行模型训练,来建立识别模型,并通过该识别模型来实现该识别结果,在此不多做赘述。

在实际实施中,基于上述四种预设条件判断基站识别结果时可以有两种不同的实现方式:串行判断和并行判断。

对于串行判断,终端可以对上述四种预设条件进行排序,依次进行判断。例如,终端可以先判断基站是否符合第一种预设条件,如果是,输出第一基站识别结果,如果否,判断基站是否符合第二种预设条件,以此类推,直到确定基站符合多种预设条件中的一种预设条件并输出第一基站识别结果,或确定基站不符合多种预设条件中每一种预设条件。当终端确定基站不符合多种预设条件中每一种预设条件的情况可以参考下述步骤203。上述仅以一种排序方式进行举例说明,本发明对这四种预设条件的判断顺序不作限定。

对于并行判断,终端可以同时根据基站信息判断基站是否符合上述多种预设条件中每一种预设条件,当终端确定基站符合多种预设条件中至少一种预设条件时,输出第一基站识别结果。例如,终端获取到基站信息,分别判断基站是否符合多种预设条件中每一种预设条件,该基站可能同时符合第二种预设条件和第三种预设条件,则终端输出第一基站识别结果。当终端确定基站不符合多种预设条件中至少一种预设条件时,可以参考以下步骤203,对基站识别结果进行进一步确认。

203、当终端根据基站信息确定基站不符合多种预设条件中每一种预设条件时,执行步骤204至206。

当终端根据基站信息确定基站不符合多种预设条件中每一种预设条件时,终端还可以根据短消息的发送号码和短消息内容中的网址进行识别,确定该基站是否为伪基站,具体过程可以参见步骤204至206。

204、终端将短消息的消息数据发送至服务器。

由于服务器具有更大的存储空间以及更强的处理能力,而终端的存储空间很小,处理能力也不强,因而终端可以通过联网,将短消息的消息数据发送至服务器,利用服务器的基站识别功能来确定发送该短消息的基站是否为伪基站。

该短消息的消息数据中的特定字段携带有该短消息的发送号码,服务器对该短消息的发送号码进行识别。服务器也可以检测该短消息的短消息内容中是否存在网址,当服务器检测到短消息内容中存在网址时,也可以对网址进行识别。

当然,终端也可以自行检测该短消息的短消息内容中是否存在网址,从而可以将该短消息的发送号码和网址发送至服务器,由服务器对执行后续的识别步骤。

205、当服务器确定发送号码和网址至少一项符合预设条件时,输出第一基站识别结果,当服务器确定发送号码和网址均不符合预设条件时,输出第二基站识别结果。

该预设条件可以是位于黑名单中。由于垃圾短消息多是由伪基站发送至终端,可以在服务器利用黑名单维护有用户的号码、该号码是否曾经发送过垃圾短消息以及该号码发送过的垃圾短消息中的网址。该黑名单用于指示该黑名单中的数据是伪基站发送的数据。该黑名单中可以包括:曾经发送过被用户标记为垃圾短消息的号码以及垃圾短消息内容中的网址。

在此以终端将短消息的消息数据发送至服务器为例,该服务器接收到该短消息的消息数据时,可以检测该短消息的短消息内容中是否存在网址,从而可以有以下两种不同的可能场景:

当服务器检测到该短消息中不存在网址时,服务器可以在黑名单中查询是否存在该短消息的发送号码,当该发送号码位于黑名单中时,也即是,当服务器确定发送号码符合预设条件时,可以初步确定该基站为伪基站,输出第一基站识别结果。在上述识别过程中,服务器可以通过基于短消息的发送号码和已知基站类型进行模型训练,来建立识别模型,并通过该识别模型实现该识别过程,服务器也可以也可以通过号码数据库实现该识别过程,在此不多做赘述。

当服务器检测到该短消息中存在网址时,服务器可以在黑名单中查询是否存在该短消息的发送号码或网址,当该发送号码和网址至少一项位于黑名单中时,也即是,当服务器确定发送号码和网址至少一项符合预设条件时,可以初步确定该基站为伪基站,输出第一基站识别结果。当该发送号码和网址都没有位于黑名单中时,也即是,当服务器确定发送号码和网址均不符合预设条件时,可以初步确定该基站不是伪基站,输出第二基站识别结果。当然,该查询结果仅为对该短消息的发送号码和网址的一个初步识别结果,还可以通过识别模型来进行进一步识别来确定发送该短消息的基站是否为伪基站。在使用识别模型来进行识别时,服务器可以通过基于发送号码或网址和已知基站类型进行模型训练,来建立识别模型,并通过该识别模型来实现该识别过程,服务器也可以通过号码或网址数据库实现该识别过程,在此不多做赘述。

上述服务器在黑名单中查询发送号码和网址的步骤也有两种可能实现方式,与步骤202中终端确定基站是否符合多种预设条件的顺序同理,可以依次对发送号码和网址进行查询,也可以同时对发送号码和网址进行查询。

206、终端接收服务器发送的基站识别结果。

服务器对发送号码和网址进行识别,得到基站识别结果后,可以将基站识别结果发送至终端,终端接收该基站识别结果。

上述步骤202至206是终端根据基站信息,或根据发送号码和网址,得到基站识别结果的过程。在步骤202提供的终端确定基站是否符合多种预设条件的一种可能实现方式中,上述步骤202至206仅示出了终端先确定基站是否符合多种预设条件,当终端确定基站不符合多种预设条件中每一种预设条件时,再由服务器对该短消息的发送号码和网址进行识别,得到基站识别结果的过程。在实际实施中,终端还可以先将短消息的消息数据发送至服务器,由服务器对该发送号码和网址进行识别,当服务器返回的基站识别结果为第二基站识别结果时,终端再确定基站是否符合多种预设条件,当终端确定基站符合多种预设条件中至少一种预设条件时,输出第一基站识别结果,当终端确定基站不符合多种预设条件中每一种预设条件时,输出第二基站识别结果。

在步骤202提供的终端确定基站是否符合多种预设条件的另一种可能实现方式中,终端确定基站是否符合多种预设条件的过程,与步骤204至206提供的终端将短消息的消息数据发送至服务器,由服务器对该发送号码和网址进行识别的过程还可以同时进行,也即是,终端确定基站是否符合多种预设条件的同时,将发送号码和网址发送至服务器,由服务器对该发送号码和网址进行识别,并返回基站识别结果。

需要说明的是,上述终端得到的基站识别结果为对发送该短消息的基站的基站类型的初步识别结果,终端还可以根据该短消息的消息数据包括的其它数据对发送该短消息的基站的基站类型进行识别。

207、终端根据本地预设的关键字对短消息内容进行关键字匹配,将匹配得到的短消息的识别结果和类型作为第一内容识别结果。

终端获取到短消息的消息数据后,还可以根据预设的关键字对该短消息的短消息内容进行关键字匹配,确定该短消息的识别结果和类型,将该短消息的识别结果和类型作为内容识别结果。该内容识别结果用于指示该短消息是否是垃圾短消息,以及该短消息的类型。当然,由于垃圾短消息多是由伪基站发送至终端,当确定该短消息为垃圾短消息时,可以初步确定发送该短消息的基站为伪基站。

其中,短消息的类型如表1所示,可以根据短消息的内容分为110种类型,并为每种类型赋予固定的类型值,其中,类型值326可以用于指示该短消息为伪基站发送的短消息。

表1

第一内容识别结果由终端根据本地预设的关键字,对短消息内容进行识别得到。预设的关键字可以包括两种关键字:敏感词和正常关键字。当该短消息内容存在与预设的敏感词匹配的关键字时,可以确定该短消息为垃圾短消息。且,当短消息内容与预设的关键字匹配的关键字组合不同时,可以确定为不同类型的短消息。因而,内容识别结果将输出两个值,第一个值是该短消息内容的识别结果,该短消息内容的识别结果可以指示该短消息为垃圾短消息和该短消息不是垃圾短消息。当然,在模型输出时可以输出1和0,以指示不同的短消息内容的识别结果,具体以1来指示该短消息为垃圾短消息还是0来指示该短消息为垃圾短消息,可以基于模型训练时的算法确定,在此不做具体限定。在本发明实施例中,以1来指示该短消息为垃圾短消息为例。第二个值是短消息内容的类型值,该短消息内容的类型值用于指示该短消息属于上述表1所示的110种类型中的哪种类型。例如,当关键字组合为银行卡、转账、中奖时,可以确定该短消息为垃圾短消息,则该短消息的识别结果为1,假设该短消息的类型值为326,则返回1和326两个值。

终端对该短消息内容进行识别的过程可以使用一种用于识别垃圾短消息的识别模型实现。终端可以将短消息内容输入该识别模型,在该识别模型中对该短消息内容进行识别,并输出第一内容识别结果。可选地,终端也可以通过在本地数据库中存储预设的关键字,终端可以获取本地预设的关键字,对短消息内容进行关键字匹配,将匹配得到的短消息内容的识别结果和类型作为第一内容识别结果。

208、终端将短消息内容发送至服务器,由服务器对该短消息内容关键字匹配,将匹配得到的短消息的识别结果和类型作为第二内容识别结果,并返回第二内容识别结果。

该第二内容识别结果由终端根据云端预设的关键字,对短消息内容进行识别得到。由于服务器具有更大的存储空间以及更强的处理能力,云端预设的关键字比本地预设的关键字要更全面,本地预设的关键字为云端预设的关键字的一部分。终端根据该本地预设的关键字可以基本实现识别伪基站的功能,而服务器根据云端预设的关键字可以更准确地识别伪基站,避免由于本地预设的关键字不够全面而可能导致的误识别。

终端可以通过联网将短消息内容发送至服务器,服务器接收到该短消息内容,根据云端预设的关键字,对该短消息内容进行关键字匹配,在进行关键字匹配的过程与步骤207中终端对该短消息内容进行关键字匹配同理,而由于该云端预设的关键字更全面,同一条短消息在服务器中匹配得到的关键字组合可能与在终端中匹配得到的关键字组合不同,从而使得该短消息在本地识别过程中得到的第一内容识别结果与云端识别过程中得到的第二内容识别结果不同。该服务器对该短消息内容进行识别的过程可以使用一种用于识别垃圾短消息的识别模型实现,可选地,也可以通过云端数据库中存储预设的关键字实现,在此不多做赘述。

例如,终端对某条短消息内容识别得到的第一内容识别结果为1和326,其中,1为该短消息的识别结果,326为该短消息的类型值,二者分别指示该短消息为垃圾短消息,发送该短消息的基站为伪基站。而服务器对该短消息内容识别,由于预设的关键字更全面,判断该短消息并不是垃圾短消息,从而得到的第二内容识别结果为0和325,其中,0为该短消息的识别结果,325为该短消息的类型值,二者分别指示该短消息不是垃圾短消息,发送该短消息的基站不是伪基站。

上述步骤207和208是在终端本地和/或服务器对短消息内容进行关键字匹配,将匹配得到的该短消息的识别结果和类型作为内容识别结果的过程,该内容识别结果也是对发送该短消息的基站的基站类型的初步识别结果,将作为后续对基站类型的精准识别过程中的数据依据。在实际实施中,上述步骤207和步骤208还可以同时进行,或先执行步骤208,再执行步骤207,本发明对上述步骤的执行顺序不作限定。

上述步骤202至208是分别对该基站信息和短消息内容进行识别,得到基站识别结果和内容识别结果的过程,在实际实施中,步骤202至206提供的终端对基站信息进行识别的过程和步骤207和208提供的终端对短消息内容进行识别的过程可以同时进行,当然也可以先执行步骤207和208,再执行步骤202至206,本发明对此不作限定。

209、终端将基站识别结果和内容识别结果转换为特征向量。

终端得到基站识别结果和内容识别结果后,可以将基站识别结果和内容识别结果转换为特征向量。该特征向量中每一位元素的值通过判断基站识别结果和内容识别结果是否符合该元素所在位对应的第四预设条件得到。

该特征向量中每一位元素所在位对应的第四预设条件如下:

如果基站识别结果==1:

元素1=1

如果基站识别结果!=1:

元素1=0

如果第一内容识别结果==1并且第一内容识别结果类型值==326:

元素2=1

否则:

元素2=0

如果第二内容识别结果==1并且第二内容识别结果类型值==326:

元素3=1

否则:

元素3=0

如果第一内容识别结果==1:

元素4=1

否则:

元素4=0

如果第二内容识别结果==1:

元素5=1

否则:

元素5=0

对于第一内容识别结果类型值元素:

假设类型值为100则,

元素6~元素115:10......0

对于第二内容识别结果类型值元素:

假设类型值为101则,

元素116~元素225:010......0

假设基站识别结果和内容识别结果均为1,第一内容识别结果类型值为100,第二内容识别结果类型值为101,则整个短消息特征向量为:

以上为举例说明了特征向量每位元素的值的确定规则,在实际实施中,在确定每个元素的值时,第1至5位的元素的值,通过上述第四预设条件确定,确定其他位的元素的值时,可以将第一内容识别结果类型值在表1所示的对应的编号与5进行相加,得到的即为该类型值对应的位数,为该位的元素赋值为1,可以将第二内容识别结果类型值在表1所示的对应的编号与115进行相加,得到即为该类型值对应的位数,为该位的元素赋值为1,其它位的元素赋值为0,得到该短消息的特征向量。在本发明实施例中,以225位元素的特征向量为例,该225位元素是由根据特定规则确定前五位,根据第一内容识别结果可能的110个类型值和根据第二内容识别结果可能的110个类型值确定。在具体实施中,可以通过改变第四预设条件或短消息的类型数目进行调整。

210、终端调用基站识别模型,将特征向量输入该基站识别模型,输出该基站的基站类型。

基站识别模型可以实现对上述基于基站识别结果和内容识别结果得到的特征向量进行处理,得到该基站的基站类型。该基站的基站类型用于指示该基站是否为伪基站。该基站识别模型可以预设于终端中,当终端有基站类型识别需求时,可以调用该基站识别模型,对发送短消息的基站进行基站类型识别。

该基站识别模型基于多个样本短消息的消息数据以及发送每个样本短消息的基站的已知基站类型训练得到,训练得到该基站识别模型的过程如下:

首先,需要从运营商数据库中获取样本短消息的消息数据,该样本短消息的消息数据包括伪基站发送的样本短消息数据和正常基站发送的样本短消息数据。

然后,可以对样本短消息数据进行处理,得到可以用于训练基站识别模型的数据。将确定为伪基站发送的样本短消息数据作为正样本短消息数据,将确定为正常基站发送的样本短消息数据作为负样本短消息数据。再将该正样本短消息数据和该负样本短消息数据转换为正样本特征向量集和负样本特征向量集。其中,正样本特征向量集中的每个正样本特征向量为在步骤209中提供的225位元素的特征向量前添加1进行标注,负样本特征向量集中的每个负样本特征向量为在步骤209中提供的225位元素的特征向量前添加-1进行标注。

最后,将该正样本特征向量集和负样本特征向量集输入至初始模型中,对于每个样本特征向量,在该初始模型中为每个样本特征向量中每一位元素分配同样的权重,将该每个样本特征向量中所有元素与对应的权重进行加权计算,得到计算结果,并将计算结果与该样本特征向量的已知基站类型,也即是该样本特征向量前的标注(1或-1)进行比较,得到该权重对应的误差率。对该权重进行调整,继续进行加权计算,直至调整后的权重对应的误差率小于指定误差率,将该调整后的权重作为基站识别模型中每一位元素对应的权重,得到基站识别模型。

终端在进行基站类型识别时,可以调用基站识别模型,将特征向量输入该基站识别模型,在该基站识别模型中,可以为该特征向量中每一位元素选择对应位的权重,该每一位元素的值与权重进行加权计算,得到该特征向量对应的结果,也即是,发送短消息的基站的基站类型。该基站的基站类型可以用1或-1表示,该基站的基站类型为1用于指示该基站为伪基站,该基站的基站类型为-1用于表示该基站不是伪基站。

上述步骤209和210是调用基站识别模型,将基站识别结果、内容识别结果输入该基站识别模型,输出该基站的基站类型的过程。终端可以将基站识别结果和内容识别结果转换为特征向量,调用基站识别模型,并将特征向量输入基站识别模型,计算得到基站的基站类型。在一种可能实现方式中,终端还可以调用基站识别模型,将基站识别结果和内容识别结果输入该基站识别模型,该基站识别模型将该基站识别结果和内容识别结果转换为特征向量,并根据该特征向量进行计算,得到基站的基站类型,相应的,在这种可能实现方式中,需要将获取到的样本短消息进行处理,得到每个样本短消息对应的基站识别结果和内容识别结果后再输入初始模型中,经过训练得到基站识别类型。

例如,终端基于该基站识别模型对接收到的短消息进行基站类型识别的过程如下:

终端获取到的短消息的消息数据如下:

2017-04-2423:59:57|1493049598|6,8,13:l3,1:s1,158:3,1|3|t|125.85.203.62|time|03020116021921163900167649243534|type|1493049598|0|10|24087|0|-257|460|0|[]|10690658665458|妹妹兼职上门服务.有需要加微信1743744409

终端可以获取该短消息的消息数据,当终端处于联网状态时,终端可以对基站信息进行识别,得到基站识别结果为1;终端可以对该短消息内容进行识别得到:第一内容识别结果为0,第二内容识别结果为1,第一内容识别结果类型值为158,第二内容识别结果类型值为170。终端可以将该基站识别结果和内容识别结果转换为特征向量如下:

终端可以将该特征向量输入基站识别模型,该基站识别模型对该特征向量进行识别,并输出基站的基站类型为1,该基站的基站类型为伪基站。

211、当基站的基站类型指示该基站为伪基站时,终端将拦截该短消息。

当该基站的基站类型指示该基站为伪基站时,终端可以拦截该短消息,以保证用户不被该短消息骚扰或欺骗。在实际中,该终端还可以只提示该短消息为伪基站发送的垃圾短消息,仍正常接收并显示该短消息。进一步地,终端在确定发送该短消息的基站为伪基站时,还可以主动与该基站断开连接。

在一种可能实现方式中,终端还可以将该伪基站的基站信息发送至服务器,由服务器对该伪基站的位置进行标注,可辅助公安机关对伪基站的非法行为进行打击。

上述过程为当终端处于联网状态时,终端和服务器对短消息的消息数据进行识别,得到发送短消息的基站的基站类型的过程还有一种可能实现方式,当终端处于未联网状态或终端处于联网状态,为了节省流量使用,也可以只在终端本地对短消息的消息数据进行识别,得到发送短消息的基站的基站类型。在这种可能实现方式中,终端对基站信息进行识别,得到基站识别结果的过程中,执行步骤202和步骤203,且在步骤203中确定基站不符合多种预设条件时,该多种预设条件包括第一种预设条件和第二种预设条件,终端在步骤203确定基站不符合多种预设条件中每一种预设条件时,输出第二基站识别结果,不再进行步骤204至206。终端对短消息内容进行识别,得到内容识别结果的过程中,执行步骤207,得到第一内容识别结果,不再执行步骤208。在步骤211中,终端可以对该短消息进行拦截,并与发送该短消息的基站断开连接,不再执行将该基站的基站信息发送至服务器的步骤。

本发明实施例先通过识别发送该短消息的基站信息初步判断该基站是否伪基站,还通过识别该消息的内容判断该短消息是否垃圾短消息,为该短消息进行分类,初步判断发送该短消息的基站是否伪基站,最后综合两种初步判断结果进行进一步的分析,最终判断该基站是否为伪基站,从而得到基站的基站类型,可以避免只对短消息的内容进行识别时,由于关键字设置的不准确可能导致的误识别,从而提高了识别准确率。进一步地,当终端处于未联网状态和联网状态时均可以对发送短消息的基站进行识别,提高了基站类型识别功能的实用性。

上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。

图3是本发明实施例提供的一种基站类型识别装置的结构示意图。参见图3,该装置包括:

获取模块301,用于获取待识别的短消息的消息数据,该消息数据包括发送该短消息的基站信息和短消息内容;

识别模块302,用于分别对该基站信息和短消息内容进行识别,得到基站识别结果和内容识别结果;

类型识别模块303,用于调用基站识别模型,将该基站识别结果、该内容识别结果输入该基站识别模型,输出基站的基站类型,该基站类型用于指示该基站是否为伪基站;

其中,该基站识别模型基于多个样本短消息的消息数据以及发送每个样本短消息的基站的已知基站类型训练得到。

在另一实施例中,如图4所示,该装置还包括:

第一确定模块304,用于确定该基站信息是否符合预设条件,得到基站识别结果;

关键字匹配模块305,用于在终端本地和/或服务器对该短消息内容进行关键字匹配,将匹配得到的该短消息的识别结果和类型作为内容识别结果。

在另一实施例中,该第一确定模块304用于:

当根据该基站信息确定基站符合多种预设条件中的至少一种预设条件时,输出第一基站识别结果,该第一基站识别结果用于指示发送该短消息的基站为伪基站;

当根据该基站信息确定该基站不符合多种预设条件中每一种预设条件时,输出第二基站识别结果,该第二基站识别结果用于指示发送该短消息的基站不是伪基站。

在另一实施例中,该多种预设条件包括:该基站信息中任一项不在规定的取值范围内;该基站在预设时间内的位置变化次数大于指定次数。

在另一实施例中,该多种预设条件包括:该基站信息中任一项不在规定的取值范围内;该基站在预设时间内的位置变化次数大于指定次数;该基站在预设时间内的位置变化的最大距离大于指定距离;该基站在预设时间内的信号强度变化大于指定强度值。

在另一实施例中,如图5所示,该装置还包括:

收发模块306,用于当该终端处于联网状态,将该短消息的发送号码和该短消息内容中的网址发送至服务器,接收该服务器返回的基站识别结果;

该基站识别结果由该服务器基于以下两种情况确定:

当该发送号码和该网址中至少一项符合预设条件时,该基站识别结果为第一基站识别结果;

当该发送号码和该网址中均不符合预设条件时,该基站识别结果为第二基站识别结果。

在另一实施例中,如图6所示,该装置还包括:

第一向量转换模块307,用于将该基站识别结果和内容识别结果转换为特征向量的形式,该特征向量中每一位元素用于指示识别结果是否符合该元素所在位对应的第四预设条件;

该类型识别模块303,用于调用基站识别模型,将该特征向量输入该基站识别模型,在该基站识别模型中为该特征向量中每一位元素选择对应位的权重进行加权计算,输出基站的基站类型。

在另一实施例中,如图7所示,该装置还包括:

第二确定模块308,用于将确定为伪基站发送的样本短消息数据作为正样本短消息数据,将确定为正常基站发送的样本短消息数据作为负样本短消息数据;

第二向量转换模块309,用于将该正样本短消息数据和该负样本短消息数据转换为正样本特征向量集和负样本特征向量集;

计算模块310,用于将该正样本特征向量集和负样本特征向量集输入至初始模型中,为每个样本特征向量中每一位元素分配同样的权重,将该每个样本特征向量中所有元素与对应的权重进行加权计算,并将计算结果与该每个样本特征向量的已知基站类型进行比较,得到该权重对应的误差率;

模型训练模块311,用于对该权重进行调整,继续进行加权计算,直至调整后的权重对应的误差率小于指定误差率,得到基站识别模型。

本发明实施例提供的装置先通过识别发送该短消息的基站信息初步判断该基站是否伪基站,还通过识别该消息的内容判断该短消息是否垃圾短消息,为该短消息进行分类,初步判断发送该短消息的基站是否伪基站,最后综合两种初步判断结果进行进一步的分析,最终判断该基站是否为伪基站,从而得到基站的基站类型,可以避免只对短消息的内容进行识别时,由于关键字设置的不准确可能导致的误识别,从而提高了识别准确率。

需要说明的是:上述实施例提供的基站类型识别装置在实现基站类型识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基站类型识别装置和基站类型识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本实施例提供了一种终端800,该终端800可以用于执行上述各个实施例中提供的基站类型识别方法。参见图8,该终端800包括:

终端800可以包括rf(radiofrequency,射频)电路810、包括有一个或一个以上计算机可读存储介质的存储器820、输入单元830、显示单元840、传感器850、音频电路860、wifi(wirelessfidelity,无线保真)模块870、包括有一个或者一个以上处理核心的处理器880、以及电源890等部件。本领域技术人员可以理解,图8中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

rf电路810可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器880处理;另外,将涉及上行的数据发送给基站。通常,rf电路810包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(sim)卡、收发信机、耦合器、lna(lownoiseamplifier,低噪声放大器)、双工器等。此外,rf电路810还可以通过无线通信与网络和其他设备通信。该无线通信可以使用任一通信标准或协议,包括但不限于gsm(globalsystemofmobilecommunication,全球移动通讯系统)、gprs(generalpacketradioservice,通用分组无线服务)、cdma(codedivisionmultipleaccess,码分多址)、wcdma(widebandcodedivisionmultipleaccess,宽带码分多址)、lte(longtermevolution,长期演进)、电子邮件、sms(shortmessagingservice,短消息服务)等。

存储器820可用于存储软件程序以及模块,处理器880通过运行存储在存储器820的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端800的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器820还可以包括存储器控制器,以提供处理器880和输入单元830对存储器820的访问。

输入单元830可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元830可包括触敏表面831以及其他输入设备832。触敏表面831,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面831上或在触敏表面831附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面831可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器880,并能接收处理器880发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面831。除了触敏表面831,输入单元830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元840可用于显示由用户输入的信息或提供给用户的信息以及终端800的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元840可包括显示面板841,可选的,可以采用lcd(liquidcrystaldisplay,液晶显示器)、oled(organiclight-emittingdiode,有机发光二极管)等形式来配置显示面板841。进一步的,触敏表面831可覆盖显示面板841,当触敏表面831检测到在其上或附近的触摸操作后,传送给处理器880以确定触摸事件的类型,随后处理器880根据触摸事件的类型在显示面板841上提供相应的视觉输出。虽然在图8中,触敏表面831与显示面板841是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面831与显示面板841集成而实现输入和输出功能。

终端800还可包括至少一种传感器850,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板841的亮度,接近传感器可在终端800移动到耳边时,关闭显示面板841和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端800还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路860、扬声器861,传声器862可提供用户与终端800之间的音频接口。音频电路860可将接收到的音频数据转换后的电信号,传输到扬声器861,由扬声器861转换为声音信号输出;另一方面,传声器862将收集的声音信号转换为电信号,由音频电路860接收后转换为音频数据,再将音频数据输出处理器880处理后,经rf电路88以发送给比如另一终端,或者将音频数据输出至存储器820以便进一步处理。音频电路860还可能包括耳塞插孔,以提供外设耳机与终端800的通信。

wifi属于短距离无线传输技术,终端800通过wifi模块870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了wifi模块870,但是可以理解的是,其并不属于终端800的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器880是终端800的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器820内的软件程序和/或模块,以及调用存储在存储器820内的数据,执行终端800的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器880可包括一个或多个处理核心;优选的,处理器880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器880中。

终端800还包括给各个部件供电的电源890(比如电池),优选的,电源可以通过电源管理系统与处理器880逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源890还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出,终端800还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端的显示单元是触摸屏显示器,终端还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。该一个或者一个以上程序包含用于执行上述图2所示实施例所示的方法。

图9是本发明实施例提供的一种基站类型识别装置900的结构示意图。例如,装置900可以被提供为一服务器。参照图9,装置900包括处理组件922,其进一步包括一个或多个处理器,以及由存储器932所代表的存储器资源,用于存储可由处理部件922的执行的指令,例如应用程序。存储器932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件922被配置为执行指令,以执行上述图2所示实施例所示的方法。

装置900还可以包括一个电源组件926被配置为执行装置900的电源管理,一个有线或无线网络接口950被配置为将装置900连接到网络,和一个输入输出(i/o)接口958。装置900可以操作基于存储在存储器932的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

在示例性实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,例如存储有计算机程序的存储器,上述计算机程序被处理器执行时实现上述图2所示实施例中的基站类型识别方法。例如,该计算机可读存储介质可以是只读内存(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、只读光盘(compactdiscread-onlymemory,cd-rom)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1