文本中号码信息的安全监测方法及装置的制造方法_2

文档序号:8226051阅读:来源:国知局
中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0045]本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS (Personal Communicat1ns Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA (Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS (Global Posit1ning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
[0046]本技术领域技术人员可以理解,这里所使用的远端网络设备,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本发明的实施例中,远端网络设备、终端设备与WNS服务器之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。
[0047]本领域技术人员应当理解,本发明所称的“应用”、“应用程序”、“应用软件”以及类似表述的概念,是业内技术人员所公知的相同概念,是指由一系列计算机指令及相关数据资源有机构造的适于电子运行的计算机软件。除非特别指定,这种命名本身不受编程语言种类、级别,也不受其赖以运行的操作系统或平台所限制。理所当然地,此类概念也不受任何形式的终端所限制。
[0048]请参阅图1,图1为本发明文本中号码信息的安全监测方法一实施例的流程示意图,如图1所示,包括以下步骤:
[0049]S11,获取包含号码的文本消息。
[0050]本实施例方法在客户端实施,客户端为安装有安全监测应用程序的电脑或移动终端,该应用程序实时查看客户端是否有包含号码的文本消息,若有,获取文本消息。
[0051]其中,文本消息为短信、聊天工具产生的聊天消息或网页信息。
[0052]其中,文本消息还可为平台中的消息,如:信息发布平台、游戏平台。
[0053]在本实施例中,客户端为手机,文本消息为短信。通过对短信进行监测,可筛选出垃圾短信,尤其是诈骗短信,防止用户产生损失。
[0054]对于平台中的文本消息,通过监测主要筛选如下消息:网络游戏平台的公共聊天频道中出现的异常低价买卖装备或游戏币、代为提升角色等级等非法交易消息,消息中包含相应的用于联系的号码,此类异常价格交易消息不仅违反网络游戏平台的相关管理规定,而且容易造成玩家的虚拟财产和真实财产的损失;信息发布平台发布的低价销售机票、火车票、出租房屋等消息,消息中包含相应的用于联系的号码,此类低价交易消息通常具有诈骗的意图。
[0055]S12,提取文本消息中的号码信息。
[0056]在本实施例中,通过命名实体识别提取短信中的号码信息,具体方法如下:
[0057]A.识别文本消息中的号码。
[0058]命名实体识别是信息处理技术中的关键基础技术,命名实体是文本中基本的信息单位,命名实体可分为人名、地名、组织名、时间表达式、数值表达式等,在不同应用领域,可根据需要定义其他类型的命名实体。在本实施例中,命名实体为号码,基于CRF(condit1nal random fields,条件随机域)对文本消息中的号码信息进行提取。号码信息的提取过程中,首先识别文本消息中的号码,将号码抽出。
[0059]其中,号码信息为银行账号、QQ号码或电话号码。
[0060]B.根据文本消息中的上下文,标注号码的类型。
[0061]识别出的号码仅为数字,因此还需要对号码的类型进行判断,判断过程主要是对号码的上下文进行标注,标注一些表征号码特征的信息,以标注的信息判断号码的类型,如:QQ号、银行账号、电话号码等。
[0062]在标注过程中,对于显式的表征号码特征的信息,如:联系我一下,电话号码是……,直接标注“电话号码”可精确获得号码的类型。对于隐式的表征号码特征的信息,如:加我一下,号码是……,这时不仅需要标注“加我”,还需根据“加我”词义进行推断。对于标注也无法判断的号码类型,如:联系我一下,号码是……,需要根据预设的号码规则(手机号码规则、固话规则、银行账号规则等)进行判断。
[0063]C.获取号码及其对应的类型。
[0064]根据文本消息的内容,可获取一个或多个号码信息。号码信息的提取,相对于汉字实体的提取,准确性更高,有利于垃圾短信的监测。
[0065]S13,发送包含号码信息的安全检测请求至服务器端。
[0066]安全检测请求用于请求服务器端检测号码信息是否存在于服务器端的黑号码库中,服务器端可以为云端,通过云端对号码信息进行检测,使得号码信息具有更全面、更新的匹配信息。在其他实施例中,还可在客户端预存黑号码库,通过客户端进行检测。
[0067]黑号码库包括黑银行账号、黑QQ号码和黑电话号码,各类型号码可以存在于同一个库中,也可分开以单独库的方式存在。
[0068]在本实施例中,黑号码库的构建方式如下:
[0069]A.用户上报的短信
[0070]通过客户端的安全监测应用程序,用户可将广告短信、诈骗短信或非法短信上报至服务器端,此上报方式可用户主动发送或应用程序询问是否有可上报的垃圾短信。此类短信主要为客户端安装安全监测应用程序前,客户端存储的短信。
[0071]服务器端接收用户上报的短信后,提取短信文本中的号码信息,用于构建黑号码库。
[0072]其中,用户还可举报黑号码及其相关的欺诈行为,该黑号码涉及已证实的不法行为,具有真实受害者(如:个人、公司、团体等),服务器端将黑号码和相关欺诈信息记载至黑号码库中。以举报诈骗短信为例,诈骗短信中的银行账号为虚假中奖信息的账号,且该账号以领奖保证金的名义骗取若干元,并提供相关证据。
[0073]其中,用户还可上报疑似垃圾短信。
[0074]B.服务器端判断的疑似短信
[0075]当服务器端对短信中的号码进行匹配时,若该号码疑似为黑号码,则也将该号码收入至黑号码库。
[0076]C.利用网络资源收集的垃圾短信
[0077]服务器端提取垃圾短信中的号码信息,并记录至黑号码库。
[0078]在其他实施例中,利用网
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1