号码属性识别方法、装置、终端和服务器的制造方法

文档序号:8398565阅读:242来源:国知局
号码属性识别方法、装置、终端和服务器的制造方法
【技术领域】
[0001]本发明涉及通信技术领域,具体而言,涉及一种号码属性识别方法、装置、终端和服务器。
【背景技术】
[0002]目前,手机等终端设备的普及度越来越高,每个终端设备用户都具有唯一的号码,通过该号码用户可以与其他人之间进行通话、发送短息、邮件等多种方式的通信。
[0003]手机等终端设备为用户来便利的同时,也带来了不少问题:来自未知号码的短信和电话增多,其包含了垃圾短信和骚扰电话,为用户带来了困扰。目前的识别未知号码的方式为,用户在接收到未知号码的短信和电话后,根据电话或短信的内容,对未知号码进行标记,例如,标记为“诈骗”、“推销”等等;收集该标记数据并保存;则在其他用户也收到该未知号码的短信或电话时,根据保存的标记数据来对其他用户提示该未知号码为“诈骗”或“推销”等。
[0004]上述方案的缺陷在于:太过于依赖用户的标记行为,用户的标记行为存在着标记次数过少或标记不准确的可能性,则根据收集的标记数据很难准确对未知号码进行识别。

【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的号码属性识别方法、装置、终端和服务器。
[0006]依据本发明的一个方面,提供了一种号码属性识别方法,其包括:获获取待识别的第一号码所对应的行为数据,所述第一号码对应的行为数据为所述第一号码所属的用户进行的通信行为过程中产生的数据;使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对所述第一号码对应的行为数据进行计算,以得到所述第一号码的属性;其中所述第二号码对应的行为数据为所述第二号码所属的用户进行的通信行为过程中产生的数据。
[0007]依据本发明的另一个方面,提供了一种号码属性识别装置,其包括:行为数据获取模块,用于获取待识别的第一号码所对应的行为数据,所述第一号码对应的行为数据为所述第一号码所属的用户进行的通信行为过程中产生的数据;属性识别模块,用于使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对所述第一号码对应的行为数据进行计算,以得到所述第一号码的属性;其中所述第二号码对应的行为数据为所述第二号码所属的用户进行的通信行为过程中产生的数据。
[0008]依据本发明的再一个方面,提供了一种终端,其包括:前述的号码属性识别装置,用于根据所述号码的行为数据,识别出所述号码的属性。
[0009]依据本发明的还一个方面,提供了一种服务器,其包括:行为数据接收模块,用于接收来自终端的待识别的号码对应的行为数据;前述的号码属性识别装置,用于根据所述号码的行为数据,识别出所述号码的属性;属性发送模块,将所述号码的属性发送给所述终端。
[0010]根据以上技术方案,可知本发明的号码属性识别方法、装置、终端和服务器至少要具有以下优点:
[0011]号码所属用户基于不同的目的进行通信行为的过程中,所产生的数据必然是不同的,所以号码对应的行为数据是可以反映出用户进行通信行为的目的;所以根据号码对应的行为数据所确定的号码的属性,能够准确体现出号码所属用户的目的,以便于对该号码进行相应处理。
[0012]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0013]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0014]图1示出了根据本发明的一个实施例的号码属性识别方法的流程图;
图1A示出了根据本发明的一个实施例的号码属性识别方法的工作示意图;
[0015]图2示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0016]图3示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0017]图4示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0018]图5示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0019]图6示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0020]图7示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0021]图8示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0022]图9示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0023]图10示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0024]图11示出了根据本发明的一个实施例的号码属性识别方法的流程图;
[0025]图12示出了根据本发明的一个实施例的号码属性识别装置的框图;
[0026]图13示出了根据本发明的一个实施例的号码属性识别装置的框图;
[0027]图14示出了根据本发明的一个实施例的号码属性识别装置的框图;
[0028]图15示出了根据本发明的一个实施例的号码属性识别装置的框图;
[0029]图16示出了根据本发明的一个实施例的号码属性识别装置的框图;
[0030]图17示出了根据本发明的一个实施例的号码属性识别装置的框图;
[0031]图18示出了根据本发明的一个实施例的终端的框图;
[0032]图19示出了根据本发明的一个实施例的服务器的框图。
【具体实施方式】
[0033]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0034]如图1所示,本发明的一个实施例中公开了一种号码属性识别方法,其包括:
[0035]步骤110,获取待识别的第一号码所对应的行为数据,第一号码对应的行为数据为第一号码所属的用户进行的通信行为过程中产生的数据。本实施例中,对通信行为的类型不进行限制,包括但不限于打电话、发短信、发邮件等;对行为数据不进行限制,包括但不限于通话时间、通话时长、被挂断占比、呼入占比、通讯录联系人占比、非长途通话占比、请求通话时向对方的平均请求次数。
[0036]步骤120,使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对第一号码对应的行为数据进行计算,以得到第一号码的属性;其中第二号码对应的行为数据为第二号码所属的用户进行的通信行为过程中产生的数据。在本实施例中,对属性不进行限制,其包括但不限于为第一号码增加的标签或分类等等。在本实施例中,对识别模型对应的算法不进行限制,例如,svm、boosting决策树等算法均适用。根据本实施例的技术方案,号码所属用户基于不同的目的进行通信行为的过程中,所产生的数据必然是不同的,所以号码对应的行为数据是可以反映出用户进行通信行为的目的;所以根据号码对应的行为数据所确定的号码的属性,能够准确体现出号码所属用户的目的,以便于对该号码进行相应处理。
[0037]例如,根据图1,收集200个号码(第二号码)的通话行为(通信行为)的呼入占比(行为数据),以及每个号码对应的标签(属性);基于boosting决策树算法生成识别模型,获取到号码A(第一号码)的通话行为(通信行为)的呼入占比(行为数据)后,将其输入识别模型,并从识别模型中输出号码A对应的标签(属性),例如,识别模型基于号码A的呼入占比非常低,所以可以确定是快递送餐电话,添加“快递送餐”标签,该标签可以用于在手机等终端上进行显示,例如图1A所示,示出该来电为快递送餐电话。
[0038]如图2所示,本发明的一个实施例中公开了一种号码属性识别方法,其包括:
[0039]步骤210,获取第一号码所属用户传输的文本信息,并从文本信息中提取词语作为第一号码对应的行为数据。本实施例中,对文本信息的类型不进行限制,其包括但不限于短信、邮件等。本实施例对提取词语的方式不进行限制,可以只提取固定词,也可以使用现有技术的分词器分词后再提取。
[0040]步骤220,使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对第一号码对应的行为数据进行计算,以得到第一号码的属性;其中第二号码对应的行为数据为第二号码所属的用户进行的通信行为过程中产生的数据。根据本实施例的技术方案,文本信息中包括很多关键的词语,能够体现第一号码发送文本信息的目的,所以根据文本信息中的词语有利于确定第一号码的属性。
[0041]例如,根据图2,经统计号码B的用户发出了一条短信(文本信息);根据经验可知很多骚扰短信的内容都是与“开发票”有关,所以可以设置提取词语的方式为提取“发票”这个词,具有“发票”字眼的号码均为黑号码;从该短信中成功提取出“发票”(词语)后,根据“发票”将该号码B分类到“黑号码”分类(属性)下。
[0042]如图3所示,本发明的一个实施例中公开了一种号码属性识别方法,其包括:
[0043]步骤310,根据预设的过滤字符库,对文本信息中的字符进行过滤;过滤字符库中记录了需要过滤的字符。在本实施例中,对需要过滤掉的字符不进行限制,可以是多种类型的标点符号。
[0044]步骤320,从文本信息中提取词语作为第一号码对应的行为数据。本实施例中,对文本信息的类型不进行限制,其包括但不限于短信、邮件等。本实施例对提取词语的方式不进行限制,可以只提取固定词,也可以使用现有技术的分词器分词后再提取。
[0045]步骤330,使用通过已知的第二号码对应的行为数据和属性所训练的识别模型,对第一号码对应的行为数据进行计算,以得到第一号码的属性;其中第二号码对应的行为数据为第二号码所属的用户进行的通信行为过程中产生的数据。根据本实施例的技术方案,很多垃圾短信息为避免被识别出,通常在信息中加入了很多起到干扰作用的字符,因此对这些字符进行过滤后,可以更容易从文本信息中提取关键词语。
[0046]例如,根据图3,号码C发送的短信(文本信息)中包含有以下内容:“……开发票……”;预设的过滤字符库中,规定需要将I符号过滤掉,则过滤后短信的内容为“……开发票……”;对过滤后的短信进行分词提取,可以顺利提取到词语“发票”(词语),该短信属于骚扰短信,从而可以将号码C分类到“骚扰号码”之下。
[0047]如图4所示,本发明的一个实施例中公开了一种号码属性识别方法,其包括:
[0048]步骤410,根据预设的字符转换库在文本信息中查询是否具有待转换的字符,并在查找到待转换的字符时根据字符转换库进行转换;字符转换库中记录待转换的字符,以及与待转换的字符对应的转换后的字符。在本实施例中,字符转换库可以用于将汉字数字转换为阿拉伯数字。
[0049]步骤420,从文本信息中提取词语作为第一号码对应的行为数据。本实施例中,对文本信息的类型不进行限制,其包括但不限于短信、邮件等
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1