标注短信类别的方法及装置的制造方法_5

文档序号:9381289阅读:来源:国知局
述新短信标注为所述多种类别中的一种之后,还包括:
[0226]将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
[0227]A12、根据All所述的方法,其中,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端之后,还包括:
[0228]接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
[0229]根据所述反馈信息确定是否更新所述训练语料。
[0230]A13、根据A12所述的方法,其中,根据所述反馈信息确定是否更新所述训练语料,包括:
[0231]若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。
[0232]B14、一种标注短信类别的装置,包括:
[0233]构造模块,适于采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置;
[0234]获取模块,适于获取多种类别的短信,其中,每种类别的短信包含多条;
[0235]训练模块,适于将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;
[0236]标注模块,适于当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。
[0237]B15、根据B14所述的装置,其中,所述构造模块还适于:
[0238]采用线性分类库Liblinear构造多分类的短信分类器;或者,
[0239]采用支持向量机分类库Libsvm构造多分类的短信分类器。
[0240]B16、根据B15所述的装置,其中,所述构造模块还适于:
[0241]调用所述Liblinear中的动态分类库;
[0242]利用调用的动态分类库构造多分类的短信分类器。
[0243]B17、根据B14-B16任一项所述的装置,其中,所述获取模块还适于:
[0244]获取人工标注的多种类别的短信;或者,
[0245]接收至少一个客户端上报的至少一种类别的短信。
[0246]B18、根据B17所述的装置,其中,所述获取模块包括:
[0247]监测单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,对各个客户端所在通信终端中的短信接收事件进行监测;
[0248]生成单元,适于当监测到陌生电话号码发来的短信时,生成提示用户对陌生电话号码进行标注的提示信息;
[0249]接收单元,适于接收用户对短信的标注类别。
[0250]B19、根据B18所述的装置,其中,所述监测单元还适于:
[0251]获取当前接收的短信对应的电话号码;
[0252]确定当前接收到的短信对应的电话号码不属于预设的黑名单或者白名单中的电话号码时,确定电话号码为陌生电话号码。
[0253]B20、根据B17所述的装置,其中,所述获取模块包括:
[0254]第一获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端的电话号码的归属地和/或地区编码号段;
[0255]监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
[0256]第一判断单元,适于判断当前接收到的短信对应的电话号码的归属地和/或地区编码号段是否与所述通信终端的电话号码的归属地和/或地区编码号段相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
[0257]B21、根据B17所述的装置,其中,所述获取模块包括:
[0258]第二获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端当前所在地信息;
[0259]监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
[0260]第二判断单元,适于判断当前接收到的短信对应的电话号码的归属地是否与所述通信终端当前所在地相同,如果不相同,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
[0261]B22、根据B17所述的装置,其中,所述获取模块包括:
[0262]第三获取单元,适于在接收至少一个客户端上报的至少一种类别的短信之前,获取各个客户端所在通信终端中保存的通讯录信息;
[0263]监测单元,适于对所述各个客户端所在通信终端中的短信接收事件进行监测;
[0264]第三判断单元,适于判断所述通讯录中是否存在与当前接收到的短信对应的电话号码具有相同归属地和/或地区编码号段的电话号码,如果不存在,则将所述当前接收到的短信标注为所述多种类别中的指定类别。
[0265]B23、根据B14-B22任一项所述的装置,其中,所述训练模块还适于:
[0266]从所述多种类别的短信中提取属性特征;
[0267]将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。
[0268]B24、根据B14-B23任一项所述的装置,其中,还包括:
[0269]下发模块,适于在所述标注模块利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。
[0270]B25、根据B24所述的装置,其中,还包括:
[0271]接收模块,适于接收所述客户端提交的关于标注的所述新短信的类别的反馈信息;
[0272]处理模块,适于根据所述反馈信息确定是否更新所述训练语料。
[0273]B26、根据B25所述的装置,其中,所述处理模块还适于:
[0274]若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。
【主权项】
1.一种标注短信类别的方法,包括: 采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置; 获取多种类别的短信,其中,每种类别的短信包含多条; 将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器; 当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。2.根据权利要求1所述的方法,其中,所述采用预置的短信分类规则,构造多分类的短信分类器,包括: 采用线性分类库Liblinear构造多分类的短信分类器;或者, 采用支持向量机分类库Libsvm构造多分类的短信分类器。3.根据权利要求2所述的方法,其中,采用线性分类库Liblinear构造多分类的短信分类器,包括: 调用所述Liblinear中的动态分类库; 利用调用的动态分类库构造多分类的短信分类器。4.根据权利要求1-3任一项所述的方法,其中,所述获取多种类别的短信,包括: 获取人工标注的多种类别的短信;或者, 接收至少一个客户端上报的至少一种类别的短信。5.根据权利要求1-4任一项所述的方法,其中,将所述多种类别的短信作为训练语料对所述短信分类器进行训练,包括: 从所述多种类别的短信中提取属性特征; 将提取的属性特征和对应的短信类别输入所述短信分类器进行训练。6.根据权利要求1-5任一项所述的方法,其中,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种之后,还包括: 将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端。7.根据权利要求6所述的方法,其中,将标注的所述新短信的类别下发给所述新短信的目的地址对应的客户端之后,还包括: 接收所述客户端提交的关于标注的所述新短信的类别的反馈信息; 根据所述反馈信息确定是否更新所述训练语料。8.根据权利要求7所述的方法,其中,根据所述反馈信息确定是否更新所述训练语料,包括: 若所述反馈信息为所述新短信的类别为不同于标注类别的其他类别,则确定根据所述新短信的其他类别更新所述训练语料。9.一种标注短信类别的装置,包括: 构造模块,适于采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信的属性特征进行设置; 获取模块,适于获取多种类别的短信,其中,每种类别的短信包含多条; 训练模块,适于将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器; 标注模块,适于当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。10.根据权利要求9所述的装置,其中,所述构造模块还适于: 采用线性分类库Liblinear构造多分类的短信分类器;或者, 采用支持向量机分类库Libsvm构造多分类的短信分类器。
【专利摘要】本发明提供了一种标注短信类别的方法及装置。该方法包括:采用预置的短信分类规则,构造多分类的短信分类器,其中,所述短信分类器中的各个参数依据短信内容的属性特征进行设置;获取多种类别的短信,其中,每种类别的短信包含多条;将所述多种类别的短信作为训练语料对所述短信分类器进行训练,计算所述短信分类器中的各个参数,得到训练后的短信分类器;当接收到一新短信时,利用所述训练后的短信分类器将所述新短信标注为所述多种类别中的一种。本发明实施例能够通过多分类的短信分类器对短信进行自动分类和标注,从而解决了现有技术中人工分类和标注费时费力、效率较低的问题。
【IPC分类】H04W4/14
【公开号】CN105101124
【申请号】CN201510484721
【发明人】张金晶, 常富洋, 李强
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
【公开日】2015年11月25日
【申请日】2015年8月7日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1