模板的处理方法及装置、短信识别方法及装置的制造方法

文档序号:9597921阅读:248来源:国知局
模板的处理方法及装置、短信识别方法及装置的制造方法
【技术领域】
[0001] 本申请涉及通信技术领域,尤其涉及模板的处理方法及装置、短信识别方法及装 置。
【背景技术】
[0002] 在文本挖掘中,经常会使用基于词汇-句法模式的方法进行处理,这样就产生了 大量的文本模板。尤其是在短信识别中(例如在短信中识别航班信息、火车订单信息、酒店 预订信息、信用卡账单信息等),会产生大量的短信模板。终端在进行短信识别时,会在短信 识别程序中写入已配置好的短信模板,其识别效率较低;并且通常是通过更新短信识别程 序,进而获得最新的短信模板,短信模板更新效果较差。

【发明内容】

[0003] 为克服相关技术中存在的问题,本公开提供了模板的处理方法及装置、短信识别 方法及装置。
[0004] 根据本公开实施例的第一方面,提供一种模板的处理方法,包括:
[0005] 获取待推送的短信模板,所述短信模板中包括模板属性和与模板属性对应的属性 值;
[0006] 根据预设的目标模板属性,从所述短信模板中提取与所述目标模板属性对应的属 性值作为与所述短信模板关联的索引;
[0007] 将所述短信模板和关联的索引推送给终端,以供终端利用与所述索引关联的短信 模板识别短信的文本内容中的目标信息。
[0008] 可选的,所述方法还包括:
[0009] 将具有相同索引的短信模板记录在同一短信模板集合中,得到一个或多个短信模 板集合;
[0010] 将所有索引记录在索引集合中;
[0011] 所述将所述短信模板和对应的索引推送给终端,包括:
[0012] 将所述短信模板集合和所述索引集合推送给终端。
[0013] 可选的,所述模板属性包括优先级属性;
[0014] 所述方法还包括:
[0015] 获取所述短信模板的优先级,将所述优先级作为所述短信模板中优先级属性的属 性值;
[0016] 所述将具有相同索引的短信模板记录在同一短信模板集合中,包括:
[0017] 根据每一所述短信模板的优先级,按照优先级高低的顺序将具有相同索引的短信 模板记录在同一短信模板集合中。
[0018] 可选的,所述模板属性包括模板识别数量属性;
[0019] 所述方法还包括:
[0020] 获取终端发送的模板识别结果,所述模板识别结果中记录有识别成功的短信模 板;
[0021 ] 根据所述模板识别结果统计预设时间内的所述短信模板的模板识别数量,将所述 模板识别数量作为所述短信模板中的模板识别数量属性的属性值。
[0022] 可选的,所述方法还包括:
[0023] 根据所述模板识别数量,通过预设的机器学习算法对所述待推送的短信模板进行 异常模板检测,筛选出异常的短信模板。
[0024] 可选的,所述模板属性包括模板有效期属性;
[0025] 所述方法还包括:
[0026] 根据所述模板有效期属性的属性值,在所述待推送的短信模板中筛选出不在有效 期内的短信模板。
[0027] 可选的,所述将所述短信模板集合和所述索引集合推送给终端,包括:
[0028] 按照预设时间周期将所述短信模板集合和所述索引集合推送给终端。
[0029] 可选的,所述短信模板和所述索引以数据库的形式进行存储。
[0030] 根据本公开实施例的第二方面,提供一种短信识别方法,所述方法包括:
[0031] 获取待识别的短信;
[0032] 在预存的索引集合中确定与所述短信相匹配的索引;
[0033] 确定与所述索引关联的短信模板集合;
[0034] 利用所述短信模板集合中的短信模板识别所述短信的文本内容中的目标信息。
[0035] 可选的,所述方法还包括:
[0036] 接收服务端发送的所述索引集合和一个或多个所述短信模板集合,其中,所述索 引集合中至少包括一条索引,所述索引集合中每一索引关联一所述短信模板集合,所述短 信模板集合中至少包括一短信模板。
[0037] 可选的,所述在预存的索引集合中确定与所述短信相匹配的索引,包括:
[0038] 判断所述短信的特定信息与所述索引中的预设信息是否相匹配;
[0039] 当所述短信的特定信息与所述索引中的预设信息相匹配时,确定所述索引与所述 短信相匹配。
[0040] 可选的,所述索引中的预设信息至少包括发送方号码、接收方归属地和关键字;
[0041] 所述判断所述短信的特定信息与所述索引中的预设信息是否相匹配,包括:
[0042] 读取所述索引中的发送方号码、接收方归属地和关键字;
[0043] 获取所述短信的发送方号码和接收方归属地;
[0044] 从所述短信的文本内容中查找是否记录有所述关键字;
[0045] 当所述短信的发送方号码和接收方归属地与所述索引中记录的发送方号码、接收 方归属地相匹配,并且所述短信的文本内容中记录有所述关键字时,确定所述短信的特定 信息与所述索引中的预设信息相匹配。
[0046] 可选的,所述利用所述短信模板集合中的短信模板识别所述短信的文本内容中的 目标信息,包括:
[0047] 从所述短信模板集合中按照短信模板的记录顺序,提取短信模板识别所述短信的 文本内容中的目标信息;
[0048] 若当前提取的短信模板无法识别出所述目标信息,则在所述短信模板集合中依次 提取下一短信模板,若当前提取的短信模板识别出所述目标信息,则停止提取短信模板。
[0049] 可选的,所述方法还包括:
[0050] 在所述利用所述短信模板识别所述短信的文本内容中的目标信息后,将模板识别 结果发送给服务端,所述模板识别结果包括识别成功的短信模板,以供服务端根据所述模 板识别结果统计短信模板的模板识别数量。
[0051] 可选的,所述索引集合以文本文件的形式进行存储,所述索引集合中的所有索引 存储在同一文本文件中;
[0052] 所述短信模板集合以文本文件的形式进行存储,每一个短信模板集合中的所有短 信模板存储在同一文本文件中,不同的短信模板集合存储在不同的文本文件。
[0053] 可选的,所述索引集合所存储的文本文件中还存储有每一条索引对应的模板路 径,所述模板路径为存储与所述索引关联的短信模板集合的文本文件的标识;
[0054] 所述确定与所述索引关联的短信模板集合,包括:
[0055] 获取所述索引对应的模板路径;
[0056] 根据所述标识,查找存储与所述索引关联的短信模板集合的文本文件,获取与所 述索引关联的短信模板集合。
[0057] 根据本公开实施例的第三方面,提供一种模板的处理装置,包括:
[0058] 短信模板获取模块,被配置为获取待推送的短信模板,所述短信模板中包括模板 属性和与模板属性对应的属性值;
[0059] 提取模块,被配置为根据预设的目标模板属性,从所述短信模板中提取与所述目 标模板属性对应的属性值作为与所述短信模板关联的索引;
[0060] 推送模块,被配置为将所述短信模板和关联的索引推送给终端,以供终端利用与 所述索引关联的短信模板识别短信的文本内容中的目标信息。
[0061] 可选的,所述装置还包括:
[0062] 模板记录模块,被配置为将具有相同索引的短信模板记录在同一短信模板集合 中,得到一个或多个短信模板集合;
[0063] 索引记录模块,被配置为将所有索引记录在索引集合中;
[0064] 所述推送模块,包括:
[0065] 集合推送子模块,被配置为将所述短信模板集合和所述索引集合推送给终端。
[0066] 可选的,所述模板属性包括优先级属性;
[0067] 所述装置还包括:
[0068] 优先级获取模块,被配置为获取所述短信模板的优先级,将所述优先级作为所述 短信模板中优先级属性的属性值;
[0069] 所述模板记录模块,包括:
[0070] 模板记录子模块,被配置为根据每一所述短信模板的优先级,按照优先级高低的 顺序将具有相同索引的短信模板记录在同一短信模板集合中。
[0071] 可选的,所述模板属性包括模板识别数量属性;
[0072] 所述装置还包括:
[0073] 识别结果获取模块,被配置为获取终端发送的模板识别结果,所述模板识别结果 中记录有识别成功的短信模板;
[0074] 统计模块,被配置为根据所述模板识别结果统计预设时间内的所述短信模板的模 板识别数量,将所述模板识别数量作为所述短信模板中的模板识别数量属性的属性值。
[0075] 可选的,所述装置还包括:
[0076] 异常检测模块,被配置为根据所述模板识别数量,通过预设的机器学习算法对所 述待推送的短信模板进行异常模板检测,筛选出异常的短信模板。
[0077] 可选的,所述模板属性包括模板有效期属性;
[0078] 所述装置还包括:
[0079] 有效期筛选模块,被配置为根据所述模板有效期属性的属性值,在所述待推送的 短信模板中筛选出不在有效期内的短信模板。
[0080] 可选的,所述推送模块,包括:
[0081] 周期推送子模块,被配置为按照预设时间周期将所述短信模板集合和所述索引集 合推送给终端。
[0082] 可选的,所述短信模板和所述索引以数据库的形式进行存储。
[0083] 根据本公开实施例的第四方面,提供一种短信识别装置,所述装置包括:
[0084] 短信获取模块,被配置为获取待识别的短信;
[0085] 索引确定模块,被配置为在预存的索引集合中确定与所述短信相匹配的索引;
[0086] 模板确定模块,被配置为确定与所述索引关联的短信模板集合;
[0087] 识别模块,被配置为利用所述短信模板集合中的短信模板识别所述短信的文本内 容中的目标信息。
[0088] 可选的,所述装置还包括:
[0089] 集合接收模块,被配置为接收服务端发送的索引集合和一个或多个所述短信模板 集合,其中,所述索引集合中至少包括一条索引,所述索引集合中每一索引关联一所述短信 模板集合,所述短信模板集合中至少包括一短信模板。
[0090] 可选的,所述索引确定模块,包括:
[0091] 匹配判断子模块,被配置为判断所述短信的特定信息与所述索引中的预设信息是 否相匹配;
[0092] 匹配确定子模块,被配置为当所述短信的特定信息与所述索引中的预设信息相匹 配时,确定所述索引与所述短信相匹配。
[0093] 可选的,所述索引中的预设信息至少包括发送方号码、接收方归属地和关键字;
[0094] 所述匹配判断子模块,包括:
[0095] 读取子模块,被配置为读取所述索引中的发送方号码、接收方归属地和关键字;
[0096] 获取子模块,被配置为获取所述短信的发送方号码和接收方归属地;
[0097] 查找子模块,被配置为从所述短信的文本内容中查找是否记录有所述关键字;
[0098] 确定子模块,被配置为当所述短信的发送方号码和接收方归属地与所述索引中记 录的发送方号码、接收方归属地相匹配,并且所述短信的文本内容中记录有所述关键字时, 确定所述短信的特定信息与所述索引中的预设信息相匹配。
[0099] 可选的,所述识别模块,包括:
[0100] 信息识别子模块,被配置为根据与所述索引关联的短信模板集合,从所述短信模 板集合中按照短信模板的记录顺序,提取短信模板识别所述短信的文本内容中的目标信 息;
[0101] 模板提取子模块,被配置为若当前提取的短信模板无法识别出所述目标信息,则 在所述短信模板集合中依次提取下一短信模板,若当前提取的短信模板识别出所述目标信 息,则停止提取短信模板。
[0102] 可选的,所述装置还包括:
[0103] 发送模块,被配置为在所述利用所述短信模板识别所述短信的文本内容中的目标 信息后,将模板识别结果发送给服务端,所述模板识别结果包括识别成功的短信模板,以供 服务端根据所述模板识别结果统计短信模板的模板识别数量。
[0104] 可选的,所述索引集合以文本文件的形式进
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1