1.一种基于短信的数据采集方法,其特征在于,包括:
接收安全汇聚网关发送的短信数据,所述短信数据包括:短信属性信息和短信文本;
根据预先设置的模版库判断所述短信数据是否为特定商户用户发送的预设类型的行业短信,所述模版库中存储有各特定商户用户所发送的所述预设类型的行业短信的模版,所述模版包括对应的所述预设类型的行业短信中的若干个关键词;
若判断出所述短信数据是所述特定商户用户发送的预设类型的行业短信时,则根据所述短信数据对应的模版提取所述短信文本中的关键词和位于部分关键词之后的数值数据;
将所述短信属性信息提取出的所述关键词和所述数值数据按照预设格式生成记录文件。
2.根据权利要求1所述的基于短信的数据采集方法,其特征在于,所述短信属性信息包括:发送号码;
所述根据预先设置的模版库判断所述短信数据是否为特定商户用户发送的预设类型的行业短信的步骤包括:
根据预先设置的特定商户接入号列表和所述发送号码判断所述短信数据是否为特定商户用户发送的行业短信,所述特定商户接入号列表记载有若干个特定商户用户的接入号;
若判断出所述短信数据为特定商户用户发送的行业短信时,则确定所述短信数据所对应的特定商户用户,并从所述模版库中调取出该特定商户用户对应的所述预设类型的行业短信的若干个模版;
将所述短信文本与调取出的各模版分别进行匹配;
若所述短信文本与调取出的一个模版匹配成功时,则识别出所述短信数据为特定商户用户发送的预设类型的行业短信。
3.根据权利要求2所述的基于短信的数据采集方法,其特征在于,所述根据预先设置的特定商户接入号列表和所述发送号码判断所述短信数据是否为特定商户用户发送的行业短信的步骤包括:
查询所述特定商户接入号列表中是否存在所述发送号码;
若能够从所述特定商户接入号列表中查询出所述发送号码,则判断出所述短信数据为特定商户用户发送的行业短信,若不能从所述特定商户接入号列表中查询出所述发送号码,则判断出所述短信数据不为特定商户用户发送的行业短信。
4.根据权利要求3所述的基于短信的数据采集方法,其特征在于,所述查询所述特定商户接入号列表中是否存在所述发送号码的步骤之前还包括:
判断所述发送号码是否为手机号;
若判断出所述发送号码不为手机号,则执行所述查询所述特定商户接入号列表中是否存在所述发送号码的步骤。
5.根据权利要求2所述的基于短信的数据采集方法,其特征在于,所述根据预先设置的特定商户接入号列表和所述发送号码判断所述短信数据是否为特定商户用户发送的行业短信的步骤之前还包括:
从行业网关中同步所述特定商户接入号列表。
6.根据权利要求1所述的基于短信的数据采集方法,其特征在于,所述将所述短信属性信息、提取出的所述关键词和所述数值数据按照预设格式生成记录文件的步骤之后还包括:
将接收到的所述短信数据丢弃。
7.一种基于短信的数据采集系统,其特征在于,包括:
短信接口模块,用于接收安全汇聚网关发送的短信数据,所述短信数据包括:短信属性信息和短信文本;
短信判断模块,用于根据预先设置的模版库判断所述短信数据是否为特定商户用户发送的预设类型的行业短信,所述模版库中存储有各特定商户用户所发送的所述预设类型的行业短信的模版,所述模版包括所述预设类型的行业短信的关键词;
数据提取模块,用于若所述短信判断模块判断出所述短信数据是所述特定商户用户发送的预设类型的行业短信时,则根据所述短信数据对应的模版提取所述短信文本中的关键词和位于部分关键词之后的数值数据;
记录生成模块,用于将所述短信属性信息、所述数据提取模块提取出的所述关键词和所述数值数据按照预设格式生成记录文件。
8.根据权利要求7所述的基于短信的数据采集系统,其特征在于,所述短信属性信息包括:发送号码;
所述短信判断模块包括:
行业短信判断单元,用于根据预先设置的特定商户接入号列表和所述发送号码判断所述短信数据是否为特定商户用户发送的行业短信,所述特定商户接入号列表记载有若干个特定商户用户的接入号;
模版调取单元,用于若所述行业短信判断单元判断出所述短信数据为特定商户用户发送的行业短信时,则确定所述短信数据所对应的特定商户用户,并从所述模版库中调取出该特定商户用户对应的所述预设类型的行业短信的若干个模版;
模版匹配单元,用于将所述短信文本与调取出的各模版分别进行匹配,其中,若所述短信文本与调取出的一个模版匹配成功时,则判断出所述短信数据为特定商户用户发送的预设类型的行业短信。
9.根据权利要求8所述的基于短信的数据采集系统,其特征在于,所述行业短信判断单元包括:
号码查询子单元,用于查询所述特定商户接入号列表中是否存在所述发送号码;其中,若能够从所特定商户接入号列表中查询出所述发送号码,则判断出所述短信数据为特定商户用户发送的行业短信,若不能从所述特定商户接入号列表中查询出所述发送号码,则判断出所述短信数据不为特定商户用户发送的行业短信。
10.根据权利要求9所述的基于短信的数据采集系统,其特征在于,所述行业短信判断单元还包括:
手机号判断子单元,用于判断所述发送号码是否为手机号;
所述号码查询子单元用于若所述手机号判断子单元判断出所述发送号码不为手机号时,查询所述特定商户接入号列表中是否存在所述发送号码。
11.根据权利要求2所述的基于短信的数据采集系统,其特征在于,还包括:
商户接入号信息管理模块,用于从行业网关中同步所述特定商户接入号列表。