信息识别方法、装置、终端及服务器的制造方法

文档序号:9688210阅读:210来源:国知局
信息识别方法、装置、终端及服务器的制造方法
【技术领域】
[0001] 本公开设及计算机技术领域,尤其设及一种信息识别方法、装置、终端及服务器。
【背景技术】
[0002] 相关技术中,使用信用卡消费的用户,可W定期收到信用卡中屯、发送的各种还款 信息,还款信息中一般包括还款金额、还款日期等等,W提醒用户及时进行还款。

【发明内容】

[0003] 为克服相关技术中存在的问题,本公开提供了一种信息识别方法、装置、终端及服 务器。
[0004] 根据本公开实施例的第一方面,提供一种信息识别方法,包括:
[0005] 接收信用卡账单信息;
[0006] 截取所述信用卡账单信息中包含金额的分句;
[0007] 对各分句进行分词处理,基于预存储的特征词集合对所述分词处理后得到的词进 行特征提取,得到所述信用卡账单信息的特征词集合;
[000引基于预存储的训练模型和所述信用卡账单信息的特征词集合确定所述信用卡账 单信息中的款项信息。
[0009] 可选的,所述基于预存储的训练模型和所述信用卡账单信息的特征词集合确定所 述信用卡账单信息中的款项信息,包括:
[0010] 读取所述训练模型中的款项分类;
[0011] 基于预存储的训练模型和所述信用卡账单信息的特征词集合,对各所述分句中的 金额进行预测,得到各金额属于各所述款项分类的概率,所述款项分类包括还款额类和非 还款额类;
[0012] 将概率最高的款项分类作为对应的金额所属的款项分类;
[0013] 判断各分句中的金额是否属于所述还款额类,基于判断结果确定所述信用卡账单 信息中的款项信息。
[0014] 可选的,所述基于判断结果确定所述信用卡账单信息中的款项信息,包括:
[0015] 在没有一个所述分句中的金额被判断为属于所述还款额类时,确定所述信用卡账 单信息中的还款信息为零;
[0016] 在只有一个所述分句中的金额被判断为属于所述还款额类时,将所述分句中的金 额确定为还款额,将币种确认为人民币;
[0017] 在多于一个所述分句中的金额被判断为属于所述还款额类时,基于所述分句中的 币种的不同确定还款额。
[0018] 可选的,所述基于所述分句中的币种的不同确定还款额,包括:
[0019] 对于金额属于所述还款额的各所述分句,分别提取各所述分句上下文中的币种信 息;
[0020] 在各所述币种信息互不相同时,将各所述币种信息对应的所述分句中的金额确定 为还款额。
[0021] 可选的,所述基于所述分句中的币种的不同确定还款额,包括:
[0022] 在至少两个所述币种信息相同时,读取相同的币种信息对应的金额分别属于还款 额的概率;
[0023] 将所述概率最大的金额确定为所述币种信息的还款额。
[0024] 可选的,所述方法还包括:
[0025] 接收服务器发送的基于信息增益对信用卡账单信息进行筛选所得到的特征词集 合,W及基于朴素贝叶斯分类器对所述信用卡账单信息的分句进行训练所生成的训练模 型。
[00%] 可选的,所述方法还包括:
[0027]将所述款项信息添加到日历生成提醒信息。
[002引可选的,所述方法还包括:
[0029] 将所述款项信息发送至金融应用APP进行自动还款。
[0030] 根据本公开实施例的第二方面,提供一种信息识别方法,包括:
[0031] 获取设定时间段内收到的信用卡账单信息;
[0032] 截取所述信用卡账单信息中包含金额的分句,并基于预设的款项分类对所述分句 中的金额进行标注;
[0033] 基于所述款项分类对标注后的所述分句进行特征词选择,得到特征词集合;
[0034] W各所述分句中的金额作为训练目标,基于所述特征词集合对标注后的所述分句 进行训练,得到训练模型;
[0035] 将所述训练模型发送给终端,W使所述终端基于接收到的信用卡账单信息中的特 征词集合及所述训练模型,确定所接收到的信用卡账单信息中的款项信息。
[0036] 可选的,所述基于所述款项分类对标注后的所述分句进行特征词选择,得到特征 词集合,包括:
[0037] 对所述标注后的所述分句进行分词处理;
[0038] 对所述分词处理之后得到的词进行去重处理;
[0039] 从所述去重处理之后得到的词中,选择出与所述款项分类的关联性大于设定阔值 的特征词,所选择出的特征词构成所述特征词集合。
[0040] 可选的,所述选择出与所述款项分类的关联性大于设定阔值的特征词,包括:
[0041] 采用信息增益的方法选择出与所述款项分类的关联性大于设定阔值的特征词。
[0042] 可选的,所述基于所述特征词集合对标注后的所述分句进行训练,包括:
[0043] 采用朴素贝叶斯分类器,基于所述特征词集合对标注后的所述分句进行训练。
[0044] 根据本公开实施例的第Ξ方面,提供一种信息识别装置,包括:
[0045] 第一接收模块,被配置为接收信用卡账单信息;
[0046] 第一截取模块,被配置为截取所述第一接收模块接收的信用卡账单信息中包含金 额的分句;
[0047] 处理模块,被配置为对所述第一截取模块截取的各分句进行分词处理,基于预存 储的特征词集合对所述分词处理后得到的词进行特征提取,得到所述信用卡账单信息的特 征词集合;
[0048] 确定模块,被配置为基于预存储的训练模型和所述处理模块得到的所述信用卡账 单信息的特征词集合确定所述信用卡账单信息中的款项信息。
[0049] 可选的,所述确定模块包括:
[0050] 读取子模块,被配置为读取所述训练模型中的款项分类;
[0051] 预测子模块,被配置为基于预存储的训练模型和所述信用卡账单信息的特征词集 合,对各所述分句中的金额进行预测,得到各金额属于所述读取子模块读取的各所述款项 分类的概率,所述款项分类包括还款额类和非还款额类;
[0052] 分类确定子模块,被配置为将所述预测子模块所预测的概率最高的款项分类作为 对应的金额所属的款项分类;
[0053] 判断子模块,被配置为判断各分句中的金额是否属于所述还款额,基于判断结果 确定所述信用卡账单信息中的款项信息。
[0054] 可选的,所述判断子模块包括:
[0055] 第一确定单元,被配置为在没有一个所述分句中的金额被判断为属于所述还款额 类时,确定所述信用卡账单信息中的还款信息为零;
[0056] 第二确定单元,被配置为在只有一个所述分句中的金额被判断为属于所述还款额 类时,将所述分句中的金额确定为还款额,将币种确认为人民币;
[0057] 第Ξ确定单元,被配置为在多于一个所述分句中的金额被判断为属于所述还款额 类时,基于所述分句中的币种的不同确定还款额。
[005引可选的,所述第Ξ确定单元包括:
[0059] 提取子单元,被配置为对于金额属于所述还款额的各所述分句,分别提取各所述 分句上下文中的币种信息;
[0060] 第一确定子单元,被配置为在所述提取子单元提取的各所述币种信息互不相同 时,将各所述币种信息对应的所述分句中的金额确定为还款额。
[0061] 可选的,所述第Ξ确定单元包括:
[0062] 读取子单元,被配置为在至少两个所述币种信息相同时,读取相同的币种信息对 应的金额分别属于还款额的概率;
[0063] 第二确定子单元,被配置为将所述读取子单元读取的概率最大的金额确定为所述 币种信息的还款额。
[0064] 可选的,所述装置还包括:
[0065] 第二接收模块,被配置为接收服务器发送的基于信息增益对信用卡账单信息进行 筛选所得到的特征词集合,W及基于朴素贝叶斯分类器对所述信用卡账单信息的分句进行 训练所生成的训练模型。
[0066] 可选的,所述装置还包括:
[0067] 添加模块,被配置为将所述款项信息添加到日历生成提醒信息。
[006引可选的,所述装置还包括:
[0069] 发送模块,被配置为将所述款项信息发送至金融应用APP进行自动还款。
[0070] 根据本公开实施例的第四方面,提供一种信息识别装置,包括:
[0071] 获取模块,被配置为获取设定时间段内收到的信用卡账单信息;
[0072] 第二截取模块,被配置为截取所述获取模块获取的所述信用卡账单信息中包含金 额的分句,并基于预设的款项分类对所述分句中的金额进行标注;
[0073] 特征词选择模块,被配置为基于所述款项分类对所述第二截取模块标注后的所述 分句进行特征词选择,得到特征词集合;
[0074] 训练模块,被配置为W各所述分句中的金额作为训练目标,基于所述特征词选择 模块选择的所述特征词集合对标注后的所述分句进行训练,得到训练模型;
[0075] 发送模块,被配置为将所述训练模块训练的所述训练模型发送给终端,W使所述 终端基于接收到的信用卡账单信息中的特征词集合及所述训练模型,确定所接收到的信用 卡账单信息中的款项信息。
[0076] 可选的,所述特征词选择模块包括:
[0077] 分词子模块,被配置为对所述标注后的所述分句进行分词处理;
[0078] 去重子模块,被配置为对所述分词子模块分词处理之后得到的词进行去重处理;
[0079] 选择子模块,被配置为从所述去重子模块去重处理之后得到的词中,选择出与所 述款项分类的关联性大于设定阔值的特征词,所选择出的特征词构成所述特征词集合。
[0080] 可选的,所述选择子模块包括:
[0081] 选择单元,被配置为采用信息增益的方法选择出与所述款项分类的关联性大于设 定阔值的特征词。
[0082] 可选的,所述训练模块包括:
[0083] 训练子模块,被配置为采用朴素贝叶斯分类器,基于所述特征词集合对标注后的 所述分句进行训练。
[0084] 根据本公开实施例的第五方面,提供一种终端,包括:处理器;用于存储处理器可 执行指令的存储器;其中,所述处理器被配置为:
[0085] 接收信用卡账单信息;
[0086] 截取所述信用卡账单信息中包含金额的分句;
[0087] 对各分句进行分词处理,基于预存储的特征词集合对所述分词处理后得到的词进 行特征提取,得到所述信用卡账单信息的特征词集合;
[0088] 基于预存储的训练模型和所述信用卡账单信息的特征词集合确定所述信用卡账 单信息中的款项信息。
[0089] 根据本公开实施例的第六方面,提供一种服务器,包括:处理器;用于存储处理器 可执行指令的存储器;其中,所述处理器被配置为:
[0090] 获取设定时间段内收到的信用卡账单信息;
[0091] 截取所述信用卡账单信息中包含金额的分句,并基于预设的款项分类对所述分句 中的金额进行标注;
[0092] 基于所述款项分类对标注后的所述分句进行特征词选择,得到特征词集合;
[0093] W各所述分句中的金额作为训练目标,基于所述特征词集合对标注后的所述分句 进行训练,得到训练模型;
[0094] 将所述训练模型发送给终端,W使所述终端基于接收到的信用卡账单信息中的特 征词集合及所述训练模型,确定所接收到的信用卡账单信息中的款项信息。
[00%]本公开的实施例提供的技术方案可W包括W下有益效果:
[0096] 本公开中终端可W截取接收到的信用卡账单信息中包含金额的分句,对分句进行 分词处理,并进行特征提取,得到账单信息的特征词集合,然后基于预存储的训练模型能够 确定账单信息中的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1