一种基于知识与数据共同驱动的移动支付方式识别方法与流程

文档序号:17792484发布日期:2019-05-31 20:29阅读:249来源:国知局
一种基于知识与数据共同驱动的移动支付方式识别方法与流程
本发明涉及移动支付信息处理以及计算机应用
技术领域
,特别是涉及一种基于知识与数据共同驱动的移动支付方式识别方法。
背景技术
:移动支付(又称手机支付)是指用户使用移动手持设备,通过无线网络(包括移动通信网络和广域网)购买实体或虚拟物品以及各种服务的一种新型支付方式。它具有移动性、及时性、集成性等特点。移动支付方式是理解用户移动支付行为的基本属性。用户的移动支付状态总是表现出一定的规律性,而对移动支付方式的识别能够体现出这种规律性,并且可以为用户提供特定的服务,比如用户常常在某段时间进行移动支付,可以在该时间段提供相应的业务推送。移动支付方式的识别还可以为个人的支付行为习惯提供丰富的信息,也能够及时地了解用户移动支付方式及其发展变化。此外,通过对移动支付方式的识别,还能够进行移动支付风险识别和异常检测,如特定时间里,用户在某陌生地域发生多次移动支付,就可以判断该支付事件可能发生了盗取支付。基于多个用户的移动支付方式识别,还能够检测城市里的热点支付区域和群体支付行为模式。因而对用户移动支付方式的识别对分析用户行为具有重要意义和价值。当前,移动用户通过支付宝、微信支付、翼支付、云闪付、沃支付等客户端app软件进行支付已成为我国主流的移动支付方式。而且,用户的移动支付过程会产生网上交易日志、资金消费提示短信、手机信令等与移动支付方式密切相关的行为数据。然而,由于移动支付牵涉加密算法、移动基站设备产生故障或异常等原因,导致在采集这些数据时常常存在不少无法解析却十分重要的数据,从而对高效、快速、准确地识别用户的移动支付方式提出了挑战。目前移动支付方式识别方法可以分为两类:一类是基于知识规则匹配的移动支付方式识别方法;另一类是基于机器学习的移动支付方式识别方法。基于知识规则匹配的移动支付方式识别方法是一种传统的利用移动支付领域知识针对一种或几种支付方式来设计的算法。该类识别方法的基本思想是基于移动支付领域知识人工提取移动支付方式特征,并利用人工设定的知识规则进行匹配来识别移动支付方式。这类识别方法只能识别出已解析数据,但是对于未解析数据无法设计相应的算法进行有效识别,而这些未解析数据中可能包含了重要的且被加密了的支付数据。同时,该类识别方法只能识别出部分移动支付方式,且识别性能与人工设定的知识规则呈现强相关性,缺乏良好的自适应性和泛化性,远远达不到目前行业的商业标准。基于机器学习的移动支付方式识别方法是一种利用机器学习技术自动提取移动支付方式相关特征并进行支付识别的算法。该类识别方法的基本思想是提取移动支付相关特征构建特征矩阵,并添加标签,利用机器学习的模型进行模型训练,最后将测试数据送入训练好的模型中进行识别。这类识别方法具有灵活性和通用性高、自适应和泛化性能强、无需背景领域知识等优点。该类方法有效的利用了未解析的数据,并提高了模型的性能,但是该方法采用的数据模型是“黑箱”模型,数据构建完全依赖于数据,但是对移动支付方式不具有解释意思。技术实现要素:针对上述各种方法的不足,本发明的目的在于提供一种基于知识与数据共同驱动的移动支付方式识别方法,通过该方法可以有效的识别用户移动支付方式,掌握用户的消费习惯,满足各类业务需求。本发明针对现有的移动支付方式识别方法中存在的上述问题,提出了一种基于知识与数据共同驱动的移动支付方式识别方法。该方法充分利用了知识规则匹配和机器学习模型各自的优点,不仅能够将移动支付领域相关知识和数据模型特点进行有效的融合,最大化地利用未解析数据以提高其识别性能,而且还能够降低算法的复杂度以增加识别效率。本发明解决上述问题的技术方案是提供了一种基于知识与数据共同驱动的移动支付方式识别方法,包括如下步骤:步骤1),采集移动用户上网行为数据,填充缺失的时间序列(精确到秒级),统计用户每秒上网行为数据频次,并构建时间序列-频次矩阵;步骤2),将时间序列-频次矩阵按照基于事件驱动的用户上网行为时间序列自动分割方法划分用户上网行为;步骤3),利用划分的用户上网行为事件,提取支付事件相关特征,构建基于数据驱动的移动支付事件识别模型,从而识别移动支付事件;步骤4),基于词频-逆文档频率算法构建基于知识驱动的移动支付方式主题词提取模型,从而提取移动支付方式主题词;步骤5),融合基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型,构建基于知识与数据共同驱动的移动支付方式识别方法,最终识别用户移动支付方式。其中,步骤1)所述用户上网行为数据包括但不限于用户上网日志数据和用户短信话单数据。其中,步骤2)所述基于事件驱动的用户上网行为时间序列自动分割方法具体是:首先利用上网日志数据频次的突变点确定事件发生的分割点,且相邻分割点必须满足最小事件的时间限制(经实验验证,最小事件时间限制为6分钟时移动支付事件模型识别性能最优)。如当前用户上网行为起点时间为20190121090000,终点时间为20190121100000,且每秒钟的时间序列对应一个上网数据频次,首先连接时间起点和终点构成一条直线,并选取距离该直线最大距离的点作为分割点,依次连接该分割点与时间起点和终点,若该分割点和时间起点或终点的时间间隔满足最小事件的时间限制(6分钟),则再选取距离连接时间起点或终点的直线距离最大的点作为分割点,并按照该原则继续进行分割,然后选取前top-k个距离值最大的分割点,最后利用用户短信话单数据进一步确定分割点,并依次连接分割点构成用户上网行为事件。其中,步骤3)所述的支付事件相关特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次。其中,步骤3)所述构建基于数据驱动的移动支付事件识别模型具体是:首先从划分的用户上网行为事件中提取支付事件相关特征,其特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次;然后将打上标签的支付事件特征数据集分为训练集和测试集,并将训练集送入机器学习模型(如支持向量机模型)进行训练;最后将测试集送入训练好的机器学习模型中进行测试,根据测试性能调整机器学习模型相关参数以达到性能标准,并最终识别移动支付事件。其中,步骤5)所述基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型的融合方式为:内函数为数据驱动的移动支付事件识别模型函数fd(x,θd),外函数为知识驱动的移动支付方式主题词提取模型函数fk(x,θk)的复合方式,即基于知识与数据共同驱动的移动支付方式识别方法函数为fk(fd(x,θd),θk)。其中,x表示输入的数据,包括上网日志数据等;fk和fd分别为知识驱动子模型和数据驱动子模型函数,θk和θd分别对应知识驱动子模型和数据驱动子模型参数,即θk表示为移动支付方式主题词模型中选取的k个关键字,即θd表示为移动支付事件识别模型中机器学习模型的训练参数。本发明的有益效果如下:本发明是一种基于知识与数据共同驱动的移动支付方式识别方法。该方法充分利用了知识规则匹配和机器学习模型各自的优点,不仅能够将移动支付领域相关知识和数据模型特点进行有效的融合,最大化地利用未解析数据以提高其识别性能,而且还能够降低算法的复杂度以增加识别效率。附图说明图1是本发明方法的原理框图;图2是本发明方法的流程图;图3是本发明的基于事件驱动的用户上网行为时间序列自动分割方法流程图;图4是本发明的基于数据驱动的移动支付事件识别模型流程图;图5是本发明的基于知识驱动的移动支付方式主题词提取模型流程图;图6是本发明的基于知识与数据共同驱动的移动支付方式识别方法流程图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。实施例如图1和图2所示,本发明提供了一种基于知识与数据共同驱动的移动支付方式识别方法,其步骤为:步骤1),采集移动用户上网行为数据,填充缺失的时间序列(精确到秒级),统计用户每秒上网行为数据频次(即缺失的时间序列所对应的数据频次为零),并构建时间序列-频次矩阵;具体的时间序列-频次矩阵如表1所示:表1上网行为时间序列-频次矩阵时间序列上网行为数据频次201901211017185201901211017190201901211017203201901211017216……其中,步骤1)所述用户上网行为数据包括但不限于用户上网日志数据和用户短信话单数据。步骤2),将时间序列-频次矩阵按照基于事件驱动的用户上网行为时间序列自动分割方法划分用户上网行为,构成用户上网行为事件;其中,如图3所示,步骤2)所述基于事件驱动的用户上网行为时间序列自动分割方法具体是:首先利用上网日志数据频次的突变点确定事件发生的分割点,且相邻分割点必须满足最小事件的时间限制,然后选取前top-k个距离值最大的分割点,最后利用用户短信话单数据进一步确定分割点,并依次连接分割点构成用户上网行为事件。步骤3),利用划分的用户上网行为事件,提取支付事件相关特征,构建基于数据驱动的移动支付事件识别模型,从而识别移动支付事件;其中,步骤3)所述的支付事件相关特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次。其中,如图4所示,步骤3)所述构建基于数据驱动的移动支付事件识别模型具体是:首先从划分的用户上网行为事件中提取支付事件相关特征,其特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次;然后将打上标签的支付事件特征数据集分为训练集和测试集,并将训练集送入机器学习模型(如支持向量机模型)进行训练;最后将测试集送入训练好的机器学习模型中进行测试,根据测试性能调整机器学习模型相关参数以达到性能标准,并最终识别移动支付事件。步骤4),基于词频-逆文档频率(termfrequency-inversedocumentfrequency,tf-idf)算法构建基于知识驱动的移动支付方式主题词提取模型,从而提取移动支付方式主题词;其中,如图5所示,步骤4)所述构建基于知识驱动的移动支付方式主题词提取模型具体为:首先将上网日志数据进行规范化,去掉其冗余信息,提取关键字(上网日志数据为url类型数据,关键字为其host值);然后对所提取的每个关键字计算其词频-逆文档频率值,并进行排序;最后取前top-k个词频-逆文档频率值最大的关键字构成移动支付方式主题词(k取5-10个左右最佳)。步骤5),融合基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型,构建基于知识与数据共同驱动的移动支付方式识别方法,最终识别用户移动支付方式。其中,如图6所示,步骤5)所述基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型的融合方式为:内函数为数据驱动的移动支付事件识别模型函数fd(x,θd),外函数为知识驱动的移动支付方式主题词提取模型函数fk(x,θk)的复合方式,即基于知识与数据共同驱动的移动支付方式识别方法函数为fk(fd(x,θd),θk)。其中,fk和fd分别为知识驱动子模型和数据驱动子模型函数,θk和θd分别对应知识驱动子模型和数据驱动子模型参数,即θk表示为移动支付方式主题词模型中选取的k个关键字,即θd表示为移动支付事件识别模型中机器学习模型的训练参数。从技术角度看,本发明是一种基于知识与数据共同驱动的移动支付方式识别方法。与现有的知识规则匹配和机器学习模型方法相比,该方法充分利用了知识规则匹配和机器学习模型各自的优点,不仅能够将移动支付领域相关知识和数据模型特点进行有效的融合,最大化地利用未解析数据以提高其识别性能,而且还能够降低算法的复杂度以增加识别效率。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1