业务信息推送方法、装置、可读存储介质和计算机设备与流程

文档序号:20839660发布日期:2020-05-22 17:20阅读:158来源:国知局
业务信息推送方法、装置、可读存储介质和计算机设备与流程

本申请涉及计算机技术领域,特别是涉及一种业务信息推送方法、装置、计算机可读存储介质和计算机设备。



背景技术:

由于业务事项非常多,而且涉及的业务部门也非常多,用户不清楚业务在事项目录系统里的具体名称,也不知道事项由哪个业务部门负责。因此用户在在线办理事项时,大多需要通过业务相关网址的搜索,检索到相关事项和推荐的事项,然后通过结果中的链接进入办理页面。或者用户也可以通过智能客服检索到相关事项和搜索结果里的推荐相关事项,然后链接到办事页面。传统的相关事项的业务信息推送方法基于全文检索加基本的nlp(naturallanguageprocessing,自然语言处理)实现的,对于搜索结果事项的推荐其实也是基于全文检索的,导致业务信息推送不准确。



技术实现要素:

基于此,有必要针对业务信息推送不准确的技术问题,提供一种业务信息推送方法、装置、计算机可读存储介质和计算机设备。

一种业务信息推送方法,所述方法包括:

获取第一事项标识;

从关联事项标识集中获取与所述第一事项标识相关的第二事项标识,其中,所述关联事项标识集是根据业务事项标识集得到的,所述业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;所述业务信息中包括业务事项标识以及对应的业务办理时间;

推送所述第二事项标识。

一种业务信息推送装置,所述装置包括:

第一获取模块,用于获取第一事项标识;

第二获取模块,用于从关联事项标识集中获取与所述第一事项标识相关的第二事项标识,其中,所述关联事项标识集是根据业务事项标识集得到的,所述业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;所述业务信息中包括业务事项标识以及对应的业务办理时间;

推送模块,用于推送所述第二事项标识。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:

获取第一事项标识;

从关联事项标识集中获取与所述第一事项标识相关的第二事项标识,其中,所述关联事项标识集是根据业务事项标识集得到的,所述业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;所述业务信息中包括业务事项标识以及对应的业务办理时间;

推送所述第二事项标识。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

获取第一事项标识;

从关联事项标识集中获取与所述第一事项标识相关的第二事项标识,其中,所述关联事项标识集是根据业务事项标识集得到的,所述业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;所述业务信息中包括业务事项标识以及对应的业务办理时间;

推送所述第二事项标识。

上述业务信息推送方法、装置、计算机可读存储介质和计算机设备,获取第一事项标识,从关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,关联事项标识集是根据业务事项标识集得到的,业务事项标识集是是按照业务办理时间对所获取的业务信息进行排序得到的,业务信息中包括业务事项标识以及对应的业务办理时间,并推送第二事项标识,能够挖掘出有关联关系的事项标识集,能够推送更加符合用户需求的事项,提高信息推送的准确性。

附图说明

图1为一个实施例中业务信息推送方法的应用环境图;

图2为一个实施例中业务信息推送方法的流程示意图;

图3为一个实施例中根据业务事项集得到关联事项标识集的流程示意图;

图4为一个实施例中得到关联事项标识集的流程示意图;

图5为一个实施例中业务信息推送的界面示意图;

图6为一个实施例中业务信息推送装置的结构框图;

图7为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

图1为一个实施例中业务信息推送方法的应用环境图。该业务信息推送方法应用于业务信息推送系统。该业务信息推送系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。业务信息推送程序可应用于服务器120。

在一个实施例中,政务服务网是一种用户在线办理事项的门户,一般由各省政数局根据国家要求并结合本地实际情况建立。政务服务网由首页,个人服务,法人服务,政民互动,效能监督,好差评组成等国家规定的栏目加一些地方特色组成。智能客服是政务服务网的一个重要组成部分。然而传统的智能客服推荐信息时推荐不合理,缺乏对政务业务的理解,其次是使用技术上的问题。

如图2所示,提供了一种业务信息推送方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该信息推送方法具体包括如下步骤:

步骤202,获取第一事项标识。

其中,第一事项标识可展示在终端。第一事项标识可以是以事项名称的形式展示,也可以是以事项编码的形式展示。例如,第一事项名称可以是结婚登记,对应的第一事项编码可以是te4409027000099840344210000000。

具体地,业务信息推送程序从终端获取第一事项标识。信息推送程序可从终端获取第一事项名称,根据事项名称与事项编码的对应关系,将第一事项名称转化为第一事项编码。

步骤204,从关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,关联事项标识集是根据业务事项标识集得到的,业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;业务信息中包括业务事项标识以及对应的业务办理时间。

其中,关联事项集是具有关联性的事项的集合。即发生了事项a,则大概率发生事项d,那么事项a和事项d为关联事项。发生了事项a和事项b,则大概率发生事项c,那么事项a、事项b和事项c为关联事项。或者发生了事项e,则大概率发生事项f、g和h等不限于此,那么事项e、事项f、事项g和事项h为关联事项。至少两套关联事项组合成关联事项标识集。那么{a,d}为关联事项标识;{a,b,c}为关联事项标识;{e,f,g,h}为关联事项标识。上述关联事项标识集中包括{a,d}、{a,b,c}和{e,f,g,h}。关联事项标识集是业务事项标识集的子集。

业务事项标识用于唯一地标识业务事项。业务事项具体可以是在政务网申办的事项。每个业务事项标识均有唯一对应的业务事项。业务事项标识可由数字、字母、符号、文字中一种或多种组成。业务事项标识可以是指业务事项名称,也可以是指业务事项编码等。例如业务事项名称可以是设立登记、申请刻章、申请开户、申请领发票、公积金开户、社保开户、结婚登记、生育登记、生育津贴申请、户口办理等不限于此。业务事项编码可以是te4409027000099840344210000000等不限于此。

业务信息中包括业务事项标识以及对应的业务办理时间。业务信息中还可包含其他信息,例如,业务流水标识、申请人类型、申请人标识、行政区划等。业务事项信息可从网办库中得到。网办库中的数据量大,且较零散,因此需要进行数据清洗,按照业务事项时间对业务事项信息进行排序。

网办库是指个人或法人在政务服务网,统一业务事项标识系统,审批系统办事后产生的办件,通过共享交换平台或政务畅通工程或其他形式汇聚到一起的包含业务事项标识人(个人或法人),代理人,经手人等基本信息,包括业务事项标识,网上预受理,受理,补正告知,补正受理,特别程序申请,特别审查结果,办结,领证登记等办件过程数据组成。

业务信息推送程序可将业务事项标识集输入至关联规则挖掘算法只能怪得到第二事项标识。从大规模数据中挖掘对象之间的隐含关系被称为关联分析(associateanalysis)或者关联规则学习(associaterulelearning)。例如关联规则挖掘算法可以是apriori算法等。关联规则挖掘例如总共有10000个人,有7000个人办理的事项的顺序都有结婚登记,生育登记,生育津贴申请和户口办理,我们认为这个事项的办理顺序集是有一定现实意义的,同样对“一件事“也一样。

具体地,关联事项标识集预先存储在服务器中。即关联事项标识集对应的文件中已定义关联事项标识。业务信息推送程序可根据第一事项标识从关联事项标识集中匹配相关的第二事项标识。第二事项标识的数量不限。业务信息推送程序可获取业务信息,其中业务信息中包括业务事项标识以及对应的业务办理时间。业务信息推送程序按照业务办理时间对业务信息排序得到业务事项标识集。业务信息推送程序根据业务事项标识集进行处理得到关联事项标识集。具体地,业务信息推送程序可将业务事项标识集输入至关联规则挖掘算法模型中,得到关联事项标识集。

步骤206,推送第二事项标识。

具体地,信息推送程序向对应的终端推送第二事项标识。信息推送程序获取到第二事项编码,获取第二事项编码对应的第二事项名称,向终端推送第二事项名称。

上述业务信息推送方法,获取第一事项标识,从关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,关联事项标识集是根据业务事项标识集得到的,业务事项标识集是是按照业务办理时间对所获取的业务信息进行排序得到的,业务信息中包括业务事项标识以及对应的业务办理时间,并推送第二事项标识,能够挖掘出有关联关系的事项标识集,能够推送更加符合用户需求的事项,提高信息推送的准确性。

在一个实施例中,在政务网获取用户输入的第一申办事项标识,例如“结婚登记”。业务信息推送程序从关联事项标识集中获取与第一申办事项标识相关的第二申办事项标识。其中,关联事项标识集是按照申办时间对所获取的申办信息进行排序得到的,申办信息中包括申办事项标识以及对应的申办时间。例如“生育登记”和“生育津贴申领”等,并在政务网推送第二申办事项标识。

在一个实施例中,业务信息推送程序获取用户订阅的事项标识,例如某书籍标识,从关联事项标识集中获取与第一事项标识相关的第二事项标识,并推送该第二事项标识。其中,关联事项标识集是根据订阅的事项标识集得到的,订阅的事项标识集是按照订阅时间对所获取的订阅信息进行排序得到的,订阅信息中包括订阅事项标识以及对应的订阅时间。例如某书籍的第一部为第一事项标识,第二部为第二事项标识。

在一个实施例中,业务信息推送程序获取第一事项标识,例如第一网络安全事项标识。业务信息推送程序从关联事项标识集中获取与第一网络安全事项标识相关的第二网络安全事项标识,其中,关联事项标识集是按照网络安全事项开启时间对所获取的网络安全信息进行排序得到的,网络安全信息中包括网络安全事项标识以及对应的网络安全事项开启时间。

在一个实施例中,业务信息推送程序获取申请人类型以及第一事项标识,从申请人类型对应的关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,申请人类型对应的关联事项标识集是根据申请人类型对应的业务事项标识集得到的,业务事项标识集是按照申请人标识、申请人类型以及业务办理时间对所获取的业务信息进行排序得到的;业务信息中包括业务事项标识以及对应的业务办理时间、申请人标识和申请人类型。

在一个实施例中,业务信息包括第一业务信息。在获取第一事项标识之前,该业务信息推送方法还包括:获取第一业务信息,第一业务信息包括业务事项标识、业务事项标识对应的申请人标识,以及业务事项标识对应的业务办理时间;按照申请人标识以及业务办理时间对第一业务信息进行排序,得到具有时间顺序的业务事项标识集。

其中,申请人标识是指办理某个事项的申请人的标识。申请人标识用于唯一地标识申请人。申请人标识可以是身份证号码、电话号码等不限于此。业务办理时间是指申请人办理某个业务事项的时间。每个业务事项标识均有对应的申请人标识以及业务办理时间。

具体地,在实际使用过程之前,即获取第一事项标识之前,需要预先建立关联事项标识集。业务信息推送程序获取第一业务信息,第一业务信息中包括业务事项标识、业务事项标识对应的申请人标识,以及业务事项标识对应的业务办理时间。例如,业务事项标识-申请人标识-业务办理标识。业务信息推送程序按照申请人标识先按照申请人标识对第一业务信息进行分组,得到申请人标识对应的业务办理标识集以及对应的业务办理时间。再按照业务办理时间对申请人标识对应的业务办理标识集进行排序,得到具有时间顺序的事项标识集。表1为申请人标识对应的申办事项编码集、申办事项名称集以及业务办理时间集。那么,具有时间顺序的事项标识集为{a,b,c,d}。

如表1:

本实施例中,某个用户办理的事项的顺序,比如结婚登记,生育登记,生育津贴申请,户口办理。虽然不是同一件事,但是和时间顺序相关事项,比如结婚登记,生育登记,生育津贴申请,户口办理这些有内在时间关系逻辑的事项。如果把这些事项和人的属性进行协同过滤进行推荐,可能挖掘不到出这样的事项规律。

本实施例中,获取第一业务信息,包括:每隔预设时长获取第一业务信息。

上述业务信息推送方法,由于业务信息的数据量大,按照申请人标识排序能够得到可以筛选得到申请人标识申办的业务事项标识,再按照业务办理时间排序,能够得到某个人按照时间顺序事项标识集,作为关联事项的参考,即在申办了某个事项之后,很有可能执行下一个事项,提高业务信息推送的准确性。

在一个实施例中,第一业务信息还包括申请人标识对应的申请人类型。按照申请人标识以及业务办理时间对第一业务信息进行排序,得到具有时间顺序的事项标识集,包括:按照申请人标识,以及申请人标识对应的申请人类型进行分组后,按照业务办理时间对第一业务信息进行排序,得到与申请人类型对应的具有时间顺序的业务事项标识集。

其中,申请人类型可包括第一申请人类型和第二申请人类型。例如第一申请人类型可以是个人类型,第二申请人类型可以是法人类型。或者第一申请人类型可以是法人类型,第二申请人类型可以是个人类型。

具体地,业务信息推送程序按照申请人标识,以及申请人标识对应的申请人类型对第一业务信息进行分组后,按照业务办理时间对分组后的第一业务信息进行排序,得到与申请人类型对应的具有时间顺序的事项标识集。例如,申请人标识1,对应第一类型,对应具有时间顺序的事项标识集{a,b,c},以及对应的业务办理时间。申请人标识1,对应第二类型,对应具有时间顺序的事项标识集{s,m,l}。

本实施例中,申请人类型包括第一申请人类型以及第二申请人类型。业务信息推送程序根据第一申请人类型对应的事项标识集得到第一关联事项标识集。业务信息推送程序根据第二申请人类型对应的事项标识集得到第二关联事项标识集。从关联事项标识集中获取与第一事项标识相关的第二事项标识,包括:从第一关联事项标识集和第二关联事项标识集中获取与第一事项标识相关的第二事项标识。

本实施例中,业务信息推送程序可通过selectgroup_concat(sxbm)fromt_gdbs_sbwheresbsj>=to_date(…)groupbysqrzjhm,sqrlxorderbysbsj。即从广东省数据库中抽取申办时间在…之后的数据,按照申请人证件号码以及申请人类型进行排序,输出事项编码集合。申请人证件号码即申请人标识。

上述业务信息推送方法,由于不同类型的申请人,需要办理的业务事项通常不相同,因此,按照申请人标识以及对应的申请人类型对第一业务信息进行分组后,再按照业务办理时间对第一业务信息进行排序,就能得到不同申请人类型对应的具有时间顺序的事项标识集,从而能够满足不同类型的业务事项的推荐,提高业务事项推送的准确性。

在一个实施例中,业务信息包括第二业务信息。在获取第一事项标识之前,方法还包括:获取第二业务信息,业务信息包括业务流水标识、业务流水标识对应的事项标识集,以及事项标识集中每个事项标识对应的业务办理时间;按照业务流水标识以及业务办理时间对第二业务信息进行排序,得到具有时间顺序的事项标识集。

其中,业务流水标识可对应一个或至少两个事项标识,即业务事项标识集。业务流水标识用于唯一地标识一套事项流程。

具体地,第二业务信息中的信息可能是无序的,一个业务流水标识可对应业务事项编码集,而每个业务事项编码均有对应的业务办理时间。那么按照业务流水标识和业务办理时间对第二业务信息进行排序,能得到业务流水标识对应的具有时间顺序的事项标识集,例如表2中的{115,111,113,114}或者{f,b,d,e}。业务信息推送程序根据具有时间顺序的事项标识集处理得到关联事项标识集。

如表2:

本实施例中,某个用户办理“一件事“(主要以工程建设,企业法人)需要办理的事项-设立登记,申请刻章,申请开户,申请领发票,公积金开户,社保开户。a.挖掘一件事(多个事项组成的一个完整流程,含时间顺序),和人的基本属性无关,比如一般企业的开设过程,需要办理几个事项,设立登记,申请刻章,申请开户,申请领发票,公积金开户,社保开户。这些事项是组成企业开设这样的一件事情,这些事项和办理的人的属性无关,当用户办理了设立登记,申请刻章,申请开户,申请领发票,本方案推荐他可能感兴趣的事项是公积金开户,社保开户。

本实施例中,获取第二业务信息,包括:每隔预设时长获取第二业务信息。

上述业务信息推送方法,由于在办理一个业务时,往往会由多个业务事项组成,不同的申办事项可能在不同的地址或者部门等进行办理,传统的方式是一个事项标识对应一个申办流水标识,而各部门之间网络打通之后,可使用一个申办流水标识包含一套流程,即一件包含多个事项的事情,使用一个流水标识,那么按照业务流水标识以及业务办理时间对第二业务信息进行排序,就能得到具有时间顺序的事项标识集,即具有关联性的事项标识集,且由于通过申办流水标识得到的事项顺序更加准确,那么得到的关联事项标识集更加准确,即当发生事项a时大概率会发生事项b,从而能够满足一个业务相关的业务事项的推荐,提高业务事项推送的准确性。

在一个实施例中,如图3所示,为一个实施例中根据业务事项集得到关联事项标识集的流程示意图,包括:

步骤302,获取业务事项标识集中的事项标识以及对应的支持度。

其中,支持度是指事项标识在业务事项标识集中出现的次数,或者事项标识在业务事项标识集中出现的频率。例如业务事项标识集中的业务事项标识有100个,而业务事项a在业务事项标识集中出现了50次,那么支持度可为50%。

具体地,业务信息推送程序扫描业务事项标识集中的业务事项标识,得到所有业务事项标识,并统计每个业务事项标识对应的支持度。

步骤304,获取支持度阈值,保留支持度大于或等于支持度阈值的业务事项标识,得到目标事项标识。

其中,支持度阈值可用于筛选出频次较高的业务事项标识。

具体地,业务信息推送程序获取支持度阈值,将小于支持度阈值的业务事项剪枝,保留大于或等于支持度阈值的业务事项标识,得到目标事项标识。例如,支持度阈值为50%,那么剔除支持度小于50%的业务事项标识。

步骤306,对目标事项标识进行连接处理,得到频繁项集。

其中,连接处理是指频繁项集是指满足支持度阈值的事项集合。即频繁项集是指出现次数较为频繁的项集。

具体地,业务信息推送程序对目标事项标识进行连接处理,得到连接项集,对连接项集再进行连接处理,得到频繁项集。

步骤308,获取置信度阈值以及频繁项集中每个频繁项对应的置信度。

其中,置信度阈值用于筛选频繁项。例如,频繁项中包括{a,b,c},那么频繁项对应的置信度可以是发生了a和b后,发生c的概率;或者发生了a之后,发生b和c的概率等不限于此。

具体地,业务信息推送程序获取置信度阈值,以及频繁项集中每个频繁项对应的置信度。

步骤310,保留置信度大于置信度阈值的频繁项,得到关联事项标识集。

具体地,置信度大于或等于置信度阈值的频繁项即为强关联的频繁项,得到关联事项标识集。

上述业务信息推送方法,获取支持度阈值,保留支持度大于或等于支持度阈值的业务事项标识,得到目标事项标识,可筛选掉支持度较低的业务事项标识,再进行连接处理得到频繁项集,保留置信度大于或等于置信度阈值的频繁项,能够进一步筛选频繁项,减少计算量,能够得到关联事项标识集,从而提高信息推送的准确性。

在一个实施例中,如图4所示,为一个实施例中得到关联事项标识集的流程示意图,在获取第一事项标识之前,该业务信息推送方法还包括:

步骤402,获取第一业务信息,第一业务信息包括业务事项标识、业务事项标识对应的申请人标识,以及业务事项标识对应的业务办理时间。

步骤404,按照申请人标识以及业务办理时间对第一业务信息进行排序,得到具有时间顺序的第一业务事项标识集。

步骤406,获取第二业务信息,业务信息包括业务流水标识、业务流水标识对应的事项标识集,以及事项标识集中每个事项标识对应的业务办理时间。

步骤408,按照业务流水标识以及业务办理时间对第二业务信息进行排序,得到具有时间顺序的第二业务事项标识集。

步骤410,根据第一业务事项标识集和第二业务事项标识集处理得到关联事项标识集。

上述业务信息处理方法,获取业务信息,业务信息包括第一业务信息和第二业务信息,分别对两种信息进行处理,得到业务事项标识集,能够得到两种类型的业务事项标识集,即个人办理的具有时间顺序的业务事项标识集,以及办理某件事情需要的业务事项标识集,根据这两种标识集挖掘得到关联事项标识集,能够使关联事项标识集中的数据更加丰富,更容易根据第一事项标识查找到对应的第二事项标识。

在一个实施例中,在从关联事项标识集中获取与第一事项标识相关的第二事项标识之前,该业务信息处理方法还包括:获取输入的置信度阈值;获取频繁项集以及频繁项集中每个频繁项对应的置信度;频繁项集是对业务事项标识集进行连接处理得到的;将置信度大于置信度阈值的频繁项确定为关联事项标识,得到关联事项标识集。

其中,频繁项可以是指{a,b,c},频繁项集中包括{a,b,c}、{d,e,f,g}等不限于此。至少一个频繁项组成频繁项集。频繁项集以及每个频繁项集对应的置信度已存储在服务器中。

具体地,业务信息处理程序获取输入的置信度阈值,以及获取频繁项集以及频繁项集中每个频繁项对应的置信度。其中,业务信息处理程序可获取业务事项标识集中事项标识以及对应的支持度,获取支持度阈值,保留支持度大于或等于支持度阈值的业务事项标识,得到目标事项标识,对目标事项标识进行连接处理,得到频繁项集。业务信息处理程序将置信度大于置信度阈值的频繁项确定为关联事项标识,组成关联事项标识集。

上述业务信息处理方法中,获取输入的置信度阈值,即置信度阈值可以自行配置,当获取到输入的置信度阈值时,可根据置信度阈值筛选出大于或等于置信度阈值的频繁项,得到关联事项,那么当置信度阈值越大时,筛选出的频繁项越少,那么业务信息推送的精确性越高;当置信度阈值越小时,筛选出的频繁项越多,推送的业务信息越多,可选择的选项也就越多。

在一个实施例中,如图5所示,为一个实施例中业务信息推送的界面示意图。该界面也为一个智能客服系统的界面图,获取第一事项标识“结婚登记”后,可显示与地区相关的控件。当获取对与地区相关的控件的响应指令时,显示与该地区相关的第一事项标识对应的事项简介等。在“猜你想问”模块,显示第二事项标识“生育登记”以及“生育津贴申领”。即一般在结婚登记后,大概率会发生生育登记以及生育津贴申领,提高业务信息推送的准确性。

在一个实施例中,一种业务信息推送方法,包括:

步骤a1,从网办库获取申办信息表,例如广东可为t_gdbs_sb。服务器抽取申办信息表的申办流水号(sblsh)、申办事项编码(sxbm)、申办事项名称(sxmc)、申请人类型(sqrlx)、申请人证件号码(sqrzjhm)、申请人证件类型(lxrzjlx)、申办时间(sbsj)和行政区划(xzqhdm)到智能客服的数据库中由于申办信息表的数据量会很大,但是考虑不需要经常去读这些数据,半年拉一次数据甚至一年按以下步骤写入数据到智能客服可访问的本地文本文件即可。业务信息推送模型从文本文件中读取申办信息。

具体地,申请人类型可以是个人或法人。申请人即申办人。

步骤a2,将事项编码和事项名称的映射关系从事项目录系统中同步至服务器内存中。

其中,事项编码和事项名称的数据不是很多,几十兆即可。事项目录是指政务部门开展工作的依据,由国家编办编制,然后逐级下发到省,然后由省编办根据情况细化或新增,再下发到市,县区,街道等。事项目录系统是指实现事项目录编制的应用。

步骤a3,按照申请人证件号码(sqrzjhm),申请人类型(sqrlx)对申办信息进行分组,然后按照申办时间(sbsj)升序排序获得的事项编码(sxbm),事项名称(sxmc)数据集合。

具体地,可通过selectgroup_concat(sxbm)fromt_gdbs_sbwheresbsj>=to_date(…)groupbysqrzjhm,sqrlxorderbysbsj。即从广东省数据库中抽取申办时间在…之后的数据,按照申请人证件号码以及申请人类型进行排序,输出事项编码集合。这个语句得到的结果是按申请人分组的事项编码以逗号分隔的事项集合,取过去多长时间的数据,一般1年就够了,如果想获取更多的数据,可以多一些。结果类似如下:

te4409027000099840344210000000,te44088370000983506442100000005,te44122670001299201442100000001,写入文本文件保存。

步骤a4,经过步骤a3得到一个按照某个个人或法人办理的按时间发生先后顺序排序的申办事项集合。从这里经过业务信息推送算法即频繁项集算法可以挖掘出和时间相关的有意思的关联事项。比如个人事项的结婚登记、生育登记、生育津贴申请、户口办理这种依次发生的事项。那么当用户在终端检索或咨询生育登记,可以按时间发生的先后顺序推荐生育津贴申请、户口办理等事项。

步骤a5,按申办流水号(sblsh),对数据进行分组,然后按照sbsj升序排序得到的事项编码和事项名称数据集合。

具体地,可通过下述语句实现:selectgroup_concat(sxbm)fromt_gdbs_sbwheresbsj>=to_date(…)groupbysblshorderbysbsj。即从广东省数据库中抽取申办时间在…之后的数据,按照申办流水号进行分组,按照申办时间进行排序,输出事项编码集合。返回的事项编码集合写入文本文件。

步骤a6,从步骤a3和步骤a5获取的文本文件,经过频繁项集apriori算法可以挖掘出办理某件事,需要办理的事项。

其中,apriori算法利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉那些没必要的中间结果)组成。该算法中项集的概念即为项的集合。包含k个项的集合为k项集。项集出现的频率是包含项集的事务数,称为项集的频率。如果某项集满足最小支持度,则称它为频繁项集。

具体地,步骤a5这一类主要体现在法人事项里,比如营商环境,工程项目。目前这类数据还不多,但是是未来政务的重点和政府非常重视的。这个可以挖掘出比如企业设立或者工程审批这种复杂程序,需要办理什么事项,并且顺序是怎样的。例如,事项a,事项b->事项c;事项a->事项d;事项e->事项f,g,h。即当发生事项a,b时,就会发生c;当发生事项a时,就会发生事项d;当发生事项e时就会发生f,g,h,即得到关联事项集。获取关联事项集后,保存到内存,并且持久化到数据库中。

上述业务信息推送方法,传统智能客服的推荐事项采取的是后台静态配置方式实现,可能是基于经验或者办件热度,千人一面,本实施例结合大数据分析和挖掘的手段,对网办库中的网办数据进行大数据分析与挖掘,使用频繁项集apriori算法,根据用户的输入动态地推荐相关事项,提高信息推送准确性。

图2至4为一个实施例中业务信息推送方法的流程示意图。应该理解的是,虽然图2至4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图6所示,为一个实施例中业务信息推送的结构框图,一种业务信息推送装置,包括:

第一获取模块602,用于获取第一事项标识;

第二获取模块604,用于从关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,关联事项标识集是根据业务事项标识集得到的,业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;业务信息中包括业务事项标识以及对应的业务办理时间;

推送模块606,用于推送第二事项标识。

上述业务信息推送装置,获取第一事项标识,从关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,关联事项标识集是根据业务事项标识集得到的,业务事项标识集是是按照业务办理时间对所获取的业务信息进行排序得到的,业务信息中包括业务事项标识以及对应的业务办理时间,并推送第二事项标识,能够挖掘出有关联关系的事项标识集,能够推送更加符合用户需求的事项,提高信息推送的准确性。

在一个实施例中,该业务信息推送装置还包括业务信息处理模块。业务信息处理模块用于获取第一业务信息,第一业务信息包括业务事项标识、业务事项标识对应的申请人标识,以及业务事项标识对应的业务办理时间;按照申请人标识以及业务办理时间对第一业务信息进行排序,得到具有时间顺序的业务事项标识集。

上述业务信息推送装置,由于业务信息的数据量大,按照申请人标识排序能够得到可以筛选得到申请人标识申办的业务事项标识,再按照业务办理时间排序,能够得到某个人按照时间顺序事项标识集,作为关联事项的参考,即在申办了某个事项之后,很有可能执行下一个事项,提高业务信息推送的准确性。

在一个实施例中,该业务信息推送装置还包括业务信息处理模块。第一业务信息还包括申请人标识对应的申请人类型。业务信息处理模块用于按照申请人标识,以及申请人标识对应的申请人类型进行分组后,按照业务办理时间对第一业务信息进行排序,得到与申请人类型对应的具有时间顺序的业务事项标识集。

上述业务信息推送装置,由于不同类型的申请人,需要办理的业务事项通常不相同,因此,按照申请人标识以及对应的申请人类型对第一业务信息进行分组后,再按照业务办理时间对第一业务信息进行排序,就能得到不同申请人类型对应的具有时间顺序的事项标识集,从而能够满足不同类型的业务事项的推荐,提高业务事项推送的准确性。

在一个实施例中,业务信息包括第二业务信息。该业务信息推送装置还包括业务信息处理模块。业务信息处理模块用于获取第二业务信息,业务信息包括业务流水标识、业务流水标识对应的事项标识集,以及事项标识集中每个事项标识对应的业务办理时间;按照业务流水标识以及业务办理时间对第二业务信息进行排序,得到具有时间顺序的事项标识集。

上述业务信息推送装置,由于在办理一个业务时,往往会由多个业务事项组成,不同的申办事项可能在不同的地址或者部门等进行办理,传统的方式是一个事项标识对应一个申办流水标识,而各部门之间网络打通之后,可使用一个申办流水标识包含一套流程,即一件包含多个事项的事情,使用一个流水标识,那么按照业务流水标识以及业务办理时间对第二业务信息进行排序,就能得到具有时间顺序的事项标识集,即具有关联性的事项标识集,且由于通过申办流水标识得到的事项顺序更加准确,那么得到的关联事项标识集更加准确,即当发生事项a时大概率会发生事项b,从而能够满足一个业务相关的业务事项的推荐,提高业务事项推送的准确性。

在一个实施例中,该业务信息推送装置还包括业务信息处理模块。业务信息处理模块用于获取业务事项标识集中的事项标识以及对应的支持度;获取支持度阈值,保留支持度大于或等于支持度阈值的业务事项标识,得到目标事项标识;对目标事项标识进行连接处理,得到频繁项集;获取置信度阈值以及频繁项集中每个频繁项对应的置信度;保留置信度大于置信度阈值的频繁项,得到关联事项标识集。

上述业务信息推送装置,获取支持度阈值,保留支持度大于或等于支持度阈值的业务事项标识,得到目标事项标识,可筛选掉支持度较低的业务事项标识,再进行连接处理得到频繁项集,保留置信度大于或等于置信度阈值的频繁项,能够进一步筛选频繁项,减少计算量,能够得到关联事项标识集,从而提高信息推送的准确性。

在一个实施例中,该业务信息推送装置还包括业务信息处理模块。业务信息处理模块用于获取第一业务信息,第一业务信息包括业务事项标识、业务事项标识对应的申请人标识,以及业务事项标识对应的业务办理时间;按照申请人标识以及业务办理时间对第一业务信息进行排序,得到具有时间顺序的第一业务事项标识集;获取第二业务信息,业务信息包括业务流水标识、业务流水标识对应的事项标识集,以及事项标识集中每个事项标识对应的业务办理时间;按照业务流水标识以及业务办理时间对第二业务信息进行排序,得到具有时间顺序的第二业务事项标识集;根据第一业务事项标识集和第二业务事项标识集处理得到关联事项标识集。

上述业务信息处理装置,获取业务信息,业务信息包括第一业务信息和第二业务信息,分别对两种信息进行处理,得到业务事项标识集,能够得到两种类型的业务事项标识集,即个人办理的具有时间顺序的业务事项标识集,以及办理某件事情需要的业务事项标识集,根据这两种标识集挖掘得到关联事项标识集,能够使关联事项标识集中的数据更加丰富,更容易根据第一事项标识查找到对应的第二事项标识。

在一个实施例中,第一获取模块602用于获取输入的置信度阈值。第二获取模块604用于获取频繁项集以及频繁项集中每个频繁项对应的置信度;频繁项集是对业务事项标识集进行连接处理得到的;将置信度大于置信度阈值的频繁项确定为关联事项标识,得到关联事项标识集。

上述业务信息处理装置中,获取输入的置信度阈值,即置信度阈值可以自行配置,当获取到输入的置信度阈值时,可根据置信度阈值筛选出大于或等于置信度阈值的频繁项,得到关联事项,那么当置信度阈值越大时,筛选出的频繁项越少,那么业务信息推送的精确性越高;当置信度阈值越小时,筛选出的频繁项越多,推送的业务信息越多,可选择的选项也就越多。

图7示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图7所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现业务信息推送方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行业务信息推送方法。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的业务信息推送装置可以实现为一种计算机程序的形式,计算机程序可在如图7所示的计算机设备上运行。计算机设备的存储器中可存储组成该业务信息推送装置的各个程序模块,比如,图6所示的第一获取模块602、第二获取模块604和推送模块606。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的业务信息推送方法中的步骤。

例如,图7所示的计算机设备可以通过如图6所示的业务信息推送装置中的第一获取模块602执行获取第一事项标识。计算机设备可通过第二获取模块604执行从关联事项标识集中获取与第一事项标识相关的第二事项标识,其中,关联事项标识集是根据业务事项标识集得到的,业务事项标识集是按照业务办理时间对所获取的业务信息进行排序得到的;业务信息中包括业务事项标识以及对应的业务办理时间。计算机设备可通过推送模块606执行推送第二事项标识。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述业务信息推送方法的步骤。此处业务信息推送方法的步骤可以是上述各个实施例的业务信息推送方法中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述业务信息推送方法的步骤。此处业务信息推送方法的步骤可以是上述各个实施例的业务信息推送方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1