一种征信模型的建立方法、征信确定方法及对应装置的制造方法

文档序号:10535441阅读:334来源:国知局
一种征信模型的建立方法、征信确定方法及对应装置的制造方法
【专利摘要】本发明提供了一种征信模型的建立方法、征信确定方法及对应装置,收集已知信用状况的用户到访特征作为训练样本;利用所述训练样本对机器学习模型进行训练,得到征信模型。收集待评价用户的用户到访特征;将所述用户到访特征输入征信模型,得到所述待评价用户的信用状况。本发明采用用户到访信息作为特征来建立征信模型,这种特征能够通过用户的定位装置上报并收集,降低了人工成本,且该特征能够更加客观地刻画用户的信用水平,难以造假,提高了征信准确性。
【专利说明】
_种征信模型的建立方法、征信确定方法及对应装置
【技术领域】
[0001]本发明涉及计算机应用技术领域,特别涉及一种征信模型的建立方法、征信确定方法及对应装置。
【【背景技术】】
[0002]征信指的是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估、信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。征信对于金融机构而言,具有非常重要的意义,例如在向用户发放贷款前,亟需评估出用户的信用评价,从而尽量降低坏账率。
[0003]对于个人用户而言,传统征信模型诸如是采用诸如收入、年龄、职业等特征,这些特征主要依靠手工采集和输入,一方面信息的获取比较费时费力,另一方面提供的信息存在造假的可能且难以验证。

【发明内容】

[0004]有鉴于此,本发明提供了一种征信模型的建立方法、征信确定方法及对应装置,以便于提高征信准确性,且降低人工成本。
[0005]具体技术方案如下:
[0006]本发明提供了一种征信模型的建立方法,该方法包括:
[0007]收集已知信用状况的用户到访特征作为训练样本;
[0008]利用所述训练样本对机器学习模型进行训练,得到征信模型。
[0009]根据本发明一优选实施方式,所述用户到访特征包括以下特征中的至少一种:
[0010]用户访问各类别POI的次数或频率;
[0011]用户在各类别POI的停留时长超过预设时长的次数或频率;
[0012]用户访问各级别消费类POI的次数或频率;
[0013]用户在各级别消费类POI的停留时长超过预设时长的次数或频率;
[0014]用户访问各旅游地的次数或频率;
[0015]用户位置移动轨迹分布状况。
[0016]根据本发明一优选实施方式,通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该POI;或者,
[0017]通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者,
[0018]获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该POI。
[0019]根据本发明一优选实施方式,所述消费类POI包括:
[0020]餐饮店、旅馆、教育机构、娱乐场所或者商场。
[0021]根据本发明一优选实施方式,所述用户位置移动轨迹分布状况的收集包括:
[0022]通过用户的定位设备获取用户的移动轨迹;
[0023]统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
[0024]根据本发明一优选实施方式,所述机器学习模型包括:
[0025]逻辑回归模型、支撑向量机模型、人工神经网络或梯度决策树。
[0026]本发明还提供了一种征信确定方法,该方法包括:
[0027]收集待评价用户的用户到访特征;
[0028]将所述用户到访特征输入征信模型,得到所述待评价用户的信用状况;
[0029]其中所述征信模型是利用上述的征信模型的建立方法建立的。
[0030]根据本发明一优选实施方式,所述用户到访特征包括以下特征中的至少一种:
[0031 ]用户访问各类别POI的次数或频率;
[0032]用户在各类别POI的停留时长超过预设时长的次数或频率;
[0033]用户访问各级别消费类POI的次数或频率;
[0034]用户在各级别消费类POI的停留时长超过预设时长的次数或频率;
[0035]用户访问各旅游地的次数或频率;
[0036]用户位置移动轨迹分布状况。
[0037]根据本发明一优选实施方式,通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该POI;或者,
[0038]通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者,
[0039]获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该POI。
[0040]根据本发明一优选实施方式,所述用户位置移动轨迹分布状况的收集包括:
[0041]通过用户的定位设备获取用户的移动轨迹;
[0042]统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
[0043]本发明还提供了一种征信模型的建立装置,该装置包括:
[0044]第一收集单元,用于收集已知信用状况的用户到访特征作为训练样本;
[0045]训练单元,用于利用所述训练样本对机器学习模型进行训练,得到征信模型。
[0046]根据本发明一优选实施方式,所述用户到访特征包括以下特征中的至少一种:
[0047]用户访问各类别POI的次数或频率;
[0048]用户在各类别POI的停留时长超过预设时长的次数或频率;
[0049]用户访问各级别消费类POI的次数或频率;
[0050]用户在各级别消费类POI的停留时长超过预设时长的次数或频率;
[0051 ]用户访问各旅游地的次数或频率;
[0052]用户位置移动轨迹分布状况。
[0053]根据本发明一优选实施方式,所述第一收集单元在确定用户访问POI时,具体执行:
[0054]通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该POI;或者,
[0055]通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者,
[0056]获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该POI。
[0057]根据本发明一优选实施方式,所述消费类POI包括:
[0058]餐饮店、旅馆、教育机构、娱乐场所或者商场。
[0059]根据本发明一优选实施方式,所述第一收集单元在收集用户位置移动轨迹分布状况时,具体执行:
[0060]通过用户的定位设备获取用户的移动轨迹;
[0061]统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
[0062]根据本发明一优选实施方式,所述训练单元采用的机器学习模型包括:
[0063]逻辑回归模型、支撑向量机模型、人工神经网络或梯度决策树。
[0064]本发明还提供了一种征信确定装置,该装置包括:
[0065]第二收集单元,用于收集待评价用户的用户到访特征;
[0066]信用评价单元,用于将所述第二收集单元收集的用户到访特征输入征信模型,得到所述待评价用户的信用状况;
[0067]其中所述征信模型是利用上述的征信模型建立装置建立的。
[0068]根据本发明一优选实施方式,所述用户到访特征包括以下特征中的至少一种:
[0069]用户访问各类别POI的次数或频率;
[0070]用户在各类别POI的停留时长超过预设时长的次数或频率;
[0071]用户访问各级别消费类POI的次数或频率;
[0072]用户在各级别消费类POI的停留时长超过预设时长的次数或频率;
[0073]用户访问各旅游地的次数或频率;
[0074]用户位置移动轨迹分布状况。
[0075]根据本发明一优选实施方式,所述第二收集单元在确定用户访问POI时,具体执行:
[0076]通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该Ρ0Ι;或者,
[0077]通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者,
[0078]获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该POI。
[0079]根据本发明一优选实施方式,所述第二收集单元在收集用户位置移动轨迹分布状况时,具体执行:
[0080]通过用户的定位设备获取用户的移动轨迹;
[0081]统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
[0082]由以上技术方案可以看出,本发明采用用户到访信息作为特征来建立征信模型,这种特征能够通过用户的定位装置上报并收集,降低了人工成本,且该特征能够更加客观地刻画用户的信用水平,难以造假,提高了征信准确性。
【【附图说明】】
[0083]图1为本发明实施例提供的主要方法流程图;
[0084]图2为本发明实施例提供的征信模型的建立装置示意图;
[0085]图3为本发明实施例提供的征信确定装置的结构图。
【【具体实施方式】】
[0086]为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
[0087]在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0088]应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,六和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符,一般表示前后关联对象是一种“或”的关系。
[0089]取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
[0090]本发明在建立征信模型时,采用一种新的特征,即用户到访特征来建立征信模型。所谓用户到访特征是指通过追踪用户的线下活动提炼出来的和用户信用特点相关的特征,这些特征并非是单纯的地理位置特征,而是通过深度的特征加工处理以及和其他数据源融合从而更多的包含了丰富的语义特征。下面结合实施例对本发明提供的方法进行详细描述。
[0091]图1为本发明实施例提供的主要方法流程图,在本实施例中主要包含两个阶段:征信模型的建立阶段和利用征信模型的征信确定阶段,其中征信模型的建立阶段可以是预先于征信确定阶段执行的,也可以是独立于征信确定阶段周期性执行并及时更新征信模型的,征信确定阶段是利用已经建立或不断更新的征信模型实现的,两个过程相互独立,在本实施例中以前后执行的顺序为例进行描述。如图1中所示,该方法可以包括以下步骤:
[0092]在101中,收集已知信用状况的用户到访特征作为训练样本。
[0093]在构建训练样本时,需要对一些已知信用状况的用户进行到访特征的收集。其中,已知信用状况指的是已经确定出这些用户的信用评分或者信用评级,训练样本由用户到访特征和用户信用状况构成。举一个最简单的例子,假设将信用极好的用户其信用评分记为I分,将信用极差的用户其信用评分记为O分,也可以理解为正、负样本,然后对这些用户进行到访特征的收集,从而构建训练征信模型所使用的训练样本。对于信用评级的情况,即可以预先将已知信用状况的用户分成几个等级,例如优、良、中等、差等等级,然后收集这些用户的到访特征,从而构建训练样本。
[0094]其中,收集的用户到访特征可以包括但不限于以下几种:
[0095]I)用户访问各类别POKPoint Of Interest,兴趣点)的次数或频率。所谓POI指的是地理信息系统中的元素信息,可以包含该元素的描述信息和位置信息,一个POI (即地理信息系统中的元素)可以是一个商铺、房子、公交站、邮筒、旅游景点、餐馆、旅店、教育机构等等。当用户到达某个POI,在一定程度就意味着用户对该POI感兴趣。并且,POI不仅仅包含着位置信息,该POI的描述信息中,还包含着丰富的语义信息,包括该地点的名称、类别、特色等。通过该位置信息与语义信息的结合,就能够体现出用户的偏好。
[0096]在收集用户对POI的到访信息时,可以通过用户的定位装置实现,该定位装置可以是用户手机、平板电脑等具有定位功能的设备。具体可以通过以下几种方式实现:
[0097]—种实现方式是,如果通过用户的定位装置确定用户的位置在某POI的范围内(例如该POI位置周围I公里内),则可以确定该用户访问了该Ρ0Ι。
[0098]另一种实现方式是,如果通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的APUccess Point,接入点),则确定该用户访问了该POI,这种实现方式需要结合其他数据源,即接入各POI的AP的用户信息的获取。每个POI的AP都具有一个SSID(Service Set Identif ier,服务集标识),当用户通过手机、平板电脑、智能穿戴设备等接入一个POI的AP时,在数据库中会存在一条包含该用户标识、SSID和接入时间的记录,通过该记录就能够获知用户接入了该POI的AP。
[0099]还有一种实现方式,如果获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。这种实现方式也需要结合其他数据源,即获取用户在电子地图上的检索记录,当用户在电子地图上进行了检索后,会在数据库中存在一条包含用户标识、检索关键字、检索时间等的记录,通过该记录就可以获知用户在电子地图上检索了某Ρ0Ι。
[0100]另外,可以依据类别对用户访问POI的次数或频率进行记录,其中类别的粒度可以根据实际需求灵活设置。POI的类别可以诸如商圈、教育机构、餐饮、酒店、旅游景点等。
[0101]2)用户在各类别POI的停留时长超过预设时长的次数或频率。该特征与第I)种访问POI的特征相似,但该特征加上了一个限制条件,进一步要求用户在该POI停留足够长的时间,例如预设时长采用15分钟。这种停留的特征更能够体现用户的偏好。其他与第I)种特征基本相同,在此不再赘述。
[0102]3)用户访问各级别消费类POI的次数或频率。
[0103]对于一些特殊的POI,即消费类POI,诸如餐饮店、旅馆、教育机构、娱乐场所、商场等,这些POI的级别能够比较好的刻画用户的消费水平,从而进一步和用户的信用水平产生关联,这也是单纯的地理位置无法体现的一种信用偏好特征。
[0104]可以预先将各消费类POI按照消费水平分成几个级别,以餐饮店为例,可以按照人均消费分成〈50元,50-100元,100-150元,150-200元,200以上等级别;以旅馆为例,可以按照不同星级分成快捷酒店、三星、四星、五星等;然后分别统计用户在各级别消费类POI访问的次数或频率。
[0105]各消费类POI的消费水平可以通过爬取网上信息的方式获得,也可以通过人工标注的方式获得。
[0106]4)用户在各级别消费类POI的停留时长超过预设时长的次数或频率。该特征与第3)种访问POI的特征相似,但该特征加上了一个限制条件,进一步要求用户在该POI停留足够长的时间,例如针对餐饮类POI预设时长采用30分钟,针对旅馆类POI预设时长采用2小时。这种停留的特征更能够体现用户的偏好。其他与第3)种特征基本相同,在此不再赘述。
[0107]5)用户访问各旅游地的次数或频率。通过用户的定位设备还可以统计出用户的旅游特征,这种旅游特征在很大程度上也体现了用户的消费水平和风险偏好,进而体现用户的信用水平。若通过用户的定位设备确定用户位置在某个国家的范围之内,则就可以认为该用户去过这个国家旅游。例如如果用户去过美国两次,那么该特征形式可以表示为:
[0108]travel$美国:2
[0109]通过这种方式,就可以统计出用户在过去一段时间去过的国家、省份、城市等。该特征同时还包含用户在过去一段时间去过的国家,省份和城市的数量。
[0110]6)用户位置移动轨迹分布状况。通过用户定位装置可以获取待用户位置的移动轨迹,通过移动轨迹来获取的该特征可以包括但不限于以下两种:
[0111]第一种:统计用户在设定时段内的移动距离。例如,统计用户的日常移动距离,还可以进一步根据不同类型时间进行划分,例如按照工作日、节假日和周末进行分类,按照午餐时间、晚餐时间进行分类,按照白天、晚上进行分类等等。可以统计出一个用户在所有工作日的最大移动距离是25公里,除了最大移动距离之外,还可以计算每天的移动距离之和、平均数、中位数等。
[0112]第二种:统计用户在设定时段内的移动距离在不同档位上的分布信息。这种特征实际上是对第一种特征的细化,比如,可以将一个用户的单日最大移动距离按照小于100千米、100-200千米、200-500千米进行分档,进而统计出用户在不同档位出现的频次。
[0113]这种对移动轨迹分布状况的统计实际上是对移动距离的统计,与地理位置信息并没有相关性。移动轨迹分布状况可以隐含体现诸如用户是否失业、搬家、换工作、是否需要经常出差等等行为,在一定程度上体现了用户的信用水平。
[0114]在102中,利用训练样本对机器学习模型进行训练,得到征信模型。
[0115]将步骤101中收集的训练样本放入机器学习模型进行训练,可选用的机器学习模型可以包括但不限于LR(Logistic Regress1n,逻辑回归)模型、SVM(Support VectorMachine,支撑向量机)模型、ANN(Artif icial Neural Network,人工神经网络)或GBDT(Gradient Boosting Decis1n Tree,梯度决策树)。
[0116]需要说明的是,在训练征信模型时,除了采用如步骤101中所收集的用户到访特征之外,还可以进一步结合诸如用户职业、年龄、收入等现有技术中所采用的特征,还可以结合从诸如用户的电商交易数据、社交数据中提取出的其他特征。
[0117]以上是建立征信模型的过程,下面步骤是利用征信模型进行征信确定的过程。
[0118]在103中,收集待评价用户的用户到访特征。
[0119]在本步骤中对待评价用户的用户到访特征的收集与上述步骤1I中收集的特征类型和方式相同,在此不再赘述。
[0120]在104中,将收集的待评价用户的用户到访特征输入征信模型,得到待评价用户的信用状况。
[0121]根据征信模型输出得到的结果,可以是待评价用户的信用评分,也可以是待评价用户的信用等级,还可以采用其他信用状况的体现方式。
[0122]以上是对本发明所提供方法进行的描述,下面结合实施例对本发明所提供的装置进行详细描述。
[0123]图2为本发明实施例提供的征信模型的建立装置示意图,如图2所示,该装置可以包括:第一收集单元01和训练单元02,其中各组成单元的主要功能如下:
[0124]第一收集单元01负责收集已知信用状况的用户到访特征作为训练样本。
[0125]其中用户到访特征可以包括以下特征中的至少一种:
[0126]I)用户访问各类别POI的次数或频率;POI的类别可以诸如商圈、教育机构、餐饮、
酒店、旅游景点等。
[0127]2)用户在各类别POI的停留时长超过预设时长的次数或频率。
[0128]3)用户访问各级别消费类POI的次数或频率。消费类POI可以包括诸如:餐饮店、旅馆、教育机构、娱乐场所或者商场等。各消费类POI的消费水平可以通过爬取网上信息的方式获得,也可以通过人工标注的方式获得。
[0129]4)用户在各级别消费类POI的停留时长超过预设时长的次数或频率。
[0130]5)用户访问各旅游地的次数或频率。
[0131]6)用户位置移动轨迹分布状况。第一收集单元01在收集用户位置移动轨迹分布状况时,可以通过用户的定位设备获取用户的移动轨迹;统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
[0132]第一收集单元01在确定用户访问POI时,可以采用但不限于以下几种方式:
[0133]方式一、通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该PO I。
[0134]方式二、通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI。
[0135]方式三、获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。
[0136]训练单元02负责利用训练样本对机器学习模型进行训练,得到征信模型。
[0137]其中,训练单元02采用的机器学习模型可以包括但不限于:LR(LogistiCRegress1n,逻辑回归)模型、SVM(Support Vector Machine,支撑向量机)模型、ANN(Artificial Neural Network,人工神经网络)或GBDT(Gradient Boosting Decis1nTree,梯度决策树)。
[0138]图3为本发明实施例提供的征信确定装置的结构图,如图3所示,该装置可以包括:第二收集单元11和信用评价单元12,其中各组成单元的主要功能如下:
[0139]第二收集单元11负责收集待评价用户的用户到访特征。第二收集单元11对待评价用户的用户到访特征的收集与第一收集单元01收集的特征类型和方式相同。
[0140]其中用户到访特征可以包括以下特征中的至少一种:
[0141]I)用户访问各类别POI的次数或频率;POI的类别可以诸如商圈、教育机构、餐饮、
酒店、旅游景点等。
[0142]2)用户在各类别POI的停留时长超过预设时长的次数或频率。
[0143]3)用户访问各级别消费类POI的次数或频率。消费类POI可以包括诸如:餐饮店、旅馆、教育机构、娱乐场所或者商场等。各消费类POI的消费水平可以通过爬取网上信息的方式获得,也可以通过人工标注的方式获得。
[0144]4)用户在各级别消费类POI的停留时长超过预设时长的次数或频率。
[0145]5)用户访问各旅游地的次数或频率。
[0146]6)用户位置移动轨迹分布状况。第二收集单元11在收集用户位置移动轨迹分布状况时,可以通过用户的定位设备获取用户的移动轨迹;统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
[0147]第二收集单元11在确定用户访问POI时,可以采用但不限于以下几种方式:
[0148]方式一、通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该PO I。
[0149]方式二、通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI。
[0150]方式三、获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。
[0151]信用评价单元12负责将第二收集单元11收集的用户到访特征输入征信模型,得到待评价用户的信用状况。得到的信用状况可以是待评价用户的信用评分,也可以是待评价用户的信用等级,还可以采用其他信用状况的体现方式。
[0152]本发明实施例提供的上述方法的执行主体,即上述装置,可以是位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopment Kit,SDK)等功能单元,或者,还可以位于服务器端,本发明实施例对此不进行特别限定。
[0153]本发明提供的方法和装置可以适用于对自然人的信用评价系统,特别在金融领域能够得到很好的应用。例如,作为消费信贷提供方的金融机构,在向消费者发放贷款前,可以通过本发明提供的方法和装置对消费者进行信用评价,根据其信用状况确定是否为其发放贷款或者向其发放多少额度的贷款。本发明提供的方法和装置并不限于此应用,也可以应用于其他场景或领域,在此不再一一穷举。
[0154]由以上描述可以看出,本发明提供的方法和装置可以具备以下优点:
[0155]I)本发明采用用户到访信息作为特征来建立征信模型,这种特征能够通过用户的定位装置上报并收集,降低了人工成本,且该特征能够更加客观地刻画用户的信用水平,难以造假,提高了征信准确性。
[0156]2)用户到访信息并非单纯的地理位置特征,而是包含了丰富的语义特征体现了用户的风险偏好。即可以通过用户在不同POI的停留表现来体现用户行为的多样性,也可以结合诸如POI描述等非结构化信息和消费类POI的消费水平等结构化信息做融合,来进一步体现单纯地理位置无法体现的用户的消费偏好和经济能力。还可以通过用户移动特征所包含的语义特征来体现用户的信用偏好,从而隐含体现诸如用户是否失业、搬家、换工作、是否经常出差等多种行为。
[0157]在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0158]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0159]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0160]上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,R0M)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0161]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【主权项】
1.一种征信模型的建立方法,其特征在于,该方法包括: 收集已知信用状况的用户到访特征作为训练样本; 利用所述训练样本对机器学习模型进行训练,得到征信模型。2.根据权利要求1所述的方法,其特征在于,所述用户到访特征包括以下特征中的至少一种: 用户访问各类别POI的次数或频率; 用户在各类别POI的停留时长超过预设时长的次数或频率; 用户访问各级别消费类POI的次数或频率; 用户在各级别消费类POI的停留时长超过预设时长的次数或频率; 用户访问各旅游地的次数或频率; 用户位置移动轨迹分布状况。3.根据权利要求2所述的方法,其特征在于,通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该POI;或者, 通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者, 获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。4.根据权利要求2所述的方法,其特征在于,所述消费类POI包括: 餐饮店、旅馆、教育机构、娱乐场所或者商场。5.根据权利要求2所述的方法,其特征在于,所述用户位置移动轨迹分布状况的收集包括: 通过用户的定位设备获取用户的移动轨迹; 统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。6.根据权利要求1所述的方法,其特征在于,所述机器学习模型包括: 逻辑回归模型、支撑向量机模型、人工神经网络或梯度决策树。7.一种征信确定方法,其特征在于,该方法包括: 收集待评价用户的用户到访特征; 将所述用户到访特征输入征信模型,得到所述待评价用户的信用状况; 其中所述征信模型是利用如权利要求1至6任一权项所述的方法建立的。8.根据权利要求7所述的方法,其特征在于,所述用户到访特征包括以下特征中的至少一种: 用户访问各类别POI的次数或频率; 用户在各类别POI的停留时长超过预设时长的次数或频率; 用户访问各级别消费类POI的次数或频率; 用户在各级别消费类POI的停留时长超过预设时长的次数或频率; 用户访问各旅游地的次数或频率; 用户位置移动轨迹分布状况。9.根据权利要求8所述的方法,其特征在于,通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该POI;或者, 通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者, 获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。10.根据权利要求8所述的方法,其特征在于,所述用户位置移动轨迹分布状况的收集包括: 通过用户的定位设备获取用户的移动轨迹; 统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。11.一种征信模型的建立装置,其特征在于,该装置包括: 第一收集单元,用于收集已知信用状况的用户到访特征作为训练样本; 训练单元,用于利用所述训练样本对机器学习模型进行训练,得到征信模型。12.根据权利要求11所述的装置,其特征在于,所述用户到访特征包括以下特征中的至少一种: 用户访问各类别POI的次数或频率; 用户在各类别POI的停留时长超过预设时长的次数或频率; 用户访问各级别消费类POI的次数或频率; 用户在各级别消费类POI的停留时长超过预设时长的次数或频率; 用户访问各旅游地的次数或频率; 用户位置移动轨迹分布状况。13.根据权利要求12所述的装置,其特征在于,所述第一收集单元在确定用户访问POI时,具体执行: 通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该Ρ0Ι;或者, 通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者, 获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。14.根据权利要求12所述的装置,其特征在于,所述消费类POI包括: 餐饮店、旅馆、教育机构、娱乐场所或者商场。15.根据权利要求12所述的装置,其特征在于,所述第一收集单元在收集用户位置移动轨迹分布状况时,具体执行: 通过用户的定位设备获取用户的移动轨迹; 统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。16.根据权利要求11所述的装置,其特征在于,所述训练单元采用的机器学习模型包括: 逻辑回归模型、支撑向量机模型、人工神经网络或梯度决策树。17.一种征信确定装置,其特征在于,该装置包括: 第二收集单元,用于收集待评价用户的用户到访特征; 信用评价单元,用于将所述第二收集单元收集的用户到访特征输入征信模型,得到所述待评价用户的信用状况; 其中所述征信模型是利用如权利要求11至16任一权项所述的装置建立的。18.根据权利要求17所述的装置,其特征在于,所述用户到访特征包括以下特征中的至少一种: 用户访问各类别POI的次数或频率; 用户在各类别POI的停留时长超过预设时长的次数或频率; 用户访问各级别消费类POI的次数或频率; 用户在各级别消费类POI的停留时长超过预设时长的次数或频率; 用户访问各旅游地的次数或频率; 用户位置移动轨迹分布状况。19.根据权利要求18所述的装置,其特征在于,所述第二收集单元在确定用户访问POI时,具体执行: 通过用户的定位装置确定用户的位置在某POI的范围内,则确定该用户访问了该Ρ0Ι;或者, 通过用户的定位装置确定用户的位置在某POI的范围内,且获取到该用户接入了该POI的接入点AP,则确定该用户访问了该POI;或者, 获取到用户在电子地图上检索了某POI,且在设定时长内通过该用户的定位装置确定用户的位置在该POI的范围内,则确定该用户访问了该Ρ0Ι。20.根据权利要求18所述的装置,其特征在于,所述第二收集单元在收集用户位置移动轨迹分布状况时,具体执行: 通过用户的定位设备获取用户的移动轨迹; 统计用户在设定时段内的移动距离,或者统计用户在设定时段内的移动距离在不同档位上的分布信息。
【文档编号】G06N3/08GK105894089SQ201610251602
【公开日】2016年8月24日
【申请日】2016年4月21日
【发明人】周景博, 程允胜, 李超, 汪天, 汪天一, 武政伟, 郝天, 郝天一, 裴红斌, 吴海山
【申请人】百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1