一种用户出行画像构建的方法及计算机设备与流程

文档序号:30579701发布日期:2022-06-29 11:30阅读:178来源:国知局
一种用户出行画像构建的方法及计算机设备与流程

1.本发明实施例涉及城市公共交通领域,尤其涉及一种用户出行画像构建方法及计算机设备。


背景技术:

2.随着网约车等其他出行方式的发展以及用户对多样化、高品质出行服务需求的日益增多,城市公共交通逐渐暴露出总体客流下降、用户出行换乘效率低下、用户出行成本增加、服务水平低下等一系列问题。而对用户的出行特征认识不清是导致上述问题的原因之一。相关部门开始意识到将“用户核心”思想运用到城市公共交通运营上的重要性,但利用城市公共交通数据来分析用户的出行画像的研究尚处于起步阶段,较为缺乏根据用户出行数据来进行画像构建的方法。


技术实现要素:

3.本技术提供了一种用户出行画像构建方法及计算机设备,以解决现有技术中缺乏根据用户出行数据来进行画像构建的技术问题。
4.第一方面,本技术提供了一种用户出行画像构建方法,该方法包括:
5.获取目标用户的出行信息和目标用户所乘坐的公共交通的数据信息与研究区域的兴趣点数据信息;
6.基于出行信息和数据信息,构建与目标用户对应的出行链数据库;
7.基于出行链数据库,确定出行特征标签,其中,出行特征标签由出行特征构成;
8.根据出行特征,确定目标用户的类型标签;
9.基于出行链数据库和出行特征标签以及兴趣点数据信息,确定目标用户的偏好标签;
10.根据出行特征标签、类型标签和偏好标签,生成目标用户的出行画像。
11.在一个可能的实施方式中,基于出行信息和数据信息,确定目标用户出行链数据库,包括:
12.对出行信息和数据信息进行预处理,获取经过预处理后的数据;
13.基于经过预处理后的数据,确定目标用户在预设时间段内的出行日期、出行的单位时间数、每一个单位时间内的通行数据;
14.根据目标用户在预设时间段内的出行日期、出行的单位时间数、每一个单位时间内的通行数据,构建目标用户出行链数据库。
15.在一个可能的实施方式中,单位时间内的通行数据中包括通行次数,基于经过预处理后的数据,确定单位时间内的通行数据中包括的通行次数,包括:
16.基于预处理数据,获取目标用户在第一单位时间内,出行对应的全部交易记录;
17.基于全部交易记录,获取全部交易记录中第一交易记录与相邻的第二交易记录之间的时间间隔;
18.将时间间隔与预先设置的间隔阈值进行比较;
19.若时间间隔大于或者等于间隔阈值,则将第一交易记录对应的出行与第二交易记录对应的出行,记为两次出行;
20.或者,若时间间隔小于间隔阈值,则将第一交易记录对应的出行,与第二交易记录对应的出行,记为同一次出行,其中,第一单位时间为预设时间段内的任一个单位时间。
21.在一个可能的实施方式中,每一个单位时间内的通行数据还包括:首次出发时间、出行地点,以及出行距离;当单位时间为一天时,基于出行链数据库,确定目标用户的出行特征标签,包括:
22.根据目标用户在预设时间段内的出行日期,以及出行的单位时间数,确定目标用户在预设时间段内的出行总天数、工作日出行天数;
23.根据目标用户在预设时间段内的出行日期,以及每一个单位时间内的通行数据,确定工作日首次出发时间、工作日出行地点、工作日出行距离、出行总次数,以及工作日出行次数;
24.基于出行总天数、工作日出行天数、出行总次数,以及工作日出行次数,确定出行强度特征;
25.基于工作日首次出发时间,以及工作日出行天数,确定出行时间特征;
26.基于工作日出行地点,以及工作日出行距离,确定出行空间特征;
27.根据出行强度特征、出行时间特征,以及出行空间特征,确定目标用户的出行特征标签。
28.在一个可能的实施方式中,根据出行特征,确定目标用户的类型标签,包括:
29.将出行强度特征与预设的分类阈值进行比较;
30.当出行强度特征大于分类阈值时,确定目标用户的类型标签为高频用户;
31.或者,当出行强度特征小于或者等于分类阈值时,确定目标用户的类型标签为低频用户。
32.在一个可能的实施方式中,当高频用户数量包括多个时,方法还包括:
33.对高频用户利用聚类算法进一步的进行分类处理,确定高频分类结果;
34.和/或,当低频用户数量包括多个时,方法还包括:
35.对低频用户利用聚类算法进一步的进行分类处理,确定低频分类结果。
36.在一个可能的实施方式中,每一个单位时间内的通行数据还包括与目标用户对应的兴趣点信息和目标用户乘坐公共交通时,所停靠的站点信息;基于出行链数据库和出行特征,确定目标用户的偏好标签,包括:
37.统计预设时间段内目标用户乘坐公共交通时,所停靠的所有站点信息以及兴趣点信息数据;
38.基于各个站点信息,确定各个站点信息对应的缓冲区;
39.确定各个缓冲区中的每一个兴趣点信息对应的权重;
40.基于权重,确定各个站点信息对应的站点属性;
41.基于出行特征中的出行强度特征和各个站点信息对应的站点属性,确定偏好站点信息;
42.基于偏好站点信息,确定偏好标签。
43.第二方面,本发明实施例提供一种用户出行画像构建的设备,该设备包括:
44.获取模块,用于获取目标用户的出行信息和目标用户所乘坐的公共交通的数据信息;
45.处理模块,用于基于出行链数据库,确定出行特征标签,其中,出行特征标签由出行特征构成;根据出行特征,确定目标用户的类型标签;基于出行链数据库和出行特征标签,确定目标用户的偏好标签;
46.生成模块,用于根据出行特征标签、类型标签和偏好标签,生成目标用户的出行画像。
47.根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中的用户出行画像构建的方法。
48.根据第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第一方面或者第一方面的任意一种实施方式中的用户出行画像构建的方法。
49.本发明实施例提供的一种用户出行画像构建的方法,获取目标用户的出行信息和目标用户所乘坐的公共交通的数据信息与兴趣点信息数据,基于出行信息和数据信息,构建与目标用户对应的出行链数据库,基于出行链数据库,确定目标用户的出行特征,基于出行特征,生成出行特征标签,根据出行特征,确定目标用户的类型标签,基于出行链数据库和出行特征,确定目标用户的偏好标签,将出行特征标签、类型标签和偏好标签作为目标用户的出行画像。
50.通过该方式,克服了现有技术中,缺乏根据用户出行信息来进行画像构建的缺陷,本发明中通过分析方法的限定,明确了各个标签的获取方式,并且在获取标签的过程中引入了用户出行信息,进一步提高了画像的精准性,极大的提高了工作效率。
附图说明
51.图1为本发明实施例提供的一种用户出行画像构建方法流程示意图;
52.图2为本发明实施例提供的站点属性确定示意图;
53.图3为本发明实施例提供的一种用户出行画像可视化示意图;
54.图4为本发明实施例提供的一种用户出行画像构建装置结构示意图;
55.图5为本发明实施例提供一种计算机设备结构示意图。
具体实施方式
56.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
57.为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
58.针对背景技术中所提及的技术问题,本技术实施例提供了一种用户出行画像构建
方法,具体参见图1所示。图1为本发明实施例提供的一种用户出行画像构建方法流程示意图
59.步骤110:获取目标用户的出行信息和目标用户所乘坐的公共交通的数据信息与研究区域的兴趣点数据信息。
60.具体的,目标用户的出行信息包括但不限于以下信息:用户刷卡数据中的卡编号、刷卡时间、线路编号、车辆编号信息等等,目标用户所乘坐的公共交通的数据信息包括但不限于以下信息:公交定位数据中的时间、线路编号、车辆编号、方向、站点编号、站点经纬度信息,车辆运行数据中的车辆编号、线路编号、线路方向、站点编号、进站时间、出站时间信息,城市公交线网数据中的线路编号、线路方向、站点编号、站点经纬度信息,研究区域的兴趣点数据信息即城市兴趣点(point of interest,poi)数据。
61.在一个具体的例子中,获取的不仅限于一个用户,而是可以按照同样的方法,对采集区域内所有用户的出行信息和数据信息进行采集。
62.步骤120:基于出行信息和数据信息,构建与目标用户对应的出行链数据库。
63.具体的,对出行信息和数据信息进行预处理,获取经过预处理后的数据。
64.在一个具体的例子中,预处理过程可以包括数据匹配和无效数据的删除。例如,假设存在一个用户user,其出行数据中记载,用户刷卡数据中的卡编号为“01”,刷卡时间为“1月1日上午7点05分”,车辆编号信息为“01”。则需要在公交定位数据中,寻找时间为“1月1日上午7点05分”,车辆编号为“01”的数据,若可以找到,则匹配成功,将对应的出行信息和数据信息进行记录,否则,将对应的数据进行舍弃。
65.需要注意的是,无效数据判断的方法和原因不仅限于上述步骤,还存在有例如:存储格式错误、获取空白值、获取重复值等错误,此处列举的无效数据删除方式仅为举例,具体以实际应用为准。
66.进一步的,基于经过预处理后的数据,确定目标用户在预设时间段内的出行日期、出行的单位时间数、每一个单位时间内的通行数据,根据目标用户在预设时间段内的出行的单位时间数、每一个单位时间内的通行数据,构建目标用户出行链数据库。
67.在一个具体的例子中,仍以上述用户user为例,假设采集了用户user共计2天的出行数据,分别是“1月1日”和“1月2日”,其中,在1月1日,用户user的刷卡数据分别是:上午7点05分“01”公交上车卡,上午7点15分“01”公交下车卡,上午7点20分“02”公交上车卡,上午7点30分“02”公交下车卡,下午7点05分“02”公交上车卡,下午7点15分“02”公交下车卡,在1月2日,用户uesr的刷卡数据分别是:上午7点20分“01”公交上车卡,上午7点30分“01”公交下车卡,根据上述数据,将预设的时间段定为2天,并记录出行日期“1月1日”和“1月2日”,同样,将单位时间设置为1天,则可以获得对应的出行天数为2。
68.进一步的,每一个单位时间内的通行数据可以基于预处理数据,获取目标用户在第一单位时间内,出行对应的全部交易记录,基于全部交易记录,获取全部交易记录中第一交易记录与相邻的第二交易记录之间的时间间隔,将时间间隔与预先设置的间隔阈值进行比较,若时间间隔大于或者等于间隔阈值,则将第一交易记录对应的出行与第二交易记录对应的出行,记为两次出行,或者,若时间间隔小于间隔阈值,则将第一交易记录对应的出行,与第二交易记录对应的出行,记为同一次出行,其中,第一单位时间为预设时间段内的任一个单位时间。
69.在一个具体的例子中,假设将出行间隔设置为30分钟,对于1月1日的出行数据,首先要根据上车和下车,以及对应的车辆编号进行交易记录的划分,同一编号公交的相邻的上下车刷卡记录,可以看作是一次交易记录,因此,在1月1日的出行数据中,包含有4次交易记录,分别是交易记录a“上午7点05分—上午7点15分”,交易记录b“上午7点20分—上午7点30分”,交易记录c“下午7点05分—下午7点15分”,交易记录d“下午7点20分—下午7点30分”,在计算这个几次交易记录之间的时间间隔,其中交易记录a与交易记录b之间的时间间隔为5分钟,交易记录b与交易记录c之间的时间间隔为11小时35分钟,交易记录c与交易记录d之间的时间间隔为5分钟,将交易记录之间的时间间隔与预设的出行间隔进行比较,交易记录之间的时间间隔小于预设的出行间隔的所有交易记录对应的出行均记为同一次出行,同时将这一次出行下每个交易记录对应的出行按照出行的时间顺序进行排序,并记为子出行,根据上述规则,很显然,用户user在1月1日共出行两次,其中第一次出行包含有两次子出行,第二次出行也包含有两次子出行。同理,对1月2日中的数据也进行统计。利用上述数据构建用户user出行链数据库。
70.需要注意的是,实际应用中,可以对在一个具体的例子中,获取的不仅限于一个用户,而是可以按照同样的方法,对调查范围内所有的用户的出行链数据库进行构建。
71.步骤130:基于出行链数据库,确定出行特征标签,其中,出行特征标签由出行特征构成。
72.具体的,目标用户的出行特征包括:出行强度特征、出行时间特征,以及出行空间特征。
73.进一步的,出行强度特征包括有:预设时间段内的出行天数d
period
、预设时间段内的工作日出行天数d
w_period
、预设时间段内的出行次数t
period
与预设时间段内的工作日出行次数t
w_period

74.其中,预设时间段内的出行天数d
period
可以通过如下公式进行统计:
[0075][0076][0077]
其中,md为预设时间段内的总天数;d表示研究时间范围的第d天;fd表示第d天是否有出行记录,若有则取值1,若无则取值0。
[0078]
在一个具体的例子中,假设存在有一个用户a,预设时间段为某一个周的周一至周日,其中周一至周五为工作日,周六周日为休息日,并且在周一至周六中用户a均有出行记录,而周日中不存在有出行记录,则用户a对应的f1—f6均等于1,而f7等于0,进而可以获得用户a对应的d
period
等于6。
[0079]
进一步的,预设时间段内的工作日出行天数d
w_period
计算公式为:
[0080]
[0081][0082]
其中,mwd为预设时间段内的工作日总天数;j

表示预设时间段内的第j

个工作日;fj′
表示第j

个工作日是否有出行记录,若有则取值1,若无则取值0;
[0083]
在一个具体的例子中,仍以上述用户a和其对应的出行记录为例,很显然,mwd此时等于5,且f1′
—f5′
均等于1,进而可以获得用户a对应的d
w_period
等于5。
[0084]
进一步的,预设时间段内的出行次数t
period
计算公式如下:
[0085][0086][0087]
其中,表示第d天的第n次出行,若有则取值1,若无则取值0;n表示一天中最大出行次数;在一个具体的例子中,仍以上述用户a和其对应的出行记录为例,并假设用户a的出行次数如下表1所示:
[0088][0089]
表1
[0090]
则对应用户a的t
period
为21。
[0091]
进一步的,预设时间段内的工作日出行次数t
w_period
计算公式如下:
[0092][0093][0094]
其中,表示第j

个工作日的第n次出行,若有则取值1,若无则取值0;
[0095]
在一个具体的例子中,仍以上述用户a和其对应的表1为例,则对应用户a的t
w_period
为15。
[0096]
进一步的,出行时间特征计算,包括工作日首次出发的平均出发小时h
average
,工作日首次出发时间间隔的方差vw。
[0097]
其中,工作日首次出发的平均出发时刻h
average
的计算公式如下:
[0098]
[0099]
其中,hi表示第i个小时;ni表示第i个出行小时下的出行天数;
[0100]
在一个具体的例子中,仍以上述用户a为例,假设用户a每日首次出行时刻如下表2所示:
[0101][0102]
表2
[0103]
则用户a的h
average
为7。
[0104]
进一步的,工作日首次出发时间间隔的方差vw,计算公式如下:
[0105]
δt
j-1
=t
j-t
j-1
[0106][0107][0108]
其中,tj为用户在第j个工作日的出行时间;δt
j-1
为用户在相邻两个工作日的出行时间差;m为用户工作日首次出发时间间隔的均值。
[0109]
在一个具体的例子中,仍以上述用户a为例和对应的表2为例,则用户a的vw为0。
[0110]
进一步的,出行空间特征计算,包括工作日有闭合出行链天数d
w_close
与工作日平均出行距离disw。
[0111]
具体的,工作日有闭合出行链天数d
w_close
计算公式如下:
[0112][0113][0114]
其中,cj为第j个工作日下的闭合出行链个数;δ为设定的阈值距离。
[0115]
在一个具体的例子中,仍以上述用户a为例,假设用户a每天出行的首次出发站点与末次到达站点间距如下表3所示:
[0116][0117]
表3
[0118]
假设δ为850米,则用户a的d
w_close
为4。
[0119]
进一步的,工作日平均出行距离disw计算公式如下:
[0120][0121]
其中,disj表示用户在第j个工作日的出行距离;
[0122]
在一个具体的例子中,仍以上述用户a为例,假设用户a每天出行的出行距离如下表4所示:
[0123][0124]
表4
[0125]
则用户a的disw为7000。
[0126]
进一步的,将上述获得出行特征进行整理,构成出行特征标签。
[0127]
其中出行强度特征、出行时间特征,以及出行空间特征等均可以包括至少一个参数表示。
[0128]
在一个具体的例子中,仍以上述用户a为例,则上述用户a对应的出行特征标签包括有,出行强度特征:d
period
为6、d
w_period
为5、t
period
为21、t
w_period
为15;出行时间特征:h
average
为7、vw为0;出行空间特征:d
w_close
为4,disw为7000。
[0129]
步骤140:根据出行特征,确定目标用户的类型标签。
[0130]
具体的,将出行强度特征与预设的分类阈值进行比较,当出行强度特征大于分类阈值时,确定目标用户的类型标签为高频用户,或者,当出行强度特征小于或者等于分类阈值时,确定目标用户的类型标签为低频用户。
[0131]
在一个具体的例子中,仍以上述用户a为例,并设置分类条件:若用户出行强度特
征满足条件1或条件2,则判断该用户为高频乘客,否则为低频乘客;条件1:研究时间范围的出行天数d
period
》α且研究时间范围的出行次数t
period
》γ,条件2:研究时间范围的工作日出行天数d
w_perios
》β且研究时间范围的工作日出行次数t
w_period
》σ,其中各个希腊字母所代表但含义为:预设时间段内的出行天数阈值α、预设时间段内的出行次数阈值γ、预设时间段内的工作日出行天数阈值β、预设时间段内的工作日出行次数阈值σ。假设,其中α为5,γ为15,β为4,σ为10。基于此条件,用户a为高频用户。
[0132]
需要说明的是,实际应用中,不仅限于一个用户,而是可以按照同样的方法,对调查范围内所有的用户的进行分类,同时分类也不仅限于一种分类,在完成高频用户与低频用户的分类后,还可对分类后的高频用户中的用户或低频用户中的用户进行再次分类。
[0133]
步骤150:基于出行链数据库和出行特征以及所述研究区域的兴趣点数据信息,确定目标用户的偏好标签。
[0134]
具体的,统计目标用户乘坐公共交通时,所停靠的所有站点信息以及所述研究区域的兴趣点数据信息,基于各个站点信息,确定各个站点信息对应的缓冲区,确定各个缓冲区中的每一个兴趣点信息对应的权重,基于权重,确定各个站点信息对应的站点属性,基于出行特征中的出行强度特征和各个站点信息对应的站点属性,确定偏好站点信息,基于偏好站点信息,确定偏好标签。
[0135]
在一个具体的例子中,仍以上述用户a为例,假设用户a在预设的时间段内,共去过站点10个,并且去各个站点的次数如下表5所示:
[0136]
站点abcdefghij次数11223344410
[0137]
表5
[0138]
进一步的,参阅图2所示,假设以一个黑色原点代表站点j,以500米为半径,以站点j为原型,设定一个圆形的缓冲区,假设在缓冲区中,包含有兴趣点共10个,其中1个为医疗属性的兴趣点,1个为学习属性的兴趣点,剩下8个为工作属性的兴趣点,则可以根据兴趣点的占比进行权重的计算,将站点j的属性定位工作属性。其他站点也可以按照同样的方法进行站点属性的确定。
[0139]
需要注意的是,权重的确定的方法不仅限于根据兴趣点的占比,也可以通过词频—逆文本频率指数(term frequency

inverse document frequency,tf-idf)加权算法等方法进行计算,此处仅为举例。
[0140]
进一步的,对用户a去不同站点的次数,将用户a去的次数最多的站点对应的属性,作为用户a的偏好标签,即用户a的偏好标签为工作。
[0141]
需要说明的是,本实例中使用用户a去不同站点的次数作为确定用户偏好站点的方法,实际应用中,还可以通过用户a去不同站点的停留时间等等任意的方法,作为确定偏好站点的方法,本技术并不限定,以实际应用为准。
[0142]
步骤160:将出行特征标签、类型标签和偏好标签作为目标用户的出行画像。
[0143]
具体的,可以将上述获得标签进行图像化展示。
[0144]
在一个具体的例子中,参阅图3所示,仍以上述用户a为例,对用户a的出行特征标签、类型标签和偏好标签进行展示,其中,出行特征标签由出行强度特征,出行时间特征,出行空间特征整理获得,其中,出行强度特征为:出行天数6、工作日出行天数5、工作日平均出
行距离7000、出行次数21、工作日出行次数15;出行时间特征为:工作日首次出行时刻平均值7,工作日首次出发时间间隔的方差0;出行空间特征为:工作日闭合出行链天数4;类型标签为:高频用户,偏好标签为偏好为工作。
[0145]
本发明实施例提供的一种用户出行画像构建的方法,获取目标用户的出行信息和目标用户所乘坐的公共交通的数据信息与研究区域的兴趣点数据信息,基于出行信息和数据信息,构建与目标用户对应的出行链数据库,基于出行链数据库,确定目标用户的出行特征,基于出行特征,生成出行特征标签,根据出行特征,确定目标用户的类型标签,基于出行链数据库和出行特征与研究区域的兴趣点数据信息,确定目标用户的偏好标签,将出行特征标签、类型标签和偏好标签作为目标用户的出行画像。
[0146]
通过该方式,克服了现有技术中,缺乏根据用户出行信息来进行画像构建的缺陷,本发明中通过分析方法的限定,明确了各个标签的获取方式,并且在获取标签的过程中引入了用户出行信息,进一步提高了画像的精准性,极大的提高了工作效率。
[0147]
图4为本发明实施例提供的一种用户出行画像构建的设备,具体参见图4所示,该设备包括:获取模块401、处理模块402、生成模块403。
[0148]
获取模块401,用于获取目标用户的出行信息和目标用户所乘坐的公共交通的数据信息以及研究区域的兴趣点数据信息;
[0149]
处理模块402,用于基于出行链数据库,确定出行特征标签,其中,出行特征标签由出行特征构成;根据出行特征,确定目标用户的类型标签;基于出行链数据库和出行特征标签以及所述研究区域的兴趣点数据信息,确定目标用户的偏好标签;
[0150]
生成模块403,用于根据出行特征标签、类型标签和偏好标签,生成目标用户的出行画像。
[0151]
可选的,处理模块402,用于对出行信息和数据信息进行预处理,获取经过预处理后的数据;
[0152]
基于经过预处理后的数据,确定目标用户在预设时间段内的出行日期、出行的单位时间数、每一个单位时间内的通行数据;
[0153]
根据目标用户在预设时间段内的出行日期、出行的单位时间数、每一个单位时间内的通行数据,构建目标用户出行链数据库。
[0154]
可选的,处理模块402,用于基于预处理数据,获取目标用户在第一单位时间内,出行对应的全部交易记录;
[0155]
基于全部交易记录,获取全部交易记录中第一交易记录与相邻的第二交易记录之间的时间间隔;
[0156]
将时间间隔与预先设置的间隔阈值进行比较;
[0157]
若时间间隔大于或者等于间隔阈值,则将第一交易记录对应的出行与第二交易记录对应的出行,记为两次出行;
[0158]
或者,若时间间隔小于间隔阈值,则将第一交易记录对应的出行,与第二交易记录对应的出行,记为同一次出行,其中,第一单位时间为预设时间段内的任一个单位时间。
[0159]
可选的,处理模块402,用于根据目标用户在预设时间段内的出行日期,以及出行的单位时间数,确定目标用户在预设时间段内的出行总天数、工作日出行天数;
[0160]
根据目标用户在预设时间段内的出行日期,以及每一个单位时间内的通行数据,
确定工作日首次出发时间、工作日出行地点、工作日出行距离、出行总次数,以及工作日出行次数;
[0161]
基于出行总天数、工作日出行天数、出行总次数,以及工作日出行次数,确定出行强度特征;
[0162]
基于工作日首次出发时间,以及工作日出行天数,确定出行时间特征;
[0163]
基于工作日出行地点,以及工作日出行距离,确定出行空间特征;
[0164]
根据出行强度特征、出行时间特征,以及出行空间特征,确定目标用户的出行特征标签。
[0165]
可选的,处理模块402,用于将出行强度特征与预设的分类阈值进行比较;
[0166]
当出行强度特征大于分类阈值时,确定目标用户的类型标签为高频用户;
[0167]
或者,当出行强度特征小于或者等于分类阈值时,确定目标用户的类型标签为低频用户。
[0168]
可选的,处理模块402,用于对高频用户利用聚类算法进一步的进行分类处理,确定第一分类结果;
[0169]
和/或,当低频用户数量包括多个时,方法还包括:
[0170]
对低频用户利用聚类算法进一步的进行分类处理,确定第二分类结果。
[0171]
可选的,处理模块402,用于统计预设时间段内与目标用户对应的所有兴趣点信息,以及目标用户乘坐公共交通时,所停靠的所有站点信息;
[0172]
基于各个站点信息,确定各个站点信息对应的缓冲区;
[0173]
确定各个缓冲区中的每一个兴趣点信息对应的权重;
[0174]
基于权重,确定各个站点信息对应的站点属性;
[0175]
基于出行特征中的出行强度特征和各个站点信息对应的站点属性,确定偏好站点信息;
[0176]
基于偏好站点信息,确定偏好标签。
[0177]
上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
[0178]
本发明实施例还提供一种电子设备,具有上述图4所示的用户出行画像构建的装置。
[0179]
请参阅图5,图5是本发明可选实施例提供的一种电子设备的结构示意图,如图5所示,该电子设备可以包括:至少一个处理器51,例如cpu(central processing unit,中央处理器),至少一个通信接口53,存储器54,至少一个通信总线52。其中,通信总线52用于实现这些组件之间的连接通信。其中,通信接口53可以包括显示屏(display)、键盘(keyboard),可选通信接口53还可以包括标准的有线接口、无线接口。存储器54可以是高速ram存储器(random access memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器54可选的还可以是至少一个位于远离前述处理器51的存储装置。其中处理器51可以结合图5所描述的装置,存储器54中存储应用程序,且处理器51调用存储器54中存储的程序代码,以用于执行上述任一方法步骤。
[0180]
其中,通信总线52可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。通信总线52可以分为地址总线、数据总线、控制总线等。
为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0181]
其中,存储器54可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:ram);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:hdd)或固态硬盘(英文:solid-state drive,缩写:ssd);存储器54还可以包括上述种类的存储器的组合。
[0182]
其中,处理器51可以是中央处理器(英文:central processing unit,缩写:cpu),网络处理器(英文:network processor,缩写:np)或者cpu和np的组合。
[0183]
其中,处理器51还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:asic),可编程逻辑器件(英文:programmable logic device,缩写:pld)或其组合。上述pld可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:cpld),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:fpga),通用阵列逻辑(英文:generic array logic,缩写:gal)或其任意组合。
[0184]
可选地,存储器54还用于存储程序指令。处理器51可以调用程序指令,实现如本技术任一实施例中所示的用户出行画像构建的方法。
[0185]
本发明实施例还提供了一种非暂态计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用户出行画像构建的方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;存储介质还可以包括上述种类的存储器的组合。
[0186]
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1