一种在竞争环境中根据影响运动用户选择设施地址的方法与流程

文档序号:23806816发布日期:2021-02-03 11:53阅读:91来源:国知局
一种在竞争环境中根据影响运动用户选择设施地址的方法与流程

[0001]
本发明属于空间大数据和数据挖掘技术领域,涉及一种在竞争环境中根 据影响运动用户选择设施地址的方法。


背景技术:

[0002]
最大影响力选址是重要的空间数据挖掘问题,在商业选址和城市规划等 领域具有非常广泛的应用。具体地,最大影响力选址是指在地理空间中,从 众多候选地址中挖掘出最优位置以建设或部署设施,使得在该地址处的设施 能够影响最多的潜在用户。
[0003]
随着具备地理定位能力的终端设备日益普及,传统上将用户视为单一静 止空间位置点,及将用户群体视为区域密度等静态方式无法客观反映用户运 动行为特征,例如用户既可能在住宅附近购物,也可能在工作地点附近消费。 因此,通过综合考虑用户运动点集合整体受设施的影响,目前的最大影响力 选址技术(一种选址方法和装置zl201610347674.8)能够将用户的运动特征 纳入到选址决策当中,获得比传统静态选址技术更准确的选址结果。
[0004]
但在现实针对运动用户的最大影响力选址应用中,没有同行竞争的理想 选址环境往往是不存在的。如对于商业店铺选址等应用,几乎都不可避免地 要面对同行竞争,即拟新建的设施通常需要与周边现有的同类设施竞争潜在 运动用户。因此,在面向竞争的环境中,现有同类设施对用户的影响会显著 作用于新建设施的影响力评估,忽视设施间的竞争关系因素,会降低选址结 果的准确性和可用性。


技术实现要素:

[0005]
本发明的目的是提供一种在竞争环境中根据影响运动用户选择设施地 址的方法,解决现有针对运动用户的最大影响力选址技术中,由于未考虑同 类设施竞争因素导致选址方法难以应用于同行竞争场景的问题。
[0006]
本发明所采用的技术方案是,一种在竞争环境中根据影响运动用户选择 设施地址的方法,具体按以下步骤实施:
[0007]
步骤1,给定多个候选位置,计算各候选位置所能影响的运动用户集合;
[0008]
步骤2,加入现有竞争设施与各候选位置形成竞争,确定现有设施和候 选位置在竞争情况下所能影响的运动用户集合,根据得到的运动用户集合计 算多个候选位置的竞争影响值;
[0009]
步骤3,根据经步骤2得到的竞争影响值,对多个候选位置进行筛选;
[0010]
步骤4,将经步骤3筛选后的候选位置进行排序,得到优选位置。
[0011]
本发明的特点还在于:
[0012]
其中步骤1具体内容包括:
[0013]
步骤1.1,给定多个候选位置,得到候选位置集合c,以候选位置集合c中 任意候选位置c
i
作为hash键值,建立三元组其中元素表示c
i
能够影响的运动用户
集合,初始时为空集;元素表示针对候选位置c
i
的 待确定用户集合,初始化为用户全集;
[0014]
步骤1.2,遍历每个运动用户,针对任一运动用户利用基于多个空间运 动点的剪枝规则进行计算,可得到必然能够影响和不能影响该用户的两个侯 选位置集合的子集,对必然能够影响该用户的每个候选位置,通过hash值 找到对应的三元组,将该用户从元素集合中删除,同时将该用户添加到 集合中;对于必然不影响该用户的每个候选位置,将该用户从对应候选位 置三元组的集合中删除;
[0015]
步骤1.3,在完成所有用户的遍历之后,对所有侯选位置及其三元组进 行遍历,如果侯选位置c
i
三元组中集合为空集,则此时即为候选位置 所能影响的用户集合;否则,需要按照设施位置c
i
对中各运动用户的累 加影响概率定义进行计算,将能够影响的用户添加到集合中,遍历完成后, 各候选位置得到各自所能影响的用户集合;
[0016]
其中步骤2具体内容包括:
[0017]
步骤2.1,以运动用户集合o中每个用户o
s
作为hash键值构建用户竞争 二元组的集合,其中是所有竞争设施中能够影响用户o
s
的竞争设施 集合,该二元组针对所有用户均将项初始化为空集;建立以竞争设施f
j
作 为hash键值的竞争设施二元组其中表示针对竞争设施f
j
的待 确定用户集合,初始为用户全集,当确定竞争设施f
j
能够影响用户o
s
时,将 该用户o
s
从二元组的集合中删除,同时将f
j
添加到用户o
s
二元组的集 合中,得到竞争设施多能影响的用户集合;
[0018]
步骤2.2,根据候选位置c
i
影响的用户集合每个用户所受竞争设施 影响的具体情况,累加计算c
i
的竞争影响值:通过查看中每个用户o
s
(即 )的用户竞争二元组可以确定c
i
在与竞争情况下对o
s
的影 响力,即进而针对所有中的用户,通过累加可以得到c
i
的 竞争影响值即c
i
通过与现有设施竞争所能够影响 运动用户的概率之和;
[0019]
其中步骤2.1中在获得候选位置和竞争设施各自影响的用户集合后,此 时如果存在一个运动用户o
s
既可被候选位置c
i
影响,又可以被m个(m≥1) 竞争设施f1,f2,...,f
m
影响的情况,用户访问设施f1,f2,...,f
m
和c
i
的概率相同, 则f1,f2,...,f
m
和c
i
中任一设施对用户o
s
的影响力为1/(m+1);
[0020]
其中步骤2.1中考虑到竞争影响值计算中累加部分当中仅需计 算c
i

响的用户集合其中“·”表示忽略或考虑设施特征向量时对用户影 响力或影响概率的计算,不受候选位置c
i
影响的用户不需要进行遍历,即可 以剪枝这些用户,因此在计算运动用户受竞争设施影响的竞争二元组时,只需遍历至少被一个候选位置影响的运动用户集合,即 其中c为候选位置集合;
[0021]
其中步骤2.2中不同设施的各种特征并不相同,根据对不同设施属性要 求的高低设置权值,利用设施加权特征值来计算候选位置的竞争影响值:
[0022]
令任意设施f
j
(包括候选位置c
i
处建设的设施)除位置以外的特征构成 设施向量其中表示本发明的应用场景中所要考虑设 施f
j
的n个特征,当获取了特征分值之后,对所有设施某一特征分值进行归 一化计算,得到最终用户的特征向量:特定设施的归一化特征值采用该设施 特征分值除以所有设施中最大特征分值确定,且特征的分值可根据具体应用 场景进行评分定义,对特征的需求重要度权值向量为w=(w1,w2,...,w
n
), 则设施f
j
的加权特征值为此时, 当c
i
影响用户o
s
时,根据竞争二元组可以计算在考虑特征差异时c
i
对 o
s
的影响力,即其中候选位置c
i
的加权特征值为 因此,考虑不同设施的特征差异,候选位置c
i
的竞争影响值 为
[0023]
其中步骤3具体内容为:
[0024]
根据经步骤2得到的所有候选位置的竞争影响值,即可筛选出最优的k 个候选位置;
[0025]
其中步骤3具体内容为引入候选位置竞争影响值上界和竞争影响值阈 值,通过剪枝处理方法进行筛选,具体按以下步骤实施:
[0026]
步骤3.1,根据经步骤1中得到的候选位置所能影响的运动用户集合, 令候选位置c
i
所能影响的用户集合大小为由于没有考虑任何竞争设 施对运动用户的竞争影响,对于任何被候选位置影响的用户o
s
都有即此时候选位置c
i
所展现的影响力最大,当有其他设施竞 争时候选位置c
i
的影响力不可能超过因此不考虑竞争时的影响力为候选位置c
i
的竞争影响值上界以候选位置的竞争影响值上界 为关键字,将所有候选位置存储在fibonacci大顶堆hu中,可以快速确定 竞争影响值上界最大的k个侯选位置;
[0027]
设计算已经得到k

个(k

≥k)候选位置的竞争影响值,此时竞争影响 值第k大的候选位置为c
k
,则将score(c
k
)设为竞争影响值阈值score
t
,对于剩 余尚未计算的|c|-k

个候选位置中,将竞争影响值上界小于阈值score
t
的侯 选位置进行剪枝处理,已经计算得到
竞争影响值的候选位置,采用以竞争影 响值为关键字的fibonacci小顶堆hs进行存储,初始小顶堆hs为空堆;
[0028]
步骤3.2,将步骤3.1中hu大顶堆中的堆顶候选位置c
(1)ut
弹出,其中上 标(1)表示第1个弹出的候选位置,然后根据c
(1)ut
影响的用户集合查 找与c
(1)ut
竞争的设施,此过程首先初始化用户竞争二元组集合为空, 即其中不包含任何用户的二元组,只需处理中的用户,计算能影响其 的竞争设施得到针对中对应用户的以及中竞争设 施的特征向量,通过计算得到的竞争影响值score(c
(1)ut
), 然后将c
(1)ut
作为第一个元素插入小顶堆hs中,首次设置阈值score
t
为小顶 堆hs堆顶元素c
st
的竞争影响值,此时由于hs中只有c
(1)ut
一个元素,则 score
t
=score(c
st
)=score(c
(1)ut
)。
[0029]
步骤3.3,按照步骤3.2中处理c
(1)ut
的过程,继续弹出hu大顶堆中的堆 顶候选位置c
(2)ut
,c
(3)ut
,...,c
(i)ut
,...,c
(|c|)ut
,即第2个,第3个,
……
,第 i个,直至最后1个弹出的候选位置;
[0030]
步骤3.4,逐一处理hu大顶堆弹出的候选位置并更新小顶堆hs;在弹出 大顶堆hu的堆顶候选位置c
(i)ut
时,当c
(i)ut
的竞争影响值上界小于阈 值score
t
,则根据大顶堆定义和竞争影响值上界可知 将即c
(i)ut
进行剪枝,对于hu大顶堆中剩 余候选位置c
(i+j)ut
,其中j为大于1的整数且i+j≤|c|,则同理可将第i个 元素之后的候选位置都进行剪枝处理;
[0031]
其中步骤3.3中如果和的用户o
s
(即)已经出现在用户 竞争二元组集合中,则根据用户剪枝方法不再计算该用户;
[0032]
计算得到竞争影响值score(c
(i)ut
)并插入步骤3.2中的小顶 堆hs,如果插入后小顶堆hs中存储的候选数量大于k,则弹出hs的堆顶元素, 即hs中只保留竞争影响值最大的k个候选位置,将更新后小顶堆hs中堆顶侯 选位置c

st
的竞争影响值更新为阈值score
t
,即score
t
=score(c

st
),其中 c

st
表示hs中每次新插入元素并弹出多于k个的元素后新的堆顶元素,其中当 插入前hs中元素数小于k时堆顶候选位置可能不发生改变,此时则c

st
=c
st
, 其他情况下c

st
必然发生变化;
[0033]
其中步骤4的具体内容为:
[0034]
按照步骤3逐一处理hu大顶堆弹出的候选位置,当出现堆顶侯选位置 的竞争影响值上界小于阈值score
t
,或者直至大顶堆hu最后一个元素被弹 出且处理完成时,小顶堆hs中的k个候选位置即为最优的k个候选位置;
[0035]
若考虑k个候选位置的成本效益,则可利用单位成本的竞争影响值来进 行进一步的选择,对于任一最优候选位置c
i
,如果在该位置建设服务设施的 成本为cost(c
i
),则可以
计算c
i
的成本效益比即竞争力基于此对k个最优候选位置计算竞争力并进行排序,竞争力最大即为最优候 选位置。
[0036]
本发明的有益效果是
[0037]
本发明基于运动用户整体运动性与设施位置间的空间影响关系,通过考 虑设施本身的相对竞争力因素,分析不同设施对用户的竞争力度,实现设施 间竞争影响关系的数学建模,从而量化竞争环境中设施地址对于运动对象的 影响力,制定面向竞争环境的最佳选址方案,避免现有面向运动用户选址技 术不能适用于竞争环境的局限,使得选址决策结果更加准确客观,有效提升 设施选址的商业和社会效益。通过设计优化计算复杂度的策略,能够极大程 度的提高海量用户场景下的竞争选址效率,进一步提高方法的实用性。
附图说明
[0038]
图1是本发明的一种在竞争环境中根据影响运动用户选择设施地址的方 法中实施例提供的面向竞争选址方法的原理图;
[0039]
图2是本发明的一种在竞争环境中根据影响运动用户选择设施地址的方 法实施例提供的用户剪枝处理原理的示意图;
[0040]
图3是本发明的一种在竞争环境中根据影响运动用户选择设施地址的方 法实施例提供的候选位置剪枝处理原理示意图;
[0041]
图4(a)、图4(b)、图4(c)和图4(d)是本发明的一种在竞争环境 中根据影响运动用户选择设施地址的方法中实施例与现有技术的可用性数 据分别从改变侯选位置数量、运动用户数量、竞争设施数量和最优候选的k值 四方面对比效果图。
具体实施方式
[0042]
下面结合附图和具体实施方式对本发明进行详细说明。
[0043]
本发明提供了一种在竞争环境中根据影响运动用户选择设施地址的方 法如图1所示,具体按以下步骤实施:
[0044]
步骤1,首先可以根据应用场景中的多个运动用户位置,确定各候选位 置所能影响的运动用户:
[0045]
首先,需要获得运动用户的运动点数据,这可以通过但不限于采集用户 的运动轨迹数据、兴趣点地理签到数据、生活地理日志数据、公共交通出行 数据、移动通信位置数据等方式进行。要说明的是,本发明并不依赖于特定 方式获取运动数据,任何可以描述用户地理运动行为位置点的数据均可作为 运动用户运动点数据。
[0046]
步骤1.1,根据特定设施位置对单一运动用户多个空间运动点的累加影 响概率定义,能够确定该设施位置是否影响运动用户,基于此定义,对于一 个具体的候选位置,通过遍历所有运动用户并计算相应的累加影响概率,可 以得出该候选位置能够影响的用户集合,该集合的大小即为该候选位置的影 响力。对所有候选位置进行上述遍历,即可得到各候选位置无竞争环境的影 响力;
[0047]
步骤1.2,由于运动用户数量通常较为庞大,遍历每个用户的所有空间 运动点计算累加影响概率代价高昂,可采用以下方法进行快速计算:首先以 候选位置集合c中任意
候选位置c
i
作为hash键值,建立三元组其中元素表示c
i
能够影响的用户集合,初始时为空集;元素表示针对 候选位置c
i
的待确定用户集合,初始化为用户全集。然后遍历每个运动用户。 针对任一运动用户,利用基于多个空间运动点的剪枝规则进行计算,可得到 必然能够影响和不能影响该用户的两个侯选位置集合的子集。对必然能够影 响该用户的每个候选位置,通过hash值找到对应的三元组,将该用户从元 素集合中删除,同时将该用户添加到集合中;对于必然不影响该用户 的每个候选位置,将该用户从对应候选位置三元组的集合中删除。
[0048]
步骤1.3,在完成所有用户的遍历之后,对所有侯选位置及其三元组进 行遍历。如果侯选位置c
i
三元组中集合为空集,则此时即为候选位置 所能影响的用户集合;否则,需要按照设施位置c
i
对中各运动用户的累 加影响概率定义进行计算,将能够影响的用户添加到集合中。上述遍历完 成后,各候选位置得到各自所能影响的用户集合;
[0049]
步骤2,然后加入同行设施与各候选形成竞争,确定竞争设施和候选位 置竞争哪些运动用户,过程中可以剪枝无关运动用户的计算:
[0050]
步骤2.1,以运动用户集合o中每个用户o
s
作为hash键值构建用户竞争 二元组的集合,其中是所有竞争设施中能够影响用户o
s
的竞争设施 集合,该二元组针对所有用户均将项初始化为空集。在不考虑其他竞争设 施对用户影响的情况下,可以采用与上述步骤0候选位置影响力计算的类似 方法,来计算各竞争设施所能影响的用户集合,但其中有两处差别。第一处 不同是建立以竞争设施f
j
作为hash键值的竞争设施二元组其中表示针对竞争设施f
j
的待确定用户集合,初始为用户全集。与候选位置影响 力计算过程另一处不同在于,当确定竞争设施f
j
能够影响用户o
s
时,将该用 户o
s
从二元组的集合中删除,同时将f
j
添加到用户o
s
二元组的集合中;
[0051]
在获得候选位置和竞争设施各自影响的用户集合后,此时如果存在一个 运动用户o
s
既可被候选位置c
i
影响,又可以被m个(m≥1)竞争设施 f1,f2,...,f
m
影响的情况,则需要考虑竞争在影响力计算中的作用。假定除地 理位置不相同以外,竞争设施f1,f2,...,f
m
和拟在候选位置c
i
建设或开设的设 施的其他特征相同,即这些设施的服务内容、服务质量、规模、价格、环境 等特征均无差别,用户在选择服务时不存在任何的偏好差异,则此时这些设 施对用户的影响力是均等的,即用户访问设施f1,f2,...,f
m
和c
i
的概率相同, 则f1,f2,...,f
m
和c
i
中任一设施对用户o
s
的影响力为1/(m+1);
[0052]
由于运动用户的数量庞大,前述计算竞争设施各自影响的运动用户集合 需要遍历所有用户,计算复杂度过高。可选的,采用基于候选位置影响用户 的剪枝方法,可以避免对部分用户进行遍历,具体的,考虑到竞争影响值计 算中累加部分当中仅需计算c
i
影响的用户集合其中“·”表示忽 略或考虑设施特征向量时对用户影响力或影响
概率的计算,那么不受候选位 置c
i
影响的用户不需要进行遍历,即可以剪枝这些用户。因此在计算运动用 户受竞争设施影响的竞争二元组对,只需遍历至少被一个候选位置影 响的运动用户集合,即其中c为候选位置集合;
[0053]
步骤2.2,根据候选位置c
i
影响的用户集合中每个用户所受竞争设施 影响的具体情况,累加计算c
i
的整体影响力,本发明中称为c
i
的竞争影响值。 具体的,通过查看中每个用户o
s
(即)的用户竞争二元组可以确定c
i
在与竞争情况下对o
s
的影响力,即进而针对所 有中的用户,通过累加可以得到c
i
的竞争影响值 即c
i
通过与设施竞争所能够影响运动用户的概率 之和,这与现有无竞争条件下影响力统计影响用户数量有本质差别;
[0054]
可选的,通常不同设施的各种特征(或属性)并不相同,此时可以根据 对不同设施属性要求的高低设置权值,利用设施加权特征值来计算候选位置 的竞争影响值;具体的,令任意设施f
j
(包括候选位置c
i
处建设的设施)除 位置以外的特征构成设施向量其中表示本发明的应 用场景中所要考虑设施f
j
的n个特征,这些特征的取值既可以来自于网络评 价信息、用户调研等传统途经,也可以通过机器学习及其他可获取设施特征 分值的方式,当获取了特征分值之后,对所有设施某一特征分值进行归一化 计算,得到最终用户本发明的特征向量。具体的,特定设施的归一化特征值 采用该设施特征分值除以所有设施中最大特征分值确定,且特征的分值可根 据具体应用场景进行评分定义。对特征的需求重要度权值向量为 w=(w1,w2,...,w
n
),则设施f
j
的加权特征值为 此时,当c
i
影响用户o
s
时,根 据竞争二元组可以计算在考虑特征差异时c
i
对o
s
的影响力,即 其中候选位置c
i
的加权特征值为因 此,考虑不同设施的特征差异,候选位置c
i
的竞争影响值为 [0055]
步骤3,在竞争影响关系的基础上,对最有潜力成为最优位置的候选逐 一验证,利用竞争影响值的阈值对较差的候选地址进行剪枝处理:
[0056]
考虑到在侯选位置的成本效益,即在该位置建设或开设服务设施的费用 和竞争影响值之间的平衡,给出k个(k为大于1的整数)最优的侯选位置相 比仅给出1个最优位置具有更好的实用性。按照步骤2计算所有候选位置的 竞争影响值,即可选出最优的k个候选位置,然而此过程需要处理大量竞争 设施是否影响用户的计算,因此,可选的,本发明针对候选位置竞争影响值 上界,利用竞争影响值阈值,设计了可以显著降低上述计算复杂度的候选位 置剪枝处理方法,下面对该方法进行详细阐述:
[0057]
步骤3.1,按照步骤1中的计算,令候选位置c
i
所能影响的用户集合大 小为由于没有考虑任何竞争设施对运动用户的竞争影响,对于任何被 候选位置影响的用户o
s
都有即此时候选位置c
i
所 展现的影响力最大。当有其他设施竞争时候选位置c
i
的影响力不可能超过 因此不考虑竞争时的影响力为候选位置c
i
的竞争影响值上界 以候选位置的竞争影响值上界为关键字,将所有候选位置存储 在fibonacci大顶堆hu中,可以快速确定竞争影响值上界最大的k个侯选位 置;
[0058]
假定通过计算已经得到k

个(k

≥k)候选位置的竞争影响值,此时竞 争影响值第k大的候选位置为c
k
,则将score(c
k
)设为竞争影响值阈值score
t
。 对于剩余尚未计算的|c|-k

个候选位置中,竞争影响值上界小于阈值score
t
的侯选位置,即其在竞争情况下的竞争影响之不可能高于已计算得到的、竞 争影响值最大的前k个侯选位置,因此可以直接剪枝处理。已经计算得到竞 争影响值的候选位置,采用以竞争影响值为关键字的fibonacci小顶堆hs进 行存储,初始小顶堆hs为空堆;
[0059]
可选的,其他类型的堆数据结构也可作为大顶堆hu和小顶堆hs的替代 存储结构。
[0060]
步骤3.2,上述hu大顶堆中的堆顶候选位置c
(1)ut
弹出,其中上标(1)表 示第1个弹出的候选位置,然后根据c
(1)ut
影响的用户集合查找与 c
(1)ut
竞争的设施。此过程首先初始化用户竞争二元组集合为空,即 其中不包含任何用户的二元组。根据步骤2的运动用户剪枝方法,只需处理 中的用户,计算能影响其的竞争设施得到针对中对应 用户的以及中竞争设施的特征向量,通过计算得到 的竞争影响值score(c
(1)ut
),然后将c
(1)ut
作为第一个元素插入小顶堆 hs中。首次设置阈值score
t
为小顶堆hs堆顶元素c
st
的竞争影响值,此时由于 hs中只有c
(1)ut
一个元素,则score
t
=score(c
st
)=score(c
(1)ut
);
[0061]
步骤3.3,按照上述处理c
(1)ut
类似的过程,继续弹出hu大顶堆中的堆 顶候选位置c
(2)ut
,c
(3)ut
,...,c
(i)ut
,...,c
(|c|)ut
(即第2个,第3个,
……
,第i个, 直至最后1个弹出的候选位置),但处理过程有三处不同。第一处差别是, 如果中的用户o
s
(即)已经出现在用户竞争二元组集 合中,则根据用户剪枝思想不再计算该用户。第二处不同在于,计算 得到竞争影响值score(c
(i)ut
)并插入小顶堆hs,如果插入后小顶 堆hs中存储的候选数量大于k,则弹出hs的堆顶元素,即hs中只保留竞争影 响值最大的k个候选位置。第三处不同在于,需要将更新后小顶堆hs中堆顶 侯选位置c

st
的竞争影响值更新为阈值score
t
,即score
t
=score(c

st
),其 中c

st
表示hs中每次新插入元素并弹
出多于k个的元素后新的堆顶元素,其中 当插入前hs中元素数小于k时堆顶候选位置可能不发生改变,此时则 c

st
=c
st
,其他情况下c

st
必然发生变化。
[0062]
步骤3.4,,逐一处理hu大顶堆弹出的候选位置并更新小顶堆hs;在弹出 大顶堆hu的堆顶候选位置c
(i)ut
时,并非要弹出至最后一个元素。当c
(i)ut
的 竞争影响值上界小于阈值score
t
,则根据大顶堆定义和竞争影响值上 界定义可知即c
(i)ut
必然不会成为最优的k 个候选位置,可以进行剪枝。进一步的,对于hu大顶堆中剩余候选位置 c
(i+j)ut
,其中j为大于1的整数且i+j≤|c|,则同理可将第i个元素之后的 候选位置都进行剪枝处理。
[0063]
步骤4,经过上述过程处理,将k个最优候选位置挑选出来,作为最具 有竞争力的结果:
[0064]
按照步骤3逐一处理hu大顶堆弹出的候选位置,当出现上述堆顶侯选 位置的竞争影响值上界小于阈值score
t
,或者直至大顶堆hu最后一个元素 被弹出且处理完成时,小顶堆hs中的k个候选位置即为最优的k个候选位置;
[0065]
可选的,按照步骤2计算所有候选位置的竞争影响值,同样可选出最优 的k个候选位置;
[0066]
可选的,如果需要考虑k个候选位置的成本效益,则可利用单位成本的 竞争影响值来进行进一步的选择。具体的,对于任一最优候选位置c
i
,如果 在该位置建设服务设施的成本为cost(c
i
),则可以计算c
i
的成本效益比即竞争 力基于此对k个最优候选位置计算竞争力并进行排 序,竞争力最大即为最优候选位置。
[0067]
一种在竞争环境中根据影响运动用户选择设施地址的方法可以兼容运 动用户的各类型运动点数据,所设计的竞争影响概率计算方法可以在候选位 置与竞争设施同时影响运动用户时,量化候选位置竞争环境中对多个运动用 户的整体竞争影响值。通过设施特征向量归一化加权计算,竞争影响值可进 一步适用于考虑除位置属性外设施的其他特征对竞争力的影响。此外,考虑 到运动用户庞大数量带来的计算复杂度,根据候选位置影响用户,可以剪枝 部分用户与竞争设施的影响计算,同时,利用候选位置竞争影响值上界和竞 争影响值阈值,可以剪枝大量较差候选位置竞争影响值计算。按照上述方法, 进一步可以结合k个候选位置的成本效益,得到竞争环境中最优的选址方案。
[0068]
本发明中多个设施(含拟在候选位置上建设的设施和竞争设施)能够同 时影响某一特定运动用户时,在不考虑设施位置以外特征差异的情况下,用 户选择到哪个设施获取服务不存在偏好差异,即这些设施对该用户的影响概 率相同,进一步的,当考虑各设施的特征差异时,根据设施不同属性在竞争 用户时贡献的权重,利用设施加权特征值的大小来表征设施对用户影响概率 的大小。上述设施竞争影响模型与网页搜索经典算法pagerank中网页跳转 模型(如果网页上链接对用户而言无偏好差异,则其被点击的概率相同;如 果网页上链接对用户而言相对较重要,则被点击的概率也较高)类比,通过 将“网页中链接”、“链接被点击”和“链接重要度”类比为“设施”、“用户 选择设施”和“设施加权特征值”,则可以视为二者是同态的,因此设施竞 争影响模型同样具备实际应用可行性;
[0069]
另一方面根据步骤2,首先要计算候选位置影响用户集合相关的竞争设 施数量,
然后计算所有候选位置的竞争影响值,最终获得最优k个选址结果, 其计算复杂度为|c|
·
|o|
·
|f|,其中|c|为候选位置数量,|o|为运动用户数量, |f|为竞争设施数量。利用步骤2中剪枝部分不相关用户及步骤3中剪枝较差 候选位置两种处理方式,计算复杂度将下降为|c

|
·
|o

|
·
|f|,其中o

为候选 位置影响的用户集合,即o

∈o,剪枝部分不相关用户使得|o

|<|o|;c

为 利用大顶堆hu和小顶堆hs实现较差候选位置剪枝后,实际需要计算的候选 数量,由于通常用户活动为偏态分布,因此|c

|<<|c|。综上,经过两类剪枝 处理,可以更为高效的进行基于侯选位置竞争影响值的选址;
[0070]
实施例
[0071]
鉴于本发明按照侯选位置的竞争影响值进行选址,目前暂无竞争环境中 针对运动用户影响概率的选址方案,因此只能与现有运动用户最大影响力选 址技术(一种选址方法和装置zl201610347674.8)进行效率上的对比,且该 对比还需按照竞争影响值计算进行改编:按照步骤2分别计算所有候选位置 和竞争设施各自能够影响的运动用户,遍历所有候选位置并根据本发明提供 的竞争影响值计算方法计算各自的竞争影响值,将竞争影响值最大的k个侯 选位置作为最优选址方案。两种对比的方法均使用相同的语言实现、运行在 同一平台上且采用相同的数据集;如图4(a)、图4(b)、图4(c)和图4 (d)所示,分别从改变侯选位置数量、运动用户数量、竞争设施数量和最 优候选的k值四方面,显著的说明本发明提出的方法更为高效。
[0072]
以图2中候选位置为例,假定利用剪枝可得必然影响/不能影响用户的 以及需要进一步验证的候选位置关系如表1,则侯选位置三元组的快速计算过程如下:对于o1和o2,利用剪枝规则可得c1必然影响,则将o1和 o2插入c1三元组并从和删除,c2和c3必然不影响,则直接将o1和o2从 c2,c3的三元组和中删除;对于o3,利用剪枝规则只能得到c3必然不 影响,则将o3从c3的三元组中删除,然后经过验证计算得到c1可以影响o3而c2则不影响,则将o3插入c1三元组并从中删除,将o3从c2的三元组 中删除。类似的,可以继续计算o4到o8,过程中不断更新和最 终可以得到c1,c2,c3的三元组,其中其中
[0073]
表1
[0074][0075]
如图2所示,其中箭头表示侯选位置和竞争设施能够影响的运动用户: 以候选位置c2为例,可以看到于是根据候选位置影响用户的 剪枝方法,仅需遍历用户o4,o5而不需考虑其他6个用户。对于用户o4,o5, 能影响它们的竞争设施分别为和则c2竞争影响值的计 算为要特别说明的是, 由于候选位置c1,c2,c3都不能影响运动用户o7和o8(图2中阴影部分包含的运 动用户),因此在计算用户竞争二元组时,不需要计算o7和o8的二元 组,就本例而言复杂度下降至3/4(不采用剪枝需计算所有用户|o|=8,采 用剪枝处理后|o

|=6);
[0076]
如果考虑设施特征向量的作用,竞争影响值计算过程类似。以候选位置 c2为例,相关设施的特征值如表2所示,假定设施特征向量有两个维度:用户 评分(0星到5星)和服务环境(优:5分、良:4分、中:2.5分、差:1 分),这两个维度的权值向量为w=(w1,w2)=(0.6,0.4),则c2的加权特征 值类似的,f1和f2的加权特 征值分别为和因此c2的竞争影响值为 [0077]
表2
[0078][0079]
以图2所示的影响关系,对利用竞争影响值阈值剪枝候选位置的处理方 法进行举例说明,令k为2,如图3中左侧的大顶堆hu所示,侯选位置按照 各自竞争值上界关键字从大到小进行排序。首先,将堆顶侯选位置c1从大顶 堆hu中弹出,此时大顶堆hu中剩下两个元素c2,c3,堆顶元素为c2。由于 可得它们对应的用户竞争二元组,可得可得进而计算出侯选位置的竞争影响值score(c1)=1.5, 然后将其插入到小顶堆hs中,此时如图3右上角所示的hs只有c1一个元素, 因此设置阈值score
t
=score(c1);然后弹出hu中堆顶元素为c2。由于 则可得和进而得出c2的竞争影响值 score(c2)=1.33。在将c2插入小顶堆hs后,小顶堆恰好存储k=2个候选位 置。如图3右下角所示,由于score(c1)>score(c2),故将侯选位置c2放至 堆顶。此时更新阈值为堆顶元素的竞争影响值score
t
=score(c2)。此时, 由于大顶堆hu中堆顶侯选位置c3的竞争影响值上界小于阈值 score
t
=1.33,则可以将大顶堆hu中剩余的侯选位置全部剪枝,即不需计 算c3的竞争影响值。最终,侯选位置子集{c1,c2}为k=2时的最优竞争选址方 案。
[0080]
对于考虑k个最优候选位置成本效益的情况,以表1表3的数据为例进 行说明。根据候选位置的竞争影响值和成本,计算各自的成本效益比,即
ꢀꢀ
基于此,可以确定候选位置c2为成本 效益最高的最优结果。
[0081]
表3
[0082] c1c2c2竞争影响值score(c
i
)1.51.330.5建设成本cost(c
i
)10万元8万元6万元
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1