一种用于挖掘用户室内设计个性化需求的小样本分析方法与流程

文档序号:31624635发布日期:2022-09-24 00:16阅读:150来源:国知局
一种用于挖掘用户室内设计个性化需求的小样本分析方法与流程

1.本发明涉及数据挖掘和统计学习技术,特别涉及利用统计学习方法设计小样本机器学习算法从用户行为数据中挖掘用户隐性偏好信息。


背景技术:

2.随着家装行业的发展和消费升级趋势的带动,家居设计市场积累了大量的用户需求,而与快速增长的市场需求不相匹配的是专业设计人员的相对匮乏。目前,由于大部分用户缺少必要的设计领域知识,导致设计师交流成本高昂、沟通效率低下以及签单率低等一系列市场痛点问题。不仅如此,用户的需求也会随着信息暴露程度的增加而发生调整或者迁移,这使得设计师在识别、跟踪和管理用户需求偏好时会面更多的挑战和更繁琐的工作量。
3.对于家装设计过程中的用户的偏好的评价与估计,通常是一个较为复杂的问题;很难通过客户的直接叙述或者选择相应的特征来获得客户的真正的偏好感受,如何能够通过一些更为直观的方式使客户进行选择,并从客户的直观选择中推测出客户的爱好特征,往往较为困难;并且,客户的选择结果又有时会随时间而发生变化,导致不同时间段选择出的结果相互之间存在着较大区别,使得真实的信息很难被得到。另外,客户在进行喜好选择时,往往存在着样本量较小的情况,由于如果向客户提供更多的可选样例时,使得客户需要在较多的设计样例中进行挑选,这一过程非常的费时和占用精力,导致了客户体验较差,如果向只提供较小样本的情况下时,又会存在着归纳出用户喜好的难度更大,这就导致了在样本量的确定上存在着矛盾点。


技术实现要素:

4.本发明所要解决的技术问题是:在样本量有限的情况下,难于向用户提供出适合其喜好的家装设计结果。
5.本发明公开一种用于挖掘用户室内设计隐性偏好的小样本分析技术。本发明是一种小样本驱动的、可并行计算的、具有可解释性的通用型数据挖掘方法,可通过少量的用户行为数据来挖掘用户对于空间设计、家具陈设、软装陈设、室内风格、色彩搭配、灯光照明、材料应用等方面的隐性偏好。本发明首先对用户行为数据进行正则化处理;通过对用户行为模式的抽象量化,得到一个可用于刻画用户偏好随时间变化的最优化模型序列;针对所得模型的结构化特征,给出一种能从少量用户行为数据中挖掘用户隐性偏好的计算方法。
6.一种用于挖掘用户室内设计个性化需求的小样本分析方法,包括如下步骤:第1步,确定室内设计的维度特征:约定{f1,
……fm
}为室内设计的维度特征的集合,fs是室内设计维度的特征,s为1到m之间的任意整数,并定义f
s+
和f
s-为正负两种标签用于评估特征fs;第2步,表达向量的构建:令为特征的表达
向量,其中,分别是标签为正值的特征表征值;分别是标签为负值的特征表征值;第3步,印象向量的构建:印象向量空间p是;分别是标签为正值的印象向量,分别是标签为正值的印象向量;其中,其中,,下标i是案例编号,下标j是评分人编号;pi是第i个案例的印象向量,n(i)是评分人的数量,t i,j
是第i个设计案例的第j个评分人的表达向量集合;第4步,设q为隐性偏好向量,对以下最小化问题进行求解:其中,yi是用户对第i个案例做出的选择行为;a是权重参数矩阵;表示pi的转置矩阵;获得的最优解,并且将作为用户行为挖掘得到的需求结果。
7.所述的第2步中,表达向量中的特征值通过下式确定:s为1到m之间的任意整数。
8.所述的第2步中,约束条件是:。
9.所述的第4步中,a是权重参数矩阵的结构是:a是权重参数矩阵的结构是:表示印象向量的正特征部分与隐性偏好向量负特征部分进行比较时权重向量;其中的元素表示印象向量的第g个正特征与隐性偏好向量第h个负特征相比较时的权重;表示印象向量的正特征部分与隐性偏好向量正特征部分进行比较时权重向量;其中的元素表示印象向量的第g个正特征与隐性偏好向量第h个正特征相比较时的权重;
表示印象向量的负特征部分与隐性偏好向量负特征部分进行比较时权重向量;其中的元素表示印象向量的第g个负特征与隐性偏好向量第h个负特征相比较时的权重;表示印象向量的负特征部分与隐性偏好向量正特征部分进行比较时权重向量;其中的元素表示印象向量的第g个负特征与隐性偏好向量第h个正特征相比较时的权重。
10.所述的权重参数矩阵受条件约束。
11.所述的第4步中,选择行为是指:归类为“喜欢”则返回案例的标签y = 1,否则返回y =
ꢀ‑
1。
12.所述的第4步中,最小化问题进行求解的方法是:s41,在q的可行空间进行均匀随机抽样,对于其中的每一个q
(j)
,求解以下最小化问题,其中是指目标函数值;pi是第i个案例的印象向量;q
(j)
是第j个评分人的隐性偏好向量; s42,将步骤s41中得到的目标函数值由小到大排列,取前一定数量的解作为优质解,并对优质解进行聚类处理;s43,对于s42中得到的各类解集,分别求解以下最小化问题: 其中,w = acqc;其中,ac和qc分别是聚类后在某一类中的全部a和q
(j)
的解;令是聚类中心隐性偏好向量,是聚类中心权重向量;且当聚类结果只有一类时,为用户行为挖掘得到的需求结果;当聚类结果为多个时,即为用户行为挖掘得到的需求结果,下标1,
……
,h分别是各个聚类中心的编号。
13.所述的步骤s42中,前一定数量是指前5-40%。
14.有益效果: (1)可通过少量的用户行为数据来挖掘用户对于空间设计、家具陈设、软装陈设、室内风格、色彩搭配、灯光照明、材料应用等方面的隐性偏好。(2) 本发明首先对用户行为数据进行正则化处理;通过对用户行为模式的抽象量化,得到一个可用于刻画用户偏好随时间变化的最优化模型序列;针对所得模型的结构化特征,给出一种能从少量用户行为数据中挖掘用户隐性偏好的计算方法。(3)本发明一方面在一定程度上改变了设计
师与用户的沟通方式,非专业用户通过点击选择行为即可向设计师表达自身的需求和偏好;另一方面,帮助室内设计师快速识别、跟踪和管理用户偏好,以此提高双方沟通效率。
附图说明
15.图1是本发明方法流程图。
具体实施方式
16.基于以上的问题,本发明公开一种用于挖掘用户室内设计隐性偏好的小样本分析技术。本发明是一种小样本驱动的、可并行计算的、具有可解释性的通用型数据挖掘方法,可通过少量的用户行为数据来挖掘用户对于空间设计、家具陈设、软装陈设、室内风格、色彩搭配、灯光照明、材料应用等方面的隐性偏好。本发明首先对用户行为数据进行正则化处理;通过对用户行为模式的抽象量化,得到一个可用于刻画用户偏好随时间变化的最优化模型序列;针对所得模型的结构化特征,给出一种能从少量用户行为数据中挖掘用户隐性偏好的计算方法;最后,将所得技术用于处理用户的时序列行为数据,自动检测用户偏好的变化情况。本发明一方面在一定程度上改变了设计师与用户的沟通方式,非专业用户通过点击选择行为即可向设计师表达自身的需求和偏好;另一方面,帮助室内设计师快速识别、跟踪和管理用户偏好,以此提高双方沟通效率。
17.本发明的方法详述如下:第1步,数据标注和处理过程如下:本发明中,首先需要准备一些案例集,其中包含有不同的设计风格的户型设计效果,这些是用于向客户直观展示;因此,案例中的各个风格特征需要通过一定的方式进行特征提取,本发明中对案例集进行数据处理是指先结合业务需要对特征进行筛选;再结合标签信息对每张设计案例是否呈现选定的特征进行二值化处理;最后,综合设计师和用户对每张设计案例的标签标注,给出设计案例对应的正则化特征向量;约定{f1,
……fm
}为如上所述关于室内设计维度的特征的集合,其中fs是室内设计维度的特征,s为1到m之间的任意整数,并定义f
s+
和f
s-为正负两种标签用于评估特征fs。这里的设计维度特征可以是指空间设计、家具陈设、软装陈设、室内风格、色彩搭配、灯光照明和材料应用;可以将每个特征的值设为两种,例如灯光设为明亮或昏暗,色彩搭配设为活泼或安静。专业设计师根据领域知识从七个维度的若干特征对选定的设计案例用标签进行标注;非专业用户根据直观感觉对相应的设计案例用标签进行标注;定义t为特征的表达向量,其中t来自于设计师或者用户的标注。
18.并约定:其中,分别是标签为正值的特征表征值;分别是标签为负值的特征表征值;
s为1到m之间的任意整数;此外,还约定:以及是关于第i个设计案例的第j个专业设计师或者非专业用户的表达向量集合,j=1,2,
……
,n(i)。n(i)是总的专业设计师或者非专业用户的数量;本发明中,专业设计师或者非专业用户也被统一定义为评分人,他们共同参与到设计风格的确定过程中的评分中。
19.同时定义:pi是第i个案例的特征向量,称之为印象向量,i=1,
……
,k约定印象向量空间p为:其中,分别是标签为正值的印象向量,分别是标签为正值的印象向量;当设计师和用户对案例库标注完成后,案例库中的每个案例将对应一个印象向量。随后,当其他用户需要向设计师表达设计需求时,系统从案例库中随机抽取k张案例发送给用户,用户勾选喜欢的案例并将选择结果返回给系统。此时,约定yj是用户对第j个案例做出的选择行为。yj=1当且仅当用户对第j个案例做出勾选,否则yj=-1。
20.经过以上的步骤,构建起了由不同设计风格的构成的设计效果集合,并且对这些集合进行了特征向量的构建,由用户根据自己的直感感受选择偏爱的设计。
21.第2步,用户行为建模,并构造相应的效用函数空间;用户行为建模是指,先基于认知行为理论,抽象出用户行为与偏好之间的关系,并用公理系统来刻画这种关系;再添加子公理用来刻画更为细致的约束关系;效用函数空间是指,由用户行为-偏好公理系统推导而得的函数空间,并将这个函数空间成为效用函数空间。构造满足下述公理的效用函数数空间成为效用函数空间。构造满足下述公理的效用函数
隐性偏好q是指,用户用于多维度权衡与评价案例集中对各设计方案偏好的先验心理标准,即心理预期或心理锚定;我们可以直接观测到用户对各案例所对应的印象向量p的评估,但用户的隐性偏好q是未知的且无法直接观测;因此,我们利用上述公理系统将印象向量与隐性偏好建立结构效用关系,这样做的目的在于:利用这种内在关系和可观测的p以及对于p的评估y,间接地对q进行估计;q与p具有相同的向量格式,在同一个向量空间。
22.其中,公理b1假设隐性偏好的存在且与印象向量p同在一个空间;b2含义是指,对于相同的隐性偏好,越是超过预期,效用值越大;b3含义是指将隐性偏好向量q和印象向量p互换位置,那么效用和为零,即如果p高于q,那么q低于p,类似的有如果p低于q,那么q高于p;b4通过赋予效用函数线性性质来简化效用函数空间的结构,一阶近似逼近非线性。
23.基于以上公理系统,可推导出效用函数空间为:这里具有反对称结构;其中,a中的元素按照矩阵的分块共有四种,分别是;g和h分别代表元素在矩阵中的位置;g和h的取值是1,
……
,m;更具体地:更具体地:更具体地:为第g个正特征为1的单位列向量,为第h个负特征为1的单位列向量;分块矩阵表示印象向量的正特征部分与隐性偏好向量负特征部分进行比较时权重向量,设分块矩阵是由元素构成;且表示印象向量的第g个正特征与隐性偏好向量第h个负特征相比较时的权重;分块矩阵表示印象向量的正特征部分与隐性偏好向量正特征部分进行比较时权重向量;设分块矩阵是由元素构成,且表示印象向量的第g个正特征与隐性偏好向量第h个正特征相比较时的权重;分块矩阵表示印象向量的负特征部分与隐性偏好向量负特征部分进行比较时权重向量;设分块矩阵是由元素构成,且表示印象向量的第g个负特征与隐性偏好向量第h个负特征相比较时的权重;分块矩阵表示印象向量的负特征部分与隐性偏好向量正特征部分进行比较时权重向量;设分块矩阵是由元素构成,且表示印象向量的第g个负特征与隐性偏好向量第h个正特征相比较时的权重;g、h取值范围是1,2,
……
,m。
24.且由公理系统可推导出分块矩阵间满足。a称之为交
叉比较矩阵,它的元素用来表示印象向量与隐性偏好向量交叉比较的权重,由此可以用来反映用户是如何将印象向量和隐性偏好向量进行比较的。具体的,印象向量可分为正印象部分和负印象两部分,隐性偏好向量也同样可分为正负预期两部分;表示印象向量的第i个正特征与隐性偏好向量第j个负特征相比较时的权重,表示印象向量的正特征部分与隐性偏好向量负特征部分进行比较时权重向量(++/
‑‑
/-+时,以此类推);根据单调公理2,公理2,,当标准降低时,相同印象获得更高效用。设计师可根据先验知识对a的结构添加额外先验信息,例如,通过限定的取值范围;取值范围越大意味着先验知识越粗糙。下一步,利用效用函数的双线性结构,先验知识和观测数据,对a进行计算估计。
25.第3步,根据用户行为数据和效用函数,计算用户比较矩阵和隐性偏好向量;通过小样本机器学习方法拟合效用函数,得到一个矩阵估计和一个向量估计,即关于用户的选择行为和用户的隐性偏好的知识。
26.为了减少给用户带来的认知困难和选择障碍,发送给用户的案例数量k通常是一个比较小的数。所以,我们在效用函数空间利用结构风险最小化原则,建立用户隐性偏好的双凸最小化问题模型。通过观测到的向量(p,y)和偏好模型来估计用户的交叉比较矩阵a和用户的隐性偏好q。因此,转化为以下的最小化问题: yi是用户对第i个案例做出的选择行为;m是a的取值范围;表示pi的转置矩阵;一般的,上述问题为np-hard。为了估计a和q,本发明公开一种可并行计算的通用学习算法策略:s31 在q的可行空间进行均匀随机抽样s32 通过并行计算,对于每一个q,通过求解下述凸优化问题进行知识抽取其中,pi是第i个案例的印象向量;q
(j)
是第j个设计师或非专业用户的隐性偏好向量;s33 按目标函数值,将所得解由小到大排序,并只保留前三十分位的优质解;由此可以获得在不同的q的条件下矩阵a的数值。
27.s34 对步骤s3中得到的优质解分别按a和q进行聚类分析;s35 基于所得聚类中心,利用如下匹配规则重新组成(a,q)对进行知识提炼:令是问题
的最优解;w=acqc;其中,ac和qc分别是聚类后在某一类中的全部a和q的解。
28.对于步骤s35每一个聚类中心隐性偏好向量,将其与聚类中心权重向量匹配,其中有:若聚类后只存在一类结果,那么为用户行为挖掘得到的需求结果;而如果聚类后存在多类,则即为所得单一时间截面的知识挖掘结果。下标h是聚类中心的数量。
29.问题可以看成是无行为-偏好结构情况下的基于结构风险最小化原则的参数估计;更具体的,令w=aq,可看作是无矩阵结构分解以及a、q先验约束情况下(即无行为-偏好结构)的最优解。由于小样本估计常常伴随过估计,通过与比较有指导性地、间接地进行矩阵分解,即对和进行重新匹配重组,这样所得到的解更具有鲁棒性,减少过估计的影响。
30.第4步,通过用户的时序列行为数据,实时解析用户偏好模式;s41在一个新的时间截面,如果同一个用户重新对案例进行选择,系统重复第3步的过程,用来获得新的时间截面的知识挖掘结果。出于符号表达的便利,令是时刻t的知识挖掘结果,是时刻t+1的知识挖掘结果。视所得2h个向量为2h节点的二部图,为上部节点,为下部节点。对与任意节点i和j,计算它们之间的权重;之后,在这个完全二部图上用最大二分匹配(maximumbipartitematching)算法得到一个二部图上的最大匹配,这样就使得两个时间截面的偏好知识按时间轴连接起来,得到不同解释在两个时刻的知识表达;显见,随时间变化,这种方法最多形成h条用户偏好变动的时间序列,每一条序列给出用户偏好变动的一种解释。通常,h可设置成一个较小的自然数,设计师可以从中依据常识和用户画像等先验信息对这些序列进行筛选判断,用于后续的偏好分析。
31.s42监督用户在相邻两个时间截面的交叉比较异常,隐性偏好异常以及效用系数异常,并进行异常值检测;具体的,约定为从到在元素ij的绝对增量,用来测量
交叉比较矩阵的变化量;为从到在元素i的绝对增量,用来测量隐性偏好向量的变化量;为从到在元素i的绝对增量,用来测量效用系数的变化量;系统监控这些测量指标的变动幅度,当变化幅度超过超过一定预先设置的阈值时,系统自动发送反馈提醒设计师关注用户的偏好变动;具体的,如果某个超过特定阈值,意味着用户对于案例的整体评估可能产生较大的调整,系统根据等式w=aq进而利用和去分析用户效用变动的产生原因;例如,判断用户是否由于对于某些特征的预期发生了显著变化所以导致了效用的显著变动;随后,系统向设计师反馈用户偏好变动的可能的原因。设计师可以借助系统对用户偏好进行跟踪分析;当用户偏好发生改变时,设计师即时地从系统获得相应提醒和用户偏好变动原因分析报告,随后便可以在原有方案基础上根据系统分析结果有针对性地修改旧方案以适应用户最新的偏好情况,从而可以省去大量传统文本或语音的沟通时间,提高沟通效率。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1