用户数据匹配方法、装置、电子设备和计算机可读介质与流程

文档序号:19892641发布日期:2020-02-11 12:53阅读:198来源:国知局
用户数据匹配方法、装置、电子设备和计算机可读介质与流程

本公开涉及数据应用技术领域,具体涉及一种用户数据匹配方法、装置、电子设备和计算机可读介质。



背景技术:

目前,在涉及与用户交互的数据应用中,特别是资讯类应用中,常常涉及向用户分发数据信息,分发的数据信息可以是投放或推送的服务信息,如广告、新闻、购物向导、地图导航和应用选项、等等。

现有技术中主要采取两种策略方式分开信息,第一种策略是广播式分发,即向广播一样向所有用户统一发送同样的数据信息,第二种策略是定向式分发,即根据用户注册的一些特点,如年龄、性别这些特点,分类向不同年龄、性别的用户分发相应的数据信息。

第一种策略虽然简单,由于向所有用户不加区分的分发数据,其发送成本高,并且分发的数据信息并不能够较好的适应于不同用户的需求,当大多数用户的需求不能满足时,会降低所述数据应用的群体用户体验度,当群体用户体验度降低到一定程度时,则会被定义为垃圾数据集应用,甚至为恶意数据应用,不利于所述数据应用的健康发展。第二种策略虽然对用户进行了区分,但是这种区分是静态的,不能适应于用户特点的动态变化,例如男性用户也可能随着生活经历的变化,如恋爱、结婚,会对女性的一些话题产生兴趣,但是却不能获取到此类仅投放或推送给女性用户的服务信息,因而也会降低用户体验度。



技术实现要素:

鉴于解决现有技术中存在的技术问题,本公开的目的之一在于提供一种用户匹配方法、装置、电子设备和计算机可读介质。所述方法、装置、电子设备和计算机可读介质,能够降低数据分发成本、克服用户体验度不容易维持的弊端。

为达此目的,本公开采用以下技术方案:

第一方面,本公开提供了一种用户数据匹配方法,包括:

获取用户画像模板库基础数据信息集;

获取目标用户特征信息;

基于用户画像模板库基础数据信息集和目标用户特征信息将用户画像模板库基础数据信息集拆解为用户画像模板库基础数据信息子集、并分发给相匹配的目标用户;

基于目标用户对所述用户画像模板库基础数据信息子集的反馈信息构建所述目标用户画像、匹配目标用户数据。

第二方面,本公开还提供了一种用户数据匹配装置,包括:

用户画像模板库基础数据信息集获取模块,用于获取用户画像模板库基础数据信息集;

目标用户特征信息获取模块,用于获取目标用户特征信息;

数据拆解匹配分发模块,用于基于用户画像模板库基础数据信息集和目标用户特征信息将用户画像模板库基础数据信息集拆解为用户画像模板库基础数据信息子集、并分发给相匹配的目标用户;

用户画像和数据匹配模块,用于基于目标用户对所述用户画像模板库基础数据信息子集的反馈信息构建所述目标用户画像、匹配目标用户数据。

第三方面,本公开还提供了一种电子设备,包括:处理器和存储器,所述存储器具有存储有程序代码的介质,当所述处理器读取所述介质存储的程序代码时,所述电子设备能够执行本公开所述的任一种用户数据匹配方法。

第四方面,本公开还提供了一种计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本公开所述的任一种用户数据匹配的方法。

与现有技术方案相比,本公开实施例的技术方案至少具有以下有益效果:

(1)通过构建目标用户画像匹配分发给目标用户的数据,避免了无效数据的分发,因而降低分发数据的成本,并能同时保持和提升用户对所述分发数据的用户体验度;

(2)通过收集用户历史数据获取目标用户特征信息以及目标用户的反馈,动态分析和构建目标用户画像,把握用户的特点,实现智能匹配和分发数据,提高所述数据分发的针对性、灵活性和/或精准度,有利于持续提升应用的用户体验度。

附图说明

图1是本公开实施例提供的用户画像的一个示意图;

图2是本公开实施例提供的用户数据匹配方法的概略性流程示意图;

图3是本公开一个较佳实施例提供的用户数据匹配方法的流程示意图;

图4是本公开一个较佳实施例提供的用户数据匹配装置的概略性结构示意图;

图5是本公开实施例提供的电子设备结构示意图;

图6是本公开实施例提供的计算机可读存储介质的示意图。

下面对本公开进一步详细说明。但下述的实例仅仅是本公开的简易例子,并不代表或限制本公开的权利保护范围,本公开的保护范围以权利要求书为准。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本公开的技术方案。

为更好地说明本公开,便于理解本公开的技术方案,本公开的典型但非限制性的实施例如下:这里需要特别说明的是本公开说明书所列的实施方式仅是为了说明问题方便而给出的示例性实施方法,其不得理解为是本公开唯一正确的实施方式,更不得理解为是对本公开保护范围的限制性说明。

随着数据应用的不断发展,用户(即:受众用户)对接收的数据的体验度要求越来越高,这就需要能够从提升用户的体验度出发,分发匹配用户的数据。例如,投放的广告数据信息,推送的新闻数据信息、地图导航数据信息的使用是否符合受众用户的喜好、是否具有良好的用户体验,等等,这就要求数据提供商可以预先分析用户的特点。此外,用户的特点并非一成不变,因此,还需要能够智能地跟踪用户的特点变化,并作出相应的调整。

为了便于理解,本公开以新闻推送为例来阐述,但不表明本公开所保护的范围仅限于新闻推送。

新闻推送是目前资讯类应用中最为流行的数据分发方式。不同的用户对新闻的喜好是不相同的。为了描述不同用户的特点,本公开以用户画像来描述用户特点。

用户画像是建立在一系列真实数据之上的目标用户模型,通过用户调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,形成了一个人物原型。参见图1,通过对用户调研获取到“女性、起居:晚12点-早7点、喜欢瑜伽/常慢跑、家有孩子,幼儿期、常看电影、喜欢兰蔻、爱打扮、炒股、使用银行:工行、喜欢海淘,常手机支付、喜欢做菜、关注可穿戴设备、关注时尚、在学车、爱看美剧、自有住房/还贷中、中国移动,4g高流量用户、宾馆:中高档、常去上海、常去星巴克、80后白领、居住地:北京”等特征,通过分析,得到“作息规律、注重品质、生活健康、爱尝试新鲜事物、小资”等典型特征作为该用户的用户画像。利用大数据分析手段,通过对收集的大量用户样本的特征进行分析,可将其中的典型用户画像构成用户画像模板库中的基础数据信息集。

下面结合附图2和3说明本公开所述的用户数据匹配方法的一个实施例。

参见图2,所述用户数据匹配方法包括:

s1:获取用户画像模板库基础数据信息集;s2:获取目标用户特征信息;s3:基于用户画像模板库基础数据信息集和目标用户特征信息将用户画像模板库基础数据信息集拆解为用户画像模板库基础数据信息子集、并分发给与其相匹配的目标用户;s4:基于目标用户对所述用户画像模板库基础数据信息子集的反馈信息构建所述目标用户画像、匹配目标用户数据。

上述实施例通过构建目标用户画像,以确定用户的喜好,例如所喜好的新闻类型等,特别是还借助于用户的动态反馈,使得确定的用户喜好更加精准,因而分发的数据将更符合用户的喜好,提高分发数据的有效性,有助于降低数据的分发成本,同时,用户的体验度也能够不断被改善。

作为一个更优选实施例,参见图3中的p1,在获取用户画像模板库基础数据信息集之前,通过人工创建或者收集用户历史数据的方式获取所述用户画像模板库基础数据信息集。人工创建主要是由用户注册时所填写的相关特征信息,但有些用户除了填写用户名和密码外,不乐意再填写更多的信息,因而无法直接获取这些用户的相关特征信息,此时可通过用户的历史数据,例如其所浏览的新闻内容、板块、发表评论的内容等,利用机器学习等大数据分析手段分析该用户的相关特征。当获得大量用户的用户特征样本后,利用机器学习中的聚类、分类等技术手段建立用户画像,即从中提取典型的用户画像形成用户画像模板库的基础数据信息集。

在一些更优选的实施例中还可采用用户人工填写和通过机器学习预测相组合的方式获取所述用户的特征信息,以改善用户填写时的体验度。例如,在用户填写相关信息时,通过机器学习手段同时预测与该用户相关信息具有关联关系的下一个特征的信息,如当用户填写阅读时间为6:00-8:00,根据已有手机的信息预测这个时间段的阅读内容为健身,并自动向用户提示,当用户认可后,则由机器自动填写,以减少用户输入文本的复杂度,改善用户填写时的体验度,而在机器自动特征分析的信息不理想的情况下,用户也可以以手动填写的方式进一步修正。

为了便于方便理解技术方案,如下表所示,是一个简化的用户画像模板库的基础数据信息集,其中,每一个基础数据编号所指示的信息为一个基础数据信息,例如a1所表示的基础数据信息是:阅读时间在6:00-8:00之间,b1表示的基础数据信息是阅读内容为健身。

上述实施方式通过人工智能手段有效降低,甚至减少了用户填写信息的强度,确保用户体验度不受到大的影响。

作为一个更优选的实施例,本公开前述实施例中的用户画像模板库的基础数据信息集可以存储在特定的数据库中以方便其他模块调用。

参见图3中的p2,获取目标用户特征信息时,也可采取据历史数据分析和/或人工设置的方式,并与用户画像模板库基础数据信息集一起作为将用户画像模板库基础数据信息集拆解的基础。

参见图3中的p3,基于用户画像模板库基础数据信息集和目标用户特征信息将用户画像模板库基础数据信息集拆解为用户画像模板库基础数据信息子集,并分发给相匹配的目标用户。

匹配的目标用户(参见图3中的“匹配用户”)对接收到的所述用户画像模板库基础数据信息子集进行反馈,形成反馈信息。

参见图3中p4,接收到目标用户的反馈信息后,形成结构化数据。所述结构化数据以可视化和/或机器可读的形式输出。所谓可视化输出是指目标用户的反馈信息通过列表、文字、图形、图像、数据地图等人类可读的数据表现形式输出表示相关数据。所述机器可读输出是指目标用户的反馈信息通过计算机信息交互、传输、识别、统计、分析的形式输出相关数据。

上述实施例利用结构化数据不仅有助于数据的存储,也有助于数据的处理和展示,降低了技术方案的实施成本。

作为更优选实施例,反馈的结构化数据对数据拆解和匹配分发方式进行优化。进一步的,根据所述目标用户对所述用户画像模板库基础数据信息子集的反馈的结构化数据优化数据拆解和匹配分发方式包括:与所述用户画像模板库基础数据信息集整体发放时的统计结果相比较,根据比较结果调整优化数据拆解和匹配分发方式。

根据所述目标用户对所述用户画像模板库基础数据信息子集的反馈的结构化数据优化数据拆解和匹配分发方式包括:在所述用户画像模板库基础数据的分发时同时通过整体数据集分发的形式和拆解数据子集的形式分发给不同的目标用户,接收并比较不同拆解方式的目标用户的反馈的结构化数据,根据比较结果优化数据集的拆解方式。

上述实施例利用用户反馈不断优化数据集拆解方式,有助于提升数据集的拆解效率。

作为一个更优选实施例,将用户画像模板库的基础数据集拆解为子集的步骤:

假设基础数据集包括n个基础数据,向m个目标用户进行匹配,则拆解的方式为:

用户画像模版子集1:{t11,t12,t13,…t1i},数量为i,

用户画像模版子集2:{t21,t22,t23,…t2j},数量为j,

用户画像模版子集3:{t31,t32,t33,…t3k},数量为k,

用户画像模版子集x:{tx1,tx2,tx3,…txq},数量为q

则需要满足i+j+k+…+q≤m*n,即需要保证分发的总子集数不超过m*n,每个基础数据分发数量最多为m个。其中i、j、k、…、q均小于n。

由于目标用户接收的仅是基础数据集的一个子集,其数量小于基础数据集的数据总数,使得用户不会被数量巨大的待反馈数据所厌倦,有助于保持良好的用户体验度。

为了保证所述子集被反馈的有效性,则需要使得子集与受众用户匹配。作为一个优选的实施例,将用户画像模版子集分发给与其相匹配的受众用户的步骤包括:

分发过程是一个用户画像模版子集和目标用户的特征匹配过程,可采取不同的匹配算法,作为一个更优选的实施例,匹配算法可通过计算两个对象之间的相似度实现,例如:有两个对象x、y,两者都包含n维特征,x=(x1,x2,x3,……..,xn),y=(y1,y2,y3,……..,yn),计算x和y的相似性,其具体的算法可为:欧几里得距离法、曼哈顿距离法、明可夫斯基距离法、余弦相似度法、或者皮尔森相关系数法。

通过上述用户画像模版子集和目标用户的匹配计算,可以将不同的用户画像模版子集分配给特征接近的目标用户;在一些更优选的实施例中,应当确保在同一次调查中同一个受众用户不会被分配两个用户画像模版子集。

目标用户在接收到用户画像模版子集后进行反馈,并将反馈信息形成结构化数据,所述结构化数据以可视化和/或机器可读的形式输出。所谓可视化输出是指目标用户的反馈信息通过列表、文字、图形、图像、数据地图等人类可读的数据表现形式输出表示相关数据。所述机器可读输出是指目标用户的反馈信息通过计算机信息交互、传输、识别、统计、分析的形式输出相关数据。

参见图3中的p4,对于以机器可读输出的反馈数据进一步可以反馈给负责拆解和分发的p3,p3根据上述反馈的结构化数据进一步优化拆解和匹配分发方式,具体过程可以为:在所述用户画像模板库基础数据的分发时同时通过整体数据集分发的形式和拆解数据子集的形式分发给不同的目标用户,接收并比较不同拆解方式的目标用户的反馈的结构化数据,根据比较结果优化数据集的拆解方式。一种优选的具体实现方式可以为:在拆解用户画像模板库基础数据集时设为两组:a组为整体数据集形式发放,b组为拆解子集形式发放。从收集结果中统计出两种反馈的比重,进行向量比较,并且通过改写b组的拆解子集的方式(例如控制每个子集的基础数据数量等)来使两种效果逼近。

通过不同的拆解方式提高用户对用户画像模板库基础数据信息子集的反馈率,一种优选的具体实现方式可以为:同样是先基础数据拆解,比如全数据拆解(其实就不做拆解)时,得到的用户反馈率v(单位时间内回收问题数量)作为基准值,改写拆解规模的参数后,对比v的变化,从而优化拆解方式。

通过不同的拆解方式提高目标用户的反馈率,同时找出反馈率最高和反馈结果与整体数据集发放时结果最接近时的最优解的具体实现方式可以为:在保证效果的前提下,尽可能提高反馈率。可以对前边两步中的结果进行统计学上的回归分析等,以便找出最优解。

参见图3的p5,基于用户的反馈,进一步构建出目标用户的用户画像,从而获取到所述目标用户的所喜好的新闻特点,基于所述特点,获取匹配的数据(参见图3中的p6),即匹配的新闻数据,向用户推送。

上述实施例利用用户画像模版子集、特征匹配的智能匹配等手段,不仅保证了数据匹配的精准性,又降低了所需用户反馈的信息量,因此,数据分发的针对性、灵活性和精准度都有了很大的提高,用户体验度同时也得到很大的改善。

作为本公开的第二个方面,还提供一种与前述方法步骤对应的装置。

本公开所述装置可以为实体硬件装置、软件功能模块构成的虚拟系统或者硬件和软件相互结合的装置,但是本领域技术人员应该理解任何软件功能模块构成的虚拟装置其功能的实现都离不开实体硬件装置的支持。

如图4所示的用户数据匹配装置(100),包括:用户画像模板库基础数据信息集获取模块(101),用于获取用户画像模板库基础数据信息集;目标用户特征信息获取模块(102),用于获取目标用户特征信息;数据拆解匹配分发模块(103),用于基于用户画像模板库基础数据信息集和目标用户特征信息将用户画像模板库基础数据信息集拆解为用户画像模板库基础数据信息子集、并分发给与其相匹配的目标用户;用户画像和数据匹配模块(104),用于基于目标用户对所述用户画像模板库基础数据信息子集的反馈信息构建所述目标用户画像、匹配目标用户数据。

可选的,上述装置进一步包括:结构化数据形成模块,用于接收所述目标用户的反馈信息,并形成结构化数据。

可选的,上述装置进一步包括:结构化数据输出模块,用于通过可视化和/或机器可读的形式输出所述结构化数据。

可选的,所述数据拆解匹配分发模块进一步包括:优化子模块,用于根据所述目标用户对所述用户画像模板库基础数据信息子集的反馈的结构化数据优化数据拆解和匹配分发方式。

可选的,所述优化子模块进一步包括:调整优化单元,用于与所述用户画像模板库基础数据信息集整体发放时的统计结果相比较,根据比较结果调整优化数据拆解和匹配分发方式。

可选的,所述调整优化单元,进一步包括:优化数据集拆解方式子单元,用于在所述用户画像模板库基础数据的分发时同时通过整体数据集分发的形式和拆解数据子集的形式分发给不同的目标用户,接收并比较不同拆解方式的目标用户的反馈的结构化数据,根据比较结果优化数据集的拆解方式。

可选的,进一步包括:数据获取模块,用于通过人工创建或收集用户历史数据的方式获取所述用户画像模板库基础数据信息集。

可选的,所述获取目标用户特征信息包括:根据历史数据分析获取的目标用户的特征信息和/或人工设置的方式获取的目标用户的特征信息。

可选的,所述用户画像模板库基础数据信息子集和目标用户的匹配采用特征向量欧氏距离和/或余弦相似度的计算方式实现。

可选的,所述匹配目标用户数据包括:根据构建的目标用户画像向目标用户推送服务信息,所述服务信息包括下述至少一项:广告、新闻、购物向导、地图导航或应用选项。

本领域技术人员应当理解,所述数据拆解匹配分发模块(103)能够用户画像模板库基础数据信息集获取模块(101)获取的基础数据信息集信息和目标用户特征信息获取模块(102)获取的目标用户特征信息,经基于基础数据信息集和目标用户特征信息将基础数据信息集拆解为子集、并分发给与其相匹配的目标用户。用户画像和数据匹配模块(104)根据目标用户反馈的信息构建用户画像,并给予用户画像匹配数据。具体的拆解、匹配、分发过程与本公开所述的方法相对应,这里不再重复。

作为本公开的第三个方面,还提供一种电子设备,包括:处理器和存储器,所述存储器具有存储有程序代码的介质(计算机可读存储介质),当所述处理器读取所述介质存储的程序代码时,所述电子设备能够执行如下方法步骤:获取用户画像模板库基础数据信息集;获取目标用户特征信息;基于用户画像模板库基础数据信息集和目标用户特征信息将用户画像模板库基础数据信息集拆解为用户画像模板库基础数据信息子集、并分发给与其相匹配的目标用户;基于目标用户对所述用户画像模板库基础数据信息子集的反馈信息构建所述目标用户画像、匹配目标用户数据。

进一步地,当所述处理器读取所述介质存储的程序代码时,所述电子设备还能够执行本公开所述的其它任何方法。

图5是图示根据本公开实施例的电子设备的硬件结构示意图。电子设备可以以各种形式来实施,本公开中的电子设备可以包括但不限于诸如移动电话、智能电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、导航装置、车载电子设备、车载显示终端、车载电子后视镜等的移动电子设备以及诸如数字tv、台式计算机等等的固定电子设备。

如图5所示,电子设备1100可以包括处理器1120、输入单元1130、存储器1140、输出单元1150等。虽然图5示出了具有各种组件的电子设备,但是应理解的是,并不要求实施所有示出的组件,可以替代地实施更多或更少的组件。

其中,电子设备处理器1120用于执行本公开所公开的用户数据匹配方法,输入单元1130可以根据用户输入的命令生成键输入数据以控制电子设备的各种操作,输出单元1150提供输出信号。存储器1140可以存储由处理器1120执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据。存储器1140可以包括至少一种类型的存储介质。而且,电子设备1100可以与通过网络连接执行存储器1140的存储功能的网络存储装置协作。处理器1120通常控制电子设备的总体操作。

作为本公开的第四个方面,图6是本公开实施例提供的一种计算机可读存储介质的示意图。如图6所示,计算机可读存储介质300,其上存储有非暂时性计算机可读指令301。当该非暂时性计算机可读指令301由处理器运行时,执行前述的本公开各实施例的用户数据匹配方法的全部或部分步骤。

本公开提出的用户数据匹配方法的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,本公开提出的用户数据匹配方法的各种实施方式可以通过使用特定用途集成电路(asic)、数字信号处理器(dsp)、数字信号处理装置(dspd)、可编程逻辑装置(pld)、现场可编程门阵列(fpga)、处理器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,本公开提出的用户数据匹配方法的各种实施方式可以在图5所示的处理器1120中实施。对于软件实施,本公开提出的用户数据匹配方法的各种实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器1140中并且由处理器1120执行。

虽然上述实施例是以新闻推送为例,但是本领域技术人员应该理解通过对上述实施例中的数据作相适应的改变和调整,则可实现广告推送、购物向导、地图导航、应用(app)的选择或推荐等服务信息的推送。

申请人声明,本公开通过上述实施例来说明本公开的详细结构特征,但本公开并不局限于上述详细结构特征,即不意味着本公开必须依赖上述详细结构特征才能实施。所属技术领域的技术人员应该明了,对本公开的任何改进,对本公开所选用部件的等效替换以及辅助部件的增加、具体方式的选择等,均落在本公开的保护范围和公开范围之内。

以上详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1