一种基于位置和用户画像智能匹配社交目标的方法和系统与流程

文档序号:12034730阅读:209来源:国知局
一种基于位置和用户画像智能匹配社交目标的方法和系统与流程
软件开发、移动网络、大数据、推荐算法、数据挖掘、用户画像、行为分析、标签库。
背景技术
:用户画像(userprofile)又称用户角色(persona),是真实用户的虚拟代表,根据用户的目标、行为和观点的差异的调研去了解用户,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型,即用户角色。作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为、习惯与期待联结起来,并根据这些信息而抽象出的一个标签化的用户模型,即给用户贴“标签”。受互联网迅速发展影响,通过用户上网行为分析得到的用户画像在精准营销、用户统计、数据挖掘、产品设计、业务经营等方面得到了应用,例如应用在目前流行的程序化广告交易上,能让企业营销更加精准、有效提高业务转化率。通常,用户行为分析主要通过对用户行为监测获得的数据进行分析,可以让企业更加详细、清楚地了解用户的行为习惯,从而找出网站、推广渠道等企业营销环境存在的问题。通信运营商网络中大量的交互数据记录了详细的用户行为特征信息,特别是移动通信网络中,结合o域和b域数据,可以灵活地从用户基本属性(用户号码、实名认证信息等)、业务使用、活跃位置、终端使用、热点搜索、用户感知等多维度构建用户全视图画像,有效建立多维度用户标签库并定期及时更新。目前,全球各通信运营商或互联网公司都非常重视各维度用户标签库的建设,并不断利用大数据和数据挖掘等技术提升数据采集、存储、运算、分析建模和决策的效率和质量,但目前用户标签库的应用个人用户应用上主要专注于精准营销方面,在其他方面发挥较少。为提升移动网络运营商用户标签库的数据价值和应范围,本发明提出一种基于位置用户画像进行智能匹配社交目标的方法和系统,能实时为终端用户提供一种基于位置区域以及社交目标用户特征匹配的智能推荐服务,也可为交友网站提供实时的用户特征匹配信息。由于本系统使用的用户标签库信息是通过实际网络中大量用户行为数据统计运算而得,因此对用户特征分析具备一定的客观性,对比交友网站中用户自己上传的特征信息更具备可信度;此外,本系统在匹配用户特征过程中隐藏了用户具体地址、姓名、电话号码等敏感信息,具备用户隐私保护安全设置。技术实现要素:本发明提出一种基于位置和用户画像进行智能匹配社交目标的方法和系统。利用该系统,终端用户可通过相关的手机应用软件(app)登录并搜索一定位置区域范围内与自己特征匹配度(匹配指数)高或互补性(互补指数)高的社交目标;同时,在用户允许并保障用户信息安全的前提下,系统可以主动向用户本人或社交应用(网站可能有些局限)推荐用户标签特征匹配度高或互补性高的社交目标。系统主要构成有:自主服务交互界面、开放接口、用户画像智能匹配模块、推荐策略配置库、分类评分定义信息库、特征检索分析模块、用户画像数据平台。系统主要模块的组成参看说明书附图之图1,具体工作原理描述如下:1.自助服务交互界面(手机终端服务软件app或web页面等)(1)服务账号注册:为愿意开通服务的用户提供注册登录页面,以接受系统提供智能匹配社交目标的服务。(2)范围圈选:用户可在地图上圈选一定的地理范围并选择交友目标的驻留特征(如:常驻、来访、所有等等)。(3)特征选择:提供用户画像的多种特征(或标签)给用户进行筛选过滤,也可直接交给系统帮忙选择,寻找与自己特征匹配度高或互补性高的topn社交目标。用户可对7大特征(文化、经济、颜值、健康、征信、性格、爱好)进行选择并由交给特征检索分析模块对相关特征的上网业务内容和业务量统计计算两个用户各自特征的“强度指数”。7大特征的表示方法和评估方法如下表格:特征名称表示方法评估方法文化高、中等偏高、中等、一般,低,或标尺评分等通过区分职业、专业类别,阅读内容、关注内容、app使用时长等数据进行综合判断经济优、良、中、一般,或标尺评分等通过通信费用套餐、品牌关注、居住地、消费场所、出行特点、终端型号等数据进行综合判断颜值优、良、中、一般,或标尺评分等通过对用户上传照片进行图像识别,以及上传的身高体重等数据进行综合判断健康优、良、中、一般,或标尺评分等通过接入第三方应用的用户行走数据、骑行app数据、旅行app数据等进行综合判断征信征信分值通过用户套餐、欠费记录、实名登记、在网时长等情况进行评估。性格开朗、平和、节假日活跃、节假日宅家app使用活跃度、出行活跃度,动态运行轨迹等数据进行综合判断爱好例如主要业务标签排列:视频、旅游、购物、美食、运动、游戏、音乐、阅读、新闻、棋牌、理财,并显示标尺评分通过计算用户一段时间各类业务的使用时长(或业务量)与设定的门限值对比进行打分,或者与全网用户的平均水平对比进行打分(4)主动推荐:在用户允许并保障用户信息安全的前提下(如可由用户选择在被推荐时是否隐藏手机号、姓名等敏感信息),系统提供向用户终端应用(或接入的第三方应用)推荐匹配的社交目标信息,如匹配评估结果(7大特征“匹配指数”、爱好“强度指数”)、账号名(或昵称)、头像等。(5)即时通信:系统提供给用户与推荐的社交目标进行对话、留言、发送媒体文件、为头像点赞等功能。(6)推荐评分:系统为用户提供对推荐的社交目标是否有效的结果反馈功能。2.开放接口(api,sdk等)(1)推荐服务:系统开放推荐服务接口,第三方应用可以通过该接口进行调用,传入当前用户位置,用户号码及圈选范围等参数,即可得到与该用户匹配的社交目标推荐列表。(2)应用数据接入服务:系统开放数据接入服务接口,第三方应用可以通过该接口上传应用数据,在智能匹配社交目标时会使用第三方应用数据进行综合分析匹配。3.特征检索分析模块该模块主要提供通过用户标识(如:用户手机号码),调用用户画像数据平台接口获取到该用户的用户画像及特征数据,加载分类评分定义信息库的分类规则与评分标准,并结合业务内容和业务量统计数据对特征的强度指数进行计算。4.用户画像智能匹配模块该模块通过特征检索分析模块获取当前用户的画像特征及强度指数数据,以及圈选范围内的其他目标用户的画像特征及强度指数数据,并结合两者的数据进行分析,其中涉及对画像的匹配指数、互补指数进行计算和关联分析匹配,并结合用户反馈的推荐评分结果进行综合分析,匹配的结果根据特定的规则(规则通过推荐策略配置库获取)进行排序过滤,将匹配结果返回给交互界面,将合适的目标对象推荐给用户。5.推荐策略配置库该配置库主要用来定义和存储推荐策略规则,包括:用户选择匹配范围配置(如用户可选择的匹配范围阈值)、推荐策略(相似性或互补性)、排序规则、过滤规则、topn设置等,并为用户画像智能匹配模块推荐策略规则进行综合分析。6.分类评分定义信息库该信息库主要存储特征的分类信息与评分标准。如文化:在定义文化的评分规则(高、中、低)时,需要对阅读量和内容进行评估和分类,如经常访问文学作品,经济周刊,论文等,列为评判高文化优先考虑因素;如爱好:在定义旅游爱好者的评分规则(热爱、有兴趣、有关注等)时,需要对其访问内容进行分类,如经常访问旅游网站,出行订票,访问旅游杂志周刊等信息列为旅游热爱程度优化考虑因素。。该信息库存储了定义7大特征强度指数的评估方法。如“文化”特征通过计算访问文学类、经济类、新闻类、科技类等网站或栏目的频率占比。评分标准如下:访问文学类网站的频率占比80%及以上为5分,60%-80%为4分,40%-60%为3分,20%-40%为2分,0-20%为1分;访问经济类网站的频率占比80%及以上为5分,60%-80%为4分,40%-60%为3分,20%-40%为2分,0-20%为1分。等等如上述这些评分定义,综合这些规则的评分为“文化”这个属性的表示方法分类为高、中等偏高、中、一般、低。特征检索分析模块通过加载该信息库数据进行特征的强度指数计算。7.用户画像数据平台用户画像及特征数据主要来源于:信息资源库(性别、年龄段等),用户行为及轨迹信息库(使用套餐、访问行为、经纬度,用户运行轨迹,常驻位置等),业务量统计信息库(arpu、流量分布、访问时长,访问频率等),移动网络信令平台(主被叫信令详单、位置更新详单、切换详单、s1-u/gb/iups/等接口上网详单等),第三方应用数据库(骑行数据、订单数据、行走数据等)。附图说明图1是特征智能匹配系统主要模块组成示意图。图2是特征智能匹配系统的业务应用过程示意图。具体实施方式下面通过实例详细说明具体实施方式。这里以本发明的系统应用于社交目标推荐场景的业务处理流程进行说明,所选用的实例仅用于解释本发明,并非用于限定本发明的范围。特征智能匹配系统推荐社交目标的业务处理流程参看说明书附图之图2,具体过程说明如下:step1:用户提交匹配请求,内容包含用户手机号码,用户实时位置信息,圈选的地理范围信息(如:5km等),以及用户所关注的社交目标特征(如:音乐爱好、旅游爱好等)。step2:特征检索分析模块接受到用户提交的匹配条件,会分为如下两个步骤进行检索:a.根据当前用户手机号码,通过用户画像数据平台获取该用户所符合的画像特征以及每个特征的业务量统计情况。b.根据当前用户的实时位置信息、圈选的地理范围,通过用户画像数据平台获取该范围内其他用户的信息和画像特征,以及每个用户的7大特征业务量统计情况。特征检索分析模块通过加载业务量统计数据,以及加载分类评分定义信息库的规则数据,对画像7大特征属性的“强度指数”进行计算,如从上网业务类别的统计可分析出用户的爱好特征中主要特征标签有:游戏、棋牌、运动、旅游、购物、美食、音乐、视频、摄影、阅读、新闻、理财等等;音乐爱好者的标签“强度指数”可根据同一时段内,该用户访问音乐网站的流量占该用户总流量的占比(或时长占比、点击率占比)进行评估;也可以根据该用户与全量用户访问音乐网站平均流量(或平均时长、平均点击率)的差别进行评估。用户画像数据平台的特征数据来源于移动网络信令平台、信息资源库、第三方应用数据库。其中:1)移动网络信令平台用于采集移动网络中各设备间的交互数据包(xdr)并进行包解析(dpi),其中xdr包括了电路域(cs域)和数据域(ps域)控制面和用户面信令详单(如:主被叫信令详单、位置更新详单、切换详单、s1-u/gb/iups/等接口上网详单),解析后的重要数据存放于信令平台中的数据库中,其中重要的数据包括了每个用户行为上网六要素,如:时间、地点、终端标识号imei、手机号、内容、结果;2)信息资源库主要用于存放小区数据库、终端信息库、用户信息库和业务识别库。小区数据库:包括小区id、名称、网络类型、覆盖类型、经纬度、覆盖场景、行政区、地市等信息;3)第三方应用数据库主要用于存储第三方应用数据,如骑行数据、订单数据、行走数据,旅游app数据等信息。step3:用户画像智能匹配模块加载推荐策略库的策略规则信息,得到使用相似性的特征属性与互补性的特征属性(性格、爱好),以及topn的配置信息。用户画像智能匹配模块通过加载step1与step2的检索与分析结果进行匹配。该模块的匹配算法会根据特征的强度指数进行匹配计算,得到匹配指数结果(即两者的相似程度)。如果采用互补性策略进行匹配,则需要将具有互补性的特征进行等值转换(如:“活泼”,强度指数5等值于“内敛”,强度指数5)。两个对象相似度采用向量空间余弦相似度的方式进行计算,计算用户之间的相似程度,相似度度量的值越小,说明用户间相似度越小,相似度的值越大说明用户差异越大。用户对各种事物的喜爱程度转换为用户的特征,然后用户之间的特征向量计算余弦相似度。余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个用户差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。而计算用户余弦相似度的公式为:假设用户a对体育的强度指数(即爱好程度)为2,对音乐的强度指数为3,即a的特征向量为(2,3),即x1=2,y1=3。而用户b对体育的强度指数为5,对音乐的强度指数是1,则b的特征向量为(5,1),即x1=5,y1=1,然后代入上面公式便可以计算用户a和b的cos(θ)值,也就是匹配指数(即相似度)。通过计算后得到当前用户与范围内(如:5km)的其他用户的所有匹配指数(相似度),然后对结果进行排序得到匹配指数最高topn,并将结果返回给用户或社交应用。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1