一种用户偏好分析方法及其装置与流程

文档序号:15637170发布日期:2018-10-12 21:37阅读:344来源:国知局

本公开涉及计算机网络数据技术领域,特别涉及一种用户偏好分析方法及其装置。



背景技术:

为了高效高速的给用户提供推荐产品信息,从用户历史访问记录中挖掘到用户的偏好信息,并根据偏好信息向用户推荐相关产品信息,节省用户获取有用产品信息的时间,个性化产品推荐服务应运而生,个性化产品推荐服务首先会根据用户行为数据进行相应的用户行为偏好分析,常用的方法是通过用户行为分析建立一个用户偏好模型,将用户的行为转换为用户的偏好。本公开对用户行为偏好建模大多是在信息搜索引擎、电商平台等,针对用户信息搜索关键字、访问记录、访问频度、搜索信息,访问日志、评价信息等方面进行偏好分析,并不能根据用户的偏好分析出该用户的个性化需求信息推送。



技术实现要素:

本公开的目的是针对现有技术中缺少根据用户的偏好分析出该用户的个性化需求信息推送的问题,提供一种用户偏好分析方法及其装置,所述一种用户偏好分析方法具体包括以下步骤:

步骤1,提取产品与案例信息的特征词;

步骤2,通过日志文件和数据库采集用户历史数据;

步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;

步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;

步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;

步骤6,向用户推送用户的偏好信息;

其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。

进一步地,在步骤1中,所述提取产品与案例信息的特征词的方法包括以下子步骤:

步骤1.1,将所述产品与案例的文本分词,获得分类词;

步骤1.2,遍历所有分类词并统计每个分类词次数;

步骤1.3,选取分类词次数大于或等于次数阈值的分类词作为特征词;

其中,次数阈值为5次。

进一步地,在步骤2中,所述采集用户历史数据的方法包括以下子步骤:

步骤2.1,采集日志文件中的用户访问关键词;

步骤2.2,读取sql数据库内的用户访问类型记录;

步骤2.3,合并用户访问关键词和用户访问记录得到用户历史数据。

其中,用户访问类型记录包括产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。

进一步地,在步骤3中,所述非真正用户数据包括非注册用户访问数据、临时用户数据和已注销用户数据。

进一步地,在步骤4中,所述计算出整体产品与案例的偏好度的方法为:

其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10,访问类型为产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。

进一步地,在步骤5中,所述根据偏好度匹配产品与案例的特征词获取偏好信息方法为:

步骤5.1,根据特征词与用户对产品与案例信息的访问次数设置类别阈值;

步骤5.2,当偏好度大于等于类别阈值时读取特征值所对应的产品与案例偏好信息;

其中,类别阈值为用户对产品与案例信息的访问次数/权重值,其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10。

本发明还提供了一种用户偏好分析装置,所述装置包括:

特征词提取单元,用于提取产品与案例信息的特征词;

历史数据采集单元,用于通过日志文件和数据库采集用户历史数据;

历史数据过滤单元,用于过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;

偏好度计算单元,用于使用过滤后的用户历史数据计算出整体产品与案例的偏好度;

偏好信息获取单元,用于根据偏好度匹配产品与案例的特征词获取偏好信息;

偏好信息推送单元,用于向用户推送用户的偏好信息。

本公开的有益效果为:本公开针对单个用户通过用户搜索、浏览、收藏产品和案例的数据和整体产品与案例的偏好值数据来计算每个用户对产品与案例的偏好值,然后结合用户个人基本信息判断推送,能够精准的推送用户偏好的相关产品给用户,能够高效高速的给用户提供推荐产品信息。

附图说明

通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:

图1所示为本公开的一种用户偏好分析方法工作流程图;

图2所示为本公开的一种用户偏好分析装置模块架构图。

具体实施方式

以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

如图1所示为根据本公开的一种用户偏好分析方法及其装置工作流程图,下面结合图1来阐述根据本公开的用户偏好分析方法。

本公开提出一种用户偏好分析方法,具体包括以下步骤:

步骤1,提取产品与案例信息的特征词;

步骤2,通过日志文件和数据库采集用户历史数据;

步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;

步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;

步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;

步骤6,向用户推送用户的偏好信息;

其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。

进一步地,在步骤1中,所述提取产品与案例信息的特征词的方法包括以下子步骤:

步骤1.1,将所述产品与案例的文本分词,获得分类词;

步骤1.2,遍历所有分类词并统计每个分类词次数;

步骤1.3,选取分类词次数大于或等于次数阈值的分类词作为特征词;

其中,次数阈值为5次。

其中,文本分词方法为假定分词词典中的最长词有i个汉字字符,则用被处理文档的当前字串中的前i个字作为匹配字段,查找字典。若字典中存在这样的一个i字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个i字词,则匹配失败,将匹配字段中的最后一个字去掉,对剩下的字串重新进行匹配处理……如此进行下去,直到匹配成功,即切分出一个词或剩余字串的长度为零为止。这样就完成了一轮匹配,然后取下一个i字字串进行匹配处理,直到文档被扫描完为止。

文本分词算法描述如下:

s1:从左向右取待切分汉语句的m个字符作为匹配字段,m为大机器词典中最长词条个数。

s2:查找大机器词典并进行匹配。若匹配成功,则将这个匹配字段作为一个词切分出来。若匹配不成功,则将这个匹配字段的最后一个字去掉,剩下的字符串作为新的匹配字段,进行再次匹配,重复以上过程,直到切分出所有词为止。

进一步地,在步骤2中,所述采集用户历史数据的方法包括以下子步骤:

步骤2.1,采集日志文件中的用户访问关键词;

步骤2.2,读取sql数据库内的用户访问类型记录;

步骤2.3,合并用户访问关键词和用户访问记录得到用户历史数据;

其中,用户访问类型记录包括产品类型、主砖色系、装修风格、门店接待历史、垂直/移

动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。

其中,采集日志文件的用户访问关键词,数据采集请求被请求后会被执行,执行如下步骤:

(1)通过浏览器内置javascript对象采集信息,如页面title(通过document.title)、referrer(上一跳url,通过document.referrer)、用户显示器分辨率(通过windows.screen)、cookie信息(通过document.cookie)等等的用户访问关键词。

(2)解析_gaq采集配置信息。这里面包括用户自定义的事件跟踪、业务数据(如电子商务网站的商品编号等)等用户访问关键词。

(3)将上面两步采集的用户数据按预定义格式解析并拼接。

进一步地,在步骤3中,非真正用户数据包括非注册用户访问数据、临时用户数据和已注销用户数据。

进一步地,在步骤4中,所述计算出整体产品与案例的偏好度的方法为:

其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10,访问类型为产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。

进一步地,在步骤5中,所述根据偏好度匹配产品与案例的特征词获取偏好信息方法为:

步骤5.1,根据特征词与用户对产品与案例信息的访问次数设置类别阈值;

步骤5.2,当偏好度大于等于类别阈值时读取特征值所对应的产品与案例偏好信息;

其中,类别阈值为用户对产品与案例信息的访问次数/权重值,其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10。

本发明还提供了一种用户偏好分析装置,如图2所示,所述装置包括:

特征词提取单元,用于提取产品与案例信息的特征词;

历史数据采集单元,用于通过日志文件和数据库采集用户历史数据;

历史数据过滤单元,用于过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;

偏好度计算单元,用于使用过滤后的用户历史数据计算出整体产品与案例的偏好度;

偏好信息获取单元,用于根据偏好度匹配产品与案例的特征词获取偏好信息;

偏好信息推送单元,用于向用户推送用户的偏好信息。

所述一种用户偏好分析装置可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述一种用户偏好分析装置可运行的装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是一种用户偏好分析装置的示例,并不构成对一种用户偏好分析装置的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种用户偏好分析装置还可以包括输入输出设备、网络接入设备、总线等。所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种用户偏好分析装置运行装置的控制中心,利用各种接口和线路连接整个一种用户偏好分析装置可运行装置的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种用户偏好分析装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1