一种基于大数据挖掘的用户行为分析方法及系统与流程

文档序号:12466135阅读:394来源:国知局
一种基于大数据挖掘的用户行为分析方法及系统与流程

本发明涉及互联网技术领域,尤其涉及一种基于大数据挖掘的用户行为分析方法及系统。



背景技术:

在互联网应用这一领域,用户行为分析指的是统计和分析用户接入网络服务全过程当中(包括访问和浏览网页、进行交互式操作、使用APP等)产生的实时性和历史性的用户行为信息。在用户接入网络服务的行为过程当中,包含着大量有价值的信息。据测算,用户在一次网上购物的过程中平均要关注3-4件商品,访问5-7个网站,浏览40个以上的页面。用户行为信息包括但不局限于以下内容:网络服务的访问次数、访问频度、访问停留时间、操作活跃时间、用户输入关键词、用户点击链接、用户交互操作(如加关注、取消关注、打分、保存为书签、加入购物车、取出购物车、形成订单、取消订单、付款、退款等等)。通过对用户行为信息的研究,可以从中发现用户在接入网络服务时表现出来的规律分布,并且为提升用户体验、高效信息推送和促进目标营销提供科学、准确的客观依据。针对用户行为的研究与应用,最有效的手段是记录用户的所有行为带来的全部用户行为信息,并对全部的用户行为信息进行统计、分析。

大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,成为了网络服务背后强大的后台支撑。基于大数据平台实现对全部用户行为信息的分析与利用,适应了用户行为信息自身规模庞大、数据格式复杂多元化、运算速度要求高的特点,能够满足各类型网络服务的实际需求。

对于用户行为的分析,国内外做过很多研究,但存在一些问题:首先,大多集中于挖掘WEB日志,但这些日志并不足以及时描述用户访问网站时的情景;其次,大型网站一般拥有庞大的在线用户,产生的实时行为和上下文信息量巨大,因此,系统的存储能力和计算速度更强,才能及时地将分析结果反馈给用户。而目前,大多数用户行为分析系统采用关系数据库技术与传统的数据处理方法,不能很好满足海量数据的高效分析。



技术实现要素:

本发明实施例提供了一种基于物联网的非智能空调监控方法及系统,可以监控非智能空调的各种参数信息,并根据参数信息调节非智能空调,可以实现检查空调温湿度设置是否合理,或根据时段自动控制空调开关机,避免不必要的冷源浪费。

本发明实施例第一方面公开了一种基于大数据挖掘的用户行为分析方法,包括:

采集用户行为数据;

对用户行为数据采用并行运算模型进行预处理与聚合;

根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。

作为一种可选的实施方式,所述方法还包括,

对用户行为数据本体模型进行推理,找出用户最新兴趣数据。

作为一种可选的实施方式,所述用户行为数据包括用户行为主体、发生时间、发生的页面、上下滚动页面、移动或点击鼠标、页面停留时间、收藏、打印、保存、访问同一页面次数、复制粘贴文字操作、当前用户的搜索条件、搜索关键字对应的标题。

作为一种可选的实施方式,所述预处理包括:去除不完整数据,删除重复数据、图片、页面动画;对页面进行的打印、收藏、保存、下载操作,在获取后,将其转换为对应的数据格式保存在数据库中;

所述数据聚合包括:对正确、但无效的用户行为信息,采用基于规则的用户行为聚合算法进行过滤、整合。

作为一种可选的实施方式,所述建立用户行为数据本体模型,具体包括:

使用OWL-DL描述语言建立用户行为数据本体模型,并对本体模型进行分解,所述数据库采用开源的非关系型分布式数据库。

本发明实施例第二面公开了一种基于大数据挖掘的用户行为分析系统,包括:

采集单元,用于采集用户行为数据;

预处理单元,用于对用户行为数据采用并行运算模型进行预处理与聚合;

建模单元,用于根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。

作为一种可选的实施方式,所述系统还包括:

推理单元,用于对用户行为数据本体模型进行推理,找出用户最新兴趣数据。

作为一种可选的实施方式,所述用户行为数据包括用户行为主体、发生时间、发生的页面、上下滚动页面、移动或点击鼠标、页面停留时间、收藏、打印、保存、访问同一页面次数、复制粘贴文字操作、当前用户的搜索条件、搜索关键字对应的标题。

作为一种可选的实施方式,所述预处理包括:去除不完整数据,删除重复数据、图片、页面动画;对页面进行的打印、收藏、保存、下载操作,在获取后,将其转换为对应的数据格式保存在数据库中;

所述数据聚合包括:对正确、但无效的用户行为信息,采用基于规则的用户行为聚合算法进行过滤、整合。

作为一种可选的实施方式,所述建模单元具体用于:使用OWL-DL描述语言建立用户行为数据本体模型,并对本体模型进行分解,所述数据库采用开源的非关系型分布式数据库。

从以上技术方案可以看出,本发明实施例具有以下优点:

本发明实施例中,采集用户行为数据;对用户行为数据采用并行运算模型进行预处理与聚合;根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。由此可见,实施本发明实施例,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,从而实现有效与精准的用户推送。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明第一实施例公开的一种基于大数据挖掘的用户行为分析方法的流程示意图;

图2为本发明第二实施例公开的一种基于大数据挖掘的用户行为分析方法的流程示意图;

图3为本发明第三实施例公开的一种基于大数据挖掘的用户行为分析系统的结构示意图;

图4为本发明第四实施例公开的一种基于大数据挖掘的用户行为分析系统的结构示意图;

图5为本发明第五实施例公开的一种基于大数据挖掘的用户行为分析终端的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同的对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法或设备固有的其他步骤或单元。

在本文中提及实施例意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例相结合。

本发明实施例提供了一种基于大数据挖掘的用户行为分析方法,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,从而实现有效与精准的用户推送。

请参阅图1,图1是本发明第一实施例公开的一种基于大数据挖掘的用户行为分析方法的流程示意图。其中,图1所示的基于大数据挖掘的用户行为分析方法,可以包括以下步骤:

101、采集用户行为数据;

本发明实施例中,所述用户行为数据包括用户行为主体、发生时间、发生的页面、上下滚动页面、移动或点击鼠标、页面停留时间、收藏、打印、保存、访问同一页面次数、复制粘贴文字操作、当前用户的搜索条件、搜索关键字对应的标题。

102、对用户行为数据采用并行运算模型进行预处理与聚合;

本发明实施例中,所述预处理包括:去除不完整数据,删除重复数据、图片、页面动画;对页面进行的打印、收藏、保存、下载操作,在获取后,将其转换为对应的数据格式保存在数据库中。

所述数据聚合包括:对正确、但无效的用户行为信息,采用基于规则的用户行为聚合算法进行过滤、整合。

103、根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。

本发明实施例中,使用OWL-DL描述语言建立用户行为数据本体模型,并对本体模型进行分解,所述数据库采用开源的非关系型分布式数据库。

104、对用户行为数据本体模型进行推理,找出用户最新兴趣数据。

本发明实施例中,将聚合后的用户行为数据添加到用户行为数据本体模型中,对存储在数据库中的用户行为数据本体模型数据进行推理,找出用户最新兴趣数据。

在图1所描述的方法中,采集用户行为数据;对用户行为数据采用并行运算模型进行预处理与聚合;根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。由此可见,实施本发明实施例,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,从而实现有效与精准的用户推送。

下面为本发明系统实施例,本发明系统实施例用于执行本发明方法实施例一实现的方法,为了便于说明,仅示出了与本发明实施例相关的办法,具体计算细节未揭示的,请参照本发明实施例一至二。

请参阅图2,图2是本发明第二实施例公开的一种基于大数据挖掘的用户行为分析系统的结构图。如图2所示,该系统可以包括:

采集单元201,用于采集用户行为数据;

所述用户行为数据包括用户行为主体、发生时间、发生的页面、上下滚动页面、移动或点击鼠标、页面停留时间、收藏、打印、保存、访问同一页面次数、复制粘贴文字操作、当前用户的搜索条件、搜索关键字对应的标题。

预处理单元202,用于对用户行为数据采用并行运算模型进行预处理与聚合。

所述预处理包括:去除不完整数据,删除重复数据、图片、页面动画;对页面进行的打印、收藏、保存、下载操作,在获取后,将其转换为对应的数据格式保存在数据库中;

所述数据聚合包括:对正确、但无效的用户行为信息,采用基于规则的用户行为聚合算法进行过滤、整合。

建模单元203,用于根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。

本发明实施例中,使用OWL-DL描述语言建立用户行为数据本体模型,并对本体模型进行分解,所述数据库采用开源的非关系型分布式数据库。

推理单元204,用于对用户行为数据本体模型进行推理,找出用户最新兴趣数据。

本发明实施例中,将聚合后的用户行为数据添加到用户行为数据本体模型中,对存储在数据库中的用户行为数据本体模型数据进行推理,找出用户最新兴趣数据。

在图2所描述的系统中,采集单元采集用户行为数据;预处理单元对用户行为数据采用并行运算模型进行预处理与聚合;建模单元根据聚合后的用户行为数据,建立用户行为数据本体模型,并存储在数据库中。由此可见,实施本发明实施例,将云计算技术的强大处理能力和大规模数据存储能力、本体及其推理、知识发现方法相结合,实时分析海量用户行为数据,及时获取用户兴趣,从而实现有效与精准的用户推送。

本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中任何一种服务进程的监控方法的部分或全步骤。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中国所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本发明所必须的。

本发明实施例的方法的不足顺序可以根据实际需要进行调整、合并或删减。本发明实施例的终端的单元可以根据实际需要进行整合、进一步划分或删减。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参加其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,可通过其他的方式实现,例如,以上所描述的系统实施例是示意性的,例如所述单元的划分,为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的简介耦合或通信连接,可以是电性或其他的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以是不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

值得注意的是,上述基于物联网的多点测温仪上报系统和终端设备实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

另外,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read OnlyMemory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1