基于矩阵分解算法的偏好发掘方法及装置与流程

文档序号:17667090发布日期:2019-05-15 22:47阅读:175来源:国知局
基于矩阵分解算法的偏好发掘方法及装置与流程

本发明涉及大数据应用技术领域,特别涉及一种基于矩阵分解算法的偏好发掘方法及装置。



背景技术:

大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

存在很多有关偏好挖掘的现有技术。现有技术cn104766215b公开了一种综合性、多维度的货主选择量化方法,适用于会员从多个维度对货主进行客观、综合的评估量化。该发明充分考虑货主准时装卸货、承运业务次数、遭平台会员投诉次数、货款支付及信息发布的及时率、一次报价成单率等多个影响选择度量指标,基于组合最小二乘法和electre-ii法的多属性决策模型的指标权重划分方法定量确定各指标权重,通过精确的大数据挖掘分析和模型算法较好地处理了以物流服务为交易对象的电子商务平台合理评定货主可信度问题,使平台会员能够判断待选货主的综合情况并做出符合自己需求的选择。

现有技术cn104281718b公开了一种根据用户群体行为计算资讯相似度并对用户进行数据挖掘智能推荐的解决方法,通过收集用户行为数据并进行权重处理,把用户进行区间划分,通过大量的矩阵计算获取任意资讯之间的相似度,结合历史最近的点击资讯列表,从相关资讯库中选取和其历史偏好相似度高、时效性好的资讯实时推荐,同时对离线、缓存资讯进行分析,如此即可快速推荐相似的和相关度极高的资讯给用户。

现有技术cn104699693b获取用户的项目评分数据集,项目评分数据集包括用户对项目的评分;获得用户-项目评分数据集中每个节点与一待推荐用户节点的第一相关性权重wi,第一相关性权重为同一类项目中的相关性权重;计算用户-项目评分数据集中每个节点与待推荐用户节点的第二相关性权重we,第二相关性权重为不同类项目间的相关性权重;根据we和wi,得出每个节点的推荐度;根据推荐度确定待推荐项目。从二分图的特点出发,先用随机游走模型计算wi,将用户隐式分类;其次为避免反复计算节点间的相关性,直接计算待推荐用户与邻近用户的相关性作为we,充分挖掘了用户的潜在偏好项目节点,提高了推荐质量。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。



技术实现要素:

本发明的目的在于提供一种基于矩阵分解算法的偏好发掘方法及装置,从而克服现有技术的缺点。

本发明提供了一种基于矩阵分解算法的偏好发掘方法,基于矩阵分解算法的偏好发掘方法包括如下步骤:

由移动终端通过社交网络收集与偏好发掘相关的数据;

由偏好发掘服务器接收移动终端发送的身份信息以及地理位置信息;

由偏好发掘服务器基于地理位置信息将移动终端分成多个组;

由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息;

由移动终端接收偏好发掘相关信息传输寻呼消息,其中,每个移动终端组中的多个移动终端接收的偏好发掘相关信息传输寻呼消息中包括相同的组身份标志;

在移动终端接收到偏好发掘相关信息传输寻呼消息之后,由移动终端随机生成随机退回时间;

在随机退回时间之后,由移动终端向偏好发掘服务器发送数据传输接入请求;

由移动终端接收数据传输确认消息,其中,数据传输确认消息是由偏好发掘服务器响应于数据传输接入请求而发送的;

在接收到数据传输确认消息之后,由移动终端向偏好发掘服务器发送与偏好发掘相关的数据;

由偏好发掘服务器基于与偏好发掘相关的数据,发现隐藏在数据中关联用户与物品之间的偏好关系,并基于偏好关系来生成推荐信息。

优选地,上述技术方案中,与偏好发掘相关的数据包括:社交关系、人口统计学信息配置项以及用户的消费记录等隐因子项。

优选地,上述技术方案中,由偏好发掘服务器基于地理位置信息将移动终端分成多个组具体包括:

由偏好发掘服务器基于地理位置信息确定移动终端的地理位置;

由偏好发掘服务器基于移动终端的地理位置,确定位于预定范围内的移动终端;

由偏好发掘服务器将位于预定范围内的移动终端划分成一个组。

优选地,上述技术方案中,由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息具体包括如下步骤:

由偏好发掘服务器针对多个移动终端组中的每个移动终端组生成组身份标志;

由偏好发掘服务器向每个移动终端组中的每个移动终端分配组身份标志,其中,每个移动终端组中的每个移动终端都具有相同的组身份标志。

优选地,上述技术方案中,如果移动终端没有要发送的数据,则当移动终端接收到偏好发掘相关信息传输寻呼消息之后,由移动终端停止与偏好挖掘有关的操作。

本发明提供了一种基于矩阵分解算法的偏好发掘装置,其特征在于:基于矩阵分解算法的偏好发掘装置包括:

用于由移动终端通过社交网络收集与偏好发掘相关的数据的单元;

用于由偏好发掘服务器接收移动终端发送的身份信息以及地理位置信息的单元;

用于由偏好发掘服务器基于地理位置信息将移动终端分成多个组的单元;

用于由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息的单元;

用于由移动终端接收偏好发掘相关信息传输寻呼消息的单元,其中,每个移动终端组中的多个移动终端接收的偏好发掘相关信息传输寻呼消息中包括相同的组身份标志;

用于在移动终端接收到偏好发掘相关信息传输寻呼消息之后的单元,由移动终端随机生成随机退回时间;

用于在随机退回时间之后,由移动终端向偏好发掘服务器发送数据传输接入请求的单元;

用于由移动终端接收数据传输确认消息的单元,其中,数据传输确认消息是由偏好发掘服务器响应于数据传输接入请求而发送的;

用于在接收到数据传输确认消息之后,由移动终端向偏好发掘服务器发送与偏好发掘相关的数据的单元;

用于由偏好发掘服务器基于与偏好发掘相关的数据,发现隐藏在数据中关联用户与物品之间的偏好关系,并基于偏好关系来生成推荐信息的单元。

优选地,上述技术方案中,与偏好发掘相关的数据包括:社交关系、人口统计学信息配置项以及用户的消费记录等隐因子项。

优选地,上述技术方案中,由偏好发掘服务器基于地理位置信息将移动终端分成多个组具体包括:

由偏好发掘服务器基于地理位置信息确定移动终端的地理位置;

由偏好发掘服务器基于移动终端的地理位置,确定位于预定范围内的移动终端;

由偏好发掘服务器将位于预定范围内的移动终端划分成一个组。

优选地,上述技术方案中,由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息具体包括如下步骤:

由偏好发掘服务器针对多个移动终端组中的每个移动终端组生成组身份标志;

由偏好发掘服务器向每个移动终端组中的每个移动终端分配组身份标志,其中,每个移动终端组中的每个移动终端都具有相同的组身份标志。

优选地,上述技术方案中,如果移动终端没有要发送的数据,则当移动终端接收到偏好发掘相关信息传输寻呼消息之后,由移动终端停止与偏好挖掘有关的操作。

与现有技术相比,本发明具有如下有益效果:本发明研究了矩阵分解算法对处理大规模用户与物品评分矩阵的推荐效果,在组合预测模型中加入社交关系、人口统计学信息配置项、用户的消费记录等隐因子项,通过对社交网络进行数据挖掘,发现隐藏在数据中关联用户与物品之间的偏好关系,然后对用户建模分析,选择合适的推荐引擎进行个性化物品推荐。根据用户的当前物品浏览行为智能推荐相关物品,如果是点击物品,则推荐和当前物品最相关的物品到用户浏览页中,如果是下拉刷新,则结合历史最近的点击物品列表,从相关物品库中选取和其历史偏好相似度高、时效性好的物品实时推荐给用户。通过收集多种用户的行为数据来计算用户对某一条物品的喜爱程度,通过不同用户对某一条物品的喜爱程度评分能计算出两条物品间的相似程度;可以离线计算解决了海量行为数据问题;缓存物品相关性表,从而可以使得用户有相应点击/刷新行为的时候快速推荐相似的和相关的物品给用户。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是根据本发明的基于矩阵分解算法的偏好发掘方法的方法流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1是根据本发明的基于矩阵分解算法的偏好发掘方法的方法流程图。如图所示,本发明的方法包括:

步骤101:由移动终端通过社交网络收集与偏好发掘相关的数据;

步骤102:由偏好发掘服务器接收移动终端发送的身份信息以及地理位置信息;

步骤103:由偏好发掘服务器基于地理位置信息将移动终端分成多个组;

步骤104:由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息;

步骤105:由移动终端接收偏好发掘相关信息传输寻呼消息,其中,每个移动终端组中的多个移动终端接收的偏好发掘相关信息传输寻呼消息中包括相同的组身份标志;

步骤106:在移动终端接收到偏好发掘相关信息传输寻呼消息之后,由移动终端随机生成随机退回时间;

步骤107:在随机退回时间之后,由移动终端向偏好发掘服务器发送数据传输接入请求;

步骤108:由移动终端接收数据传输确认消息,其中,数据传输确认消息是由偏好发掘服务器响应于数据传输接入请求而发送的;

步骤109:在接收到数据传输确认消息之后,由移动终端向偏好发掘服务器发送与偏好发掘相关的数据;

步骤110:由偏好发掘服务器基于与偏好发掘相关的数据,发现隐藏在数据中关联用户与物品之间的偏好关系,并基于偏好关系来生成推荐信息。

优选地,上述技术方案中,与偏好发掘相关的数据包括:社交关系、人口统计学信息配置项以及用户的消费记录等隐因子项。

优选地,上述技术方案中,由偏好发掘服务器基于地理位置信息将移动终端分成多个组具体包括:

由偏好发掘服务器基于地理位置信息确定移动终端的地理位置;

由偏好发掘服务器基于移动终端的地理位置,确定位于预定范围内的移动终端;

由偏好发掘服务器将位于预定范围内的移动终端划分成一个组。

优选地,上述技术方案中,由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息具体包括如下步骤:

由偏好发掘服务器针对多个移动终端组中的每个移动终端组生成组身份标志;

由偏好发掘服务器向每个移动终端组中的每个移动终端分配组身份标志,其中,每个移动终端组中的每个移动终端都具有相同的组身份标志。

优选地,上述技术方案中,如果移动终端没有要发送的数据,则当移动终端接收到偏好发掘相关信息传输寻呼消息之后,由移动终端停止与偏好挖掘有关的操作。

本发明提供了一种基于矩阵分解算法的偏好发掘装置,其特征在于:基于矩阵分解算法的偏好发掘装置包括:

用于由移动终端通过社交网络收集与偏好发掘相关的数据的单元;

用于由偏好发掘服务器接收移动终端发送的身份信息以及地理位置信息的单元;

用于由偏好发掘服务器基于地理位置信息将移动终端分成多个组的单元;

用于由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息的单元;

用于由移动终端接收偏好发掘相关信息传输寻呼消息的单元,其中,每个移动终端组中的多个移动终端接收的偏好发掘相关信息传输寻呼消息中包括相同的组身份标志;

用于在移动终端接收到偏好发掘相关信息传输寻呼消息之后的单元,由移动终端随机生成随机退回时间;

用于在随机退回时间之后,由移动终端向偏好发掘服务器发送数据传输接入请求的单元;

用于由移动终端接收数据传输确认消息的单元,其中,数据传输确认消息是由偏好发掘服务器响应于数据传输接入请求而发送的;

用于在接收到数据传输确认消息之后,由移动终端向偏好发掘服务器发送与偏好发掘相关的数据的单元;

用于由偏好发掘服务器基于与偏好发掘相关的数据,发现隐藏在数据中关联用户与物品之间的偏好关系,并基于偏好关系来生成推荐信息的单元。

优选地,上述技术方案中,与偏好发掘相关的数据包括:社交关系、人口统计学信息配置项以及用户的消费记录等隐因子项。

优选地,上述技术方案中,由偏好发掘服务器基于地理位置信息将移动终端分成多个组具体包括:

由偏好发掘服务器基于地理位置信息确定移动终端的地理位置;

由偏好发掘服务器基于移动终端的地理位置,确定位于预定范围内的移动终端;

由偏好发掘服务器将位于预定范围内的移动终端划分成一个组。

优选地,上述技术方案中,由偏好发掘服务器向多个移动终端组中的每个移动终端组中的多个移动终端发送偏好发掘相关信息传输寻呼消息具体包括如下步骤:

由偏好发掘服务器针对多个移动终端组中的每个移动终端组生成组身份标志;

由偏好发掘服务器向每个移动终端组中的每个移动终端分配组身份标志,其中,每个移动终端组中的每个移动终端都具有相同的组身份标志。

优选地,上述技术方案中,如果移动终端没有要发送的数据,则当移动终端接收到偏好发掘相关信息传输寻呼消息之后,由移动终端停止与偏好挖掘有关的操作。

本领域技术人员将理解,信息和信号可使用各种不同技术和技艺中的任何一种来表示。例如,贯穿上面描述始终可能被述及的数据、指令、命令、信息、信号、位(比特)、码元、和码片可由电压、电流、电磁波、磁场或磁粒子、光场或光粒子、或其任何组合来表示。

本领域技术人员将进一步领会,结合本文公开所描述的各种解说性逻辑框、模块、电路、和算法步骤可被实现为电子硬件、计算机软件、或两者的组合。为清楚地解说硬件与软件的这一可互换性,以上已经以其功能性的形式一般化地描述了各种解说性组件、框、模块、电路、和步骤。此类功能性是被实现为硬件还是软件取决于具体应用和加诸于整体系统的设计约束。技术人员可针对每种特定应用以不同方式来实现所描述的功能性,但此类实现决策不应被解读为致使脱离本公开的范围。

结合本文公开描述的各种解说性逻辑框、模块、以及电路可用被设计成用于执行本文中描述的功能的通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其他可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如dsp与微处理器的组合、多个微处理器、与dsp核心协作的一个或更多个微处理器、或任何其他此类配置。

结合本文公开描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中实施。软件模块可驻留在ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读写信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。

在一个或更多个示例性设计中,所描述的功能可以在硬件、软件、固件、或其任何组合中实现。如果在软件中实现,则各功能可以作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被通用或专用计算机访问的任何可用介质。作为示例而非限定,此类计算机可读介质可以包括ram、rom、eeprom、cd-rom或其他光盘存储、磁盘存储或其他磁存储设备、或能被用来携带或存储指令或数据结构形式的期望程序代码手段且能被通用或专用计算机、或者通用或专用处理器访问的任何其他介质。另外,任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(dsl)、或诸如红外、无线电、以及微波之类的无线技术从web站点、服务器、或其他远程源传送的,那么该同轴电缆、光纤电缆、双绞线、dsl、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的,盘(disk)和碟(disc)包括压缩碟(cd)、激光碟、光碟、数字多用碟(dvd)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。以上组合也应被包括在计算机可读介质的范围内。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1