图书信息关联推荐方法、服务器及系统的制作方法

文档序号:6424258阅读:136来源:国知局
专利名称:图书信息关联推荐方法、服务器及系统的制作方法
技术领域
本申请涉及网络通信技术领域, 特别是涉及一种图书信息关联推荐方法、服务器及系统。
背景技术
用户在选择电子商务网站浏览并购买目标图书时,网站通常会同时向用户提供与该目标图书具有强相关性的其它图书列表,以便于用户在一次购买图书的过程中,可以快速获得该用户感兴趣的图书,省却用户为了检索其它目标图书所耗费的时间,也可以相应减少网站服务器为海量用户提供检索服务所耗费的系统资源。现有技术中,在向用户提供与目标图书的相关的其它图书列表时,需要进行图书间相关性的统计,即获得网站内与目标图书相关性最强的若干图书。通常采用的方法为,基于对整个用户空间购买历史记录的统计计算,以目标图书集合在用户一次购买图书列表中同时出现的概率作为计算基础,得到一系列关联关系规则测度描述,根据该关联关系规则测度判定在目标图书页面中是否推荐其它图书。例如,两个图书产品A和B,当判定在选择图书A时是否推荐图书B,则需要检索关联规则,查询是否存在以图书A为前件,以图书B为后件的关联规则(A — B)存在,如果存在则将图书B及相应的关联规则测度放入图书A的候选推荐列表中,然后按照推荐列表中关联规则测度的值从高到低确定排位在前的若干图书,如果图书B为若干图书中的一个,则将图书B放入图书A的最终推荐列表中。然而,现有技术中的推荐列表中的图书排序仅考虑了图书间的直接统计测度,也就是在进行排序时参考的维度较少,没有考虑更为复杂的语义信息;同时,现有技术中使用的图书间直接统计测度通常为可信度,可信度是一个较弱的相关性测度,难以有效体现图书产品间的相关性。由此导致现有推荐列表中的排序准确性不高,推荐效果不好,用户往往需要重新检索才能得到感兴趣的图书,这增加了网站服务器为处理检索而导致的资源耗费。

发明内容
为了解决上述技术问题,本申请实施例提供了一种图书信息关联推荐方法、服务器及系统,以解决现有图书关联信息推荐不准确,导致用户检索量的增加,使服务器耗费更多的系统资源的问题。为了解决上述技术问题,本申请实施例公开了一种图书信息关联推荐方法,是这样实现的—种图书信息关联推荐方法,保存预先生成的图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度,所述方法包括接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识;
根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项;对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识;输出所述获取的与目标图书的图书标识对应的推荐图书标识。为了解决上述技术问题,本申请实施例还公开了一种图书信息关联推荐服务器,是这样实现的一种图书信息关联推荐服务器,包括·生成单元,用于预先生成图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度;保存单元,用于保存所述生成单元生成的图书推荐列表;接收单元,用于接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识;查找单元,用于根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项;获取单元,用于对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识;输出单元,用于输出所述获取的与目标图书的图书标识对应的推荐图书标识。为了解决上述技术问题,本申请实施例还公开了一种图书信息关联推荐系统,是这样实现的一种图书信息关联推荐系统,包括推荐计算服务器、WEB服务器、和检索服务器,所述推荐计算服务器,用于生成图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度;所述WEB服务器,用于接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识,并将所述检索请求发送给所述检索服务器;所述检索服务器,用于保存预先生成的图书推荐列表,并在接收到所述检索请求后,根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项,对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识,并向所述WEB服务器输出所述获取的与目标图书的图书标识对应的推荐图书标识。由上述实施例可以看出,本申请实施例中保存预先生成的图书推荐列表,该图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,该相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度,接收包含用户所选择的目标图书的图书标识的图书推荐列表的检索请求,根据目标图书的图书标识查找所述图书推荐列表,获取包含目标图书的图书标识的表项,对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与目标图书的图书标识对应的推荐图书标识,输出获取的与目标图书的图书标识对应的推荐图书标识。应用本申请实施例进行图书推荐,由于图书推荐列表中图书排序考虑了图书间的多维统计测度,包括产品级余弦相关性测度和类目级余弦相关性测度,因此提高了排序准确性和相应的图书推荐效果,相应减少了用户为获取感兴趣图书所要进行的检索,减少了网站服务器为进行检索对系统资源的耗费。


为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本申请图书信息关联推荐方法的第一实施例流程图;图2为本申请应用本申请图书信息关联推荐方法实施例的一个网络架构示意图;图3为本申请图书信息关联推荐方法的第二实施例流程图; 图4A为本申请图书信息关联推荐服务器的实施例框图;图4B为图4A中生成单元的实施例框图;图4C为图4A中获取单元的实施例框图;图5为本申请图书信息关联推荐系统的实施例框图。
具体实施例方式本发明如下实施例提供了一种图书信息关联推荐方法、服务器及系统。为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。参见图1,为本申请图书信息关联推荐方法的第一实施例流程图,其具体包括以下步骤步骤101 :保存预先生成的图书推荐列表,该图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,该相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。在生成图书推荐列表时,查找图书购买信息,从图书购买信息中提取并生成预设统计时间内的若干购买记录,每一条购买记录中包含用户标识及对应的购买时间和图书标识;查找图书类目信息,从图书类目信息中检索购买记录中的每一条记录中的图书标识对应的类目标识,生成若干类目记录,每一条类目记录中包含图书标识和对应的类目标识;根据购买记录和类目记录生成图书关联规则数据表和类目关联规则数据表;根据图书关联规则数据表和类目关联规则数据表生成所述图书推荐列表。具体的,在生成图书关联规则数据表时,根据购买记录中的购买时间生成以季度为统计单位的图书产品级事务记录,每一个图书产品级事务记录中包括用户标识、季节标识和图书标识;统计图书产品级事务记录中每一个图书标识对应的不同用户标识和季节标识的数目,将该数目作为图书标识的产品一项集绝对支持度;统计图书产品级事务记录中具有相同用户标识和季节标识的至少两个图书标识;根据至少两个图书标识中任意不重复的两个图书标识生成图书产品二项集记录;统计图书产品二项集记录中每一条记录的重复数目,将重复数目作为记录对应的两个图书标识的产品二项集绝对支持度;计算图书产品二项集记录中每一条记录的产品级余弦相关性测度,产品级余弦相关性测度为每一个图书产品二项集记录中的产品二项集绝对支持度与图书产品二项集记录中两个图书标识中的每一个图书标识对应的产品一项集绝对支持度乘积的平方根的比值;生成图书关联规则数据表,图书关联规则数据表中的每一条记录包括所述图书产品二项集记录中的每一条记录中的两个图书标识,及两个图书标识对应的产品二项集绝对支持度和产品级余弦相关性测度。具体的,在生成类目关联规则数据表时,融合类目记录和所述图书产品级事务记录中具有相同产品标识的记录,生成图书类目级事务记录,每一个图书类目级事务记录中包含用户标识、季节标识和类目标识;统计图书类目级事务记录中每一个类目标识对应的不同用户标识和季节标识的数目,将数目作为类目标识的类目一项集绝对支持度;统计图书类目级事务记录中具有相同用户标识和季节标识的至少两个类目标识;根据至少两个类目标识中任意不重复的两个类目标识生成图书类目二项集记录;统计图书类目二项集记录 中每一条记录的重复数目,将重复数目作为记录对应的两个类目标识的类目二项集绝对支持度;计算图书类目二项集记录中每一条记录的类目级余弦相关性测度,类目级余弦相关性测度为每一个图书类目二项集记录中的类目二项集绝对支持度与所述图书类目二项集记录中两个类目标识中的每一个类目标识对应的类目一项集绝对支持度乘积的平方根的比值;生成类目关联规则数据表,该类目关联规则数据表中的每一条记录包括图书类目二项集记录中的每一条记录中的两个类目标识,及两个类目标识对应的类目二项集绝对支持度和类目级余弦相关性测度。具体的,在根据图书关联规则数据表和类目关联规则数据表生成图书推荐列表时,根据图书关联规则数据表中的每一条记录中的两个图书标识查找所述类目记录,获取两个图书标识对应的类目标识;根据获取的类目标识查找类目关联规则数据表,获得相应的类目级余弦相关测度;生成图书推荐列表,图书推荐列表中的每一条记录包括两个图书标识、对应的产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。步骤102 :接收图书推荐列表的检索请求,该检索请求中包含用户所选择的目标图书的图书标识。步骤103 :根据目标图书的图书标识查找图书推荐列表,获取包含目标图书的图书标识的表项。步骤104 :对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识。其中,在对获取的表项中的相关性信息按照预设策略进行排序时,当目标图书的图书标识对应的产品一项集绝对支持度大于I时,按照优先级从高到低分别为产品级余弦相关性测度、类目级余弦相关性测度和产品二项集绝对支持度的顺序对获取的表项进行排序;当目标图书的图书标识对应的产品一项集绝对支持度不大于I时,按照优先级从高到低分别为类目级余弦相关性测度、产品二项集绝对支持度和产品级余弦相关性测度的顺序对获取的表项进行排序。
步骤105 :输出获取的与目标图书的图书标识对应的推荐图书标识。参见图2,为应用本申请图书信息关联推荐方法实施例的一个网络架构示意图该网络架构中包括客户端浏览器、WEB服务器、图书交易数据库服务器、图书类目数据库服务器、图书关联推荐检索服务器和离线图书关联推荐服务器。应用该网络架构进行图书信息关联推荐的过程如下用户通过客户端浏览器与电子商务网站的WEB服务器进行交互,向WEB服务器发送浏览、搜索、购买等请求信息;WEB服务器接收到请求信息后,向用户反馈相应的应答信息;其中,用户的购买请求信息发送到图书交易数据库服务器进行存储,图书产品的类目信息存储在图书类目数据库服务器中。离线图书关联推荐服务器可以定期从图书交易数据库服务器和图书类目数据库 服务器中获取图书购买数据和图书类目数据,并根据获取的图书购买数据和图书类目数据计算图书间的关联关系,生成每一个图书的关联推荐列表,将该关联推荐列表更新到图书关联推荐检索服务器中;由于定期计算图书间的关联关系所需要的数据为海量数据,因此该离线图书关联推荐服务器可以采用集群式计算方式,可以具体由分布式硬件集群、分布式操作环境和相应的语言程序组成。当用户通过客户端浏览器选择购买目标图书时,会向WEB服务器发送获取目标图书对应的推荐列表的请求,WEB服务器接收到该请求后,向图书关联推荐检索服务器发送检索目标图书的推荐列表的请求,图书关联推荐列表检索服务器将检索结果反馈给WEB服务器,由WEB服务器将检索结果嵌入到用户在客户端浏览器上浏览的网页内,并将该网页反馈给客户端浏览器。参见图3,为本申请图书信息关联推荐方法的第二实施例流程图,该实施例结合图2描述图书信息关联推荐过程步骤301 :查找图书购买信息,从图书购买信息中提取并生成预设统计时间内的若干购买记录,每一条购买记录中包含用户标识及对应的购买时间和图书标识。在生成网络中的图书推荐列表时,查找图书交易数据库服务器中存储的用户图书购买信息,其中,每一项图书购买信息记录可以包含用户ID(标识)、用户地址、图书ID、图书价格、购买时间、购买数量等,从图书交易数据库服务中检索出一年内的用户图书购买信息,并抽取出每一项图书购买信息记录中的用户ID、图书ID和购买时间,根据抽取出的信息生成购买记录RE表,RE表中的表项模式可以表示为〈用户ID,购买时间,图书ID>,RE表中的表项数量与从图书交易数据库服务器中检索出的用户图书购买信息记录的数量一致。步骤302 :查找图书类目信息,从图书类目信息中检索购买记录中的每一条记录中的图书标识对应的类目标识,生成若干类目记录,每一条类目记录中包含图书标识和对应的类目标识。根据RE表中每个表项的图书ID查找图书类目数据库服务器,从中检索出与每个图书ID对应的类目ID,生成类目记录Pcat表,Pcat表中的每一条记录包含RE表中每个图书ID及其对应的类目ID,PCat表中的表项模式可以表示为〈图书ID,类目ID〉。步骤303 :根据购买记录和类目记录生成图书关联规则数据表和类目关联规则数据表。在生成图书关联规则数据表时,按照如下过程进行
生成以季度为统计单位的图书产品级事务记录TP表。基于生成的RE表生成事务信息,将RE表的每一个表项中的时间ID按照季节进行分类,其中每个用户在一个季节中购买的图书集合形成一个事务(即对一个用户来说最多有四类事务);每一类事务的标识通过{用户ID,季节ID}表示,根据上述分类结果生成产品级事务记录TP表,TP表中的表项模式可以表示为〈用户ID,季节ID,图书ID> ;统计产品一项集绝对支持度。基于生成的TP表,TP表中的每一个表项中的图书ID作为一个产品一项集,统计包含一个产品一项集的事务数(即不同{用户ID,季节ID}的个数),将统计出的事务数作为该产品一项集的绝对支持度,根据上述支持度信息生成产品一项集绝对支持度OneIAS表,OneIAS表中的表项模式可以表示为〈产品ID,产品一项集绝对支持度 >,由此可以生成网络中每一种图书的产品一项集绝对支持度;生成图书产品二项集记录TwoI表。基于生成的TP表,查找TP表中具有相同事务标识的图书ID,查找到的图书ID可能不止两个,因此根据查找到的图书ID中的任意两个不重复的图书ID生成图书产品二项集记录TwoI表,该TwoI表中每一条记录的两个图书ID 属于同一个事务,该两个图书ID对应一个产品二项集,TwoI表中的表项模式可以表不为〈图书ID_1,图书ID_2> ;统计产品二项集绝对支持度。基于TwoI表,统计该TwoI中每一条记录的重复数量,即包含每一个产品二项集的事务数,将该事务数作为产品二项集绝对支持度,根据上述支持度信息生成产品二项集绝对支持度TwoIAS表,TwoIAS表中的表项模式可以表示为〈图书ID_1,图书ID_2,产品二项集绝对支持度> ;计算产品级余弦相关性测度。对于TwoI表中的任一产品二项集,例如,可以表示为{A,B},其中蕴含两个关联规则,分别为A — B与B — A,计算上述两个关联规则的余弦相关性测度。在计算A — B产品级余弦相关性测度时,根据A和B的图书ID查找TwoIAS表,获取{A,B}的产品二项集绝对支持度,然后分别根据A和B的图书ID查找OneIAS表,获取A和B的产品一项集绝对支持度,将产品二项集绝对支持度与两个产品一项集绝对支持度的乘积的平方根的比值作为A — B的产品级余弦相关性测度,B-A的余弦相关性测度等于A — B的余弦相关性测度。根据上述计算的产品级余弦相关性测度生成产品级余弦相关性测度TwoICos表,TwoICos表中的表项可以表示为〈图书ID_1,图书ID_2,产品级余弦相关性测度> ;生成图书关联规则数据表。根据产品二项集记录TwoI表中的〈图书ID_1,图书ID_2>关联TwoIAS表与TwoICos表,即将TwoIAS表与TwoICos表中具有相同产品二项集的记录合并,生成图书关联规则数据PAR表,PAR表中的表项可以表示为〈图书ID_1,图书ID_2,产品二项集绝对支持度,产品级余弦相关性测度>。在生成类目关联规则数据表时,按照如下过程进行生成以季度为统计单位的图书类目级事务记录TP表。基于生成的TP表,根据TP表中的表项〈用户ID,季节ID,产品ID>中的产品ID,查找PCat表中的产品ID与类目ID的对应关系,将TP表表项中的产品ID替换为对应的类目ID,生成图书类目级事务记录TC表,TC表中的表项模式可以表示为〈用户ID,季节ID,类目ID>,对上述TC表进行处理,使其中的每个表项都为不重复的表项,即仅保留重复表项中的一个表项;统计类目一项集绝对支持度。基于生成的TC表,TC表中的每一个表项中的类目ID作为一个类目一项集,统计包含一个类目一项集的事务数(即不同{用户ID,季节ID}的个数),将统计出的事务数作为该类目一项集的绝对支持度,根据上述支持度信息生成类目一项集绝对支持度OneDAS表,OneDAS表中的表项模式可以表不为〈类目ID,类目一项集绝对支持度 >,由此可以生成网络中每一种图书的类目一项集绝对支持度;生成图书类目二项集记录TwoD表。基于生成的TC表,查找TC表中具有相同事务标识的类目ID,查找到的类目ID可能不止两个,因此根据查找到的类目ID中的任意两个不重复的类目ID生成图书类目二项集记录TwoD表,该TwoD表中每一条记录的两个类目ID属于同一个事务,该两个类目ID对应一个类目二项集,TwoD表中的表项模式可以表不为〈类目ID_1,类目ID_2> ;统计类目二项集绝对支持度。基于TwoD表,统计该TwoD中每一条记录的重复数量,即包含每一个类目二项集的事务数,将该事务数作为类目二项集绝对支持度,根据上述支持度信息生成类目二项集绝对支持度TwoDAS表,TwoDAS表中的表项模式可以表示为〈类目ID_1,类目ID_2,类目二项集绝对支持度〉; 计算类目级余弦相关性测度。对于TwoD表中的任一类目二项集,例如,可以表示为{X,Y},其中蕴含两个关联规则,分别为X — Y与X — Y,计算上述两个关联规则的余弦相关性测度。在计算X — Y类目级余弦相关性测度时,根据X和Y的类目ID查找TwoDAS表,获取{X,Y}的类目二项集绝对支持度,然后分别根据X和Y的类目ID查找OneDAS表,获取X和Y的类目一项集绝对支持度,将类目二项集绝对支持度与两个类目一项集绝对支持度的乘积的平方根的比值作为X — Y的类目级余弦相关性测度,Y-X的余弦相关性测度等于X — Y的余弦相关性测度。根据上述计算的类目级余弦相关性测度生成类目级余弦相关性测度TwoDCos表,TwoDCos表中的表项可以表示为〈类目ID_1,类目ID_2,类目级余弦相关性测度> ;生成类目关联规则数据表。根据类目二项集记录TwoD表中的〈类目ID_1,类目ID_2>关联TwoDAS表与TwoDCos表,即将TwoDAS表与TwoDCos表中具有相同类目二项集的记录合并,生成类目关联规则数据CAR表,CAR表中的表项可以表示为〈类目ID_1,类目ID_2,类目二项集绝对支持度,类目级余弦相关性测度>。步骤304 :根据图书关联规则数据表和类目关联规则数据表生成图书推荐列表。融合PAR表、PCat表和CAR表。据PAR表中的每一条记录中的两个图书ID查找PCat表,获取两个图书ID对应的类目ID,根据获取的类目ID查找CAR表,获得相应的类目级余弦相关测度,据此生成图书推荐列表PArC表,PArC表中的表项可以表示为〈图书ID_1,图书ID_2,产品二项集绝对支持度,产品级余弦相关性测度,类目级余弦相关性测度>。步骤305 :保存预先生成的图书推荐列表,该图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,该相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。前述步骤在离线图书关联推荐服务器内完成,生成的图书推荐列表PArC表由离线图书关联推荐服务器发送到图书关联推荐检索服务器进行保存。步骤306 :接收图书推荐列表的检索请求,该检索请求中包含用户所选择的目标图书的图书标识。
当用户通过客户端浏览器选择购买目标图书后,WEB服务器向图书关联推荐检索服务器发送包含目标图书的图书ID的检索请求。步骤307 :根据目标图书的图书标识查找图书推荐列表,获取包含目标图书的图书标识的表项。图书关联推荐检索服务器接收到检索请求后,根据目标图书的图书ID查找PArC表,提取该图书ID所在的表项,这些表项中的除目标图书的图书ID外的其它图书ID即为该目标图书的关联图书的图书ID。步骤308 :对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应·的推荐图书标识。其中,当目标图书的图书ID对应的产品一项集绝对支持度大于I时,按照优先级从高到低分别为产品级余弦相关性测度、类目级余弦相关性测度和产品二项集绝对支持度的顺序对获取的表项进行排序,根据排序结果,例如,从中获取排在前十位的图书ID ;当目标图书的图书ID对应的产品一项集绝对支持度不大于I时,按照优先级从高到低分别为类目级余弦相关性测度、产品二项集绝对支持度和产品级余弦相关性测度的顺序对获取的表项进行排序,根据排序结果,例如,从中获取排在前十位的图书ID。步骤309 :输出获取的与目标图书的图书标识对应的推荐图书标识。图书关联推荐检索服务器将步骤308中获取的图书ID作为与目标图书最相关的图书的图书ID反馈给WEB服务器,由WEB服务器将上述图书ID嵌入客户端浏览器所浏览的网页,从而实现对用户所选择目标图书的相关推荐。需要说明的是,除了上述实施例中示出的计算余弦相关性测度的方式外,也可以采用计算覆盖度或提升度的方式。其中,覆盖度可以根据二项集绝对支持度与二项集中的后项的一项集绝对支持度的比值获得,提升度可以根据二项集绝对支持度与两个一项集绝对支持度的乘积的比值获得。对于上述采用哪一种测度,本申请实施例不进行限制,本申请实施例的核心在于分别从产品和类目的维度生成图书推荐列表,因此提高了排序准确性和相应的图书推荐效果,相应减少了用户为获取感兴趣图书所要进行的检索,减少了网站服务器为进行检索对系统资源的耗费。与本申请图书信息关联推荐方法的实施例相对应,本申请还提供了图书信息关联推荐服务器及系统的实施例。参见图4A,为本申请图书信息关联推荐服务器的实施例框图该服务器包括生成单元410、保存单元420、接收单元430、查找单元440、获取单元450和输出单元460。其中,生成单元410,用于预先生成图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度;保存单元420,用于保存所述生成单元生成的图书推荐列表;接收单元430,用于接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识;查找单元440,用于根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项;获取单元450,用于对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识;输出单元460,用于输出所述获取的与目标图书的图书标识对应的推荐图书标识。参见图4B,为图4A中生成单元的实施例框图该生成单元410可以包括图书购买信息查找单元411,用于查找图书购买信息,从所述图书购买信息中提取并生成预设统计时间内的若干购买记录,每一条购买记录中包含用户标识及对应的购买时间和图书标识;图书类目信息查找单元412,用于查找图书类目信息,从所述图书类目信息中检索所述购买记录中的每一条记录中的图书标识对应的类目标识,生成若干类目记录,每一条类目记录中包含图书标识和对应的类目标识;第一数据表生成单元413,用于根据所述购买记录和类目记录生成图书关联规则数据表;第二数据表生成单元414,用于根据所述购买记录和类目记录生成类目关联规则数据表;推荐列表生成单元415,用于根据所述图书关联规则数据表和类目关联规则数据表生成所述图书推荐列表。具体的,所述第一数据表生成单元413可以包括(图4B中未示出)图书产品级事务记录生成单元,用于根据所述购买记录中的购买时间生成以季度为统计单位的图书产品级事务记录,每一个图书产品级事务记录中包括用户标识、季节标识和图书标识;图书产品级事务记录统计单元,用于统计所述图书产品级事务记录中每一个图书标识对应的不同用户标识和季节标识的数目,将所述数目作为所述图书标识的产品一项集绝对支持度,以及统计所述图书产品级事务记录中具有相同用户标识和季节标识的至少两个图书标识;图书产品二项集记录生成单元,用于根据所述至少两个图书标识中任意不重复的两个图书标识生成图书产品二项集记录;图书产品二项集记录统计单元,用于统计所述图书产品二项集记录中每一条记录的重复数目,将所述重复数目作为所述记录对应的两个图书标识的产品二项集绝对支持度;产品级余弦相关性测度计算单元,用于计算所述图书产品二项集记录中每一条记录的产品级余弦相关性测度,所述产品级余弦相关性测度为每一个图书产品二项集记录中的产品二项集绝对支持度与所述图书产品二项集记录中两个图书标识中的每一个图书标识对应的产品一项集绝对支持度乘积的平方根的比值;图书关联规则数据表生成单元,用于生成所述图书关联规则数据表,所述图书关联规则数据表中的每一条记录包括所述图书产品二项集记录中的每一条记录中的两个图书标识,及所述两个图书标识对应的产品二项集绝对支持度和产品级余弦相关性测度。
具体的,所述第二数据表生成单元414可以包括(图4B中未示出):图书类目级事务记录生成单元,用于融合所述类目记录和所述图书产品级事务记录中具有相同产品标识的记录,生成图书类目级事务记录,每一个图书类目级事务记录中包含用户标识、季节标识和类目标识;图书类目级事务记录统计单元,用于统计所述图书类目级事务记录中每一个类目标识对应的不同用户标识和季节标识的数目,将所述数目作为所述类目标识的类目一项集绝对支持度,以及统计所述图书类目级事务记录中具有相同用户标识和季节标识的至少两个类目标识;图书类目二项集记录生成单元,用于根据所述至少两个类目标识中任意不重复的两个类目标识生成图书类目二项集记录;图书类目二项集记录统计单元,用于统计所述图书类目二项集记录中每一条记录的重复数目,将所述重复数目作为所述记录对应的两个类目标识的类目二项集绝对支持 度;类目级余弦相关性测度计算单元,用于计算所述图书类目二项集记录中每一条记录的类目级余弦相关性测度,所述类目级余弦相关性测度为每一个图书类目二项集记录中的类目二项集绝对支持度与所述图书类目二项集记录中两个类目标识中的每一个类目标识对应的类目一项集绝对支持度乘积的平方根的比值;类目关联规则数据表生成单元,用于生成所述类目关联规则数据表,所述类目关联规则数据表中的每一条记录包括所述图书类目二项集记录中的每一条记录中的两个类目标识,及所述两个类目标识对应的类目二项集绝对支持度和类目级余弦相关性测度。具体的,所述推荐列表生成单元415可以包括(图4B中未示出):类目记录查找单元,用于根据所述图书关联规则数据表中的每一条记录中的两个图书标识查找所述类目记录,获取所述两个图书标识对应的类目标识;类目关联规则数据表查找单元,用于根据获取的类目标识查找所述类目关联规则数据表,获得相应的类目级余弦相关测度;图书推荐列表生成单元,用于生成所述图书推荐列表,所述图书推荐列表中的每一条记录包括两个图书标识、对应的产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。参见图4C,为图4A中获取单元450的实施例框图该获取单元450包括第一排序单元451,用于当所述目标图书的图书标识对应的产品一项集绝对支持度大于I时,按照优先级从高到低分别为产品级余弦相关性测度、类目级余弦相关性测度和产品二项集绝对支持度的顺序对获取的表项进行排序;第二排序单元452,用于当所述目标图书的图书标识对应的产品一项集绝对支持度不大于I时,按照优先级从高到低分别为类目级余弦相关性测度、产品二项集绝对支持度和广品级余弦相关性测度的顺序对获取的表项进行排序。参见图5,为本申请图书信息关联推荐系统的实施例框图该系统包括推荐计算服务器510、WEB服务器520、和检索服务器530。其中,所述推荐计算服务器510,用于生成图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度;所述WEB服务器520,用于接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识,并将所述检索请求发送给所述检索服务器;所述检索服务器530,用于保存预先生成的图书推荐列表,并在接收到所述检索请求后,根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项,对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识,并向所述WEB服务器输出所述获取的与目标图书的图书标识对应的推荐图书标识。具体的,所述推荐计算服务器510可以包括(图5中未示出)图书购买信息查找单元,用于查找图书购买信息,从所述图书购买信息中提取并 生成预设统计时间内的若干购买记录,每一条购买记录中包含用户标识及对应的购买时间和图书标识;图书类目信息查找单元,用于查找图书类目信息,从所述图书类目信息中检索所述购买记录中的每一条记录中的图书标识对应的类目标识,生成若干类目记录,每一条类目记录中包含图书标识和对应的类目标识;第一数据表生成单元,用于根据所述购买记录和类目记录生成图书关联规则数据表;第二数据表生成单元,用于根据所述购买记录和类目记录生成类目关联规则数据表;推荐列表生成单元,用于根据所述图书关联规则数据表和类目关联规则数据表生成所述图书推荐列表。进一步,所述第一数据表生成单元可以包括图书产品级事务记录生成单元,用于根据所述购买记录中的购买时间生成以季度为统计单位的图书产品级事务记录,每一个图书产品级事务记录中包括用户标识、季节标识和图书标识;图书产品级事务记录统计单元,用于统计所述图书产品级事务记录中每一个图书标识对应的不同用户标识和季节标识的数目,将所述数目作为所述图书标识的产品一项集绝对支持度,以及统计所述图书产品级事务记录中具有相同用户标识和季节标识的至少两个图书标识;图书产品二项集记录生成单元,用于根据所述至少两个图书标识中任意不重复的两个图书标识生成图书产品二项集记录;图书产品二项集记录统计单元,用于统计所述图书产品二项集记录中每一条记录的重复数目,将所述重复数目作为所述记录对应的两个图书标识的产品二项集绝对支持度;产品级余弦相关性测度计算单元,用于计算所述图书产品二项集记录中每一条记录的产品级余弦相关性测度,所述产品级余弦相关性测度为每一个图书产品二项集记录中的产品二项集绝对支持度与所述图书产品二项集记录中两个图书标识中的每一个图书标识对应的产品一项集绝对支持度乘积的平方根的比值;
图书关联规则数据表生成单元,用于生成所述图书关联规则数据表,所述图书关联规则数据表中的每一条记录包括所述图书产品二项集记录中的每一条记录中的两个图书标识,及所述两个图书标识对应的产品二项集绝对支持度和产品级余弦相关性测度。进一步,所述第二数据表生成单元可以包括图书类目级事务记录生成单元,用于融合所述类目记录和所述图书产品级事务记录中具有相同产品标识的记录,生成图书类目级事务记录,每一个图书类目级事务记录中包含用户标识、季节标识和类目标识;图书类目级事务记录统计单元,用于统计所述图书类目级事务记录中每一个类目标识对应的不同用户标识和季节标识的数目,将所述数目作为所述类目标识的类目一项集绝对支持度,以及统计所述图书类目级事务记录中具有相同用户标识和季节标识的至少两个类目标识;
图书类目二项集记录生成单元,用于根据所述至少两个类目标识中任意不重复的两个类目标识生成图书类目二项集记录;图书类目二项集记录统计单元,用于统计所述图书类目二项集记录中每一条记录的重复数目,将所述重复数目作为所述记录对应的两个类目标识的类目二项集绝对支持度;类目级余弦相关性测度计算单元,用于计算所述图书类目二项集记录中每一条记录的类目级余弦相关性测度,所述类目级余弦相关性测度为每一个图书类目二项集记录中的类目二项集绝对支持度与所述图书类目二项集记录中两个类目标识中的每一个类目标识对应的类目一项集绝对支持度乘积的平方根的比值;类目关联规则数据表生成单元,用于生成所述类目关联规则数据表,所述类目关联规则数据表中的每一条记录包括所述图书类目二项集记录中的每一条记录中的两个类目标识,及所述两个类目标识对应的类目二项集绝对支持度和类目级余弦相关性测度。进一步,所述推荐列表生成单元可以包括类目记录查找单元,用于根据所述图书关联规则数据表中的每一条记录中的两个图书标识查找所述类目记录,获取所述两个图书标识对应的类目标识;类目关联规则数据表查找单元,用于根据获取的类目标识查找所述类目关联规则数据表,获得相应的类目级余弦相关测度;图书推荐列表生成单元,用于生成所述图书推荐列表,所述图书推荐列表中的每一条记录包括两个图书标识、对应的产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。具体的,所述检索服务器530可以包括(图5中未示出)第一排序单元,用于当所述目标图书的图书标识对应的产品一项集绝对支持度大于I时,按照优先级从高到低分别为产品级余弦相关性测度、类目级余弦相关性测度和产品二项集绝对支持度的顺序对获取的表项进行排序;第二排序单元,用于当所述目标图书的图书标识对应的产品一项集绝对支持度不大于I时,按照优先级从高到低分别为类目级余弦相关性测度、产品二项集绝对支持度和广品级余弦相关性测度的顺序对获取的表项进行排序。通过对以上实施方式的描述可知,本申请实施例中保存预先生成的图书推荐列表,该图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,该相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度,接收包含用户所选择的目标图书的图书标识的图书推荐列表的检索请求,根据目标图书的图书标识查找所述图书推荐列表,获取包含目标图书的图书标识的表项,对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与目标图书的图书标识对应的推荐图书标识,输出获取的与目标图书的图书标识对应的推荐图书标识。应用本申请实施例进行图书推荐,由于图书推荐列表中图书排序考虑了图书间的多维统计测度,包括产品级余弦相关性测度和类目级余弦相关性测度,因此提高了排序准确性和相应的图书推荐效果,相应减少了用户为获取感兴趣图书所要进行的检索,减少了网站服务器为进行检索对系统资源的耗费。本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分 所述的方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种图书信息关联推荐方法,其特征在于,保存预先生成的图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度,所述方法包括 接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识; 根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项; 对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识;输出所述获取的与目标图书的图书标识对应的推荐图书标识。
2.根据权利要求I所述的方法,其特征在于,预先生成图书推荐列表包括 查找图书购买信息,从所述图书购买信息中提取并生成预设统计时间内的若干购买记录,每一条购买记录中包含用户标识及对应的购买时间和图书标识; 查找图书类目信息,从所述图书类目信息中检索所述购买记录中的每一条记录中的图书标识对应的类目标识,生成若干类目记录,每一条类目记录中包含图书标识和对应的类目标识; 根据所述购买记录和类目记录生成图书关联规则数据表和类目关联规则数据表; 根据所述图书关联规则数据表和类目关联规则数据表生成所述图书推荐列表。
3.根据权利要求2所述的方法,其特征在于,所述根据所述购买记录和类目记录生成图书关联规则数据表包括 根据所述购买记录中的购买时间生成以季度为统计单位的图书产品级事务记录,每一个图书产品级事务记录中包括用户标识、季节标识和图书标识; 统计所述图书产品级事务记录中每一个图书标识对应的不同用户标识和季节标识的数目,将所述数目作为所述图书标识的产品一项集绝对支持度; 统计所述图书产品级事务记录中具有相同用户标识和季节标识的至少两个图书标识; 根据所述至少两个图书标识中任意不重复的两个图书标识生成图书产品二项集记录; 统计所述图书产品二项集记录中每一条记录的重复数目,将所述重复数目作为所述记录对应的两个图书标识的产品二项集绝对支持度; 计算所述图书产品二项集记录中每一条记录的产品级余弦相关性测度,所述产品级余弦相关性测度为每一个图书产品二项集记录中的产品二项集绝对支持度与所述图书产品二项集记录中两个图书标识中的每一个图书标识对应的产品一项集绝对支持度乘积的平方根的比值; 生成所述图书关联规则数据表,所述图书关联规则数据表中的每一条记录包括所述图书产品二项集记录中的每一条记录中的两个图书标识,及所述两个图书标识对应的产品二项集绝对支持度和产品级余弦相关性测度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述购买记录和类目记录生成类目关联规则数据表包括 融合所述类目记录和所述图书产品级事务记录中具有相同产品标识的记录,生成图书类目级事务记录,每一个图书类目级事务记录中包含用户标识、季节标识和类目标识;统计所述图书类目级事务记录中每一个类目标识对应的不同用户标识和季节标识的数目,将所述数目作为所述类目标识的类目一项集绝对支持度; 统计所述图书类目级事务记录中具有相同用户标识和季节标识的至少两个类目标识; 根据所述至少两个类目标识中任意不重复的两个类目标识生成图书类目二项集记录; 统计所述图书类目二项集记录中每一条记录的重复数目,将所述重复数目作为所述记录对应的两个类目标识的类目二项集绝对支持度; 计算所述图书类目二项集记录中每一条记录的类目级余弦相关性测度,所述类目级余弦相关性测度为每一个图书类目二项集记录中的类目二项集绝对支持度与所述图书类目二项集记录中两个类目标识中的每一个类目标识对应的类目一项集绝对支持度乘积的平方根的比值; 生成所述类目关联规则数据表,所述类目关联规则数据表中的每一条记录包括所述图书类目二项集记录中的每一条记录中的两个类目标识,及所述两个类目标识对应的类目二项集绝对支持度和类目级余弦相关性测度。
5.根据权利要求4所述的方法,其特征在于,所述根据所述图书关联规则数据表和类目关联规则数据表生成所述图书推荐列表包括 根据所述图书关联规则数据表中的每一条记录中的两个图书标识查找所述类目记录,获取所述两个图书标识对应的类目标识; 根据获取的类目标识查找所述类目关联规则数据表,获得相应的类目级余弦相关测度; 生成所述图书推荐列表,所述图书推荐列表中的每一条记录包括两个图书标识、对应的产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。
6.根据权利要求5所述的方法,其特征在于,所述对获取的表项中的相关性信息按照预设策略进行排序包括 当所述目标图书的图书标识对应的产品一项集绝对支持度大于I时,按照优先级从高到低分别为产品级余弦相关性测度、类目级余弦相关性测度和产品二项集绝对支持度的顺序对获取的表项进行排序; 当所述目标图书的图书标识对应的产品一项集绝对支持度不大于I时,按照优先级从高到低分别为类目级余弦相关性测度、产品二项集绝对支持度和产品级余弦相关性测度的顺序对获取的表项进行排序。
7.一种图书信息关联推荐服务器,其特征在于,包括 生成单元,用于预先生成图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度; 保存单元,用于保存所述生成单元生成的图书推荐列表;接收单元,用于接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识; 查找单元,用于根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项; 获取单元,用于对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识; 输出单元,用于输出所述获取的与目标图书的图书标识对应的推荐图书标识。
8.根据权利要求7所述的服务器,其特征在于,所述推荐列表生成单元包括 类目记录查找单元,用于根据所述图书关联规则数据表中的每一条记录中的两个图书标识查找所述类目记录,获取所述两个图书标识对应的类目标识; 类目关联规则数据表查找单元,用于根据获取的类目标识查找所述类目关联规则数据表,获得相应的类目级余弦相关测度; 图书推荐列表生成单元,用于生成所述图书推荐列表,所述图书推荐列表中的每一条记录包括两个图书标识、对应的产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度。
9.根据权利要求8所述的服务器,其特征在于,所述获取单元包括 第一排序单元,用于当所述目标图书的图书标识对应的产品一项集绝对支持度大于I时,按照优先级从高到低分别为产品级余弦相关性测度、类目级余弦相关性测度和产品二项集绝对支持度的顺序对获取的表项进行排序; 第二排序单元,用于当所述目标图书的图书标识对应的产品一项集绝对支持度不大于I时,按照优先级从高到低分别为类目级余弦相关性测度、产品二项集绝对支持度和产品级余弦相关性测度的顺序对获取的表项进行排序。
10.一种图书信息关联推荐系统,其特征在于,包括推荐计算服务器、WEB服务器、和检索服务器, 所述推荐计算服务器,用于生成图书推荐列表,所述图书推荐列表中的每个表项包含具有相关性的两种图书的图书标识和相关性信息,所述相关性信息包括产品二项集绝对支持度、产品级余弦相关性测度、类目级余弦相关性测度; 所述WEB服务器,用于接收图书推荐列表的检索请求,所述检索请求中包含用户所选择的目标图书的图书标识,并将所述检索请求发送给所述检索服务器; 所述检索服务器,用于保存预先生成的图书推荐列表,并在接收到所述检索请求后,根据所述目标图书的图书标识查找所述图书推荐列表,获取包含所述目标图书的图书标识的表项,对获取的表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与所述目标图书的图书标识对应的推荐图书标识,并向所述WEB服务器输出所述获取的与目标图书的图书标识对应的推荐图书标识。
全文摘要
本申请公开了一种图书信息关联推荐方法、服务器及系统,该方法包括保存预先生成的图书推荐列表;接收包含用户所选择的目标图书的图书标识的图书推荐列表的检索请求;根据图书标识查找图书推荐列表,获取包含图书标识的表项;对表项中的相关性信息按照预设策略进行排序,并从排序结果中按照从高到低的顺序获取与预设数目一致的,且与目标图书的图书标识对应的推荐图书标识;输出获取的与目标图书的图书标识对应的推荐图书标识。由于考虑了图书间的多维统计测度,包括产品级余弦相关性测度和类目级余弦相关性测度,因此提高了排序准确性和相应的图书推荐效果,减少了用户为获取感兴趣图书所要进行的检索,以及服务器为进行检索对系统资源的耗费。
文档编号G06Q30/02GK102789615SQ201110127070
公开日2012年11月21日 申请日期2011年5月17日 优先权日2011年5月17日
发明者张伟 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1