基于用户网站访问记录的图书推荐方法

文档序号:26626191发布日期:2021-09-14 21:35阅读:68来源:国知局
基于用户网站访问记录的图书推荐方法

1.本发明涉及信息处理技术领域,尤其涉及一种基于用户网站访问记录的图书推荐方法。


背景技术:

2.随着网络的普及,互联网信息过载的时代已经来临。如何过滤掉无关、无用的信息,将用户感兴趣的信息直接呈现给用户,是互联网发展中一个非常重要的课题。在图书销售领域,亚马逊、当当网等网上书店都运用各种信息技术来改进图书推荐服务。但图书推荐服务系统仍存在较多的不足,如个性化推荐不精准问题、尚未实现智能化图书检索、社会化推荐不足等,这些问题都是亟待解决的。
3.图书是人们生活的一部分,与其他电子商务品类相比,图书读者的个性化需求更加明显,所以图书销售也直接受益于推荐系统的发展。图书是人们的精神食粮,是人们生活必不可缺少的部分。在图书销售市场竞争越趋白热化的今天,如何将图书推荐给真正需要它的人们,如何使人们快速地获得自己需要的图书,这成为了图书销售的制胜关键。随着人们个性化需求越加明显,目前的图书推荐服务系统已越显不足。
4.但是,相关推荐内容与用户需求的匹配度较低,使得用户处理更多的低价值信息,而推荐内容如何高度匹配提高用户需求,快速获取用户的关注度成为人们亟待解决的问题。


技术实现要素:

5.为此,本发明提供一种基于用户网站访问记录的图书推荐系统,可以解决快速获取用户关注度,提高用户黏性的问题。
6.为实现上述目的,本发明提供一种基于用户网站访问记录的图书推荐方法,包括:
7.接收用户的登录信息和图书搜索关键字,所述登录信息包括用户的登录用户名;
8.根据所述登录用户名和网站浏览时间,确认用户在第一时间周期内的网站访问记录;
9.根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字;
10.确定筛选结果后,确定网站中的目标页面,根据目标页面的数量确定图书搜索关键字对应的待推荐图书;
11.根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户,以使用户获取待推荐图书以及待推荐图书中的精彩片段;
12.在确定待推荐图书时,根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字包括:确定图书搜索关键字所对应的网站访问记录中,若图书搜索关键字在该用户访问记录中所包含的页面中,则将该页面筛选出来,若该图书搜索关键字不在用户访问记录中所包含的页面中,则无
需对该页面进行筛选,将包含图书搜索关键字的页面进行筛选并集中至页面集合中;
13.将页面集合后,根据目标页面的数量以及图书搜索关键字确认的图书排序的关系确定待推荐图书,搜索任意图书搜索关键字,则产生第一图书排序,该第一图书排序的先后顺序是与该图书搜索关键字的相关度进行确定,在确定该顺序之后,若目标页面的数量≥预设目标数量,则选择该排序中的第一本图书作为推荐的图书;当目标页面的数量<预设目标数量时,根据目标页面的实际数量选择第一排序中的第2至第n本待推荐图书;
14.根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户包括:
15.预先设置图书的精彩片段,在每个图书中包括多个精彩片段,根据用户在目标页面停留的时间长度确定对应的图书中需要显示的精彩片段内容,在中央处理器内设置有显示矩阵d(ti,pi),其中ti表示用户在目标页面停留的时间长度,pi表示图书中的精彩片段内容;
16.若用户在目标页面停留的时间长度为t1,则中央处理器根据显示矩阵d(ti,pi)中确定p1作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为t2,则中央处理器根据显示矩阵d(ti,pi)中确定p2作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为tn,则中央处理器根据显示矩阵d(ti,pi)中确定pn作为图书中的精彩片段内容进行展示。
17.进一步地,所述确定网站中的目标页面包括:提取用户登录的全部网站i p地址;
18.确定用户在不同的网站i p地址内停留的时间长度;
19.根据停留时间确定全部网站的重要程度排序,在中央处理器内设置有预设时间长度t0;
20.选择访问时间长度≥预设时间长度t0的网站作为用户在第一时间周期内的网站访问记录。
21.进一步地,在确定某一网站的页面中是否包含该图书搜索关键字时,
22.将每个网页信息的长度li分别与标准图书搜索关键字的字段长度进行比较,若li<标准图书搜索关键字的字段长度ln,则表示该网页内不包含图书搜索关键字;
23.若li≥标准图书搜索关键字的字段长度ln,则将满足长度要求的网页信息建立网页信息矩阵m(m1,m2

mk),其中k<n,对于网页信息矩阵中的网页信息进行判断时,从网页信息mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
24.从网页信息mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准图书搜索关键字的字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
25.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准图书搜索关键字的字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字。
26.进一步地,在确定网页信息内是否包含关键字时,还包括:从网页信息mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
27.从网页信息mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
28.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字。
29.进一步地,在比较的过程中,若网页信息mi中进行k次比较之后,其中有0.2
×
k次的比较结果是网页信息中包含图书搜索关键字,此时判定网页信息mi中不包含标准字段的字符。
30.进一步地,若对于网页信息mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,若小于等于90%则需要进一步判断。
31.进一步地,当需要对网页信息是否包含图书搜索关键字进行进一步判断时,近似信息库内包含有图书搜索关键字的多个近似字段信息,分别为y1,y2

yn,近似字段为关键字的相似或相近字段,根据近似信息库对网页信息进行进一步判断,判段网页信息内是否包含关键字的相似或相近字段,若包含,则该网页信息包含图书搜索关键字,若不包含相似或相近字段,则认定该网页信息不包含图书搜索关键字。
32.进一步地,在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息y1,y2

yn更新为y11,y12

y1n,从网页信息mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息y11,y12

y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
33.从网页信息mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
34.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息y11,y12

y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含关键字;
35.从网页信息mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
36.从网页信息mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
37.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含图书搜索关键字。
38.进一步地,在确认用户在第一时间周期内的网站访问记录时,设置标准网站浏览
时间,若对于任意网站,若用户的在该网站的浏览时间<预设的标准浏览时间,则剔除该网站,不作为用户在第一时间周期内的网站访问记录;若≥预设的标准浏览时间,则将该网站作为用户在第一时间周期内的网站访问记录。
39.进一步地,用户的登录名有多个,根据当前的登录用户名,确定用户的id,在各网站上确定该id的其他用户登录名,确定用户在第一时间周期内的网站访问记录是该用户以各用户登录名和以共同的ip地址进行登录网站的访问信息。
40.与现有技术相比,本发明的有益效果在于,通过根据用户在目标页面停留的时间长度确定图书中的精彩片段进行显示的内容,在实际应用过程中,若用户在目标页面停留的时间较长,则表示用户在一定程度长对该目标页面的内容比较感兴趣,需要进行深度思考,而此时若是给用户推荐的精彩内容较为简单,则不符合用户的思考习惯,因此在实际推荐过程中,则为用户推荐的内容是符合用户兴趣且具备一定深度的内容,进而增加用户的探索欲,使得用户可以更深入去了解推荐的图书,提高用户与推荐内容之间的黏性。
41.尤其,通过监测用户在访问网站时对各个页面的浏览时间进行监测,选择浏览时间较长的页面为目标页面,基于浏览时间和浏览页面的内容确定用户的兴趣点,进而根据用户的兴趣点相关度最高的图书,将该图书推荐给用户,并将该图书中与用户兴趣点相关度最高的精彩片段显示给用户。
42.尤其,对于图书的选择是在基于图书搜索关键字的基础上结合用户的网站访问记录中的目标页面的数量继续选择的,使得对于图书的推荐更符合用户在第一时间周期内的网站访问情况,提高图书推荐的精准度。本发明实施例通过用户在一定时间内的网站访问情况对图书的排序进行调整,使得图书的推荐更为精确,使得推荐的图书更匹配用户的网站浏览状况。
43.尤其,本发明实施例通过对网页信息中的n个字符与标准字段的字符进行比较,以根据比较结果确定网页信息中是否包含图书搜索关键字,若是包含关键字则可以进一步判定其是否为目标网页,通过图书搜索关键字的判断实现对目标网页的精准确定,提高图书推荐以及图书精彩片段推荐的准确性。
44.尤其,通过对网页信息mi中选择的n个字符与标准字段的字符存在差异的第一个字符开始重新选择n个字符继续比较,该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,进一步提高对网页信息内是否包含图书搜索关键字判断的准确性,提高判断的合理性和全面性。
45.通过判定网页信息中是否包含图书搜索关键字的近似字段信息y1,y2

yn,且近似字段信息与关键字信息对于网页信息的判定至关重要,提高对网页信息中是否包含图书搜索关键字的判定的准确率,进一步提高图书推荐的准确性。
附图说明
46.图1为本发明实施例提供的基于用户网站访问记录的图书推荐方法的流程图。
具体实施方式
47.为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
48.下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
49.需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
50.此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
51.请参阅图1所示,本发明实施例提供的基于用户网站访问记录的图书推荐方法包括:
52.步骤s100:接收用户的登录信息和图书搜索关键字,所述登录信息包括用户的登录用户名;
53.步骤s200:根据所述登录用户名和网站浏览时间,确认用户在第一时间周期内的网站访问记录;
54.步骤s300:根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字;
55.步骤s400:确定筛选结果后,确定网站中的目标页面,根据目标页面确定图书搜索关键字对应的图书;
56.步骤s500:根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户,以使用户获取图书以及图书中的精彩片段;
57.具体而言,本发明实施例的执行主体为一终端,该终端可以是手机、平板或是笔记本电脑等,终端在接收到用户的登录信息后,再获取对应的图书搜索关键字。
58.具体而言,在步骤s200中,登录用户名可以是用户的手机号码还可以是用户的身份证号码,获取该手机号码在第一时间周期内的网站访问记录,本领域技术人员可以理解的是,在第一时间周期内用户的网站访问记录可以是多个,访问网网站的种类,以及浏览网站中的页面内容也是多种多样的,但是在这些页面内容中有用户感兴趣的,也有用户不感兴趣直接跳转离开的。
59.具体而言,在步骤s500中,本发明实施例通过监测用户在访问网站时对各个页面的浏览时间进行监测,选择浏览时间较长的页面为目标页面,基于浏览时间和浏览页面的内容确定用户的兴趣点,进而根据用户的兴趣点相关度最高的图书,将该图书推荐给用户,并将该图书中与用户兴趣点相关度最高的精彩片段显示给用户。
60.具体而言,所述确定网站中的目标页面包括:提取用户登录的全部网站ip地址;
61.确定用户在不同的网站ip内停留的时间长度;
62.根据停留时间确定全部网站的重要程度排序,在中央处理器内设置有预设时间长度t0;
63.选择访问时间长度≥预设时间长度t0的网站作为用户在第一时间周期内的网站
访问记录。
64.在步骤s500中,根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户包括:
65.预先设置图书的精彩片段,在每个图书中包括多个精彩片段,根据用户在目标页面停留的时间长度确定对应的图书中需要显示的精彩片段内容,在中央处理器内设置有显示矩阵d(ti,pi),其中ti表示用户在目标页面停留的时间长度,pi表示图书中的精彩片段内容。
66.具体而言,若用户在目标页面停留的时间长度为t1,则中央处理器根据显示矩阵d(ti,pi)中确定p1作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为t2,则中央处理器根据显示矩阵d(ti,pi)中确定p2作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为tn,则中央处理器根据显示矩阵d(ti,pi)中确定pn作为图书中的精彩片段内容进行展示。
67.具体而言,本发明实施例提供的基于用户网站访问记录的图书推荐方法,通过根据用户在目标页面停留的时间长度确定图书中的精彩片段进行显示的内容,在实际应用过程中,若用户在目标页面停留的时间较长,则表示用户在一定程度长对该目标页面的内容比较感兴趣,需要进行深度思考,而此时若是给用户推荐的精彩内容较为简单,则不符合用户的思考习惯,因此在实际推荐过程中,则为用户推荐的内容是符合用户兴趣且具备一定深度的内容,进而增加用户的探索欲,使得用户可以更深入去了解推荐的图书,提高用户与推荐内容之间的黏性。
68.具体而言,在步骤s200中,设置标准网站浏览时间,若对于任意网站,若用户的在该网站的浏览时间<预设的标准浏览时间,则剔除该网站,不作为用户在第一时间周期内的网站访问记录;若≥预设的标准浏览时间,则将该网站作为用户在第一时间周期内的网站访问记录。
69.具体而言,在实际应用过程中,用户的登录名可以有多个,根据当前的登录用户名,确定用户的id,在各网站上确定该id的其他用户登录名,在实际应用中,确定用户在第一时间周期内的网站访问记录是该用户以各用户登录名或以共同的ip地址进行登录网站的访问信息,本发明实施例并不局限于单一的登录用户名信息来确定用户的网站访问记录,对于用户网站访问记录的确定更为精准,提高图书推荐的准确性,可以进一步提高基于网站访问信息进行图书推荐的精准度,便于与用户之间建立更为精准的联系。
70.具体而言,在步骤s300中,根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字包括:确定图书搜索关键字所对应的网站访问记录中,若图书搜索关键字在该用户访问记录中所包含的页面中,则将该页面筛选出来,若该图书搜索关键字不在用户访问记录中所包含的页面中,则无需对该页面进行筛选,将包含图书搜索关键字的页面进行筛选并集中至页面集合中。
71.将页面集合后,根据目标页面的数量以及图书搜索关键字确认的图书排序的关系确定待推荐图书,具体而言,当不考虑用户访问记录的情况下,搜索任意图书搜索关键字,则会产生一个图书排序,该图书排序的先后顺序是与该图书搜索关键字的相关度进行确定,在确定该顺序之后,在本发明实施例中,该排序与目标页面的数量一一对应,具体而言,若目标页面的数量≥预设目标数量,则选择该排序中的第一本图书作为推荐的图书;当目
标页面的数量<预设目标数量时,根据目标页面的实际数量选择根据图书搜索关键字排序后的第2

第n本待推荐图书。
72.本发明实施例中对于图书的选择是在基于图书搜索关键字的基础上结合用户的网站访问记录中的目标页面的数量继续选择的,使得对于图书的推荐更符合用户在第一时间周期内的网站访问情况,提高图书推荐的精准度。本发明实施例通过用户在一定时间内的网站访问情况对图书的排序进行调整,使得图书的推荐更为精确,使得推荐的图书更匹配用户的网站浏览状况。
73.具体而言,在确定某一网站的页面中是否包含该图书搜索关键字时,采用以下方法:
74.将每个网页信息的长度li分别与标准图书搜索关键字的字段长度进行比较,若li<标准图书搜索关键字的字段长度ln,则表示该网页内不包含图书搜索关键字;
75.若li≥标准图书搜索关键字的字段长度ln,则将满足长度要求的网页信息建立网页信息矩阵m(m1,m2

mk),其中k<n,对于网页信息矩阵中的网页信息进行判断时,从网页信息mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
76.从网页信息mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准图书搜索关键字的字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
77.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准图书搜索关键字的字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字。
78.具体而言,在确定网页信息内是否包含关键字时,还包括:从网页信息mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
79.从网页信息mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字;
80.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息mi中包含图书搜索关键字。
81.具体而言,本发明实施例通过对网页信息中的n个字符与标准字段的字符进行比较,以根据比较结果确定网页信息中是否包含图书搜索关键字,若是包含关键字则可以进一步判定其是否为目标网页,通过图书搜索关键字的判断实现对目标网页的精准确定,提高图书推荐以及图书精彩片段推荐的准确性。
82.具体而言,在比较的过程中,若网页信息mi中进行k次比较之后,其中有0.2
×
k次的比较结果是网页信息中包含图书搜索关键字,此时判定网页信息mi中不包含标准字段的字符。
83.具体而言,若对于网页信息mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第
一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,若小于等于90%则需要进一步判断。
84.具体而言,通过对网页信息mi中选择的n个字符与标准字段的字符存在差异的第一个字符开始重新选择n个字符继续比较,该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,进一步提高对网页信息内是否包含图书搜索关键字判断的准确性,提高判断的合理性和全面性。
85.具体而言,当需要对网页信息是否包含图书搜索关键字进行进一步判断时,近似信息库内包含有图书搜索关键字的多个近似字段信息,分别为y1,y2

yn,近似字段为关键字的相似或相近字段,根据近似信息库对网页信息进行进一步判断,判段网页信息内是否包含关键字的相似或相近字段,若包含,则该网页信息包含图书搜索关键字,若不包含相似或相近字段,则认定该网页信息不包含图书搜索关键字。
86.具体而言,在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息y1,y2

yn更新为y11,y12

y1n,从网页信息mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息y11,y12

y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
87.从网页信息mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
88.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息y11,y12

y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含关键字;
89.从网页信息mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
90.从网页信息mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
91.从网页信息mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息y11,y12

y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息mi中包含关键字相似或相近信息,属于包含图书搜索关键字。
92.具体而言,本发明实施例通过判定网页信息中是否包含图书搜索关键字的近似字段信息y1,y2

yn,且近似字段信息与关键字信息对于网页信息的判定至关重要,提高对网页信息中是否包含图书搜索关键字的判定的准确率,进一步提高图书推荐的准确性。
93.至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
94.以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人
员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1