一种关联文档的推荐方法、装置、设备及介质与流程

文档序号:33399621发布日期:2023-03-08 15:45阅读:48来源:国知局
一种关联文档的推荐方法、装置、设备及介质与流程

1.本公开涉及计算机技术领域,尤其涉及计算机自然语言处理领域,具体涉及一种关联文档的推荐方法、装置、设备及介质。


背景技术:

2.由于文库中文档的类型较多,且涉及的领域较广,使得文库中会存在数量较多的存量文档。因此,在用户对文库中的文档进行查询时,如何根据用户查询需求将相关优质文档提供给用户,提高用户与文库的粘性和留存率变得十分重要。
3.现有技术中,相关文档推荐模块比较分散,且只采用由查询词组成的相关推荐策略,使得推荐内容比较单一,不能有效的满足客户的需求。


技术实现要素:

4.本公开提供了一种关联文档的推荐方法、装置、设备及介质。
5.根据本公开的一方面,提供了一种关联文档的推荐方法,包括:
6.响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与所述目标电子文档匹配的目标相关性文档检索池,其中,每个电子文档中包括多个级别的分类标签;
7.根据所述目标电子文档各级别的分类标签,在多个分类文档检索池中,获取与所述目标电子文档匹配的目标分类文档检索池;
8.其中,所述相关性文档检索池根据所述电子文档库中的多个时效性检索文档与每个电子文档间的内容相关性构建得到;所述分类文档检索池根据所述电子文档库中的多个时效性检索文档各级别的分类标签构建得到;
9.在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档;
10.将所述至少一个目标相关性文档和所述至少一个目标分类文档,组织得到关联文档目录结构;
11.在对所述目标电子文档进行即时展示的同时,对所述关联文档目录结构进行同步展示。
12.根据本公开的另一方面,提供了一种电子设备,包括:
13.至少一个处理器;以及
14.与所述至少一个处理器通信连接的存储器;其中,
15.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的关联文档的推荐方法。
16.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一实施例所述的关联文档的推荐
方法。
17.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
18.附图用于更好地理解本方案,不构成对本公开的限定。其中:
19.图1是根据本公开实施例提供的一种关联文档的推荐方法的流程图;
20.图2是根据本公开实施例提供的另一种关联文档的推荐方法的流程图;
21.图3是根据本公开实施例提供的一种当前展示页面的显示示意图;
22.图4是根据本公开实施例提供的一种关联文档的推荐方法的流程示意图;
23.图5是根据本公开实施例提供的一种关联文档的推荐装置的结构示意图;
24.图6是用来实现本公开实施例的关联文档的推荐方法的电子设备的框图。
具体实施方式
25.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
26.图1是根据本公开实施例提供的一种关联文档的推荐方法的流程图。本公开实施例可适用于根据用户的查询需求提供相关优质文档的情况,用于增加用户所需内容的选择,减少用户再次检索的步长,提高用户与文库的粘性和留存率。该方法可以由关联文档的推荐装置来执行,该装置可采用硬件和/或软件的方式实现,并一般可以集成在电子设备中。
27.如图1所示,本公开实施例提供的一种关联文档的推荐方法包括以下具体步骤:
28.s110、响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与所述目标电子文档匹配的目标相关性文档检索池,其中,每个电子文档中包括多个级别的分类标签。
29.其中,目标电子文档可以指用户即时要求展现的电子文档。即时展现请求可以指立即对目标电子文档进行展现的请求,例如,基于用户对页面中该目标电子文档的文档链接的点击指令,形成对电子文档库中目标电子文档的即时展现请求。
30.其中,相关性文档检索池可以指与任一电子文档具有内容相关性的在设定时间段内展现过的时效性检索文档的集合。通常,一个相关性文档检索池中所包含的各时效性检索文档均具有一致的内容相关性。具体的,若电子文档a的文档标题包括“小学五年级语文期末考试”,则基于各时效性检索文档构建的,与该电子文档a对应的相关性文档检索池a中的各时效性检索文档中的文档标题或者文档实际内容中也应该包括“小学五年级语文期末考试”或者与该“小学五年级语文期末考试”相类似的表述,例如:“五年级期末语文考试”等。目标相关性文档检索池可以指与目标电子文档匹配的相关性文档检索池。
31.值得注意的是,一个电子文档具有与之对应的一个相关性文档检索池,当目标电子文档被唯一确定后,与该目标电子文档对应的目标相关性文档检索池也被唯一确定。
32.s120、根据所述目标电子文档各级别的分类标签,在多个分类文档检索池中,获取与所述目标电子文档匹配的目标分类文档检索池。
33.其中,所述相关性文档检索池根据所述电子文档库中的多个时效性检索文档与每个电子文档间的内容相关性构建得到;所述分类文档检索池均根据所述电子文档库中的多个时效性检索文档各级别的分类标签构建得到。
34.其中,分类标签可以指根据电子文档所属分类选项标定的标签。示例性的,可以根据电子文档内容的属性数据将分类标签设定为初中、高中、教育或科目等。值得注意的是,还可以根据分类标签的内容覆盖范围将分类标签设定为一级分类、二级分类和三级分类等多个级别的标签,示例性的,多个级别的分类标签可以包括:试卷-一年级-数学-提高题等,其中,试卷的内容覆盖范围大于一年级的内容覆盖范围,一年级的内容覆盖范围大于数学的内容覆盖范围,数学的内容覆盖范围大于提高题的内容覆盖范围,则可以将试卷分类标签设定为一级分类、将一年级分类标签设定为二级分类、将数学分类标签设定为三级分类,并将提高题分类标签设定为四级分类等。由此,可以将各个分类标签进行等级的划分,便于后续对分类标签的管理。
35.其中,分类文档检索池可以指对应同一标准标签的电子文档的集合。目标分类文档检索池可以指与目标电子文档匹配的分类文档检索池。示例性的,可以在各分类文档检索池中筛选出与目标电子文档的分类标签相匹配的分类文档检索池,作为目标分类文档检索池。
36.在一个具体的例子中,目标电子文档的多级别的分类标签可以为a-b-c-d,进而,可以分解得到多个标签匹配项,例如:“a”、“a-b”、“a-b-c”以及“a-b-c-d”等。通过将上述各标签匹配项分别与各分类文档检索池的标准标签进行匹配,可以获取匹配成功的一个或者多个目标分类文档检索池。
37.s130、在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档。
38.其中,目标相关性文档可以指目标相关性文档检索池中选定的相关性文档。目标分类文档可以指目标分类文档检索池中选定的分类文档。
39.s140、将所述至少一个目标相关性文档和所述至少一个目标分类文档,组织得到关联文档目录结构。
40.其中,关联文档目录结构可以指包含至少一个目标相关性文档和至少一个目标分类文档的目录结构。由此,可以对目标相关性文档和目标分类文档进行展示,便于用户的选择。
41.s150、在对所述目标电子文档进行即时展示的同时,对所述关联文档目录结构进行同步展示。
42.具体的,在得到关联文档目录结构之后,可以在对目标电子文档进行即时展示的同时,将关联文档目录结构一并进行展示,以将优质的文档曝光,可以便于用户的点击和浏览,提高业务需求。
43.值得注意的是,在本公开实施例中,可以对关联文档目录结构进行及时更新处理,避免了现有技术中阅读页右侧推荐模块采用读取远程服务器(remotedictionaryserver,redis)存储相关文档时,随着电子文档数量的增加,redis会在存储量上达到峰值,导致
redis不可用的情况发生。
44.本公开实施例的技术方案,通过响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与目标电子文档匹配的目标相关性文档检索池;并根据目标电子文档各级别的分类标签,在多个分类文档检索池中,获取与目标电子文档匹配的目标分类文档检索池,进而,在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档;最终,将至少一个目标相关性文档和至少一个目标分类文档,组织得到关联文档目录结构;并在对目标电子文档进行即时展示的同时,对关联文档目录结构进行同步展示,可以将目标电子文档相关的文档组装成目录一起展示给用户,增加用户对所需内容的选择,减少用户再次检索的步长,提高了用户的服务体验。
45.图2是根据本公开实施例提供的另一种关联文档的推荐方法的流程图;本公开实施例以上述公开实施例为基础进行细化,在本实施例中,将在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档的操作,具体化为:获取分类文档检索池与相关性文档检索池之间的第一文档选取比例分配关系,以及同一分类文档检索池内不同类型文档的第二文档选取比例分配关系;根据所述第一文档选取比例分配关系、所述第二文档选取比例分配关系和各所述时效性检索文档的实时质量评分,在所述在目标相关性文档检索池中获取至少一个目标相关性文档,并在所述目标分类文档检索池中获取至少一个目标分类文档。
46.如图2所示,本公开实施例提供的一种关联文档的推荐方法包括以下具体步骤:
47.s210、响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与所述目标电子文档匹配的目标相关性文档检索池,其中,每个电子文档中包括多个级别的分类标签。
48.在一个可选的实施方式中,本公开实施例还可以包括:在电子文档库中,获取多个时效性检索文档;根据电子文档间的内容相关性,采用所述多个时效性检索文档,生成与各所述电子文档对应的相关性文档检索池。
49.其中,电子文档库可以指预先存储有大量电子文档文件的数据库。时效性检索文档可以指电子文档库中在设定时间段内展现过的检索文档。内容相关性可以指各电子文档中记录内容的关联程度。示例性的,可以通过电子文档对应的文档标题利用策略相关性模型获取与该电子文档具有内容相关性的电子文档。
50.其中,获取时效性检索文档的目的是为了在后续进行关联文档的推荐时,将被用户近期展现过的电子文档进行有效的推荐,以实现对优秀电子文档的有效曝光。
51.值得注意的是,为了实现在电子文档库中的任一电子文档的即时展示过程中,对与该电子文档的内容相关的时效性检索文档进行有效的推荐,可以基于上述各时效性检索文档,分别生成与每个电子文档分别对应的相关性文档检索池。
52.在一个可选的实施方式中,在电子文档库中,获取多个时效性检索文档,包括:根据当前系统时间,生成时效性时间区间;在所述电子文档库中,将最近展现时间位于所述时效性时间区间内的各电子文档,确定为所述时效性检索文档。
53.其中,当前系统时间可以指获取多个时效性检索文档时,当前系统所记录的时间。时效性时间区间可以指根据当前系统时间生成的具有时效性的时间段。示例性的,可以为
当前系统时间所对应的单位周天时间,如,当前系统时间为2022年11月1日10:00,则时效性时间区间可以为2022年11月1日00:00至2022年11月1日24:00。也可以为当前系统时间所对应的设定时间段时间,如,当前系统时间为2022年11月1日10:00,时效性时间区间可以为当前系统时间前后两小时的时间区间,即2022年11月1日08:00至2022年11月1日12:00。本公开实施例对此不进行限制。
54.其中,展现时间可以指电子文档展现时对应的系统时间。最近展现时间可以指电子文档最新展现时(例如,响应于用户的页面点击所实现的展示)对应的展现时间。
55.由此,通过当前系统时间确定时效性时间区间,并利用时效性时间区间在各电子文档中确定时效性检索文档,可以保证获取的时效性检索文档的时效性,为后续建立检索池提供有效的基础。
56.在一个可选的实施方式中,在电子文档库中,获取多个时效性检索文档之前,还可以包括:获取待收录电子文档;将所述待收录电子文档输入至预先训练的分类标签标注模型中,获取与所述待收录电子文档匹配的多个级别的分类标签;将加入所述多个级别的分类标签的所述待收录电子文档,加入至所述电子文档库中。
57.其中,待收录电子文档可以指未加入至电子文档库中的文档。其中,预先训练的分类标签标注模型可以指对电子文档进行标签标注处理的模型。示例性的,可以为策略中台模型。
58.值得注意的是,待收录电子文档对应的分类标签可以为多个,且各分类标签对应的级别也可以不同,本公开实施例对此不进行限制。
59.由此,通过为待收录电子文档添加多个级别的分类标签,为后续建立分类文档检索池提供了有效的基础。
60.s220、将所述目标电子文档中包括的多个级别的分类标签,与每个所述分类文档检索池对应的标准标签进行匹配,获取成功匹配的至少一个目标标准标签。
61.其中,目标标准标签可以指目标电子文档与分类文档检索池均匹配的标准标签。
62.在上述的基础上,本公开实施例还可以包括:在所述多个时效性检索文档的各级别的分类标签中确定标准标签,并采用所述多个时效性检索文档,生成与各所述标准标签对应的分类文档检索池。
63.其中,标准标签可以指特定分类级别下的分类标签。示例性的,可以将除分类级别最低的分类标签之外的任一分类标签作为标准标签。具体的,若分类级别包含一级分类、二级分类和三级分类,则可以将一级分类或二级分类中任一分类级别对应的分类标签作为标准标签。
64.具体的,在获取全部时效性检索文档的各级别的分类标签之后,可以通过设定的聚类算法,统计哪些级别的分类标签下的时效性检索文档数量更多或者是下级标签种类更多等。进而,可以根据聚类结果,确定出标准标签。具体的,该标准标签可以具体为某一个较高级别的分类标签,例如“试卷”、“试卷-一年级”或者“试卷-一年级-数学”等。
65.在确定出与各时效性检索文档分别对应的标准标签后,可以基于上述各时效性检索文档,生成与每个标准标签分别对应的分类文档检索池,同一分类文档检索池,在标准标签所限定的标签维度下的分类标签均相同。
66.值得注意的是,在本公开实施例中,针对设定周期内,例如,前一周的时效性检索
文档可以进行更新操作,并且电子文档间的内容相关性以及多个时效性检索文档的各级别的分类标签中确定标准标签也会同时进行更新,由此,通过将历史的时效性检索文档进行不断地剔除,可以使得相关性文档检索池或分类文档检索池中不断地加入新电子文档,提高了电子文档的实时性,并且提高了检索池的内存使用率。避免了现有技术中阅读页面下方推荐模块采用读取数据库(database,db)相关文档数据后,不对历史未展现的数据进行删除,造成的存储浪费的问题发生。
67.由此,通过及时有效地生成电子文档对应的相关性文档检索池及分类文档检索池,进而可以实现在电子文档的即时展现场景中进行关联文档的有效推荐,为后续的关联文档的推荐提供了有效的基础。
68.s230、获取与所述至少一个目标标准标签对应的目标分类文档检索池。
69.由此,通过对分类文档检索池的标准标签与目标电子文档的分类标签进行匹配,可以获取与成功匹配的目标标准标签对应的目标分类文档检索池,进而,为后续目标分类文档的获取提供有效的基础。
70.s240、获取分类文档检索池与相关性文档检索池之间的第一文档选取比例分配关系,以及同一分类文档检索池内不同类型文档的第二文档选取比例分配关系。
71.其中,第一文档选取比例分配关系可以指从分类文档检索池和相关性文档检索池中选取电子文档的权重关系。示例性的,可以根据分类文档检索池和相关性文档检索池中电子文档对用户的吸引力程度划分第一文档选取比例分配关系。具体的,可以获取分类文档检索池和相关性文档检索池中电子文档的点击率,将点击率高的一侧检索池所对应的比例调高。
72.其中,第二文档选取比例分配关系可以指同一分类文档检索池中不同文档类型的电子文档在分配时的权重比例。示例性的,可以将电子文档的类型分为付费文档、会员专享、会员免费以及普通免费四种,根据付费转化率效果将第二文档选取比例分配关系设定为付费文档30%、会员专享30%、会员免费20%、普通免费文档20%。
73.s250、根据所述第一文档选取比例分配关系、所述第二文档选取比例分配关系和各所述时效性检索文档的实时质量评分,在所述目标相关性文档检索池中获取至少一个目标相关性文档,并在所述目标分类文档检索池中获取至少一个目标分类文档。
74.其中,实时质量评分可以指对时效性检索文档的文档内容进行质量评估后得到的分数。可以通过实时质量评分、第一文档选取比例分配关系及第二文档选取比例分配关系,在目标相关性文档检索池和目标分类文档检索池中进行组装、过滤或去重等操作,由此,得到目标相关性文档和目标分类文档,增加了用户对所需内容的选择,减少了用户再次检索的步长。
75.s260、根据各所述目标标准标签和预设的标签体系,生成主目录架构。
76.其中,预设的标签体系可以指预先设定的分类标签构成体系。预设的标签体系中可以包含各分类标签的分类级别。示例性的,可以将分类级别较大的分类标签包含分类级别较小的分类标签。主目录架构可以指结合预设的标签体系将目标标准标签融合至显示页面后生成的目录架构。具体的,可以根据预设的标签体系划分各分类标签的分类级别,如目标标准标签“试卷”为一级分类,“单元”为一级分类“试卷”下的二级分类,“试卷解析”为二级分类“单元”下的三级分类,进而,再将各目标标准标签按照各分类标签的分类级别填充
至预设的标签体系中,即可得到主目录架构。
77.s270、在所述主目录架构中,加入相关性文档目录项,形成关联文档目录架构。
78.其中,相关性文档目录项可以指包含目标电子文档对应的目标相关性文档所属内容的目录项。示例性的,可以将相关性文档的文档标题作为相关性文档目录项,进行显示。关联文档目录架构可以指在主目录架构的基础上,加入相关性文档目录项后生成的目录架构。
79.s280、将所述至少一个目标相关性文档和所述至少一个目标分类文档分别加入至所述关联文档目录架构中,形成所述关联文档目录结构。
80.由此,通过在主目录架构的基础上加入相关性文档目录项,形成关联文档目录架构,并将至少一个目标相关性文档和至少一个目标分类文档分别加入至关联文档目录架构中,形成所述关联文档目录结构,可以为用户的选择提供便利,增加了用户对所需内容的选择。
81.s290、将当前展示页面划分为左侧显示区域和右侧显示区域。
82.其中,当前展示页面可以指当前展示目标电子文档的页面。
83.s2100、在所述右侧显示区域中展示所述目标电子文档的同时,在所述左侧显示区域中展示所述关联文档目录结构。
84.如图3所示为当前展示页面的显示示意图。具体的,若目标电子文档为“五年级语文第三单元的试卷解析”,则相关性文档目录项为“试卷-第三单元-试卷解析”,进而,再将目标电子文档对应的至少一个目标相关性文档和至少一个目标分类文档分别加入至关联文档目录架构中,即可在右侧显示区域中展示目标电子文档的同时,在左侧显示区域显示关联文档目录结构。
85.由此,通过将关联文档目录结构在突出的显示区域进行展现,为用户的选择提供便利,无需用户浏览滑动一部分内容后才会发现关联文档目录结构中的电子文档。
86.在一个可选的实施方式中,在对所述关联文档目录结构进行同步展示之后,还可以包括:响应于对所述关联文档目录结构中的至少一个关联文档的选择指令,更新所述第一文档选取比例分配关系以及所述第二文档选取比例分配关系。其中,选择指令可以指对关联文档目录结构中的关联文档的选择确认指令。示例性的,可以为对关联文档目录结构中的关联文档的点击指令。由此,可以通过对关联文档的选择指令,及时地对第一文档选取比例分配关系以及第二文档选取比例分配关系进行更新,可以使得根据第一文档选取比例分配关系、第二文档选取比例分配关系和各时效性检索文档的实时质量评分,获取的目标相关性文档及目标分类文档与用户之间的粘性增加。
87.本公开实施例的技术方案,通过响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与目标电子文档匹配的目标相关性文档检索池,并将目标电子文档中包括的多个级别的分类标签,与每个分类文档检索池对应的标准标签进行匹配,获取成功匹配的至少一个目标标准标签;进而,获取与至少一个目标标准标签对应的目标分类文档检索池;进一步,获取分类文档检索池与相关性文档检索池之间的第一文档选取比例分配关系,以及同一分类文档检索池内不同类型文档的第二文档选取比例分配关系;根据第一文档选取比例分配关系、第二文档选取比例分配关系和各时效性检索文档的实时质量评分,在目标相关性文档检索池中获取至少一个目标相关性文档,在目标分类
文档检索池中获取至少一个目标分类文档;再根据各目标标准标签和预设的标签体系,生成主目录架构;并在主目录架构中,加入相关性文档目录项,形成关联文档目录架构;以及将至少一个目标相关性文档和至少一个目标分类文档分别加入至关联文档目录架构中,形成关联文档目录结构;最终,将当前展示页面划分为左侧显示区域和右侧显示区域,在右侧显示区域中展示目标电子文档的同时,在左侧显示区域中展示关联文档目录结构,可以将目标电子文档相关的文档组装成目录一起展示给用户,增加用户对所需内容的选择,减少用户再次检索的步长,提高了用户的服务体验。
88.在上述各实施例的基础上,图4是根据本公开实施例提供的一种关联文档的推荐方法的流程示意图。具体的,获取上传或存量的待收录电子文档,并在对各待收录电子文档进行分类及打标签处理之后,将加入多个级别的分类标签的待收录电子文档,加入至电子文档库中,形成文档池;进而,获取电子文档库中在时效性时间区间内时效性检索文档,对数据进行分析挂载,根据电子文档间的内容相关性,采用多个时效性检索文档,生成与各电子文档对应的相关性文档检索池,以及,在多个时效性检索文档的各级别的分类标签中确定标准标签,并采用多个时效性检索文档,生成与各标准标签对应的分类文档检索池,同时,在设定周期内,会对相关性文档检索池和分类文档检索池进行定时更新。当存在对电子文档库中目标电子文档的即时展现请求时,在多个相关性文档检索池中,获取与目标电子文档匹配的目标相关性文档检索池;并根据目标电子文档的分类标签,在多个分类文档检索池中,获取与目标电子文档匹配的目标分类文档检索池;进而,根据分类文档检索池与相关性文档检索池之间的第一文档选取比例分配关系、同一分类文档检索池内不同类型文档的第二文档选取比例分配关系和各时效性检索文档的实时质量评分,进行权重配置,在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档。最终,将至少一个目标相关性文档和至少一个目标分类文档,组织得到关联文档目录结构;并在对目标电子文档进行即时展示的同时,对关联文档目录结构进行同步展示,实现组装目录展现。
89.作为上述各关联文档的推荐方法的实现,本公开还提供了一种实施上述各关联文档的推荐方法的执行装置的可选实施例。
90.图5是根据本公开实施例提供的一种关联文档的推荐装置的结构示意图;如图5所示,关联文档的推荐装置包括:第一文档检索池匹配模块310、第二文档检索池匹配模块320、文档获取模块330、目录结构生成模块340以及同步展示模块350;
91.其中,第一文档检索池匹配模块310,用于响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与所述目标电子文档匹配的目标相关性文档检索池,其中,每个电子文档中包括多个级别的分类标签;
92.第二文档检索池匹配模块320,用于根据所述目标电子文档各级别的分类标签,在多个分类文档检索池中,获取与所述目标电子文档匹配的目标分类文档检索池;
93.其中,所述相关性文档检索池根据所述电子文档库中的多个时效性检索文档与每个电子文档间的内容相关性构建得到;所述分类文档检索池根据所述电子文档库中的多个时效性检索文档各级别的分类标签构建得到;
94.文档获取模块330,用于在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档;
95.目录结构生成模块340,用于将所述至少一个目标相关性文档和所述至少一个目标分类文档,组织得到关联文档目录结构;
96.同步展示模块350,用于在对所述目标电子文档进行即时展示的同时,对所述关联文档目录结构进行同步展示。
97.本公开实施例的技术方案,通过响应于对电子文档库中目标电子文档的即时展现请求,在多个相关性文档检索池中,获取与目标电子文档匹配的目标相关性文档检索池;并根据目标电子文档各级别的分类标签,在多个分类文档检索池中,获取与目标电子文档匹配的目标分类文档检索池,进而,在目标相关性文档检索池中获取至少一个目标相关性文档,并在目标分类文档检索池中获取至少一个目标分类文档;最终,将至少一个目标相关性文档和至少一个目标分类文档,组织得到关联文档目录结构;并在对目标电子文档进行即时展示的同时,对关联文档目录结构进行同步展示,可以将目标电子文档相关的文档组装成目录一起展示给用户,增加用户对所需内容的选择,减少用户再次检索的步长,提高了用户的服务体验。
98.可选的,关联文档的推荐装置还可以包括:检索池生成模块,检索池生成模块具体可以包括数据获取单元、第一文档检索池生成单元及第二文档检索池生成单元;
99.其中,数据获取单元,用于在电子文档库中,获取多个时效性检索文档;
100.第一文档检索池生成单元,用于根据电子文档间的内容相关性,采用所述多个时效性检索文档,生成与各所述电子文档对应的相关性文档检索池;
101.第二文档检索池生成单元,用于在所述多个时效性检索文档的各级别的分类标签中确定标准标签,并采用所述多个时效性检索文档,生成与各所述标准标签对应的分类文档检索池。
102.可选的,数据获取单元具体可以用于:根据当前系统时间,生成时效性时间区间;
103.在所述电子文档库中,将最近展现时间位于所述时效性时间区间内的各电子文档,确定为所述时效性检索文档。
104.可选的,关联文档的推荐装置还可以包括:预处理模块,用于在电子文档库中,获取多个时效性检索文档之前,获取待收录电子文档;
105.将所述待收录电子文档输入至预先训练的分类标签标注模型中,获取与所述待收录电子文档匹配的多个级别的分类标签;
106.将加入所述多个级别的分类标签的所述待收录电子文档,加入至所述电子文档库中。
107.可选的,文档获取模块330,具体可以用于:
108.获取分类文档检索池与相关性文档检索池之间的第一文档选取比例分配关系,以及同一分类文档检索池内不同类型文档的第二文档选取比例分配关系;
109.根据所述第一文档选取比例分配关系、所述第二文档选取比例分配关系和各所述时效性检索文档的实时质量评分,在所述目标相关性文档检索池中获取至少一个目标相关性文档,并在所述目标分类文档检索池中获取至少一个目标分类文档。
110.可选的,第二文档检索池匹配模块320,具体可以用于:
111.将所述目标电子文档中包括的多个级别的分类标签,与每个所述分类文档检索池对应的标准标签进行匹配,获取成功匹配的至少一个目标标准标签;
112.获取与所述至少一个目标标准标签对应的目标分类文档检索池。
113.可选的,目录结构生成模块340,具体可以用于:
114.根据各所述目标标准标签和预设的标签体系,生成主目录架构;
115.在所述主目录架构中,加入相关性文档目录项,形成关联文档目录架构;
116.将所述至少一个目标相关性文档和所述至少一个目标分类文档分别加入至所述关联文档目录架构中,形成所述关联文档目录结构。
117.可选的,同步展示模块350,具体可以用于:
118.将当前展示页面划分为左侧显示区域和右侧显示区域;
119.在所述右侧显示区域中展示所述目标电子文档的同时,在所述左侧显示区域中展示所述关联文档目录结构。
120.可选的,关联文档的推荐装置还可以包括:比例分配关系更新模块,用于在对所述关联文档目录结构进行同步展示之后,响应于对所述关联文档目录结构中的至少一个关联文档的选择指令,更新所述第一文档选取比例分配关系以及所述第二文档选取比例分配关系。
121.上述产品可执行本公开任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
122.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
123.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
124.图6示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
125.如图6所示,设备400包括计算单元401,其可以根据存储在只读存储器(rom)402中的计算机程序或者从存储单元408加载到随机访问存储器(ram)403中的计算机程序,来执行各种适当的动作和处理。在ram403中,还可存储设备400操作所需的各种程序和数据。计算单元401、rom402以及ram403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。
126.设备400中的多个部件连接至i/o接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
127.计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,
例如关联文档的推荐方法。例如,在一些实施例中,关联文档的推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。
128.在一些实施例中,计算机程序的部分或者全部可以经由rom402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到ram403并由计算单元401执行时,可以执行上文描述的关联文档的推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行关联文档的推荐方法。
129.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
130.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
131.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
132.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
133.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数
字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
134.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
135.人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
136.云计算(cloudcomputing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。
137.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
138.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1