数字文献资源协同阅览系统的制作方法

文档序号:6370538阅读:125来源:国知局
专利名称:数字文献资源协同阅览系统的制作方法
技术领域
本发明涉及文献阅览领域,特别是涉及一种数字文献资源基于个性化的协同阅览系统。
背景技术
随着数字技术和网络技术的不断发展,已有越来越多的文献数据库在向读者提供其所需文献的同时,提供更多的个性化服务。例如,国外的文献数据库包括=ElsevierScience、SpringLink> Wiley InterScience等;国内的文献数据库包括维普、万方、专利文献库等;正在逐步分别向读者提供诸如最新文献通报、保存读者的检索历史、甚至向读者提供存储空间进行个人文献存储、管理等个性化服务功能。
尽管如此,由于各个单一的文献数据库的文献资源有其自身的局限性,大多数的读者,例如,科研人员、教师和学生等,往往需要检索阅览同一领域的多个不同文献资源数据库。读者不得不分别登录各个文献数据库,此时由于现有的个性化服务不能在多个文献数据库之间共享,显得极为不便。与此同时,当读者若想与阅览过相同文献的或具有类似兴趣的其他读者交流文献阅读心得体会时,现有的文献数据库也没有对应的服务手段。鉴于目前现有的各种文献数据库不能为读者提供一种适应多种文献资源数据库的、统一的个性化服务,也不能为读者提供具有协作、协同功能的文献交互阅览服务,因此,极有必要对现有基于网络的文献资源所提供的与文献阅览相关的服务进行改进。

发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于个性化的数字文献资源协同阅览系统,以便将不同类型的文献数据库的文献通过统一的文献阅览平台提供给读者,并为读者提供多种服务。为实现上述目的及其他相关目的,本发明提供一种数字文献资源协同阅览系统,其至少包括改写模块,用于将所获取的读者文献请求信息中的相关地址信息及来自至少一种文献服务设备提供给用户设备的文献信息中的相关地址信息分别予以改写,以便预定设备作为文献服务设备与用户设备之间的通信中介;信息记录模块,用于记录文献阅读者的读者阅读相关信息;构建模块,用于基于所记录的读者阅读相关信息来构建读者和/或文献的关联关系;信息提供模块,用于基于所构建的关联关系及来自至少一种文献服务设备的文献信息来向读者提供文献阅览平台。优选地,所述构建模块包括个性化类目体系建立单元,用于基于所记录的读者阅读相关信息来建立或更新读者各自的类目分类体系。该个性化类目体系具备上下等级层次功能。优选地,所述构建模块包括信息依存关系建立单元,用于基于所记录的读者阅读相关信息,以读者、文献及类目为节点来建立或更新节点依存关系。优选地,所述构建模块包括兴趣模型建立单元,用于基于所记录的读者阅读相关信息来建立或更新读者的兴趣模型。优选地,所述信息提供模块包括信息推荐单元,用于基于读者的兴趣模型与文献、类目以及和其他读者等信息的关联程度来向读者推荐信息。优选地,所述构建模块包括兴趣专题讨论组建立单元,用于基于读者个性化类目分类体系中的共享类目来建立或更新兴趣专题讨论组。优选地,所述构建模块包括统计单元,用于分析并统计所记录的读者阅读相关信 肩、O如上所述,本发明的数字文献资源协同阅览系统,具有以下有益效果能将不同种类的文献数据库的文献通过统一的文献阅览入口提供给读者,方便读者的阅览;能自动记录读者所阅读的文献及其阅读行为和爱好;能个性化地分类存储文献;能揭示相关文献、相关读者和相关类目及其三者之间的知识关联;也可在不同读者的相关共享类目下,为读者提供一个基于文献的交互讨论平台。


图I显示为本发明的数字文献资源协同阅览系统示意图。图2显示为本发明的数字文献资源协同阅览系统提供的文献阅览平台优选示意图。图3显示为本发明的数字文献资源协同阅览系统所构建的节点依存关系示意图。元件标号说明I数字文献资源协同阅览系统11改写模块12信息记录模块13构建模块14信息提供模块
具体实施例方式以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式
加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。请参阅图I。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。如图I所示,本发明提供一种数字文献资源协同阅览系统。所述数字文献资源协同阅览系统I至少包括改写模块11、信息记录模块12、构建模块13、信息提供模块14。所述改写模块11将所获取的读者文献请求信息中的相关地址信息及来自至少一种文献服务设备提供给用户设备的文献信息中的相关地址信息分别予以改写,以便预定设备作为文献服务设备与用户设备之间的通信中介。具体地,所述改写模块11将从所获取的读者文献请求地址信息Q/中删除包含以预定设备作为通信中介设备的地址前缀P,由该所述预定设备向相应的文献服务设备发送读者实际文献请求Qi ;在从文献服务设备获取返回结果后,所述改写模块11又将文献服务设备提供给用户设备的文献等信息中的每一个文献服务设备的链接信息Qi+1均自动添加以预定设备作为通信中介设备的链接前缀P,以形成Qi+1’。当读者在文献服务设备提供的文献等信息中予以选择后,用户设备将读者选择的链接请求Qi+1’先传送给所述预定设备,再由所述预定设备经改写操作后(Qi+1’-P —Qi+1),发送给相应的文献服务设备。由此循环往 复,实现了预定设备的通信中介功能。 例如,所述改写模块11将万方文献数据库对应的文献服务设备提供给用户设备的文献等信息中的每一个服务设备的链接地址均自动添加包含以预定设备作为通讯中介设备的链接前缀;将维普数据库对应的文献服务设备提供给用户设备的文献等信息中的每一个服务设备的链接地址也均自动添加包含以预定设备作为通讯中介设备的链接前缀。其中,所述预定设备包括能提供通讯中介服务的设备,优选地,包括但不限于,所述改写模块11所属的设备等。所述改写模块11所属的设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述改写模块11获取读者文献请求信息的获取方式包括但不限于1)由自身所属的设备提供,例如,所述改写模块11所属的设备El向读者Al所使用的用户设备BI提供文献检索页面后,该用户设备BI将读者Al在该检索页面中的输入的检索词信息及数据库信息传送回设备E1,则所述改写模块11从设备El获取的读者文献请求信息包括检索词信息、数据库信息及所属设备El的地址前缀信息。2)由其他设备提供给所述改写模块11等。所述信息记录模块12记录文献阅读者的读者阅读相关信息。其中,优选地,所述读者阅读相关信息包括但不限于读者信息和以文献为基本单位的读者所阅读文献信息与读者阅读行为相关信息等。优选地,所述读者信息包括但不限于1)读者个人识别信息;例如,用户名、密码、年龄、性别等等;2)读者部门信息;3)读者专业领域信息;4)读者类型信息,例如,学生、教师等;所述读者所阅读文献信息包括但不限于1)被阅读文献的名称信息;2)被阅读文献的作者信息;3)被阅读文献的摘要信息;4)被阅读文献的相关书目信息,例如,文献出处等;5)被阅读文献的阅读时间;6)被阅读文献的阅读频次;7)被阅读文献的阅读评价计分;8)被阅读文献的重要程度分值;所述读者阅读行为相关信息包括但不限于1)读者的文献下载行为信息;2)读者的文献在线阅读行为信息;3)读者的个性化类目体系构建行为信息;4)读者的个性化文献归类行为信息;5)读者的文献查询行为信息;6)读者的文献笔记记录行为信息;7)读者的文献摘抄行为信息;8)读者参与文献讨论的行为信息。
具体地,所述信息记录模块12基于作为文献服务设备与用户设备之间的通信中介的预定设备来获取文献阅读者的读者阅读相关信息,并予以记录。例如,所述信息记录模块12由所述预定设备接收到的读者在注册界面中输入的信息来获取读者类型信息、读者个人识别信息等。又例如,所述信息记录模块12基于所述预定设备将万方数据库的文献dl分别提供给读者All所使用的用户设备B11、读者A12所使用的用户设备B12,来记录文献dl的阅读次数为2,并记录读者A12最新阅读文献dl的时间为Tl。再例如,所述信息记录模块12基于读者A13在所述信息提供模块14提供的包含文献d2的文献阅览平台(容后陈述),对文献d2的评价分为5颗星,来记录读者A13对被阅读文献d2的阅读评价计分为与5颗星对应的预定评价分值“5分”。
又例如,所述信息记录模块12基于读者A14在所述信息提供模块14提供的包含文献d3的文献阅览平台(容后陈述),将文献d3设置为“重要”,来记录读者A14对被阅读文献d3的重要程度分值为与“重要”对应的预定权重分值“3分”。所述构建模块13基于所记录的读者阅读相关信息来构建读者和/或文献的关联关系。例如,所述构建模块13基于所记录的文献dll被读者A21及读者A22阅读过,表示文献dll分别与读者A21及读者A22相关联。则读者A21及读者A22相关联。又例如,所述构建模块13基于由读者将文献dl2与dl3同样归属于类目Cl,则文献dl2与文献dl3相关联。所述信息提供模块14基于所构建的关联关系及来自至少一种文献服务设备的文 献信息来向读者提供文献阅览平台。具体地,所述信息提供模块14基于所构建的关联关系、至少一种文献服务设备的文献信息及预定的文献阅览模板来形成读者的文献阅览平台。例如,如图2所示,其为信息提供模块14提供给读者A31的文献阅览平台。该文献阅览平台包含有读者A31曾经阅览的文献名称“全国多中心类风湿关节炎冠心病危险因素的流行病学研究”。该文献阅览平台包括文献作者、文献文摘、文献出处等文献书目信息,也包含文献评价记分、个人笔记、个人摘抄、交互讨论等读者阅读行为信息。读者A31通过诸如鼠标等人机交互设备点选“阅读全文”选项后,所述信息提供模块14将再基于该文献“全国多中心类风湿关节炎冠心病危险因素的流行病学研究”的全文来更新文献阅览平台,随后再将更新后的文献阅览平台提供给该读者A31。作为一种优选方式,所述构建模块13包括个性化类目体系建立单元(未予图示)。所述个性化类目体系建立单元基于所记录的读者阅读相关信息来建立或更新读者各自的类目分类体系。例如,所述个性化类目体系建立单元基于所述信息记录模块12所记录的读者A44已读文献d31属于类目c21、保存的文献d32属于类目c22来建立读者A44的类目分类体系为包含类目c21与c22的类目分类体系。由此,所述信息提供模块14基于所述个性化类目体系建立单元所建立或更新的类目分类体系来设置读者A44的类目体系,并将该设置添加在文献阅览平台模板中的“分门别类”栏,以便提供给读者A44。又例如,所述个性化类目体系建立单元基于所述信息记录模块12所记录的读者A51自选类目c31、c32作为自己的类目体系、且将类目c31作为共享类目,来建立读者A51的类目分类体系为包含类目c31与c32的类目分类体系,且将类目c31设置为共享。作为另一种优选方式,所述构建模块13包括兴趣专题讨论组建立单元(未予图示)。所述兴趣专题讨论组建立单元基于读者个性化类目分类体系中的共享类目来建立或更新兴趣专题讨论组。例如,所述兴趣专题讨论组建立单元基于读者A45、A46及A47的类目分类体系中均包含有“医学”类目并将该类目设置为共享,则将读者A45、A46及A47各自“医学”类目下的所有文献合并成为“医学”专题讨论组SI,形成一个基于文献为基本单位的交互讨论兴趣小组。由此,“医学”专题讨论组SI将为所有读者所分享,但只有加入关注的读者比如A48,才可以参与交互讨论。
作为又一种优选方式,所述构建模块13包括信息依存关系建立单元(未予图示)。所述信息依存关系建立单元基于所记录的读者阅读相关信息,以读者、文献及类目为节点来建立或更新节点依存关系。其中,读者、文献及类目之间的关系包括属于、阅读、基于文献相关、基于类目相关、基于读者阅读相关、基于内容相关等关系,所述信息依存关系建立单元基于该些关系来建立节点依存关系。该技术的基本思想为(I)以XML有向图方式来等价地描述节点依存关系,记作G,将读者、类目和文献描述为XML文档中的一个节点(即元素或元素属性),将其间的信息依存关系描述为节点间的父子关系、元素-属性关系或XLink引用关系,由此所有关系就以XML有向图的形式完整准确地保存下来;(2)将XML有向图Gkm等价地存储于关系数据库中。根据半结构化数据与关系数据的等价映射理论,XML文档中节点间的父子、兄弟、引用关系可以等价地存储于关系数据库中,从而实现图中节点及节点间关系的快速存取;(3)在读者查询过程中,以自适应的方式为Gkm动态构建一个支持频繁XPath路径查询的高效索引——GKM-index。该索引能够根据读者的查询需求进行自适应地更新和优化,确保频繁XPath路径的精确快速查询,同时最大程度地降低索引的空间开销;(4)通过GKM_index快速查询算法,实现Gkm中知识节点及节点间依存关系的快速查询、导航和联想。以下将对所述信息依存关系建立单元为实现上述基本思想所采用的算法,SPGH-index自适应构建算法和快速查询算法,予以详细描述。I、GKM-index自适应构建算法该算法能够根据不断变化的读者查询自适应地更新和优化索引,在确保索引准确计算频繁XPath路径的前提下,最大程度地降低索引空间开销,进而构建一个支持频繁XPath路径查询的高效XML有向图索引。该算法的基本思想就是利用频繁XPath路径的查询结果来监督GKK-index构建、更新和优化的全过程,大幅度地减少了索引结点的过度分裂,从而使其能够支持任意复杂的频繁XPath路径。
为了使GKM-index支持任意复杂的频繁XPath路径,采用分解策略,将面向复杂XPath路径的索引构建问题转化为面向主干路径Pmain和若干条件路径g, g,...,的索引构建问题。具体来说,就是利用中间查询结果对索引进行后向及前向优化,使索引能够支持主干和条件路径,这样索引就能支持任意复杂的XPath查询路径。若所述信息依存关系建立单元将节点的后向相似度提升至length(pmain),前向相似度提高至length(p^),则祖先和后代节点的前向、后向相似度也须被相应地提升。2、GKM_index快速查询算法该算法的基本思想第一,将任意复杂的XPath查询路径表达式转换 为一个或多个DFA (确定型有穷自动机),以GKM-indeX为输入运行DFA,并发现能驱动DFA到达最终状态的所有目标节点;第二,针对XPath查询路径的不同类型,对当前节点中是否包含模糊解做出快速判断。若不包含则将所有精确解都添加到查询结果中,否则对其进行正确性验证,只有通过验证的精确解才能添加到查询结果中。例如,如图3所示,其为所述信息依存关系建立单元基于所记录的读者A、B、C、D各自的读者阅读相关信息建立的读者A、B、C、D、类目Cl、类目c2、类目c3、类目c4、及文献dl、文献d2、文献d3、文献d4、文献d5之间依存关系示意图。由上可见,基于该信息依存关系建立单元所建立的依存关系,所述信息提供模块14可沿着该依存关系的路径来进行任意深度和广度的知识联想,从而使资源的获取途径与使用效率得到极大地拓展和提升。例如,所述信息提供|吴块14基于读者A与C类目相关的依存关系,将读者A阅读过、且属于类目Cl的文献d21的诸如名称、链接地址等信息添加在提供给读者C的文献阅览平台。作为另一种优选方式,所述构建模块13包括兴趣模型建立单元(未予图示)。所述兴趣模型建立单元基于所记录的读者阅读相关信息来建立或更新读者的兴趣模型。例如,所述兴趣模型建立单元采用I = (N, W)来建立读者的兴趣模型,其中N表示用户兴趣模型对应的标志号,W表示读者兴趣特征,W = (fft, Wp,Wu,W1),Wt表示此模型对应的类目名称;Wp表示此类目的父类的类目名称,一般取两级父类的类目;WU表示由读者手动添加到兴趣模型中的特征I1表示读者的兴趣模型在经过i次学习和更新后新增的特征,在初始的用户兴趣模型1(°)中,W1是一个空集。UH都是一个二元组的集合,表示为Kti, Wi), <t2, w2>,…},其中ti表示一个特征Wi代表特征\的权重。Wt中的每个特征的权值为a ;ffu中每个特征的权值为b ;ffp中的特征t,基于公式I来计算其权值/{/) =去 J G 10,1,2}(公式 I)其中,I为类目在分类体系结构中相差的层数,通常a、b、c的值都设为I。此外,所述兴趣模型建立单元还基于读者阅读相关信息来更新所建立的兴趣模型。例如,当读者A41在浏览了所提供的文献d31后,在给予的包含“重要”、“一般”等的评价选项中选择“一般”,则所述兴趣模型建立单元基于所述信息记录模块12所记录的读者A41对文献d31的评价为“一般”来降低读者A41的兴趣模型中与文献d31相关的特征的权重一个等级。又例如,设D是包含有读者对文献评价的反馈信息的文献集,dj G D,Vj代表4的浏览次数,tj代表4的浏览时间,h代表读者对文档4的评价等级,fv, ft, fe分别为文献的浏览次数、浏览时间、评价等级的加权函数,W⑴表示读者兴趣模型I(i)的兴趣特征,则所述兴趣模型建立单元按以下公式来更新兴趣特征

其中,ft和fv都是对数函数,fe是一个线性函数。如果文献&浏览次数、浏览时间、评价等级为0或空,这三个函数都返回一个常数。 优选地,所述信息提供模块14包括推荐单元(未予图示)。所述推荐单元基于读者的兴趣模型与与文献、类目以及和其他读者等信息的关联程度来向读者推荐信息。例如,所述推荐单元将读者的兴趣模型与文献分别作为一向量,再基于两向量之间的夹角来确定读者的兴趣模型与文献的关联程度,并将关联程度高于预定阈值的文献推荐给该读者。作为再一种优选方式,所述构建模块13包括统计单元(未予图示)。所述统计单元分析并统计所记录的读者阅读相关信息。例如,所述统计单元对所述信息记录模块12所记录的读者A48所浏览的文献、笔记、摘抄和讨论等信息进行统计分析,以提供给所述信息记录模块12。需要说明的是,本领域技术人员应该理解,上述图2所示的文献阅览平台仅仅只是例示,而非对本发明的限制,事实上,任何基于读者阅读相关信息所构建的关联关系及来自至少一种文献服务设备的文献信息来向读者提供交互协同服务的文献阅览平台,均包含在本发明的范围内;再有,前述信息提供模块基于信息依存关系建立单元、兴趣模型建立单元、个性类目体系建立单元、兴趣专题讨论组建立单元及统计单元提供的相关关联关系来建立或更新提供给读者的文献阅览平台仅仅只是例示,而非对本发明的限制。综上所述,本发明的数字文献资源协同阅览系统基于改写模块能将不同类型的文献数据库的文献通过统一的文献阅览入口提供给读者,方便读者的阅览;此外,还能自动记录读者所阅读的文献及其阅读行为和爱好,能将文献个性化地分类存储,并能揭示相关文献、相关读者和相关类目及其三者之间的关系,也可在不同读者的相关共享类目下,为读者社群提供一个基于文献的交互讨论平台。由此,读者除了可以个性化管理个人文献外,还可以找到和自己志趣相同的读者,让有相同爱好的读者分享彼此阅读文献的成果,促成读者间的人际交流。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
权利要求
1.一种数字文献资源协同阅览系统,其特征在于,所述数字文献资源协同阅览系统至少包括改写模块,用于将所获取的读者文献请求信息中的相关地址信息及来自至少一种文献服务设备提供给用户设备的文献信息中的相关地址信息分别予以改写,以便预定设备作为文献服务设备与用户设备之间的通信中介; 信息记录模块,用于记录文献阅读者的读者阅读相关信息; 构建模块,用于基于所记录的读者阅读相关信息来构建读者和/或文献的关联关系;信息提供模块,用于基于所构建的关联关系及来自至少一种文献服务设备的文献信息来向读者提供个性化的文献协同阅览平台。
2.根据权利要求I所述的数字文献资源协同阅览系统,其特征在于,所述构建模块包括类目体系建立单元,用于基于所记录的读者阅读相关信息来建立或更新读者各自的个性化类目分类体系。
3.根据权利要求I所述的数字文献资源协同阅览系统,其特征在于,所述构建模块包 括 信息依存关系建立单元,用于基于所记录的读者阅读相关信息,以读者、文献及类目为节点来建立或更新节点依存关系。
4.根据权利要求I所述的数字文献资源协同阅览系统,其特征在于,所述构建模块包括兴趣模型建立单元,用于基于所记录的读者阅读相关信息来建立或更新读者的兴趣模型。
5.根据权利要求4所述的数字文献资源协同阅览系统,其特征在于,所述信息提供模块包括信息推荐单元,用于基于读者的兴趣模型与信息的关联程度来向读者推荐信息。
6.根据权利要求2所述的数字文献资源协同阅览系统,其特征在于,所述构建模块包括兴趣专题讨论组建立单元,用基于读者个性化类目分类体系中的共享类目来自动创建或更新交互式的基于文献的兴趣专题讨论组。
7.根据权利要求I所述的数字文献资源协同阅览系统,其特征在于,所述构建模块包括统计单元,用于分析并统计所记录的读者阅读相关信息。
8.根据权利要求I所述的数字文献资源协同阅览系统,其特征在于,所述读者阅读相关信息包括读者信息和以文献为基本单位的读者所阅读文献信息与读者阅读行为相关信肩、O
9.根据权利要求8所述的数字文献资源协同阅览系统,其特征在于,所述读者信息包括 读者个人识别信息; 读者部门信息; 读者专业信息; 读者类型信息。
10.根据权利要求8所述的数字文献资源协同阅览系统,其特征在于,所述读者所阅读文献信息包括 被阅读文献的名称信息; 被阅读文献的作者信息; 被阅读文献的摘要信息;被阅读文献的相关书目信息; 被阅读文献的阅读时间; 被阅读文献的阅读频次; 被阅读文献的阅读评价计分; 被阅读文献的重要程度分值。
11.根据权利要求8所述的数字文献资源协同阅览系统,其特征在于,所述读者阅读行为信息包括 读者的文献下载行为信息; 读者的文献在线阅读行为信息; 读者的个性化类目体系构建行为信息; 读者的个性化文献归类行为信息; 读者的文献查询行为信息; 读者的文献笔记记录行为信息; 读者的文献摘抄行为信息; 读者的文献参与讨论行为信息。
全文摘要
本发明提供一种数字文献资源协同阅览系统。所述系统包括改写模块,用于将所获取的读者文献请求信息中的相关地址信息及来自至少一种文献服务设备提供给用户设备的文献信息中的相关地址信息分别予以改写,以便预定设备作为文献服务设备与用户设备之间的通信中介;用于记录文献阅读者的读者阅读相关信息的信息记录模块;用于基于所记录的读者阅读相关信息来构建读者和/或文献的关联关系的构建模块;用于基于所构建的关联关系及来自至少一种文献服务设备的文献信息来向读者提供文献阅览平台的信息提供模块。本发明的优点包括能够针对多种不同的文献数据库,为读者提供一个统一的以文献为基本单位的,具备个性化阅读服务功能的,数字文献资源协同阅览平台。
文档编号G06F17/30GK102750331SQ201210174889
公开日2012年10月24日 申请日期2012年5月31日 优先权日2012年5月31日
发明者耿亦兵 申请人:上海半坡网络技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1