一种基于云存储的百科数据处理方法及系统的制作方法

文档序号:6355605阅读:126来源:国知局
专利名称:一种基于云存储的百科数据处理方法及系统的制作方法
技术领域
本发明涉及数据处理技术,尤其涉及一种基于云存储的百科数据处理方法及系 统。
背景技术
随着互联网技术的不断发展,人们越来越多的开始通过互联网进行各种知识和信 息的搜索,并且,也开始习惯于通过互联网来对某个主题发表自己的意见,与其他人进行深 入的探讨。而提供该主题或者探讨平台的网站则记录每个主题中有价值的一个或预设数量 个探讨内容,供其他互联网用户进行类似主题的查询和浏览,以便为所述其他互联网用户 提供对应的知识或者借鉴。例如,现有的百度百科中,即记录了极大数量的各种行业、各种 主题以及不同用户对这些主题的意见或答复。但是,现有的百科系统所记录的内容涉及到各个行业,百科数据的数据量很大,需 要对大量的数据进行集中处理,系统的处理速度较慢。

发明内容
有鉴于此,本发明要解决的技术问题是,提供一种基于云存储的百科数据处理方 法及系统,能够提高对百科数据的处理速度。为此,本发明实施例采用如下技术方案一种基于云存储的百科数据处理方法,包括获取第一用户建立的词条项目,将所述词条项目进行云存储;获取第二用户的检索信息,根据所述检索信息从存储的词条项目中查找与所述检 索信息相关度最高的预设数量个词条项目;将查找到的所述词条项目向用户进行展现。将所述词条项目进行云存储包括将所述词条项目发送给各个进行词条项目存储的存储终端,以便各个存储终端将 接收到的词条与自身存储的词条进行匹配,匹配上时,将接收到的词条信息添加到匹配得 到的词条项目中;否则,返回失败消息;接收到所有存储终端返回的失败消息时,确定获取到的词条项目的存储终端,将 词条项目发送给确定的存储终端进行存储。根据所述检索信息从存储的词条项目中查找与所述检索信息相关度最高的预设 数量个词条项目包括将所述检索信息发送给各个进行词条项目存储的存储终端,以便各个存储终端计 算所述检索信息与自身存储的各个词条项目之间的相关度;接收各个存储终端返回的相关度超过相关度阈值的词条项目。将查找到的所述词条项目向用户进行展现包括按照词条项目的相关度进行非正序排列,将所述词条项目的词条向用户进行展现。还包括接收第二用户的指示信息,向第二用户展现第二用户指示的词条所对应 的词条项目。一种基于云存储的百科数据处理系统,包括存储单元,用于获取第一用户建立的词条项目,将所述词条项目进行云存储;查找单元,用于获取第二用户的检索信息,根据所述检索信息从存储的词条项目 中查找与所述检索信息相关度最高的预设数量个词条项目;第一展现单元,用于将查找到的所述词条项目向用户进行展现。存储单元包括第一获取子单元,用于获取第一用户建立的词条项目;第一发送子单元,用于将所述词条项目发送给各个进行词条项目存储的存储终 端,以便各个存储终端将接收到的词条与自身存储的词条进行匹配,匹配上时,将接收到的 词条信息添加到匹配得到的词条项目中;否则,返回失败消息;确定子单元,用于接收到所有存储终端返回的失败消息时,确定获取到的词条项 目的存储终端,将词条项目发送给确定的存储终端进行存储。查找单元包括第二获取子单元,用于获取第二用户的检索信息;第二发送子单元,用于将所述检索信息发送给各个进行词条项目存储的存储终 端,以便各个存储终端计算所述检索信息与自身存储的各个词条项目之间的相关度;接收子单元,用于接收各个存储终端返回的相关度超过相关度阈值的词条项目。第一展现单元具体用于按照词条项目的相关度进行非正序排列,将所述词条项 目的词条向用户进行展现。还包括第二展现单元,用于接收第二用户的指示信息,向第二用户展现第二用户 指示的词条所对应的词条项目。对于上述技术方案的技术效果分析如下将获取到的词条项目进行云存储,云存储系统本身能够进行海量存储,并对数据 进行分布式处理,从而本发明实施例的百科数据处理方法相对于现有技术的处理方法而 言,存储容量大,存储速度快;并且,在进行检索信息的检索时,是从云存储系统中进行数据 的读取,读取速度更快;因此,本发明实施例的百科数据处理方法能够实现大数据量百科数 据的存储,并且能够实现对于检索信息所对应词条及词条信息的快速检索。


图1为本发明实施例一种基于云存储的百科数据处理方法流程示意图;图2为本发明实施例另一种基于云存储的百科数据处理方法流程示意图;图3为本发明实施例一种基于云存储的百科数据处理系统结构示意图。
具体实施例方式以下,结合附图详细说明本发明实施例基于云存储的百科数据处理方法及系统的 实现。
图1为本发明实施例基于云存储的百科数据处理方法流程示意图,如图1所示,该 方法包括步骤101 获取第一用户建立的词条项目,将所述词条项目进行云存储;步骤102 获取第二用户的检索信息,根据所述检索信息从存储的词条项目中查 找与所述检索信息相关度最高的预设数量个词条项目;步骤103 将查找到的所述词条项目向用户进行展现。图1所示的百科数据处理方法中,将获取到的词条项目进行云存储,云存储系统 本身能够进行海量存储,并对数据进行分布式处理,从而图1所示的百科数据处理方法相 对于现有技术的处理方法而言,存储容量大,存储速度快;并且,在进行检索信息的检索时, 是从云存储系统中进行数据的读取,读取速度更快;因此,本发明实施例的百科数据处理方 法能够实现大数据量百科数据的存储,并且能够实现对于检索信息所对应词条及词条信息 的快速检索。在图1的基础上,通过图2对本发明实施例的基于云存储的百科数据处理方法进 行更为详细的说明,如图2所示,该方法包括步骤201 获取第一用户建立的词条项目;所述词条项目包括词条以及词条所对应的词条信息;其中,所述词条也即为用户所提出的主题;所述词条信息包括若干个用户对该 主题进行的解释、解答或者讨论等词条相关内容。例如,词条为考拉;而词条信息中包括 若干个用户分别对考拉这种动物的详细介绍。其中,所述第一用户以及后续步骤中所述的第二用户仅用户对用户进行泛指,第 一用户和第二用户仅用于区别建立词条项目的用户以及进行检索的用户,在实际应用中, 所述第一用户和第二用户可以为某一项目的用户,也即某一实际的用户既可以作为建立 词条项目的第一用户,也可以是进行词条检索的第二用户。本发明实施例中的百科数据也即包括所有的所述词条项目。在实际应用中,本步骤可以由运行本发明实施例所述方法的运营商为用户提供进 行词条项目建立的页面,并指示用户所述词条和词条信息的填写位置,相应的,当第一用户 指示进行所建立词条项目的保存时,触发百科数据处理系统直接从该页面的对应位置获取 到完整的词条项目的数据。步骤202 将所述词条项目进行云存储。其中,云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的 概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型 的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一 个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需 要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个 以数据存储和管理为核心的云计算系统。所述对词条项目进行云存储包括第一终端将所述词条项目发送给各个进行词条项目存储的存储终端;各个存储终端将将接收到的词条与自身存储的词条进行匹配,匹配上时,将接收 到的词条信息添加到匹配得到的词条项目中;否则,向第一终端返回失败消息,第一终端确定获取到的词条项目的存储终端,将词条项目发送给确定的存储终端进行存储。也即是说用户建立了一个词条项目,但是,可能之前也有其他用户建立了词条相 同的词条项目,因此,在进行用户建立词条项目的存储时,需要确定是否存在相同词条的词 条项目,如果存在就进行词条项目的更新,不存在,则直接进行词条项目的存储。步骤203 获取第二用户的检索信息,根据所述检索信息从存储的词条项目中查 找与所述检索信息相关度最高的预设数量个词条项目;本步骤中,所述查找步骤可以包括第一终端将所述检索信息发送给各个进行词条项目存储的存储终端;各个存储终端计算所述检索信息与自身存储的各个词条项目之间的相关度;将相关度超过相关度阈值的词条项目返回给第一终端。其中,在计算检索信息与词条项目之间的相关度时,可以对检索信息进行分词处 理,确定检索信息的关键词,检索各个词条项目中是否包含检索信息的关键词,通过各个词 条项目中包含的关键词数据以及关键词的出现次数确定检索信息与词条项目之间的相关 度,具体的计算方法这里不限定。步骤204 将查找到的所述词条项目向用户进行展现。一般的,本步骤的实现可以为按照词条项目的相关度进行非正序排列,将所述词条项目的词条向用户进行展 现;接收第二用户的指示信息,向第二用户展现第二用户指示的词条所对应的词条项 目;也即是说用户通过点击等操作确定查看某一词条对应的词条项目时,向用户展现用 户指示的词条所对应的词条项目。当用户查看某一条词条项目时,可能希望对该词条项目进行进一步的解释,也即 增加词条对应的词条信息,此时,本方法进一步包括步骤205 确定需要更新的词条项目的存储终端,将该词条项目的词条以及新增 加的词条信息发送给词条项目的存储终端,以便所述存储终端将接收到的词条信息增加到 所述词条对应的词条项目中。与上述的基于云存储的百科数据处理方法相对应的,本发明实施例还提供一种基 于云存储的百科数据处理系统,如图3所示,该系统包括存储单元310,用于获取第一用户建立的词条项目,将所述词条项目进行云存储;查找单元320,用于获取第二用户的检索信息,根据所述检索信息从存储的词条项 目中查找与所述检索信息相关度最高的预设数量个词条项目;第一展现单元330,用于将查找到的所述词条项目向用户进行展现。优选地,存储单元310可以包括第一获取子单元,用于获取第一用户建立的词条项目;第一发送子单元,用于将所述词条项目发送给各个进行词条项目存储的存储终 端,以便各个存储终端将接收到的词条与自身存储的词条进行匹配,匹配上时,将接收到的 词条信息添加到匹配得到的词条项目中;否则,返回失败消息;确定子单元,用于接收到所有存储终端返回的失败消息时,确定获取到的词条项 目的存储终端,将词条项目发送给确定的存储终端进行存储。
优选地,查找单元320可以包括第二获取子单元,用于获取第二用户的检索信息;第二发送子单元,用于将所述检索信息发送给各个进行词条项目存储的存储终 端,以便各个存储终端计算所述检索信息与自身存储的各个词条项目之间的相关度;接收子单元,用于接收各个存储终端返回的相关度超过相关度阈值的词条项目。优选地,第一展现单元330具体可以用于按照词条项目的相关度进行非正序排 列,将所述词条项目的词条向用户进行展现;此时,该系统还可以包括第二展现单元340,用于接收第二用户的指示信息,向第二用户展现第二用户指示 的词条所对应的词条项目。优选地,如图3所示,该系统还可以包括发送单元350,用于确定需要更新的词条项目的存储终端,将该词条项目的词条以 及新增加的词条信息发送给词条项目的存储终端,以便所述存储终端将接收到的词条信息 增加到所述词条对应的词条项目中图3所示的百科数据处理系统中,将获取到的词条项目进行云存储,云存储系统 本身能够进行海量存储,并对数据进行分布式处理,相对于现有技术的处理系统而言,存储 容量大,存储速度快;并且,在进行检索信息的检索时,是从云存储系统中进行数据的读取, 读取速度更快;因此,本发明实施例的百科数据处理系统能够实现大数据量百科数据的存 储,并且能够实现对于检索信息所对应词条及词条信息的快速检索。本领域普通技术人员可以理解,实现上述实施例的方法的过程可以通过程序指令 相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程序在执行时执行上述 方法中的对应步骤。所述的存储介质可以如ROM/RAM、磁碟、光盘等。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本发明的保护范围。
权利要求
1.一种基于云存储的百科数据处理方法,其特征在于,包括 获取第一用户建立的词条项目,将所述词条项目进行云存储;获取第二用户的检索信息,根据所述检索信息从存储的词条项目中查找与所述检索信 息相关度最高的预设数量个词条项目;将查找到的所述词条项目向用户进行展现。
2.根据权利要求1所述的方法,其特征在于,将所述词条项目进行云存储包括将所述词条项目发送给各个进行词条项目存储的存储终端,以便各个存储终端将接收 到的词条与自身存储的词条进行匹配,匹配上时,将接收到的词条信息添加到匹配得到的 词条项目中;否则,返回失败消息;接收到所有存储终端返回的失败消息时,确定获取到的词条项目的存储终端,将词条 项目发送给确定的存储终端进行存储。
3.根据权利要求1所述的方法,其特征在于,根据所述检索信息从存储的词条项目中 查找与所述检索信息相关度最高的预设数量个词条项目包括将所述检索信息发送给各个进行词条项目存储的存储终端,以便各个存储终端计算所 述检索信息与自身存储的各个词条项目之间的相关度;接收各个存储终端返回的相关度超过相关度阈值的词条项目。
4.根据权利要求1至3任一项所述的方法,其特征在于,将查找到的所述词条项目向用 户进行展现包括按照词条项目的相关度进行非正序排列,将所述词条项目的词条向用户进行展现。
5.根据权利要求4所述的方法,其特征在于,还包括接收第二用户的指示信息,向第二用户展现第二用户指示的词条所对应的词条项目。
6.一种基于云存储的百科数据处理系统,其特征在于,包括存储单元,用于获取第一用户建立的词条项目,将所述词条项目进行云存储; 查找单元,用于获取第二用户的检索信息,根据所述检索信息从存储的词条项目中查 找与所述检索信息相关度最高的预设数量个词条项目;第一展现单元,用于将查找到的所述词条项目向用户进行展现。
7.根据权利要求6所述的系统,其特征在于,存储单元包括 第一获取子单元,用于获取第一用户建立的词条项目;第一发送子单元,用于将所述词条项目发送给各个进行词条项目存储的存储终端,以 便各个存储终端将接收到的词条与自身存储的词条进行匹配,匹配上时,将接收到的词条 信息添加到匹配得到的词条项目中;否则,返回失败消息;确定子单元,用于接收到所有存储终端返回的失败消息时,确定获取到的词条项目的 存储终端,将词条项目发送给确定的存储终端进行存储。
8.根据权利要求6所述的系统,其特征在于,查找单元包括 第二获取子单元,用于获取第二用户的检索信息;第二发送子单元,用于将所述检索信息发送给各个进行词条项目存储的存储终端,以 便各个存储终端计算所述检索信息与自身存储的各个词条项目之间的相关度;接收子单元,用于接收各个存储终端返回的相关度超过相关度阈值的词条项目。
9.根据权利要求6至8任一项所述的系统,其特征在于,第一展现单元具体用于按照词条项目的相关度进行非正序排列,将所述词条项目的词条向用户进行展现。
10.根据权利要求9所述的系统,其特征在于,还包括第二展现单元,用于接收第二用户的指示信息,向第二用户展现第二用户指示的词条 所对应的词条项目。
全文摘要
本发明公开了一种基于云存储的百科数据处理方法,包括获取第一用户建立的词条项目,将所述词条项目进行云存储;获取第二用户的检索信息,根据所述检索信息从存储的词条项目中查找与所述检索信息相关度最高的预设数量个词条项目;将查找到的所述词条项目向用户进行展现。本发明还公开了一种基于云存储的百科数据处理系统,该方法和系统能够提高对百科数据的处理速度。
文档编号G06F17/30GK102129454SQ20111005431
公开日2011年7月20日 申请日期2011年3月8日 优先权日2011年3月8日
发明者吴凯峰, 吴铧明, 孙雪芬, 张 荣, 徐杰锋, 方东煦, 曹汝滨, 李云, 肖政 申请人:北京友友天宇系统技术有限公司, 北京天云融创科技有限公司, 国网信息通信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1