用于管理集成数据对象的系统及其方法

文档序号:9713557阅读:380来源:国知局
用于管理集成数据对象的系统及其方法
【技术领域】
[0001]本发明涉及一种用于管理数据对象的系统和方法,并且更具体地,涉及一种用于通过互联网和包括云的网络环境或者通过诸如计算机或智能装置这样的各种类型的装置来有效地管理诸如文件、非文件数据和动态数据这样的各种形式的数据的方法和系统。
【背景技术】
[0002]现今,诸如计算机和智能装置这样的各种装置的广泛采用和使用正变得普遍和平常。这个趋势随后正推动针对全部类型的用户-个人、企业、各种类型的组织用户以及政府的用户数据飞涨。更糟的是,这种快速的数据激增不仅体现在其量方面,而且体现在其种类方面。然而,尽管在用户数据的多样性和复杂性二者方面的这种显著增加,用于管理并组织这些用户数据的技术尚未改进或改变太多。大多数用户数据采取各种各样的“文件”的形式。另外,用户数据作为应用程序内数据或者跨越各种应用/程序的专有程序数据被存储在计算机或智能装置上。在其它情况下,用户数据作为网页内容而存在,或者存在于“云”上(即,在网络或互联网上)。
[0003]全部这些不同的形式的用户数据,加上现有技术的局限性,累计达到在处理用户数据方面的复杂性和不一致性的增加,更不必说用户的必需努力和不便性的增加。此外,用户数据既没有正被识别或组织,又没有与用户相关地且以用户为中心地有组织地进行处理。
[0004]这是因为不同种类的用户数据各自要求使用不同的管理方案:诸如文件系统(例如,FAT32或NTFS)这样的基于硬件的、以技术为中心的管理方案;与用于各种应用数据的方案相反;或者用于管理网络上或云中的用户数据的方案。目前不存在横跨并超过这些不同的方案使这些各种各样的用户数据有组织地连接并相关的这种一致的管理系统。
[0005]因此,随着数据的量或多样性增加,用户不得不处理甚至更多的文件名和“文件夹”(或者“目录”,下文中“文件夹”)路径。另外,用户可能不得不在诸如计算机和智能装置这样的不同的装置之间,或者在互联网和各种应用(诸如电子邮件、日历、联系人应用或计费程序等)之间来回跳转,仅仅以使得工作完成。结果,追踪、收集和关联(弄清其含义)分散的/分段的数据的责任落在了用户身上。
[0006]具体地,作为用于组织并存储文件数据的技术,基于文件夹的“文件系统”正被普遍地用在计算机、各种装置上,并且甚至被用在云存储服务上。然而,这种技术不是很直观也不够用户友好,并且其带有固有的低效率:为了处理“文件”形式的用户数据,用户必须知道文件名或其“文件路径”的至少一部分,以进行任何搜索或管理任务;然而,这些文件/文件夹名通常不够有意义,并因此不足以有效地识别用户数据;或者,其可能如在来自数字相机的“IMG_001.jpg”文件中一样是完全没有意义的。此外,文件夹系统通常被用于诸如硬盘驱动器、固态驱动器(SSD)和存储器卡这样的基于硬件的存储介质上以及诸如云存储装置的存储位置上的全部文件系统,是基于“树”结构的,该“树”结构正是针对处理文件数据的层次问题的原因。
[0007]树结构始终要求文件夹当中的层次。树结构强制通过创建“路径”(或目录/文件夹/文件路径;下文中“路径”)按照特定次序来指定并保存文件夹-即使当这种层次关系在现实中不存在并因此没有必要。例如,在诸如“c:\报告\销售”和“c:\销售\报告”这样的情况下,在路径中的文件夹之间的次序是任意的且无意义的。另外,不管必要性如何,始终强制文件夹之间的这种层次会产生多个问题:这在创建或定位文件夹时使用户困惑;这经常造成多余的文件夹;结果,增加了在定位文件、访问文件、使用文件和/或管理文件方面的时间和成本。
[0008]另外,树结构要求特定的文件名在每个特定文件中必须是“互相排斥的”,以使得仅一个名称实例能够针对每个文件夹中的每个唯一文件名而存在。这意味着对文件的每一处修订必然导致:覆盖现有文件并且丢失其以前的内容;或者,每当存在修订时,创建具有诸如“报告-草稿.doc”、“报告-修订-01.doc”等这样的新名称的全新的文件。另外,在多个修订文件以不同的名称而存在的情况下,或者在多个修订文件被复制到不同的位置并以相同的文件名而存在的其它情况下,不存在用于识别或比较这些关系、修订的范围或者这些修订的次序的简单方式。唯一可能的方式是用户直接检查并验证它们,这将是不方便的。当多个用户共享并修订诸如文档这样的这些可能“相同的”文件时,多个修订文件的这种“共存”或“混合的”存在通过使其管理数据、使数据同步并使用数据特别混乱和困难而变得更差。
[0009]一致且统一的数据管理对于“非文件数据”变得甚至更加困难,该“非文件数据”不采取文件的形式,而是作为特定程序或应用(诸如日历指派项、地址簿条目等)内的内部数据而存在。非文件数据是孤立的并且独立于任何文件系统,使得不可能使用来自文件系统的文件夹来进行分组或组织。虽然一些简单的内部/专有文件夹或者类似文件夹的分组机构可以设置在程序内,但是其完全取决于每个应用/程序以提供这种功能。因此,对于非文件数据,分类方案/组织方案和相关数据内容差别很大,并且容易产生不一致性和不兼容性。然而,这种不一致性和不兼容性并不一定是每个个体应用的错。相反,这是由于缺乏实现这种一致性和兼容性的公共技术基础或平台。
[0010]另一方面,相同的不一致性问题和不兼容性问题还适用于非文件数据的搜索。当智能装置上的一些少量的应用(诸如“地址簿”或“日历”)可以提供搜索应用内数据的能力时,它们局限于特定硬件或特定0S平台,并且这些制造商/开发商提供仅针对特定目的的这种功能。因此,对于大多数应用来说,不考虑硬件或0S平台,支持或提供用户数据的通用搜索在目前几乎是不可能的。不存在这种技术基础或平台。此外,任何现有的非文件数据搜索-连同文件数据搜索-在搜索方法、标准和幅度方面是有限的;并且仅能够使结果相对中等,所以难以从网页搜索中获得如用户将期望那样的快速且丰富的搜索结果。
[0011]对于网页搜索,其是快速且高效的。然而,其通过搜索网页或附近图像的基于文本的内容来工作。所以,其主题/目标大多局限于公共网页和其内容,使得在搜索条件、范围和可搜索内容/类型方面受到限制。因此,网页搜索不适于非文本格式的各种类型的文件或者任何应用数据-没有网页的任何封闭式说明。此外,其缺少针对非公共数据(诸如个人或公司所拥有的大多数文档和资源)的安全特征/功能以及除了搜索以外的其它管理功能。
[0012]更重要的是,包括网页搜索在内的任何基于文本的搜索基本上通过在无需理解每个项的目的或上下文的情况下对文本进行比较来工作。因此,搜索结果的保真度由于数据对象当中的有机关系无法围绕用户的角度被完全地掌握或理解而恶化。一些网页搜索引擎向用户提供“相关关键词”或“流行关键词”。然而,这些关键词仅仅是基于对由许多用户同时输入什么关键词以及这种频率的统计而显示的所计算的结果;它们不反映每个网页内的内容的任何真正“理解”。因此,这些网页搜索技术的有用性不适用于搜索诸如文件或应用数据这样的任何非公共用户数据。这是由于用户数据搜索和网页搜索之间的多个关键区别而造成的。首先,进行对一个人自己的数据搜索的目的和动机可以与网页搜索的目的和动机迥然不同。另外,用户数据搜索在主题(subject)数据方面更加具体和/和多样化。其次,对于用户数据搜索,通常不存在计算具有统计意义的搜索关键词的足够数目的用户和搜索请求。
[0013]现今,诸如网页、互联网媒体文件(例如,照片)和社交联网服务(SNS)帖子这样的网页内容与典型的用户数据分离:不但在其形式和搜索方法方面;而且还在管理和存储方面。典型的网页内容或者通过网络浏览器、SNS服务或特定应用作为文本被输入;或者通过指定针对诸如照片这样的各个媒体文件的路径来进行上传。然后,这些网页内容被任意地存储并在网页服务器、博客引擎或SNS服务器上进行管理。因此,在互联网上共享大量的各种用户数据(包括文件、非文件等)要求用户的额外努力-诸如进行上传。另外,以更常用的形式(诸如文件)保存任何网页内容同样要求分别选择、下载和存储这些内容的不便性。
[0014]在被用来对各种类型的数据进行分类/组织的许多数据结构当中-除了“树”结构以外-是“标签”概念。与树结构不同,标签概念通过应用多个标签允许交叠分类/分组。通过应用公共“标签”,能够将多个项分类成“集”或“组”。通过按照交叠方式指派多个标签,能够使项获得两个或更多个分类的资格。目前,“标签”大多以两种形式的技术而存在。
[0015]一种是“网页搜索标签”(或者“主题标签(Hashtag)”),其被用来增加对搜索引擎的曝光-网页、博客或SNS帖子的曝光。其通过将“搜索关键词”文本字符串直接插入到网页中来工作,并且这还包括在互联网网站或博客等上使用的“标签云”。但是,这种类型的“标签”仅仅是帮助基于适用文本的内容曝光于搜索请求的“搜索索引”,并且除非其是文本的格式,否则无法被用在公共文件上。
[0016]第二种类型
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1