用于管理元数据的方法和系统的制作方法

文档序号:8435817阅读:315来源:国知局
用于管理元数据的方法和系统的制作方法
【专利说明】用于管理元数据的方法和系统
[0001]本专利申请要求2012年10月8日提交的美国临时专利申请N0.61/710,882的优先权的权益,其教导通过引用整体地并入在本文中。
技术领域
[0002]本发明提供用于元数据的管理的基于计算机的方法,其中元数据被输入、通过与一个或多个标准或规则相比较被记分,并且产生了错误、警告以及推荐的报告。该基于计算机的方法还提供用于元数据的校正和/或编辑及改进、以及经改进的元数据的分发的手段。同样由本发明所提供的是用于元数据的质量的记分系统。
【背景技术】
[0003]元数据或元内容提供关于数据的一个或多个方面的信息,包括但不限于数据的创建、数据的目的、创建的时间和日期、数据的创建者或作者、以及所使用的标准的手段。
[0004]诸如美国国家标准协会(ANSI)和国际标准化组织(ISO)、书业研宄集团(BISG)、EDiTEUR(定义)的许多组织已为元数据建立了广泛详细的规则和/或标准,并且在各种学科中登记。在恰当标准化的目录(诸如书籍、艺术、图像、音乐以及电影)是重要的字段方面,这些标准常常调整被用于目录信息在各方之间的共享的.xml标准计算机代码。
[0005]这样的目录的管理者试图使成百、成千并且有时成千上万个单独记录保持完整,具有如例如通过可搜索性、相关性以及丰富性并且按照这些标准而确定的最高质量。
[0006]基于计算机的方法存在以用于估计和/或验证包含.xml元数据的文件的必要标签是否完整,或者处于恰当顺序或对于特定标签具有正确的代码。
[0007]然而,估计字段中所提供的元数据相对于准确性和/或格式和/或质量是否满足所选学科的已建立规则和/或标准和/或最佳实践、和/或相关性和/或完整性需要通过对于所选学科在元数据的规则和/或标准和/或最佳实践和/或质量方面具有高级专门知识的人为审查。这样的人为审查是极其费时且费力的并且常常是不准确的。另外,对于人或一群人来说不可能在符合非常细微且特定的工业标准和/或其它定性标准、常常保持在不同地方和/或数据库中的这些目录中维持大量记录。当前,这样的审查通过目录条目的随机选择来执行以得到人为审查。这个方法既不提供元数据的质量的准确表示,也不为需要在大目录内维持准确性和一致性的那些人提供成本效益合算的手段。

【发明内容】

[0008]本发明的一个方面涉及用于管理元数据的基于计算机的方法。在这个方法中,选择学科的元数据被上传到计算机处理器。首先经由计算机为必要字段的完整而检查元数据文件。所上传的元数据然后针对准确性和/或格式和/或完整性和/或质量经由计算机与所选学科的一个或多个选择的规则、标准和/或最佳实践相比较,并且根据这些比较提供错误和/或警告的分解。由计算机在这些比较步骤中识别的错误包括数据文件中的遗漏字段以及由对于该选择学科在有关元数据的规则和/或标准和/或最佳实践方面具有多年经验的专家先前仅在视觉上识别的元数据中的错误。然后提供了用来校正和/或编辑和/或增强和/或改进元数据的手段。
[0009]在一个实施例中,一个或多个分数基于必要字段的完整、所输入的元数据与所选学科的所选一个或多个规则、标准和/或最佳实践的比较、和/或元数据的质量而被分配给元数据。
[0010]因此,本发明的另一方面涉及用于元数据的记分系统,通过所述记分系统这种数据的用户和/或消费者能够评估元数据的准确性和/或可靠性和/或完整性和/或丰富性和/或质量。在这个系统中,计算机处理器被提供用于选择学科的元数据文件的输入。提供了用于为必要字段的完整而检查元数据文件的装置。还提供了用于将元数据与所选学科的一个或多个选择的规则、标准和/或最佳实践相比较的装置。通过这个比较装置所识别的错误包括由对于所选学科在有关元数据的规则和/或标准和/或最佳实践和/或质量方面具有多年经验的专家先前仅通过视觉检查所识别的元数据中的错误。记分卡被生成,并且指示元数据的质量和/或准确性和/或完整性和/或丰富性的一个或多个分数基于该比较被分配给元数据。
【附图说明】
[0011]图1是描绘本发明的方法中的信息的流程的框图。
[0012]图2A至图2C是用本发明的方法和记分系统生成的记分卡的示例。
[0013]图3A-3H提供数个工业标准或规则、标准或规则的限定词(如果需要)、以及用于将元数据与规则或标准相比较的逻辑的非限制性示例。
[0014]图4提供包含错误的.xml数据文件、其经由本发明的方法的识别以及紧跟错误的校正之后的.xml数据文件的示例。
[0015]图5A至图5E是举例说明识别并且校正元数据中的错误的过程的来自本发明的方法的屏幕快照。图5A是遵循的规则比特的列表的屏幕快照,并且指示存在正错过必要年龄资格的标题。图5B是示出具有问题的标题的书页的屏幕快照。在这个示例中,这个标题有数个问题并且全部被突出。图5C是示出标题已添加美国学校年级的紧跟校正之后的书页的屏幕快照。图是示出能够添加必要信息的数据管理器系统的屏幕快照,并且图5E是示出数据管理器添加学校年级的屏幕快照。
【具体实施方式】
[0016]本发明提供用于管理元数据的基于计算机的方法以及用于元数据的记分系统。采用本发明的方法,能够上传、估计、记分、校正并且维持选择学科的元数据文件。
[0017]在一个实施例中,基于计算机的方法提供有可经由任何web浏览器访问的用户友好基于云的环境。替换地,可以在用户自己的网络上托管基于计算机的方法。本发明的方法能够在单用户平台或多用户平台上执行,所述多用户平台使得多个用户能够协作地估计并且校正、维持和/或增强来自网站的元数据。
[0018]能够依照本发明管理元数据所针对的各种选择学科的示例包括但不限于书籍、图像、电影、音乐、艺术以及文化合集的元数据。
[0019]图1示出本发明的基于计算机的方法中的信息的流程。
[0020]在本发明的方法中,选择学科的元数据首先被上传到计算机处理器。参见图1的步骤101。能够以各种方式上传数据。在一个非限制性实施例中,数据作为.xml文件被上传。在一个非限制性实施例中,诸如经由EXCEL文件以电子表格格式上传数据。
[0021]在本发明的一个非限制性实施例中,所上传、记分、校正和/或维持的元数据是针对书籍的。书籍元数据在被正确地编码时帮助书籍卖方、数据提供方、经销商、搜索引擎以及消费者发现并且访问关于书籍的信息。它还帮助做库存跟踪等。这个元数据包括但决不限于书籍格式和价格、标题、出版者/印象/品牌视频以及关于书籍的其它多媒体、描述和标识符。ONIX或在线信息交换(用于用电子学方法传送信息的基于.XML的标准化格式)是出版工业的标准元数据格式的示例。因此,在本发明的一个实施例中,本发明的基于计算机的方法可以被设计成导出由用户上传的基于.XML的ONIX数据。
[0022]然而,如由技术人员在阅读本公开时将理解的,本文所描述的计算机方法和记分系统例行地可适于牵涉特别是基于.xml标准的那些模式的元数据的其它选择学科。在本发明的方法中,首先为必要数据字段的完整性而检查元数据文件。例如,在牵涉.xml文件的实施例中,为标签、模式等的完整而检查.xml文件,参见图1的步骤102。并且参见图4,图4依照本发明的步骤102提供包含错误、具体地遗漏数据的.xml数据文件、其经由本发明的方法的识别、以及紧跟这个错误的校正之后的.xml数据文件的非限制性示例。
[0023]在本发明的方法中,所上传的元数据然后还与所选学科的一个或多个选择的规贝1J、标准和/或最佳实践相比较。参见图1的步骤103。出于本发明的目的,规则、标准和/或最佳实践可以来自消费者和/或来自工业和/或是质量标准或评估质量度量和/或基于发明人的推荐、建议和/或提议。例如,对于涉及书籍的元数据,可以将该元数据与一个或多个ONIX工业标准和/或一个或多个最佳实践(包括但决不限于由书业集团和/或Editeur.0rg所阐述的那些、以及发明人在本文中的那些推荐、提议和/或建议)相比较。在一个非限制性实施例中,发明人在本文中的推荐、提议和/或建议可以增强元数据质量。在另一非限制性实施例中,发明人在本文中的推荐、提议和/或建议可以增强目录中的项目的可发现性、可搜索性、可销售性和/或收益性。依照本发明的方法,已经创建了按其比较元数据的规则。这些规则可以包括由工业标准设定主体所阐述的单个实体的最佳实践或基于如由发明人和/或用户所确定的工业最佳实践、推荐、建议和/或提议的组合所选择的规则集合。在一个实施例中,比较可以基于由发明人在本文中从分析其它数据集合而开发的规则集合。还基于逻辑为用户编写规则。这些规则不仅检查.xml而且在.xml内。对于这个步骤,用户可以选择它们要他们的元数据被比较的一个或多个消费者或工业规则或标准和/或最佳实践。该方法可以提供用
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1