用于语言标签管理的方法和系统的制作方法

文档序号:8339649阅读:262来源:国知局
用于语言标签管理的方法和系统的制作方法
【专利说明】用于语言标签管理的方法和系统
【背景技术】
[0001] 公共图书馆、国家数据仓库、公共服务资料库以及历史新闻数据库经常收集、分类 和挖掘历史记录。元数据管理经常被用于数据分类。例如,语言标签已经被用在元数据中 以便分等级、归档、分类和处理所收集的特定语言、脚本、领域和编码类别下的文本、图形、 音频和视频流数据格式的国际文档。语言标签可以被嵌入和/或集成到所收集的信息中以 支持联网信息处理和管理。具体地,在HTML和XML中,语言标签可以指示HTML和XML文档 中的文本或其他项目的语言。

【发明内容】

[0002] 根据本公开的一个方面,公开了一种用于国际数据存储库上的语言标签管理的方 法和技术。该方法包括:访问标准化语言标签存储库以识别存储库语言标签中的变更;搜 索使用语言标签分类的数据源的记录以识别数据源的记录中存在的语言标签;确定数据源 的记录中存在的语言标签是否与存储库语言标签不一致;响应于确定数据源的记录中存在 的语言标签与存储库语言标签不一致,确定针对数据源的语言标签更新策略;以及根据语 言标签更新策略对记录执行语言标签更新处理以基于存储库语言标签对记录重新分类。
【附图说明】
[0003] 为了更完整地理解本申请、其目的和优点,现在参考结合附图给出的以下描述,在 附图中:
[0004] 图1是可以在其中实现本公开的说明性实施例的数据处理系统的网络的实施例;
[0005] 图2是可以在其中实现本公开的说明性实施例的数据处理系统的实施例;
[0006] 图3是示出可以在其中实现本公开的实施例的用于语言标签管理的数据处理系 统的实施例的图;
[0007] 图4是示出根据本公开实施例的语言标签更新处理的图;
[0008] 图5是示出根据本公开的使用针对语言标签的抽象层的语言标签更新处理的另 一个实施例的图;
[0009] 图6是示出根据本公开的用于语言标签管理的方法的流程图;并且
[0010] 图7是示出根据本公开的用于语言标签管理的方法的另一个实施例的流程图。
【具体实施方式】
[0011] 本公开的实施例提供了一种用于国际数据存储库上的语言标签管理的方法、系统 和计算机程序产品。例如,本公开的实施例能增强语言标签管理、在旧的元数据中更新新语 言标签、并重新分类从全世界资源收集的数据。例如,本公开的实施例通过检测语言标签存 储库中的新的语言标签、从语言标签存储库动态地同步本地语言标签表、以及根据为数据 源建立的配置文件/策略使用新的语言标签动态地更新和/或重新分类所存储的数据,来 使得具有语言标签的所存储的元数据能够被管理和/或更新。在一些实施例中,访问标准 化语言标签存储库以识别存储库语言标签中的变更;搜索使用语言标签而分类的数据源的 记录以识别数据源的记录中存在的语言标签;确定数据源的记录中存在的语言标签是否与 存储库语言标签不一致;以及如果这样,则确定针对数据源的语言标签更新策略,根据语言 标签更新策略对记录执行语言标签更新处理以基于存储库语言标签对记录重新分类。
[0012] 所属技术领域的技术人员知道,本公开的各个方面可以实现为系统、方法或计算 机程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、 完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方 式,这里可以统称为"电路"、"模块"或"系统"。此外,在一些实施例中,本公开的各个方面 还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介 质中包含计算机可读的程序代码。
[0013] 可以采用一个或多个计算机可用或计算机可读介质的任意组合。计算机可读介 质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以 是一一但不限于一一电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上 的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导 线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可 编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、 磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包 含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合 使用。
[0014] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号, 其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括一一但 不限于一一电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是 计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者 传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0015] 计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一一但不限 于一一无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0016] 可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的计算 机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++ 等,还包括常规的过程式程序设计语言一诸如"C"语言或类似的程序设计语言。程序代码可 以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、 部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。 在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一一包括局域网(LAN) 或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务 提供商来通过因特网连接)。
[0017] 下面将参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图 和/或框图描述本公开。应当理解,流程图和/或框图的每个方框以及流程图和/或框图 中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计 算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计 算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程 图和/或框图中的一个或多个方框中规定的功能/动作的装置。
[0018] 也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机或 其它可编程数据处理装置以特定方式工作,从而,存储在计算机可读介质中的指令就产生 出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品。
[0019] 计算机程序指令还可以加载到计算机、其它可编程数据处理装置或其他设备上, 以使一系列操作步骤在计算机、其它可编程装置或其他设备上被执行以产生计算机实现的 过程,使得在计算机或其它可编程装置上执行的指令提供用于实现流程图和/或框图中的 一个或多个方框中规定的功能/动作的处理。
[0020] 现在参考附图并且特别参考图1-2,提供可以在其中实现本公开的说明性实施例 的数据处理环境的示例性示图。应当理解的是,图1-2仅是示例性的并且并非旨在声称或 暗示关于可以在其中实现不同实施例的环境的任何限制。可以对示出的环境进行许多修 改。
[0021] 图1是可以在其中实现本公开的说明性实施例的数据处理系统的网络的图示。网 络数据处理系统100是可以在其中实现本公开的说明性实施例的计算机网络。网络数据处 理系统100包含网络130,其是用于提供网络数据处理系统100内连接在一起的各种设备和 计算机之间的通信链路的介质。网络130可以包括连接,诸如有线、无线通信链路或光纤电 缆。
[0022] 在一些实施例中,服务器140和服务器150与数据存储装置160 -起连接到网络 130。服务器140和服务器150可以是例如BM? Power Systems?服务器。此外,客户端 110和120连接到网络130。客户端110和120可以是例如个人计算机或网络计算机。在 示出的示例中,服务器140向客户端110和120提供数据和/或服务,例如但不限于数据文 件、操作系统映像以及应用。网络数据处理系统100可以包括附加的服务器、客户端和其他 设备。
[0023] 在示出的示例中,网络数据处理系统100是具有网络130的因特网,网络130表示 全世界的使用传输控制协议/因特网协议(TCP/IP)的协议组来相互通信的网络和网关的 集合。在因特网的中心是主要节点或主计算机之间的高速数据通信线路的主干,所述主要 节点或主计算机由对数据和消息进行路由的数以千计的商业、政府、教育和其他计算机系 统组成。当然,网络数据处理系统100也可以被实现为大量不同类型的网络,诸如内联网、 局域网(LAN)或广域网(WAN)。图1意在作为一个示例,而并非作为对不同说明性实施例的 架构限制。
[0024] 图2是可以在其中实现根据本公开的用于语言标签管理的系统的实施例的数据 处理系统200的实施例,诸如但不限于客户端110和/或服务器140。在该实施例中,数据 处理系统200包括总线或通信结构202,其提供处理器单元204、存储器206、持久存储装置 208、通信单元210、输入/输出(I/O)单元212和显示器214之间的通信。
[0025] 处理器单元204用于执行可以被加载到存储器206中的软件指令。处理器单元 204可以是一组一个或多个处理器,或者可以是多处理器核,这取决于特定的实现。而且,处 理器单元204可以使用一个或多个异构处理器系统来实现,在所述异构处理器系统中主处 理器与辅助处理器一起存在于单个芯片上。作为另一个说明性示例,处理器单元204可以 是包含相同类型的多个处理器的对称多处理器系统。
[0026] 在一些实施例中,存储器206可
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1