一种信息资源的自动编目方法

文档序号:9787426阅读:1173来源:国知局
一种信息资源的自动编目方法
【技术领域】
[0001 ]本发明涉及编目技术领域,尤其涉及一种信息资源的自动编目方法。
【背景技术】
[0002] 在公共信息平台信息组织管理中,资源目录作为城市信息资源规划与管理的组成 部分,主要的作用就是将交换共享数据库或者其他业务系统的可以公开的服务聚合至一个 统一的标准目录下,并提供查询检索功能和共享的数据资源订阅功能。为共享数据资源提 供更加高效,精确的服务。
[0003] 资源目录的编目工作是建立目录资源与数据之间相互关系的重要手段和方法,是 元数据信息进行分类和归档的重要途径。如果没有编目工作,资源目录就只剩下一个空空 的框架,没有内容来充实和支撑,而数据信息也被完全孤立,无法进行检索、分类和共享。
[0004] 目前,对城市信息资源的编目工作,一般是编目人员通过人工编目的方法进行的。 随着数据资源等信息的不断增加,对于编目工作人员来说,编目任务越来越繁重而复杂,编 目人员一般要经过分析探讨才能对信息资源进行正确的分类和编目,因此,不仅使得编目 工作变得越来越复杂,而且编目过程所花费的时间也越来越多,效率越来越低,进而导致编 目的质量也受到一定的影响,所以,现有的编目方法已经无法满足编目任务的需要。

【发明内容】

[0005] 本发明的目的在于提供一种信息资源的自动编目方法,从而解决现有技术中存在 的前述问题。
[0006] 为了实现上述目的,本发明采用的技术方案如下:
[0007] -种信息资源的自动编目方法,包括如下步骤:
[0008] S1,依据同一规范定义,分别创建信息资源标识符编码字典和资源目录,所述信息 资源标识符编码字典包含标识符和对应的标识符编码,所述标识符编码与所述资源目录的 各级编码 对应;
[0009] S2,加载当前信息资源,并获取所述当前信息资源的标识符;
[0010] S3,对所述当前信息资源的标识符进行拆分,获得多个标识符片段;
[0011] S4,对于每个标识符片段,在所述信息资源标识符编码字典中查找是否存在所述 标识符片段,如果存在,则执行S5-S6,否则,结束;
[0012] S5,在所述信息资源标识符编码字典中,利用标识符和对应的标识符编码的对应 关系,根据所述标识符片段,获取所述标识符片段的编码;
[0013] S6,将所述标识符片段的编码与所述资源目录的各级编码进行比对,获取与所述 标识符片段的编码一致的各级资源目录,根据所述各级资源目录确定与所述信息资源匹配 的资源目录项,并将所述信息资源编目到所述资源目录项上。
[0014]优选地,Sl中,所述规范定义为:政务信息资源目录体系对于信息资源标识符编码 的规范定义。
[0015] 优选地,所述标识符编码的结构包括:5位字母数字前段和不定长的字符串后段, 所述前段和所述后段之间用7"隔开。
[0016] 优选地,所述前段用于标明信息资源目录的管理者,由GB18030-2000中规定的10 个阿拉伯数字和26个大写罗马字符组成。
[0017] 优选地,所述后段用于对同一信息资源目录管理者所管理的目录中的信息资源进 行唯一标识,采用GB18030-2000中规定的字符组成。
[0018] 优选地,Sl中,所述创建资源目录,采用如下步骤进行实施:
[0019] 在目录表中增加标识符编码字段;
[0020] 在目录创建界面的标识符编码输入框中输入标识符编码,并保存至所述标识符编 码字段。
[0021] 优选地,S2中,所述获取所述当前信息资源的标识符,采用如下步骤进行实施:
[0022] 在所述信息资源对应的元数据表中增加标识符字段;
[0023] 在元数据创建界面的标识符输入框中输入标识符,并保存至所述标识符字段。
[0024] 优选地,S2和S3之间还包括步骤:采用ajax技术将所述信息资源的标识符传入业 务层,则S3在所述业务层中进行。
[0025] 优选地,S5具体为,在业务层中调用autoResourceCataloguing方法,利用标识符 和对应的标识符编码的对应关系,根据所述标识符片段,获取所述标识符片段的编码。
[0026] 本发明的有益效果是:本发明实施例提供的信息资源的自动编目方法,通过依据 同一规范定义创建信息资源标识符字典和资源目录,使标识符编码与所述资源目录的各级 编码一一对应,通过将信息资源标识符解析成多个标识符片段,并在所述信息资源标识符 编码字典中查找是否存在所述标识符片段,如果存在,根据标识符与编码的对应关系,获取 每个标识符片段的编码,然后,利用标识符编码与所述资源目录的各级编码一一对应的关 系,获取资源目录的各级目录,最终确定完整的目录项,并将信息资源编目到该目录项上。 从而实现了对信息资源的自动编目,从而大大缩短了编目的时间,减少了编目人员的任务 工作量,并且提高了编目质量。
【附图说明】
[0027] 图1是本发明实施例提供的自动编目方法流程示意图;
[0028] 图2是信息资源标识符结构示意图;
[0029] 图3是标识符字典数据事例结构示意图。
【具体实施方式】
[0030] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进 行进一步详细说明。应当理解,此处所描述的【具体实施方式】仅仅用以解释本发明,并不用于 限定本发明。
[0031] 如图1所示,本发明实施例提供了一种信息资源的自动编目方法,包括如下步骤:
[0032] S1,依据同一规范定义,分别创建信息资源标识符编码字典和资源目录,所述信息 资源标识符编码字典包含标识符和对应的标识符编码,所述标识符编码与所述资源目录的 各级编码 对应;
[0033] S2,加载当前信息资源,并获取所述当前信息资源的标识符;
[0034] S3,对所述当前信息资源的标识符进行拆分,获得多个标识符片段;
[0035] S4,对于每个标识符片段,在所述信息资源标识符编码字典中查找是否存在所述 标识符片段,如果存在,则执行S5-S6,否则,结束;
[0036] S5,在所述信息资源标识符编码字典中,利用标识符和对应的标识符编码的对应 关系,根据所述标识符片段,获取所述标识符片段的编码;
[0037] S6,将所述标识符片段的编码与所述资源目录的各级编码进行比对,获取与所述 标识符片段的编码一致的资源目录的各级,根据所述资源目录的各级确定与所述信息资源 匹配的资源目录项,并将所述信息资源编目到所述资源目录项上。
[0038] 本发明实施例提供的信息资源的自动编目方法,在实际操作过程中,可以按照如 下步骤进行实施:
[0039] 首先,创建标识符字典表,TB_TYPEC0DE,字典表包含3个字段,分别为:
[0040] ID:字典表主键,INTEGER类型,非空且自增;
[0041 ] TYPEC0DE:标识符码,VARCHAR 类型,非空;
[0042] DESCRIPTION:标识符码说明,VARCHAR类型,可空;
[0043] 然后,创建资源目录,具体的方法可以为:在目录表中增加标识符编码字段, RESC0DE,字段类型为VARCHAR,非空。在目录创建的过程中,该字段为必填项,系统获取该字 段后通过正则表达式进行验证,验证其是否与字典表中的TYPEC0DE类型一致,如果一致,则 继续,否则,重新填写目录表中的标识符字段;其中,通过正则表达式对标识符编码进行验 证:
[0045]如果验证成功,
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1