本发明涉及数字服务领域,尤其涉及一种基于图谱的数字服务异构资源整合方法。
背景技术:
1、对于事物的认识,既要研究事物本身,也要研究事物与事物关系。在对事物研究过程中,研究人员梳理出事物的关键词,整理成叙词表,用于统一事物的描述。后来,研究人员提出了本体,既能描述事物本身,也能描述事物与事物之间的关系,于是出现了基于本体的语义网络。近年来,研究人员提出了数据治理,用于采集、管理和运营数据资源。对于工业资源,提出了工业数据治理;对于科技服务资源,提出了科技服务数据治理。科技服务数据治理在情报、标准、知识产权等单一领域已经进行了一些有益的尝试,在异构跨资源的治理方面刚刚起步。
2、在科技服务资源整合方面,有两种技术方案。一是资源信息整合方案,该方案整合资源的简单描述信息,通过相同、包含等模糊匹配法进行统计、归类和查询,资源内容用附件的方式采集、管理和使用;二是单一资源内容整合方案,该方案整合标准、情报、知识产权等单一资源,采用图谱的方式建立单一资源内容网络,用于展示、查询。
3、资源信息整合方案与单一资源内容整合方案存在如下问题:
4、(1)仅能整合简单的属性信息。资源信息整合方案,虽能整合全部科技服务资源,但只是实现简单的属性描述,不能整合资源内容。(2)仅能整合单一资源的内容信息。单一资源内容整合方案,虽能整合资源的内容,但资源类型过于单一,不能整合异构资源。
技术实现思路
1、鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于图谱的数字服务异构资源整合方法。
2、根据本发明的一个方面,提供了一种基于图谱的数字服务异构资源整合方法,所述整合方法包括:
3、预处理数字化科技服务异构资源;
4、将预处理后的数字化科技服务异构资源进行分类处理;
5、在资源分类的基础上,以资源分类为骨架,构建数字化科技服务异构资源图谱。
6、可选的,所述预处理数字化科技服务异构资源具体包括:
7、数字化科技服务文本资源预处理,识别资源的名称、作者、单位、时间、目录、术语、引用文献、条目、表格、图片、公式、参考文献微资源;
8、数字化科技服务多媒体资源预处理,识别资源的音频,转化为文本;识别资源的视频,抓取特征图片;
9、对文本、图片联合执行数字化科技服务文本资源预处理,并关联记录。
10、可选的,所述将预处理后的数字化科技服务异构资源进行分类处理具体包括:
11、在数字化科技服务异构资源预处理的基础上,进行资源分类;
12、从显性和隐性两个方面执行资源分类;
13、显性分类根据资源的传统或常规分类资源,隐性分类根据资源的内涵分类资源。
14、可选的,所述数字化科技服务异构资源显性分类,依据资源的常规或常识分类资源;所述资源包括情报、标准、知识产权、声像、图书和档案;
15、定义单一资源的常规或常识分类;
16、定义多个单一资源的复合或综合分类;
17、定义显性分类与资源之间的关联关系;
18、每个资源属于一个或多个分类,每个分类管理一个或多个资源。
19、可选的,所述数字化科技服务异构资源隐性分类法具体包括:
20、依据资源术语分类资源;
21、定义资源术语的顶级分类,根据术语所属的系统、领域、学科、行业等范畴定义顶级分类;
22、定义资源术语的二级分类,根据术语描述的环境、行为、专业、技术、知识、组织、任务等特性划分二级分类;
23、定义资源术语,每个二级类别包含大量的资源术语,资源术语包括管理类术语、业务类术语、数据类术语;
24、定义术语之间关系,每两个术语之间存在许用/拒用、从属/包含、对应、优先/缩略的关系;
25、定义术语与资源之间关联关系,每个资源关联一个或多个术语,每个术语关联一个或多个资源。
26、可选的,所述在资源分类的基础上,以资源分类为骨架,构建数字化科技服务异构资源图谱具体包括:
27、对于显性分类,根据分类的上下级、同级关系构建图谱;
28、对于隐性分类,根据资源术语分类及术语关系构建图谱。
29、可选的,所述在资源分类的基础上,以资源分类为骨架,构建数字化科技服务异构资源图谱具体包括:
30、图谱采集,采集显性分类图谱;图谱依据资源显性分类构建,以发散状呈现,在图谱中,名称相同的显性分类合并;
31、采集隐性分类图谱,图谱依据资源隐性分类构建,由术语分类及术语关系以网状呈现,在图谱中,名称相同的隐性分类和术语合并;
32、采集显性与隐性分类复合图谱,显性分类图谱依据资源显性分类构建;隐性分类图谱依据资源隐性分类构建,两类图谱通过相同的资源合并为一张图;
33、采集资源内涵图谱,预处理后,资源内部形成许多要素,包括术语、引用、参考要素,要素形成一张图谱;采集资源内部要素形成的图谱作为资源内涵图谱;
34、图谱存储,显性分类图谱、隐性分类图谱、显性与隐性复合图谱、资源内涵图谱都以图数据的方式存储;
35、图谱管理包括数据管理、访问控制,数据管理是指图谱采集数据以人机交互的方式进行调整、修订;访问控制是控制未授权人员对资源的访问,访问控制授权给资源分类;
36、图谱使用包括图谱查询、图谱转换、图谱比较;
37、图谱查询是沿着图谱脉络查找资源;图谱转换是以资源为核心呈现图谱,或以资源分类为核心呈现图谱,或以资源术语为核心呈现图谱;图谱比较是两个及两个以上图谱差异比较。
38、本发明提供的一种基于图谱的数字服务异构资源整合方法,所述整合方法包括:预处理数字化科技服务异构资源;将预处理后的数字化科技服务异构资源进行分类处理;在资源分类的基础上,以资源分类为骨架,构建数字化科技服务异构资源图谱。解决了异构资源的内容图谱建立、管理和应用问题。
39、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
1.一种基于图谱的数字服务异构资源整合方法,其特征在于,所述整合方法包括:
2.根据权利要求1所述的一种基于图谱的数字服务异构资源整合方法,其特征在于,所述预处理数字化科技服务异构资源具体包括:
3.根据权利要求1所述的一种基于图谱的数字服务异构资源整合方法,其特征在于,所述将预处理后的数字化科技服务异构资源进行分类处理具体包括:
4.根据权利要求3所述的一种基于图谱的数字服务异构资源整合方法,其特征在于,所述数字化科技服务异构资源显性分类,依据资源的常规或常识分类资源;所述资源包括情报、标准、知识产权、声像、图书和档案;
5.根据权利要求3所述的一种基于图谱的数字服务异构资源整合方法,其特征在于,所述数字化科技服务异构资源隐性分类法具体包括:
6.根据权利要求1所述的一种基于图谱的数字服务异构资源整合方法,其特征在于,所述在资源分类的基础上,以资源分类为骨架,构建数字化科技服务异构资源图谱具体包括:
7.根据权利要求1所述的一种基于图谱的数字服务异构资源整合方法,其特征在于,所述在资源分类的基础上,以资源分类为骨架,构建数字化科技服务异构资源图谱具体包括: