一种产品知识单元的构建方法和系统

文档序号:25791203发布日期:2021-07-09 11:27阅读:81来源:国知局
一种产品知识单元的构建方法和系统

1.本发明涉及知识图谱构建领域,特别涉及一种产品知识单元的构建方法和系统


背景技术:

2.如今互联网的蓬勃兴起,使大量的数据汇入网络。这种信息高速增加的现状,既充实了我们的生活、拓宽了我们的视野,也大大较低了实际可用资源的密度,为我们在井喷式的网络资源中提取有效信息造成了困扰。而设计相关人员在进行工作和学习时往往需要查询大量的参考资料,且目前网络于设计类的信息分布较为分散,存在知识单元列表结构可用面广但针对性低的问题,尚缺少专用于产品设计类信息查询且含多平台信息的产品设计类查询平台。因此,如何将种类各异的信息资源进行总和整理,把大量的设计知识联合组织,形成一个高效且便于设计师进行信息查询的平台成为亟待解决的大问题。


技术实现要素:

3.本发明其中一个发明目的在于提供一种产品知识单元的构建方法和系统,所述方法和系统通过知识图谱的可以构建知识单元,可以有效地整合知识单元的重要术语。
4.本发明其中一个发明目的在于提供一种产品知识单元的构建方法和系统,所述方法和系统可以建立各类知识单元之间的等级关系,可创建用于搜索引擎的完整的知识单元实例。
5.本发明其中一个发明目的在于提供一种产品知识单元的构建方法和系统,所述方法和系统可以精确地提取互联网上有效设计信息,将收集到的信息按标准进行统一的清洗、整理使产品设计知识表达变的更加规范化,便于后期对信息进行直接调用,大幅度提高设计师们查询参考数据的效率。
6.为了实现至少一个上述发明目的,本发明进一步提供一种产品知识单元的构建方法,所述方法包括如下步骤:
7.建立产品的一级知识单元列表,在所述一级知识单元列表中填入一级知识术语;
8.根据所述一级知识单元列表构建下级知识单元列表,形成树状知识单元列表结构;
9.建立知识单元的等级关系和同级关系,形成网状知识单元列表结构;
10.根据网状的知识单元列表结构创建知识单元实例;
11.根据所述知识单元列表结构创建搜索引擎。
12.根据本发明其中一个较佳实施例,所述一级知识单元列表包括一级实体和一级关系,其中所述一级关系包括等级关系和同级关系,所述一级实体通过所述等级关系连接下级知识单元列表中的实体,构建实体

关系

实体的三元组。
13.根据本发明另一个较佳实施例,所述一级实体作为一级知识单元的节点同时和不同的一级知识单元实体之间通过所述同级关系连接,同时一级实体和下级知识单元的实体连接构成分层网络状的知识单元列表结构。
14.根据本发明另一个较佳实施例,爬取对应产品实体术语,将构建好的知识单元列表结构保存并填入对应的实体术语,形成知识单元实例。
15.根据本发明另一个较佳实施例,将部分所述等级关系设置为属性关系、下级实体设置为属性值,构建“实体

属性

性值”的层级分布的三元组知识单元。
16.根据本发明另一个较佳实施例,所述搜索引擎的创建方法包括如下步骤:
17.将构建好的知识单元列表结构保存于数据库中;
18.确定检索领域,获取检索领域的url;
19.采用爬虫软件根据用户需求和所述知识单元列表结构爬取需要的实体信息;
20.将爬取后的实体信息和数据库中对比,若无相同则保存改实体信息,否则更新知识单元列表结构。
21.根据本发明另一个较佳实施例,构建搜索引擎表项,并将数据库中的信息导入搜索引擎中,用户输入查询语句后,采用solr搜索引擎使用ik中文分词器对用户输入的数据进行分词处理。
22.根据本发明另一个较佳实施例,将构建好的知识单元列表结构保存于数据库后,以下位知识单元中的实体名称作为字段名称保存。
23.为了实现至少一个上述发明目的,本发明进一步提供一种产品知识单元的构建系统,
24.本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质保存并应用上述一种产品知识单元的构建系统。
附图说明
25.图1显示的是本发明一种产品知识单元的构建方法流程示意图;
26.图2显示的是本发明中搜索引擎的构建流程示意图。
具体实施方式
27.以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
28.本领域技术人员应理解的是,在本发明的揭露中,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系是基于附图所示的方位或位置关系,其仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此上述术语不能理解为对本发明的限制。
29.请结合图1

2,本发明公开了一种产品知识单元的构建方法和系统,所述方法主要由以下几个步骤组成:建立知识单元列表;定义知识单元的等级和关系,创建知识单元实例;基于知识单元列表结构创建搜索引擎等四个步骤。
30.首先需要建立知识单元列表,所述知识单元列表是基于现有知识图谱的结构化的语义知识单元,用于描述物理世界中的概念,以及概念和概念之间的关系。目前知识单元的
构建主要有2种,一种是以“实体

关系

实体”组成的三元组知识单元,另外一种是以“实体

属性

性值”的三元组知识单元,现有的知识图谱中实体和实体之间只有连接关系而无层级关系,并且连接关系比较混乱,对于实体的抽取效果不佳。基于此本发明提供一种具有层级的知识单元列表结构。
31.具体的,首先确定并构建一级知识单元列表,其中一级知识单元列表代表产品设计信息核心概念,包括:产品名称、产品生产商、产品尺寸、产品型号、产品功能、产品适用范围、产品外观、产品制作工艺、用户评价等,作为知识单元的列表展示。其中所述一级知识单元包括一级实体和一级关系,其中以及关系连接对应的一级实体,一级关系可以连接一级实体或下级实体。换句话说,当知识单元列表呈现树状结构时,实体为树状结构的节点树枝为对应的关系,所述一级实体是深度为0层的节点对应的实体,所述一级关系是深度为0和1层的树枝代表的关系。
32.进一步的在建立一级知识单元列表后,进一步建立下级知识单元列表,并定义知识单元等级和关系,其中所述下级知识单元列表通过关系连接所述一级知识单元,所述下级知识单元可以是二级、三级知识单元,每一个下级知识单元和自身的上级知识单元连接,构成具有等级关系的树状结构。所述一级知识单元列表中的一级关系包括等级关系和同级关系,其中所述等级关系连接下级知识单元列表中的实体,所述同级关系连接同级实体。从而构成具有等级关系的分层网络状知识单元列表结构。
33.本发明优选构建2个层级作为实施例描述本发明的技术手段和技术效果:构建二级至少单元列表,所述二级知识单元列表包括二级实体和二级关系,其中所述二级实体为一级实体的下位信息。比如产品外观可分为:风格、颜色、形状等。将已建立等级机制的知识单元间关系划分为等级关系和非等级关系两种,等级关系是指基于知识单元上下位建立的树状结构关系,非等级关系是指非上下位知识单元间的网状结构关系,根据知识单元等级关系和非等级关系调整知识单元列表。其中将知识单元的树深度为1和2的连接关系作为二级知识单元的连接关系,所述二级知识单元的连接关系同样分为等级关系和同级关系,其中等级关为连接上位的一级知识单元实体,或连接二级知识单元更下位的知识单元实体的连接关系作为二级知识单元的等级关系,连接二级知识单元同级实体的连接关系问同级关系,从而进一步形成具有等级关系且分层的知识单元列表结构。
34.在完成知识单元列表结构的建立后,进一步构建知识单元示例,进一步根据用户需求分别构建“实体

关系

实体”或“实体

属性

性值”的知识单元,将构建好的知识单元列表结构保存,并填入对应的实体信息,从而构建知识单元实例。
35.所述知识单元列表结构构建并保存后可用于搜索引擎的建立,所述搜索引擎建立方法包括如下步骤:
36.信息爬取,本发明基于开源爬虫框架webmagic开发,提供多线程和分布式支持。整理目前可通过网络爬行器技术获取公开信息的网站,作为爬取源url。依据用户需要和知识单元列表结构挑取界面中有效信息,针对性地进行爬取;目前系统开通了设计类、电商类、竞赛类三个领域的爬虫机制,包含普象、花瓣等设计类网站,淘宝、京东、美的等电商类网站,红点等竞赛类网站;其中所述有效地信息包括但不仅限于产品名称、产品生产商、产品尺寸、产品型号、产品功能、产品适用范围、产品外观、产品制作工艺、用户评价。
37.进一步将爬取的信息保存于所述至少单元结构建立的数据库中,可将所述知识单
元列表结构中下位的知识单元实体名称作为字段名显示。在本发明其中一个较佳实施例中,需要将爬取的实体信息进行筛选,将爬取的实体信息和知识单元列表结构数据库中的实体信息对比,若不是相同产品,则保存于该数据库中,否则更新原有数据库。
38.值得一提的是本发明基于solr搜索引擎建立面向设计师的搜索引擎。solr是以lucene为内核开发的独立企业级搜索应用服务器,应用程序可以通过http请求方式来提交索引、查询索引,支持二次开发;
39.本发明根据知识单元列表结构建立搜索引擎表项,并将数据库中的信息导入搜索引擎中。用户输入查询语句后,solr搜索引擎使用ik中文分词器对用户输入的数据进行分词处理,并使用自带的搜索方法实现信息检索功能,向用户返回查询结果;
40.综上所述,本发明首先基于最高相关性原则,从产品设计类知识图谱中确定一级知识单元列表,再根据知识图谱中其余知识单元的相关性高低划分二级知识单元列表。然后将知识单元列表转为树状结构确定各知识单元等级,根据知识图谱中各知识单元的联系调整知识单元树。最后,将调整后的知识单元树转化为知识单元列表结构。
41.本发明还从构建的知识单元列表结构出发,建立数据库。运用网络爬虫技术,遍历产品设计相关网页,针对知识单元列表结构爬取有效信息,并存入数据库中。然后使用solr搜索引擎技术对数据库中的结构化信息建立索引,为用户提供全文检索服务。
42.特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线段的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线段、电线段、光缆、rf等等,或者上述的任意合适的组合。
43.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用
于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
44.可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
45.本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明,本发明的目的已经完整并有效地实现,本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1