一种基于语义分析的知识推送系统及方法
【专利摘要】本发明公开了一种基于语义分析的知识推送系统,包括知识捕获模块、知识推送模块、知识采集模块和知识库;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;知识捕获模块每隔一段时间调用一次设计系统的接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;知识推送模块根据捕获的设计场景信息按知识的类别将相应的知识推送至设计系统。本发明能够自动准确捕获用户设计场景下的实际需求,并可以获得更加准确、符合设计人员需求的知识资源,节省了大量搜索知识的时间。
【专利说明】一种基于语义分析的知识推送系统及方法
【技术领域】
[0001]本发明涉及一种基于语义分析的知识推送系统及方法。
【背景技术】
[0002]传统的通过搜索技术获取知识的方式不能满足用户在缺乏关键词情况时的知识需求,且搜索方式获取的知识内容准确性低,知识之间缺乏关联关系,设计人员甚至不希望在执行任务时花费大量的时间在搜索上,而希望在需要相关知识时,系统能够“雪中送炭”。知识推送系统的出现使得知识的获取方式由“搜索”变为“推送”,解决了该问题。
[0003]目前的知识推送系统一般是基于设计人员自定义关键词的方式进行知识推送,不能对设计人员的真实需求做出准确的判断,导致推送的知识难以符合设计人员的需求。另夕卜,在获取设计人员需求之后,获取知识的方式一般采用关键词出现的频率决定搜索结果的排序,获取方式过于单一。
【发明内容】
[0004]本发明所要解决的技术问题是:提供一种基于语义分析的知识推送系统及方法,能够自动准确捕获用户设计场景下的实际需求,并可以获得更加准确、具有关联关系、符合设计人员需求的知识资源,节省了大量搜索知识的时间,提高了工作效率。
[0005]本发明技术方案如下:
[0006]一种基于语义分析的知识推送系统,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;
[0007]通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;
[0008]知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;
[0009]知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。
[0010]所述知识的类别包括设计规范、最佳实践、经验技巧和故障案例。
[0011]所述设计场景信息包括具体参数信息、任务信息、模型信息和文档信息;所述任务信息包括任务名称、任务描述和任务所属专业名称;所述文档信息为文档的关键词;所述模型信息包括模型名称、类别名称以及模型打开工具名称。[0012]一种基于语义分析的知识推送方法,包括如下步骤:
[0013]录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;
[0014]每隔一段时间调用一次设计系统中的接口函数从而捕获设计场景信息;
[0015]对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。
[0016]本发明与现有技术相比具有如下有益效果:
[0017](I)本发明通过知识捕获模块自动捕获用户设计场景下的实际需求,解决了现有知识推送系统获取设计人员需求的不准确性问题。
[0018](2)采用基于潜在语义分析技术的知识采集技术,实际上对上传的知识资源做了“降噪”处理,使得主题更加清晰、准确,提高了知识推送时捕获信息与知识资源匹配的精确度,使得推送的知识资源与设计人员的需求更加吻合。
[0019](3)通过知识捕获信息与知识资源主题进行匹配计算,与传统的全文匹配计算相比,大大提升了计算速度。
[0020](4)采用推送技术节省了设计人员搜索知识时花费的大量时间,提高了工作效率。采用推送技术使得知识管理系统与企业业务系统相互融合,解决了一般知识管理系统访问量低的问题,大大提高了知识资源的使用率。
【专利附图】
【附图说明】
[0021]图1为本发明系统的总体结构图;
[0022]图2为本发明中知识捕获模块的算法流程图;
[0023]图3为本发明中知识推送模块的算法流程图;
[0024]图4为本发明中知识采集模块中主题计算的算法流程图。
【具体实施方式】
[0025]如图1所示,本发明的系统包括知识捕获模块、知识推送模块、知识采集模块和知识库。
[0026]1、知识捕获,主要通过软件集成技术实现对设计人员的设计场景信息进行捕获,获取设计人员设计场景的具体任务信息、模型信息、文档信息、参数信息,然后将捕获的信息发送给知识推送模块。
[0027]如图1所示,在业务系统或者设计系统的设计场景中包括任务(例如任务1、任务2和任务3)、模型(例如设计模型、有限元模型)、文档(例如分析报告)和参数(例如指标参数
1、指标参数2和指标参数3)。知识捕获模块的知识捕获方式主要包括任务提取、模型提取、文档提取和参数提取四种方式,四种知识捕获方式使用的软件集成技术主要通过web服务技术实现,具体在业务系统或者设计系统中封装上述四种捕获方式所需的接口函数,并对外开放,知识推送模块每隔一段时间会调用一次接口函数,来获取设计人员的设计场景信息,并将捕获的设计场景信息发送至知识推送模块。四种获取方式的算法执行流程如图2所示。
[0028]( I)任务提取,一般设计人员的任务通过设计系统进行发放和审核,其主要实现机制一般基于工作流技术实现,任务提取主要通过软件集成技术根据当前设计人员的用户名,在工作流中获取当前用户正在执行的任务信息,获取的任务信息包括任务名称、任务描述、任务所属专业名称,然后将获取的信息发送至知识推送模块。例如,通过捕获某结构模态分析任务信息,可以知道该任务的结构件名称信息及载荷特性专业信息。
[0029](2)模型提取,设计人员操作的模型一般作为任务附件进行管理,通过软件集成技术获取任务的附件名称,再对交付物本身进行格式判别,根据文件格式可以从系统配置信息中获取设计人员当前操作的模型名称、类别名称以及模型打开工具名称,然后将获取的信息发送至知识推送模块。
[0030](3)文档提取,设计人员查看和编写的文档一般作为任务附件进行管理,同样通过软件集成技术获取任务附件,经过格式判别后获取文档的名称信息,并在后台打开该文档对该文档做分词、滤词、频率统计处理,获取该文档的关键词,然后将获取的信息发送至知识推送模块。
[0031](4)参数提取,参数是任务的指标信息包括输入参数和输出参数,可以通过软件集成技术获取参数的名称,然后将获取的信息发送至知识推送模块。
[0032]2、知识推送,知识推送模块在获取设计人员需求信息后,对信息进行分词、权重计算,然后与知识库中经过知识采集处理的知识资源信息进行匹配计算,对匹配结果进行分类、排序后推送至设计人员桌面,详细执行过程如图3所示。
[0033](I)对从知识捕获模块获得的设计场景信息进行分词形成特征词集合G= Ig1, g2, g3.? ? gn};
[0034](2)计算每个特征词在设计场景信息中的权重形成权重集合Q=Iq1, q2, q3.? ? qj ;
[0035](3)遍历知识库中所有的知识资源,该类知识资源在进行知识采集时是经过主题计算处理的;
[0036](4)使用特征词集合G与知识库中的知识主题进行匹配计算,统计每一个特征词的匹配次数形成匹配次数集合M=Im1, m2, m3...mn},M与权重Q的乘积和形成匹配度P,
【权利要求】
1.一种基于语义分析的知识推送系统,其特征在于,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数; 通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间; 知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块; 知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。
2.如权利要求1所述的知识推送系统,其特征在于:所述知识的类别包括设计规范、最佳实践、经验技巧和故障案例。
3.如权利要求1所述的知识推送系统,其特征在于:所述设计场景信息包括具体参数信息、任务信息、模型信息和文档信息;所述任务信息包括任务名称、任务描述和任务所属专业名称;所述文档信息为文档的关键词;所述模型信息包括模型名称、类别名称以及模型打开工具名称。
4.一种基于语义分析的知识推送方法,其特征在于,包括如下步骤: 录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间; 每隔一段时间调用一次设计系统中的接口函数从而捕获设计场景信息; 对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。
5.如权利要求4所述的知识推送方法,其特征在于:所述知识的类别包括设计规范、最佳实践、经验技巧和故障案例。
6.如权利要求4所述的知识推送方法,其特征在于:所述设计场景信息包括具体参数信息、任务信息、模型信息和文档信息。
【文档编号】G06F17/30GK103593336SQ201310526924
【公开日】2014年2月19日 申请日期:2013年10月30日 优先权日:2013年10月30日
【发明者】褚厚斌, 杜俊鹏, 王立伟, 贾倩, 毕经元, 章乐平, 王长庆, 杨玉堃, 侯雄, 许怡婷, 章雯, 杨秋皓, 张巍 申请人:中国运载火箭技术研究院