一种基于用户行为分析的客户端优化系统及方法与流程

文档序号:20775291发布日期:2020-05-19 20:42阅读:420来源:国知局
一种基于用户行为分析的客户端优化系统及方法与流程

本发明涉及基于知识图谱的检索技术领域,具体来说,涉及一种基于用户行为分析的客户端优化系统及方法。



背景技术:

工业互联网作为新一代信息技术与工业系统深度融合的产物,日益成为实现生产制造领域全要素、全产业链、全价值链连接的关键支撑和工业经济数字化、网络化、智能化的重要基础设施。国内主流的工业互联网平台有三一重工的树根互联平台、航天云网工业互联平台以及海尔cosmoplat工业互联平台等。其中,航天云网的工业互联平台,还提供了企业供需对接的服务,对于入驻平台的企业用户来说,项目过于繁多,具有很高的使用门槛。以航天云网平台的门户搜索为例,基于传统的lucene的全文搜索引擎架构实现,用户在搜索某一关键词时,只会返回同该关键词匹配的结果,不能提供给用户发散的关联信息。

magi搜索平台中,在输入关键词“航天云网”后,返回数据。在页面布局上结构化上,而不是传统搜索出的“平摊式”的,在搜索结果中有对关键词的描述(如“中国首个工业互联网平台”)、属性(如“注册用户-超过270万”、app总数-1526个);在搜索结果的呈现上,为用户呈现了丰富的关联数据。但是,这些数据只是distantsupervision循环的副产物,属性、标签数据是通过算法随即组合以及随时变化的。magi运用的是一种从纯文本自动构建尽量可信的知识图谱的技术,目的是帮助知识工程的规模化,让各种知识图谱不用过于依赖百科维基等手动维护的数据库。



技术实现要素:

针对相关技术中的上述技术问题,本发明提出一种基于用户行为分析的客户端优化系统及方法,能够克服现有技术的上述不足。

为实现上述技术目的,本发明的技术方案是这样实现的:

一种基于用户行为分析的客户端优化系统,该系统包括:整理模块、服务器模块、解析模块、实施模块,其中

所述整理模块用于获取企业相关数据,依据业务数据,定义部分本体和关系,依据业务场景,admin管理系统制定若干搜索规则,包括企业数据模块、本体和关系模块、搜索规则模块。

所述服务器模块用于获取检索请求和检索信息,依据检索信息,检索和检索信息匹配度高的实体,发送匹配度高的实体信息到解析模块;

所述解析模块用于获取所述匹配度高的实体信息和规则参数信息,依据规则参数,获取所述搜索规则,过滤掉无关数据,选取前若干条所述匹配度高的实体,获取图数据索引信息,还用于构造存储对象,获取并封装检索过程;

所述实施模块用于依据服务器的负载均衡机制,并发检索所述匹配度高的实体数据信息,获取数据信息。

进一步的,所述企业数据模块用于获取交易产品数据信息、企业信息、关联企业信息。

进一步的,所述本体和关系模块用于关联搜索的本体,还用于依据业务数据关系,设计关系模型。

根据本发明的另一方面,提供了一种基于用户行为分析的客户端优化方法,该方法包括以下步骤:

s1:所述整理模块获取企业相关数据,依据业务数据,定义部分本体和关系;

s2:依据业务场景,admin管理系统制定若干搜索规则;

s3:服务器模块获取检索请求和检索信息,依据检索信息,检索和检索信息匹配度高的实体;

s4:所述服务器模块发送匹配度高的实体信息到解析模块;

s5:所述解析模块获取所述匹配度高的实体信息和规则参数信息,依据规则参数,获取所述搜索规则,过滤掉无关数据,选取前若干条所述匹配度高的实体,获取图数据索引信息;

s6:构造存储对象;

s7:获取并封装检索过程;

s8:实施模块依据服务器的负载均衡机制,并发检索所述匹配度高的实体数据信息;

s9:获取数据信息,结束检索。

进一步的,所述步骤s1包括以下步骤:

s11:获取交易产品数据信息;

s12:获取企业信息;

s13:获取关联企业信息。

进一步的,所述步骤s3包括以下步骤:

s31:用户发送检索指令和检索数据到分布式搜索引擎;

s32:所述分布式搜索引擎获取检索指令和检索数据信息;

s33:依据关键字索引信息,分析处理检索数据信息;

s34:获取匹配度高的实体结果。

进一步的,所述步骤s6包括以下步骤:

s61:构造treenode对象;

s62:存入图数据库中的实体信息到treenode对象。

进一步的,所述步骤s9中获取数据信息包括以下步骤:

s91:获取图数据库中的图数据;

s92:获取元数据;

s93:获取外部数据。

本发明的有益效果:通过图谱服务提供给用户相应实体信息,提供给用户实体的直接关联信息,或是二度、三度甚至更多维度的关联数据,基于利用企业数据构建的知识图谱,为用户呈现基于关键词的关联数据,给予用户更好的搜索体验,有效降低用户对于平台的使用门槛。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例所述的一种基于用户行为分析的客户端优化系统的原理框图;

图2是根据本发明实施例所述的一种基于用户行为分析的客户端优化方法的流程框图;

图3是根据本发明实施例所述的treenode对象模型图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,根据本发明实施例所述的种基于用户行为分析的客户端优化系统,该系统包括:整理模块、服务器模块、解析模块、实施模块,其中

所述整理模块用于获取企业相关数据,依据业务数据,定义部分本体和关系,依据业务场景,admin管理系统制定若干搜索规则,包括企业数据模块、本体和关系模块、搜索规则模块。

所述服务器模块用于获取检索请求和检索信息,依据检索信息,检索和检索信息匹配度高的实体,发送匹配度高的实体信息到解析模块;

所述解析模块用于获取所述匹配度高的实体信息和规则参数信息,依据规则参数,获取所述搜索规则,过滤掉无关数据,选取前若干条所述匹配度高的实体,获取图数据索引信息,还用于构造存储对象,获取并封装检索过程;

所述实施模块用于依据服务器的负载均衡机制,并发检索所述匹配度高的实体数据信息,获取数据信息。

在本发明的一个具体实施例中,所述企业数据模块用于获取交易产品数据信息、企业信息、关联企业信息。

在本发明的一个具体实施例中,所述本体和关系模块用于关联搜索的本体,还用于依据业务数据关系,设计关系模型。

如图2所示,根据本发明实施例所述的种基于用户行为分析的客户端优化方法,该方法包括以下步骤:

s1:所述整理模块获取企业相关数据,依据业务数据,定义部分本体和关系;

s2:依据业务场景,admin管理系统制定若干搜索规则;

s3:服务器模块获取检索请求和检索信息,依据检索信息,检索和检索信息匹配度高的实体;

s4:所述服务器模块发送匹配度高的实体信息到解析模块;

s5:所述解析模块获取所述匹配度高的实体信息和规则参数信息,依据规则参数,获取所述搜索规则,过滤掉无关数据,选取前若干条所述匹配度高的实体,获取图数据索引信息;

s6:构造存储对象;

s7:获取并封装检索过程;

s8:实施模块依据服务器的负载均衡机制,并发检索所述匹配度高的实体数据信息;

s9:获取数据信息,结束检索。

步骤s1包括以下步骤:

s11:获取交易产品数据信息;

s12:获取企业信息;

s13:获取关联企业信息。

步骤s3包括以下步骤:

s31:用户发送检索指令和检索数据到分布式搜索引擎;

s32:所述分布式搜索引擎获取检索指令和检索数据信息;

s33:依据关键字索引信息,分析处理检索数据信息;

s34:获取匹配度高的实体结果。

步骤s6包括以下步骤:

s61:构造treenode对象;

s62:存入图数据库中的实体信息到treenode对象。

进一步的,所述步骤s9中获取数据信息包括以下步骤:

s91:获取图数据库中的图数据;

s92:获取元数据;

s93:获取外部数据。

为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。

1.主要的企业相关数据

比如交易产品,包括实体的商品、虚拟的技能等;关联企业,a企业购买过b企业销售的产品,那么在以b企业为关键词进行查询时,应该可以搜索到a企业;企业信息,包括企业的税务信息、知识产权信息、企业信用、企业行为、有关企业的新闻等等

2.定义的部分本体及关系

用于关联搜索的本体,同业务数据保持一致,即“企业信息”的本体为company_info,“产品”的本体为product;根据业务数据之间的关系,设计了25个关系,比如“企业信息”和“产品”的关系是hasdepend,“企业信息”和“产品”都属于“企业”这个本体下,都是企业的一部分,但是产品又依赖于企业信息(产品必然是又某家企业生产的),因此“企业信息”是被“产品”依赖的。

3.定义搜索规则

根据业务场景,可制定多套搜索规则。通过规则的限制,在搜索过程中过滤掉那些不需要被展示的无关数据,或是涉及到企业隐私的订单数据。搜索规则通过admin管理系统进行设置,在发起搜索请求时,需向搜索接口传入相应规则参数,否则会使用默认的搜索规则进行搜素。

同时,规则中还定义了可被展示的字段。

4.关联搜索流程

4.1收到搜索请求,从分布式搜索引擎中检索出高匹配度的实体;

4.2根据请求参数获取“搜索规则”,从匹配结果中选取前n条结果,从中获取图数据索引信息;

4.3构造存储对象。构造一个treenode对象(图3)用于封装图检索结果。每一个treenode对象,存储了实体在图数据库中的id、标签(即本体,ontology),外部数据库中的id、外部数据的元信息(数据结构),关联数据(next)、被关联数据(prev)以及二者间的关系(relatioship)。检索深度通过depth控制,该参数来自接口的请求参数;

4.4封装图检索过程。每一个检索过程,可检索出关联的“一层”数据。如图3举例,实体a通过关系(关系1、2、3)搜索出了三个实体(b、c、d),这些数据属于被关联的“第一层”数据;对“第二层”进行搜索时,获取实体(b、c、d)的图id以及关系,搜索出关联的实体数据(e、f、g);

4.5并发检索。当一次性的待检索实体过多时,会导致图数据库过载,消耗极大的资源,甚至导致服务器宕机。因此对该批数据进行切片实施并发检索,利用服务器的负载均衡机制对检索请求进行分流降低服务器负荷;

4.5解析元数据。元数据在每个实体节点中都有所保存,从元数据中可以得到实体在关系型数据库中的表名;

4.6获取外部数据。根据数据在关系数据库中的id,批量查询关系数据,过滤掉不可被展示的字段,将处理后的数据加入到treenode对象中,完成关联搜索过程。

综上所述,借助于本发明的上述技术方案,通过图谱服务提供给用户相应实体信息,提供给用户实体的直接关联信息,或是二度、三度甚至更多维度的关联数据,基于利用企业数据构建的知识图谱,为用户呈现基于关键词的关联数据,给予用户更好的搜索体验,有效降低用户对于平台的使用门槛。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1