一种相识文本自动扩展的系统及其方法与流程

文档序号:19787038发布日期:2020-01-24 13:43阅读:来源:国知局

技术特征:

1.一种相识文本自动扩展的系统,其特征在于:所述系统包括:技能配置模块、产品管理模块、技能同步模块、以及生成语料模块;

所述技能配置模块,负责扩展类型的创建和对应的扩展模板配置;

所述产品管理模块,通过产品配置技能的方式来为产品提供扩展能力,产品同时配置多个技能来完善扩展能力,

所述技能同步模块,负责将当前产品所配置的所有技能下的所有扩展模板进行整合,作为产品扩展能力的知识库;

所述生成语料模块,将导入产品的语料集合通过当前产品的技能能力与知识库进行一个自动化扩展,所述语料包含问题和回答两个字段。

2.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述技能配置模块进一步具体为:提供一个技能平台化界面,用户能通过技能平台化界面创建自定义技能,在对应技能下,能创建各类扩展类型及说明,在每个扩展类型下,能进行扩展模板的配置;所述技能配置模块还提供一个词性查询功能,用于用户查询原有语句文本中的词性组合情况;所述词性组合的结构为:分词+词性名称+词性代码;用户能根据原有语句词性组合的情况扩展下配置对应的扩展模板,所述扩展模板的结构为:扩展类型名称+扩展说明+原有语句+扩展句式。

3.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述产品管理模块进一步具体为:提供一个产品平台化界面,该产品平台化界面创建专属产品,并添加个人定制的技能,与此同时也能添加其他人员创建的技能;所述产品管理模块还提供一个同义词导入的功能、一个产品配置功能、一个同义词扩展开关、一个restful的访问接口,所述同义词导入的功能,用于将同义词导入到系统中,且导入格式不限制;所述产品配置功能,用于支持配置是否启用同义词扩展能力;所述同义词扩展开关,用于加载当前产品下技能的所有扩展模板,加入到内存中,为对外提供扩展能力提供知识库;所述restful的访问接口,供其他需求的业务调用,只要输入文档主题属性body中包含question=“这是一个字段”的请求内容,访问接口会以列表属性字段来显示返回当前产品下能够扩展的所有句子。

4.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述技能同步模块进一步具体为:根据产品所配置的技能列表,读取所有所配置的技能;再则读取每个技能下的扩展类型及扩展模板并进行整合;最后将整合的所有扩展模板配置作为扩展的知识库。

5.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述生成语料模块进一步包括语料查重单元和句式扩展单元,所述语料查重单元,对语料进行过滤处理,给出存在的冲突语料列表;所述句式扩展单元用于读取待扩展的语料集合,每条语料以问题和回答两个字段的形式存储到列表中;对每条待扩展的语料进行分词和词性标注,然后再把该分词和标注的结果和知识库里面的扩展模板进行比对,如果发现存在一样的模板,则找到该模板的扩展类型,并将该扩展类型下的模板进行词汇替换,给出替换完后的扩展词汇;把扩展的问句以对象的方式加入到扩展语料集合,并继续进行扩展直到完成所有扩展。

6.根据权利要求5所述的一种相识文本自动扩展的系统,其特征在于:所述语料查重单元进一步具体为:对每个语料对象与其他语料对象进行对比,判断是否存在分词之后一模一样的问句,如果存在一模一样的问句,再比对二者的答案是否一样,如果答案也一样,则删除其中一个问句,如果答案不一样,则把这两个问句对象加到一设置的冲突列表中;所有语料都完成对比操作后,最终输出冲突列表,供用户进行调整。

7.一种相识文本自动扩展的方法,其特征在于:所述扩展的方法采用如权利要求1所述的扩展的系统进行扩展,所述扩展方法包括如下步骤:步骤s1、系统中的技能配置模块利用技能来创建扩展类型,并配置每个扩展类型下的扩展模板,所述配置内容包括:扩展类型名称、扩展类型描述、以及扩展句式模板列表;

步骤s2、产品管理模块再通过产品配置技能的方式来为产品提供扩展能力,产品能同时配置多个技能来完善扩展能力;

步骤s3、所述技能同步模块将当前产品所配置的所有技能下的所有扩展模板进行整合,作为产品扩展能力的知识库;

步骤s4、当有语料需要进行扩展的时候,生成语料模块进行操作,即上传语料或配置语料对应存储的数据库链接;根据需求打开或关闭技能同步模块中的同义词扩展开关;进行开始转换;生成语料模块通过当前产品的技能能力与知识库进行扩展操作。

8.根据权利要求7所述的一种相识文本自动扩展的方法,其特征在于:所述生成语料模块进一步包括语料查重单元和句式扩展单元,所述语料查重单元,对语料进行过滤处理,给出存在的冲突语料列表;所述生成语料模块通过当前产品的技能能力与知识库进行扩展操作进一步具体为:通过所述句式扩展单元读取待扩展的语料集合,每条语料以问题和回答两个字段的形式存储到列表中;对每条待扩展的语料进行分词和词性标注,然后再把该分词和标注的结果和知识库里面的扩展模板进行比对,如果发现存在一样的模板,则找到该模板的扩展类型,并将该扩展类型下的模板进行词汇替换,给出替换完后的扩展词汇;把扩展的问句以对象的方式加入到扩展语料集合,并继续进行扩展直到完成所有扩展。

9.根据权利要求8所述的一种相识文本自动扩展的方法,其特征在于:所述语料查重单元进一步具体为:对每个语料对象与其他语料对象进行对比,判断是否存在分词之后一模一样的问句,如果存在一模一样的问句,再比对二者的答案是否一样,如果答案也一样,则删除其中一个问句,如果答案不一样,则把这两个问句对象加到一设置的冲突列表中;所有语料都完成对比操作后,最终输出冲突列表,供用户进行调整。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1