一种高保真文本主语义提取系统及方法与流程

文档序号:32404199发布日期:2022-12-02 20:02阅读:32来源:国知局
一种高保真文本主语义提取系统及方法与流程

1.本发明涉及数据处理技术领域,具体涉及一种高保真文本主语义提取系统及方法。


背景技术:

2.随着人工智能的发展,用于进行文本语义识别标注的机器人或智能软硬件如雨后春笋般层出不穷,基于人工智能进行准确高效的语义识别标注的美好愿景与人工智能进行语义识别准确度现状仍存在较大的落差。
3.这一客观落差的存在与人类语言表达的多样性和复杂性相关,因而如何提高基于智能识别的文本语义提取准确度成为当前降低文本语义提取成本和人力资源消耗的重要方向。
4.现有技术中存在智能识别文本语义准确度较低,无法获得较为准确的文章主语义的缺陷,导致文本语义识别的人工依赖度和识别成本仍旧居高不下的技术问题。


技术实现要素:

5.本技术提供了一种高保真文本主语义提取系统及方法,用于针对解决现有技术中存在智能识别文本语义准确度较低,无法获得较为准确的文章主语义的缺陷,导致文本语义识别的人工依赖度和识别成本仍旧居高不下的技术问题。
6.鉴于上述问题,本技术提供了一种高保真文本主语义提取系统及方法。
7.本技术的第一个方面,提供了一种高保真文本主语义提取系统,所述系统包括:文本处理执行模块,用于获得目标识别文本,对所述目标识别文本进行文本预处理,得到预处理文本;文本类型匹配模块,用于对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,基于所述文本类型生成类型约束参数;写作特征匹配模块,用于基于所述目标识别文本获得文本作者信息,通过所述文本作者信息进行写作特征匹配,通过写作特征匹配结果生成用户特征语义约束参数;文本分割执行模块,用于对所述预处理文本进行文本多层级分割,生成预处理文本的多层级分割结果;聚合处理执行模块,用于通过所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果;语义识别处理模块,用于基于文本类型匹配识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。
8.本技术的第二个方面,提供了一种高保真文本主语义提取方法,所述方法包括:获得目标识别文本,对所述目标识别文本进行文本预处理,得到预处理文本;对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,基于所述文本类型生成类型约束参数;基于所述目标识别文本获得文本作者信息,通过所述文本作者信息进行写作特征匹配,通过写作特征匹配结果生成用户特征语义约束参数;对所述预处理文本进行文本多层级分割,生成预处理文本的多层级分割结果;通过所述类型约束参数和所述用户特征
语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果;基于文本类型匹配识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。
9.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:本技术实施例提供的方法通过获得目标识别文本,对所述目标识别文本进行文本预处理,得到预处理文本,避免后续由于错别字或文本篇章识别不清造成文本语义分割的识别缺陷以及文本类型匹配错误;对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,基于所述文本类型生成类型约束参数,用于后续对进行语义分割处理后的预处理文本进行分割结果优化;基于所述目标识别文本获得文本作者信息,通过所述文本作者信息进行写作特征匹配,通过写作特征匹配结果生成用户特征语义约束参数,用于后续对进行语义分割处理后的预处理文本进行分割结果优化;对所述预处理文本进行文本多层级分割,生成预处理文本的多层级分割结果;通过所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果,从而提高文本分割精确度;基于文本类型匹配识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。达到了提高智能识别文本语义准确度,降低文本语义识别对于人工经验的依赖从而降低文本语义识别成本的技术效果。
附图说明
10.图1为本技术提供的一种高保真文本主语义提取方法流程示意图;图2为本技术提供的一种高保真文本主语义提取方法中获得多层级分割结果的流程示意图;图3为本技术提供的一种高保真文本主语义提取方法中进行文本识别的识别优化的流程示意图;图4为本技术提供的一种高保真文本主语义提取系统的结构示意图。
11.附图标记说明:文本处理执行模块11,文本类型匹配模块12,写作特征匹配模块13,文本分割执行模块14,聚合处理执行模块15,语义识别处理模块16。
具体实施方式
12.本技术提供了一种高保真文本主语义提取系统及方法,用于针对解决现有技术中存在智能识别文本语义准确度较低,无法获得较为准确的文章主语义的缺陷,导致文本语义识别的人工依赖度和识别成本仍旧居高不下的技术问题,达到了提高智能识别文本语义准确度,降低文本语义识别对于人工经验的依赖从而降低文本语义识别成本的技术效果。
13.本发明技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
14.下面,将参考附图对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外还需要说明的是,为
了便于描述,附图中仅示出了与本发明相关的部分而非全部。
15.实施例一如图1所示,本技术提供了一种高保真文本主语义提取方法,所述方法包括:s100:获得目标识别文本,对所述目标识别文本进行文本预处理,得到预处理文本;具体而言,在本实施例中,所述目标识别文本为由同一作者在一定时间范围内撰写的包括多个文本类型文本的稿件集合,所述目标识别文本由影评杂谈、历史文化、军事政治、音乐赏析等一种或多种类型文本稿件构成,在获得所述目标识别文本后,对所述目标识别文本执行文本预处理,所述文本预处理包括错别字词替换预处理以及多个文本开始结束标识的预处理,获得无错别字且多个文本起始结束明确的所述预处理文本,避免后续由于错别字或文本篇章识别不清造成文本语义分割的识别缺陷以及文本类型匹配错误。
16.s200:对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,基于所述文本类型生成类型约束参数;具体而言,应理解的,所述预处理文本为对目标识别文本进行文本预处理获得的文本,因而所述预处理文本与所述目标识别文本一样,都是同一作者在一定时间范围内撰写的包括多个文本类型的文本稿件。
17.同时,同样的词语在不同类型文本中存在差异性,例如“节点”一词在计算机技术类型文本中的含义与叙事性文本中的含义具有差异性。因而本实施例通过对所述预处理文本进行文本类型识别,为后续文本分割和语义识别提供文本类型参考,间接提高文本分割和语义识别的准确度。
18.在本实施例中,预设多个文本类型的多个关键词库,所述文本类型与关键词库具有一一对应的映射关系。获得组成所述预处理文本的多篇文本,分别获取所述多篇文本中出现频率高于预设频率的多个实意词生成文本关键词,作为对应文本的所述初始文本识别结果,基于所述初始文本识别结果遍历所述多个关键词库,获得匹配落入关键词数量最多的关键词库对应的文本类型,作为所述预处理文本中对应文本的文本类型。采用上述方法获得所述预处理文本中所有文本的文本类型,基于所述文本类型生成类型约束参数,所述类型约束参数用于后续对进行语义分割处理后的预处理文本进行分割结果优化。
19.s300:基于所述目标识别文本获得文本作者信息,通过所述文本作者信息进行写作特征匹配,通过写作特征匹配结果生成用户特征语义约束参数;具体而言,所述写作特征指文本稿件撰写的句用语法习惯,包括但不限于惯用倒装句、惯用长难句等。应理解的,不同作者在长期文本撰写过程中逐渐产生独具一格或较有标示性的撰写风格,而撰写风格常常取决于作者的句用语法习惯,基于不同句用语法习惯表述同一文本含义在提高文本可读性的同时,也存在影响文本含义理解造成语义分割缺陷的风险。因而本实施例通过分析确定文本作者的写作特征,便于对文本分割结果进行优化,提高文本语义分割的准确度。
20.所述目标识别文本为由同一作者在一定时间范围内撰写的,包括多个文本类型文本的稿件集合。因而本实施例基于所述目标识别文本获得文本作者信息,根据所述文本作者信息获得所述文本作者的历史发表稿件以提高对文本作者写作特征匹配准确度,根据所述历史发表稿件进行写作特征匹配,获得所述文本作者历史发表稿件中各类句用语法的出
现频率并排序,获得满足预设出现频率的句用语法,作为写作特征匹配结果的生成用户特征语义约束参数,所述用户特征语义约束参数用于后续对进行语义分割处理后的预处理文本进行分割结果优化。
21.s400:对所述预处理文本进行文本多层级分割,生成预处理文本的多层级分割结果;进一步的,如图2所示,本技术提供的方法步骤还包括:s410:构建词性识别特征;s420:基于所述词性识别特征进行所述预处理文本的初始词性识别划分,获得初始层级分割结果;s430:对所述初始层级分割结果进行相邻分割词聚合评价,生成相邻分割词聚合评价结果;s440:判断所述相邻分割词聚合评价结果是否满足预设聚合评价阈值;s450:当所述相邻分割词聚合评价结果可以满足所述预设聚合评价阈值时,则进行相邻分割词聚合,其中,每一组相邻分割词聚合方案对应一层级分割结果;s460:根据相邻分割词聚合结果和所述初始层级分割结果获得所述多层级分割结果。
22.具体而言,所述词性识别特征为根据现代汉语词性构建的词性识别特征。在本实施例中根据句末标点符号,进行预处理文本中各个组成文本的语句划分,获得包括多个语义完整的语句构成的语句划分结果,所述语句划分结果以语句原本所述文本为单位构成多个以文本主题类型为单位的语句集合。
23.在各个语句划分结果内基于所述词性识别特征进行初始词性识别划分,获得初始层级分割结果,所述初始层级分割结果是截断为由多个具有相邻关系名词、动词、形容词、连词、介词构成的语义完整语句,所述动态层级分割结果脱离当前文本类型以及文本作者的句用习惯,因而存在分割破坏原本文本含义的风险,例如将“打开水龙头”分割为“打”、“开水”、“龙头”。
24.基于初始层级分割存在的语义分割缺陷,本实施例判断存在相邻关系的多个词语之间是否发生词语和相邻字合并生成具有新含义词语的情况,对所述初始层级分割结果进行相邻分割词聚合处理获得多个相邻聚合词。
25.对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,根据所述预处理文本中各个文本类型遍历大数据获得各个文本类型所述知识领域的专属词和常用词以及专属词和常用词在该知识领域中的使用频率,生成所述预处理文本中与各个文本类型对应的词库,并根据专属词和常用词在该知识领域中的使用频率预设聚合评价阈值,所述预设聚合评价阈值高于专属词和常用词在该知识领域中的使用频率。
26.基于相邻聚合词遍历所述文本类型对应词库,确定相邻聚合词是否存在,生成相邻分割词聚合评价结果,若相邻聚合词存在于词库中,所述相邻分割词聚合评价结果标记为1,若相邻聚合词不存在于词库中,所述相邻分割词聚合评价结果标记为0。
27.获得所述相邻分割词聚合评价结果标记为1的相邻聚合词对应的专属词或常用词在对应文本类型的知识领域中的使用频率,作为所述相邻分割词聚合评价结果,判断所述相邻分割词聚合评价结果是否满足预设聚合评价阈值,当所述相邻分割词聚合评价结果满
足所述预设聚合评价阈值时,则进行相邻分割词聚合,每一语义完整语句有多个相邻分割聚合方案,其中,每一组相邻分割词聚合方案对应一层级分割结果。根据相邻分割词聚合结果和所述初始层级分割结果获得所述多层级分割结果。
28.本实施例通过根据现代汉语词性对文本语句进行初级分割,并结合文本所属文本类型的知识领域中常用词和专属词进行相邻分割词的合并重组,实现了基于文本类型进行文本语义分割,提高文本分割准确度的技术效果。
29.s500:通过所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果;进一步的,本技术提供的方法步骤还包括:s510:构建发言识别词汇特征集合,并将所述发言识别词汇特征集合作为第一识别特征;s520:将发言标点识别特征作为第二识别特征,基于所述第一识别特征和所述第二识别特征进行所述预处理文本的发言识别,获得发言识别标识结果;s530:对所述发言识别标识结果部分进行独立的文本分割聚合选择,基于独立文本分割聚合选择结果获得所述文本分割聚合选择结果。
30.具体而言,应理解的,在进行诸如论证文本、文章严谨度要求较高的文本编辑撰写时,为提高文本表达的准确度,作者往往采用引入名言警句、权威人士采访或书籍原话到文本中。这部分引入内容的写作特征与文本作者的写作特征不同,因而无需基于文本作者的所述用户特征语义约束参数进行文本识别处理。
31.因而在本实施例中,根据诸如“发言”、“讨论”、“提出”等常用发言词构建发言识别词汇特征集合,并将所述发言识别词汇特征集合作为第一识别特征。根据诸如双引号、冒号、破折号等常用表征引入内容的发言标点构建发言标点识别特征作为第二识别特征,基于所述第一识别特征和所述第二识别特征进行所述预处理文本的发言识别,获得发言识别标识结果,对所述发言识别标识结果部分进行独立的文本分割聚合选择,将发言识别标识结果对应文本语句以外的文本语句的多层级分割结果根据所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果。
32.本实施例通过首先在多层级分割结果中筛出引入的与文本作者写作特征无关的语义完整语句进行独立文本分割聚合选择,再对剩余具备作者写作特征的语义完整语句的多层级分割结果基于类型约束参数和用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果,达到了获得较为准确的语义分割结果,为后续提取文本主语义提供有效参考的技术效果。
33.s600:基于文本类型匹配识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。
34.进一步的,本技术提供的方法步骤还包括:s610:基于所述语义识别结果进行关键词识别,获得关键词识别结果;s620:对所述语义识别结果进行结构化识别,生成结构化识别结果;s630:将所述关键词识别结果和所述结构化识别结果作为语义识别参考数据,基于所述语义识别参考数据获得所述语义提取结果。
35.进一步的,本技术提供的方法步骤还包括:s631:基于所述结构化识别结果进行语句层级划分,获得语句层级划分结果;s632:基于所述语句层级划分结果进行所述语义提取结果的层级标识。
36.具体而言,在本实施例中,所述关键词为在文字内容中,以自身词形为标识,关联特定语义的词语,提供文字内容概要信息的重点词汇,所述关键词包括关键词主体本身以及用于解释补充关键词确保文本语义表达准确性的辅助关键词。
37.所述识别数据库为基于多个同类型文本构成的,可根据文本语句分割结果进行文本主语义提取的文本处理模型。所述结构化识别指通过识别语句的句用和其内部语义元的结构确定文本主语义的文本语义识别处理方法。基于构成所述预处理文本的多个类型文本的具体文本类型匹配对应的文本类型识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。
38.基于所述识别数据库进行所述文本分割聚合选择结果的语义识别生成结构化识别结果的具体方法为,基于所述语义识别结果进行关键词识别,获得对应语义完整语句的中关联特定语义的关键词,将所述关键词以及补充解释关键词避免关键词标注词不达意的辅助关键词作为所述关键词识别结果,基于所述关键词识别结果进行关键词和辅助关键词之间语义关系分析,获得关键词与辅助关键词之间的语义关系,用于后续结合语义识别结果的结构化识别进行关键词层级标识。
39.对所述语义识别结果进行结构化识别,生成结构化识别结果,将所述关键词识别结果进行对应语义完整语句的语句层级划分,获得语句层级划分结果,基于所述语句层级划分结果进行所述语义提取结果的层级标识,基于所述层级标识结果以及关键词识别结果和关键词与辅助关键词之间的语义关系获得对应语义完整语句的文本语义。
40.本实施例通过基于文本类型匹配识别数据库对所述文本分割聚合选择结果进行语义识别获得反映语句内容概要信息的关键词以及确保关键词对于原语句含义准确表达的辅助关键词,并采用结构化识别基于语义识别结果进行层级标注生成语义提取结果,达到了避免关键词语义偏离语义完整语句的文本语义,准确获得构成文本的多个语句语义,从而实现提高文本语义提取准确度的技术效果。
41.进一步的,本技术提供的方法步骤还包括:s470:构建成语词库集合;s480:基于所述成语词库集合进行所述多层级分割结果的聚合评价,判断是否存在与所述成语词库集合匹配的成语聚合结果;s490:当所述多层级分割结果中存在所述成语聚合结果时,则保留所述成语聚合结果,并在将所述多层级分割结果中所述成语聚合结果部分的其他分割结果剔除。
42.具体而言,应理解的,部分成语存在被词性识别特征进行过度分割,导致原本含义被曲解的风险,例如“得意洋洋”被分割为“得意”、“洋洋”,后续将“洋洋”识别为人名昵称造成语言表达的真实含义被曲解。
43.因而在本实施例中,基于成语数据库构建所述成语词库集合,基于所述成语词库集合进行所述多层级分割结果的聚合评价,判断同一语义完整语句的多层级分割结果中是否存在与所述成语词库集合匹配的成语聚合结果;当所述多层级分割结果中存在所述成语聚合结果时,则保留所述成语聚合结果,并在将所述多层级分割结果中所述成语聚合结果
部分的其他分割结果剔除。
44.本实施例通过基于成语数据库构建成语词库集合进行同一语句完整语句的多层级分割结果的遍历,达到了提高了从同一语句完整语句的多层级分割结果中选取正确语义分割结果的效率和准确度的技术效果。
45.本实施例提供的方法通过获得目标识别文本,对所述目标识别文本进行文本预处理,得到预处理文本,避免后续由于错别字或文本篇章识别不清造成文本语义分割的识别缺陷以及文本类型匹配错误;对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,基于所述文本类型生成类型约束参数,用于后续对进行语义分割处理后的预处理文本进行分割结果优化;基于所述目标识别文本获得文本作者信息,通过所述文本作者信息进行写作特征匹配,通过写作特征匹配结果生成用户特征语义约束参数,用于后续对进行语义分割处理后的预处理文本进行分割结果优化;对所述预处理文本进行文本多层级分割,生成预处理文本的多层级分割结果;通过所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果,从而提高文本分割精确度;基于文本类型匹配识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。达到了提高智能识别文本语义准确度,降低文本语义识别对于人工经验的依赖从而降低文本语义识别成本的技术效果。
46.进一步的,如图3所示,本技术提供的方法步骤还包括:s710:将所述语义提取结果发送至工作人员,获得所述工作人员的反馈标识数据;s720:对所述反馈标识数据进行数据解析,获得数据解析结果,其中,所述数据解析结果包括适用场景和优化特征;s730:通过所述数据解析结果进行文本识别的识别优化。
47.具体而言,所述工作人员为具有高精度语义标注能力的资深从业人员,在本实施例中,将所述语义提取结果发送至工作人员,所述工作人员基于所述语义提取结果对由多个语义完整语句构成的完整文本进行文本场景标识,并确定所获语义提取结果与文本实际语义之间的偏离情况,生成所述反馈标识数据并基于高保真文本主语义提取系统反馈。
48.系统获得所述工作人员的反馈标识数据,对所述反馈标识数据进行数据解析,获得包括文本适用场景和反映语义提取结果与文本实际语义之间的偏离情况的所述文本优化特征,高保真文本主语义提取系统通过所述数据解析结果进行文本识别的识别优化。
49.本实施例通过将智能识别的语义提取结果反馈工作人员获得反馈优化方向不断进行高保真文本主语义提取系统的语义提取识别系统的优化,实现了基于人工辅助提高高保真文本主语义提取系统的文本主语义识别准确度的技术效果。
50.实施例二基于与前述实施例中一种高保真文本主语义提取方法相同的发明构思,如图4所示,本技术提供了一种高保真文本主语义提取系统,其中,所述系统包括:文本处理执行模块11,用于获得目标识别文本,对所述目标识别文本进行文本预处理,得到预处理文本;文本类型匹配模块12,用于对所述预处理文本进行初始文本识别,基于初始文本识别结果匹配文本类型,基于所述文本类型生成类型约束参数;
写作特征匹配模块13,用于基于所述目标识别文本获得文本作者信息,通过所述文本作者信息进行写作特征匹配,通过写作特征匹配结果生成用户特征语义约束参数;文本分割执行模块14,用于对所述预处理文本进行文本多层级分割,生成预处理文本的多层级分割结果;聚合处理执行模块15,用于通过所述类型约束参数和所述用户特征语义约束参数进行所述多层级分割结果的文本分割聚合选择,获得文本分割聚合选择结果;语义识别处理模块16,用于基于文本类型匹配识别数据库,基于所述识别数据库进行所述文本分割聚合选择结果的语义识别,基于语义识别结果生成语义提取结果。
51.进一步的,所述文本分割执行模块14还包括:词性特征构建单元,用于构建词性识别特征;初始层级划分单元,用于基于所述词性识别特征进行所述预处理文本的初始词性识别划分,获得初始层级分割结果;分割结果聚合单元,用于对所述初始层级分割结果进行相邻分割词聚合评价,生成相邻分割词聚合评价结果;评价结果判断单元,用于判断所述相邻分割词聚合评价结果是否满足预设聚合评价阈值;判断结果执行单元,用于当所述相邻分割词聚合评价结果可以满足所述预设聚合评价阈值时,则进行相邻分割词聚合,其中,每一组相邻分割词聚合方案对应一层级分割结果;分割结果整合单元,用于根据相邻分割词聚合结果和所述初始层级分割结果获得所述多层级分割结果。
52.进一步的,所述文本分割执行模块14还包括:成语词库构建单元,用于构建成语词库集合;分割结果判断单元,用于基于所述成语词库集合进行所述多层级分割结果的聚合评价,判断是否存在与所述成语词库集合匹配的成语聚合结果;判断结果处理单元,用于当所述多层级分割结果中存在所述成语聚合结果时,则保留所述成语聚合结果,并在将所述多层级分割结果中所述成语聚合结果部分的其他分割结果剔除。
53.进一步的,所述聚合处理执行模块15还包括:词汇特征获得单元,用于构建发言识别词汇特征集合,并将所述发言识别词汇特征集合作为第一识别特征;标点特征获得单元,用于将发言标点识别特征作为第二识别特征,基于所述第一识别特征和所述第二识别特征进行所述预处理文本的发言识别,获得发言识别标识结果;独立处理执行单元,用于对所述发言识别标识结果部分进行独立的文本分割聚合选择,基于独立文本分割聚合选择结果获得所述文本分割聚合选择结果。
54.进一步的,所述语义识别处理模块16还包括:关键词识别单元,用于基于所述语义识别结果进行关键词识别,获得关键词识别结果;结构化识别单元,用于对所述语义识别结果进行结构化识别,生成结构化识别结
果;语义提取执行单元,用于将所述关键词识别结果和所述结构化识别结果作为语义识别参考数据,基于所述语义识别参考数据获得所述语义提取结果。
55.进一步的,所述语义提取执行单元还包括:层次划分执行单元,用于基于所述结构化识别结果进行语句层级划分,获得语句层级划分结果;层级标识获得单元,用于基于所述语句层级划分结果进行所述语义提取结果的层级标识。
56.进一步的,本技术提供的系统还包括:人工辅助处理单元,用于将所述语义提取结果发送至工作人员,获得所述工作人员的反馈标识数据;数据解析执行单元,用于对所述反馈标识数据进行数据解析,获得数据解析结果,其中,所述数据解析结果包括适用场景和优化特征;识别优化执行单元,用于通过所述数据解析结果进行文本识别的识别优化。
57.综上所述的任意一项方法或者步骤可作为计算机指令或程序存储在各种不限类型的计算机存储器中,通过各种不限类型的计算机处理器识别计算机指令或程序,进而实现上述任一项方法或者步骤。
58.基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作的任何改进和修饰,皆应落入本发明的专利保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1