一种业务需求文本检查方法及相关设备与流程

文档序号:27970321发布日期:2021-12-13 00:41阅读:88来源:国知局
一种业务需求文本检查方法及相关设备与流程

1.本公开涉及文本处理技术领域,尤其涉及一种业务需求文本检查方法及相关设备。


背景技术:

2.业务需求文本是体现系统需求结构化的信息,用于实现业务部门和系统开发团队之间进行交流的文本。当前,业务人员编写的业务需求文本常常出现不规范的问题。例如:编写的业务需求文本中的项目编号、项目命名等不规范。因此,如何有效地筛选出不规范的业务需求文档,成为本领域技术人员急需解决的问题。


技术实现要素:

3.鉴于上述问题,本公开提供一种克服上述问题或者至少部分地解决上述问题的一种业务需求文本检查方法及相关设备,技术方案如下:
4.一种业务需求文本检查方法,包括:
5.获得目标业务需求文本;
6.对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;
7.对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;
8.利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。
9.可选的,所述对所述目标业务需求文本进行词组分块,获得至少一个第一词组块,包括:
10.利用open nlp对述目标业务需求文本进行词组分块,获得至少一个第一词组块,其中,所述第一词组块包括名词短语或动词短语。
11.可选的,所述对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块,包括:
12.对所述至少一个第一词组块进行冗余度计算,对重复的所述第一词组块进行去重,将去重后保留下的所述第一词组块确定为第二词组块。
13.可选的,所述预设标准需求文档中包括预先定义的至少一个标准词语结构模板,所述利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档,包括:
14.在所述至少一个第二词组块中,确定由一个或多个所述第二词组块组成的至少一个目标词语结构;
15.在预设标准需求文档中分别确定各所述目标词语结构对应的所述标准词语结构模板;
16.对任一所述目标词语结构:将该目标词语结构与对应的所述标准词语结构模板进行相似度对比,获得该目标词语结构对应的相似度结果,根据所述相似度结果,确定该目标
词语结构是否符合规范;
17.若各所述目标词语结构均符合规范,则确定所述目标业务需求文本为规范文档,若任一所述目标词语结构不符合规范,则确定所述目标业务需求文本为不规范文本。
18.可选的,所述方法还包括:
19.在确定任一所述目标词语结构不符合规范之后,根据组成所述目标词语结构的一个或多个所述第二词语块,确定所述目标词语结构在所述目标业务需求文本中的文本位置,并在所述目标业务需求文本的所述文本位置上添加可视化标记,获得携带有所述可视化标记的业务需求处理文本。
20.可选的,在所述获得携带有所述可视化标记的业务需求处理文本之后,所述方法还包括:
21.对所述业务需求处理文本进行展示。
22.可选的,所述标准词语结构模板包括项目编号词语结构、项目名称词语结构以及专业术语结构。
23.一种业务需求文本检查装置,包括:目标业务需求文本获得单元、词组分块单元、词组块去重单元以及规范文档判断单元,
24.所述目标业务需求文本获得单元,用于获得目标业务需求文本;
25.所述词组分块单元,用于对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;
26.所述词组块去重单元,用于对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;
27.所述规范文档判断单元,用于利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。
28.一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现如上述任一项所述的业务需求文本检查方法。
29.一种电子设备,所述电子设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上述任一项所述的业务需求文本检查方法。
30.借由上述技术方案,本公开提供的一种业务需求文本检查方法及相关设备,可以获得目标业务需求文本;对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。本公开实施例采用自然语言处理技术,对业务需求文档规范进行智能分析,自动审查,筛选出不规范的文档。
31.上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
32.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
33.图1示出了本公开实施例提供的业务需求文本检查方法的一种实施方式的流程示意图;
34.图2示出了本公开实施例提供的业务需求文本检查方法的另一种实施方式的流程示意图;
35.图3示出了本公开实施例提供的业务需求文本检查方法的另一种实施方式的流程示意图;
36.图4示出了本公开实施例提供的业务需求文本检查方法的另一种实施方式的流程示意图;
37.图5示出了本公开实施例提供的业务需求文本检查装置的一种结构示意图;
38.图6示出了本公开实施例提供的电子设备的一种结构示意图。
具体实施方式
39.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
40.如图1所示,本公开实施例提供的业务需求文本检查方法的一种实施方式的流程示意图,该业务需求文本检查方法可以包括:
41.s100、获得目标业务需求文本。
42.其中,业务需求为用户需要解决的问题或达到系统目标所需要的条件,也是为满足一个协议、标准、规范或其他正式定制的文档化描述,即为使系统或系统构件所需要满足和具备的条件或能力的文档化描述。
43.业务需求文本是体现系统需求结构化的信息,用于实现业务部门和系统开发团队之间进行交流的文本。本公开实施例可以获得自然语言描述的业务需求文本。
44.可选的,本公开实施例提供的业务需求文本内容可以分为五部分:前两部分是引言性内容,确定需求的背景并用一般术语予以描述。第三部分是文本的主体,即需求的详细规格说明,包括业务流程,功能详细描述,非功能需求等相关内容。最后两部分是附录和索引,包括补充说明和相关说明。
45.s200、对目标业务需求文本进行词组分块,获得至少一个第一词组块。
46.本公开实施例选择在自然语言的词组层次对目标业务需求文本进行分析和分块。在词组层次上对目标业务需求文本进行词组分块,能够提高识别的准确度,也能减少处理时间,提高处理效率。
47.具体的,基于图1所示的方法,如图2所示,本公开实施例提供的业务需求文本检查方法的另一种实施方式的流程示意图,步骤s200可以包括:
48.s210、利用open nlp对述目标业务需求文本进行词组分块,获得至少一个第一词
组块。
49.自然语言处理(natural languague processing,nlp)是计算机科学与人工智能领域的一个重要方向。它研究能实现人和计算机之间用自然语言进行有效沟通的各种理论和方法。计算机接受用户自然语言形式的输入,并在内部通过人类定义的算法进行加工、计算等系列操作,以模拟人类对自然语言的理解,并返回用户期望的结果。
50.本公开实施例可以使用开源工具open nlp的chunker对述目标业务需求文本进行词组分块,获得至少一个第一词组块。词组块为短语层次的描述。第一词组块可以包括名词短语或动词短语。
51.s300、对至少一个第一词组块进行去重处理,获得至少一个第二词组块。
52.本公开实施例可以对重复的第一词组块进行去重,对于重复的多个第一词组块可以仅保留一个第一词组块,将保留下的该第一词组块确定为第二词组块。本公开实施例通过去重处理,可以减少查询的词组块,提高查询速率。
53.可选的,基于图1所示的方法,如图3所示,本公开实施例提供的业务需求文本检查方法的另一种实施方式的流程示意图,步骤s300可以包括:
54.s310、对至少一个第一词组块进行冗余度计算,对重复的第一词组块进行去重,将去重后保留下的第一词组块确定为第二词组块。
55.具体的,本公开实施例可以通过nlp中的自动检测算法对至少一个第一词组块进行冗余度计算。
56.s400、利用至少一个第二词组块与预设标准需求文档进行相似度对比,确定目标业务需求文本是否为不规范文档。
57.可选的,预设标准需求文档中包括预先定义的至少一个标准词语结构模板。可选的,标准词语结构模板包括项目编号词语结构、项目名称词语结构以及专业术语结构。
58.可以理解的是,本公开实施例可以根据实际需求对标准需求文档进行设置,在需求规范有变更时,只需调整该标准需求文档中的标准词语结构模板即可。
59.可选的,基于图3所示的方法,如图4所示,本公开实施例提供的业务需求文本检查方法的另一种实施方式的流程示意图,步骤s400可以包括:
60.s410、在至少一个第二词组块中,确定由一个或多个第二词组块组成的至少一个目标词语结构。
61.s420、在预设标准需求文档中分别确定各目标词语结构对应的标准词语结构模板。
62.s430、对任一目标词语结构:将该目标词语结构与对应的标准词语结构模板进行相似度对比,获得该目标词语结构对应的相似度结果,根据相似度结果,确定该目标词语结构是否符合规范。
63.s440、若各目标词语结构均符合规范,则确定目标业务需求文本为规范文档。
64.s450、若任一目标词语结构不符合规范,则确定目标业务需求文本为不规范文本。
65.为了便于理解,此处通过举例进行说明:假设标准词语结构模板中的项目编号词语结构为“农银项字科xxxx第xxx号”。若目标词语结构为“农银项字科2020第123456号”,则该目标词语结构符合规范。若目标词语结构为“农银项字科2020年123456号”,则该目标词语结构不符合规范。
66.可选的,本公开实施例可以在确定任一目标词语结构不符合规范之后,根据组成该目标词语结构的一个或多个第二词语块,确定该目标词语结构在目标业务需求文本中的文本位置,并在目标业务需求文本的该文本位置上添加可视化标记,获得携带有可视化标记的业务需求处理文本。
67.可选的,本公开实施例可以对业务需求处理文本进行展示。
68.本公开提供的一种业务需求文本检查方法,可以获得目标业务需求文本;对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。本公开实施例采用自然语言处理技术,对业务需求文档规范进行智能分析,自动审查,筛选出不规范的文档。
69.虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
70.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
71.与上述方法实施例相对应,本公开实施例还提供一种业务需求文本检查装置,其结构如图5所示,可以包括:目标业务需求文本获得单元100、词组分块单元200、词组块去重单元300以及规范文档判断单元400。
72.目标业务需求文本获得单元100,用于获得目标业务需求文本。
73.词组分块单元200,用于对目标业务需求文本进行词组分块,获得至少一个第一词组块。
74.可选的,词组分块单元200,具体用于利用open nlp对述目标业务需求文本进行词组分块,获得至少一个第一词组块,其中,第一词组块包括名词短语或动词短语。
75.词组块去重单元300,用于对至少一个第一词组块进行去重处理,获得至少一个第二词组块。
76.可选的,词组块去重单元300,具体用于对至少一个第一词组块进行冗余度计算,对重复的第一词组块进行去重,将去重后保留下的第一词组块确定为第二词组块。
77.规范文档判断单元400,用于利用至少一个第二词组块与预设标准需求文档进行相似度对比,确定目标业务需求文本是否为不规范文档。
78.可选的,预设标准需求文档中包括预先定义的至少一个标准词语结构模板。可选的,标准词语结构模板包括项目编号词语结构、项目名称词语结构以及专业术语结构。
79.可选的,规范文档判断单元400包括:目标词语结构确定子单元、标准词语结构模板确定子单元、目标词语结构规范判断子单元、规范文本确定子单元以及不规范文本确定子单元。
80.目标词语结构确定子单元,用于在至少一个第二词组块中,确定由一个或多个第二词组块组成的至少一个目标词语结构。
81.标准词语结构模板确定子单元,用于在预设标准需求文档中分别确定各目标词语结构对应的标准词语结构模板。
82.目标词语结构规范判断子单元,用于对任一目标词语结构:将该目标词语结构与
对应的标准词语结构模板进行相似度对比,获得该目标词语结构对应的相似度结果,根据相似度结果,确定该目标词语结构是否符合规范。
83.规范文本确定子单元,用于若各目标词语结构均符合规范,则确定目标业务需求文本为规范文档。
84.不规范文本确定子单元,用于若任一目标词语结构不符合规范,则确定目标业务需求文本为不规范文本。
85.可选的,该业务需求文本检查装置还可以包括:业务需求处理文本获得单元。
86.业务需求处理文本获得单元,用于在确定任一目标词语结构不符合规范之后,根据组成目标词语结构的一个或多个第二词语块,确定目标词语结构在目标业务需求文本中的文本位置,并在目标业务需求文本的文本位置上添加可视化标记,获得携带有可视化标记的业务需求处理文本。
87.可选的,该业务需求文本检查装置还可以包括:文本展示单元。
88.文本展示单元,用于业务需求处理文本获得单元获得携带有可视化标记的业务需求处理文本之后,对业务需求处理文本进行展示。
89.本公开提供的一种业务需求文本检查装置,可以获得目标业务需求文本;对所述目标业务需求文本进行词组分块,获得至少一个第一词组块;对所述至少一个第一词组块进行去重处理,获得至少一个第二词组块;利用所述至少一个第二词组块与预设标准需求文档进行相似度对比,确定所述目标业务需求文本是否为不规范文档。本公开实施例采用自然语言处理技术,对业务需求文档规范进行智能分析,自动审查,筛选出不规范的文档。
90.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
91.所述业务需求文本检查装置包括处理器和存储器,上述目标业务需求文本获得单元100、词组分块单元200、词组块去重单元300以及规范文档判断单元400等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
92.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来采用自然语言处理技术,对业务需求文档规范进行智能分析,自动审查,筛选出不规范的文档。
93.本公开实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述业务需求文本检查方法。
94.本公开实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述业务需求文本检查方法。
95.如图6所示,本公开实施例提供了一种电子设备1000,电子设备1000包括至少一个处理器1001、以及与处理器1001连接的至少一个存储器1002、总线1003;其中,处理器1001、存储器1002通过总线1003完成相互间的通信;处理器1001用于调用存储器1002中的程序指令,以执行上述的业务需求文本检查方法。本文中的电子设备可以是服务器、pc、pad、手机等。
96.本公开还提供了一种计算机程序产品,当在电子设备上执行时,适于执行初始化有业务需求文本检查方法步骤的程序。
97.本公开是参照根据本公开实施例的方法、装置、电子设备(系统)、和计算机程序产
品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
98.在一个典型的配置中,电子设备包括一个或多个处理器(cpu)、存储器和总线。电子设备还可以包括输入/输出接口、网络接口等。
99.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
100.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd

rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
101.在本公开的描述中,需要理解的是,如若涉及术语“上”、“下”、“前”、“后”、“左”和“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的位置或元件必须具有特定方位、以特定的方位构成和操作,因此不能理解为本公开的限制。
102.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
103.本领域技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
104.以上仅为本公开的实施例而已,并不用于限制本公开。对于本领域技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1