公平竞争审查方法、服务器、系统及存储介质与流程

文档序号:20782637发布日期:2020-05-19 21:23阅读:241来源:国知局
公平竞争审查方法、服务器、系统及存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种公平竞争审查方法、服务器、系统及存储介质。



背景技术:

现有技术中在基于公平竞争审查制度对规章、规范性文件和其他政策措施文件进行审查时往往还是采用人工审查的方式,效率低下,无法满足审查需求,导致难以维护统一市场和公平竞争的市场环境。



技术实现要素:

本发明的目的在于提供一种公平竞争审查方法及系统,以解决现有技术中采用人工方式进行公平竞争审查效率低下,无法满足审查需求的问题。

本发明第一方面提供一种公平竞争审查方法,所述方法包括以下步骤:

s11、通过服务器获取客户端或第三方服务器的待审查文件,所述待审查文件至少包括草案、规章、规范性文件和政策措施文件;

s12、对待审查文件进行预处理,从待审查文件中提取核心内容信息;

s13、读取审查标准信息集合,根据获得的审查标准信息集合以及待审查文件的核心内容信息,确定待审查文件与审查标准信息集合的一致性,其中,确定待审查文件与审查标准信息集合的一致性包括:计算待审查文件的核心内容信息与审查标准信息集合的相关度,与预设阈值进行比较,根据比较结果确定待审查文件与审查标准信息集合的一致性,所述审查标准信息集合由多条审查标准信息组成;

s14、根据待审查文件与审查标准信息集合的一致性生成审查结论信息。

进一步的,所述对审查文件进行预处理,从待审查文件中提取核心内容信息,具体包括:

s21、判断待审查文件是否属于审查对象;

s22、若待审查文件属于审查对象,则对待审查文件进行格式化处理,通过分词算法对格式化后的待审查文件进行处理,获得核心内容信息,所述核心内容信息为由多个特征文本组成的特征文本集合,所述特征文本通过采用分词算法对格式化后的待审查文件进行处理后获得;

s23、若待审查文件不属于审查对象,则将该待审查文件从待审查文件库中删除。

进一步的,所述计算待审查文件的核心内容信息与审查标准信息的相关度,与预设阈值进行比较,具体包括:

s31、顺序抽取特征文本集合中的特征文本;

s32、通过深度学习算法计算特征文本与审查标准信息集合中的每一条审查标准信息的相关度,判断所述相关度是否超过预设阈值;

s33、若特征文本与其中一条审查标准信息的相关度超过预设阈值,则建立特征文本与该条审查标准信息的关联关系;

s34、若特征文本与审查标准信息集合中的每一条审查标准信息的相关度均未超过预设阈值,则抽取下一特征文本进行计算。

进一步的,所述根据待审查文件与审查标准信息集合的一致性生成审查结论信息,具体包括:

若待审查文件与审查标准信息集合的相关度超过预设阈值,则获取待审查文件的基本信息、相应的审查标准信息,根据审查标准信息从知识库中获取相应的整改建议信息,将所获得的待审查文件基本信息、审查标准信息、整改建议信息添加到审查结论信息中;

若待审查文件与审查标准信息集合的相关度未超过预设阈值,则直接生成相应的审查结论信息。

本发明第二方面提供一种服务器,所述服务器包括:

获取模块,用于获取客户端或第三方服务器的待审查文件,所述待审查文件至少包括草案、规章、规范性文件和政策措施文件;

预处理模块,用于对待审查文件进行预处理,从待审查文件中提取核心内容信息;

一致性认定模块,用于读取审查标准信息集合,根据获得的审查标准信息集合以及待审查文件的核心内容信息,确定待审查文件与审查标准信息集合的一致性,其中,确定待审查文件与审查标准信息集合的一致性包括:计算待审查文件的核心内容信息与审查标准信息集合的相关度,与预设阈值进行比较,根据比较结果确定待审查文件与审查标准信息集合的一致性,所述审查标准信息集合由多条审查标准信息组成;

结论生成模块,用于根据待审查文件与审查标准信息集合的一致性生成审查结论信息。

进一步的,所述预处理模块具体包括:

判断子模块,用于判断待审查文件是否属于审查对象;

格式化子模块,用于在判断子模块判断待审查文件属于审查对象时,则对待审查文件进行格式化处理,通过分词算法对格式化后的待审查文件进行处理,获得核心内容信息,所述核心内容信息为由多个特征文本组成的特征文本集合,所述特征文本通过采用分词算法对格式化后的待审查文件进行处理后获得;

删除子模块,用于在判断子模块判断待审查文件不属于审查对象时,将该待审查文件从待审查文件库中删除。

进一步的,所述一致性认定模块具体包括:

抽取子模块,用于顺序抽取特征文本集合中的特征文本;

计算子模块,用于通过深度学习算法计算特征文本与审查标准信息集合中的每一条审查标准信息的相关度,判断所述相关度是否超过预设阈值,还用于在特征文本与审查标准信息集合中的每一条审查标准信息的相关度均未超过预设阈值时,则抽取下一特征文本进行计算;

关联子模块,用于在特征文本与其中一条审查标准信息的相关度超过预设阈值时,建立特征文本与该条审查标准信息的关联关系。

进一步的,所述结论生成模块具体包括:

添加子模块,用于在待审查文件与审查标准信息集合的相关度超过预设阈值时,获取待审查文件的基本信息、相应的审查标准信息,根据审查标准信息从知识库中获取相应的整改建议信息,将所获得的待审查文件基本信息、审查标准信息、整改建议信息添加到审查结论信息中;

生成子模块,用于在待审查文件与审查标准信息集合的相关度未超过预设阈值时,直接生成相应的审查结论信息。

本发明第三方面提供一种公平竞争审查系统,所述系统包括前述第二方面所述的服务器、客户端和第三方服务器,所述服务器分别与客户端、第三方服务器通信连接。

本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现前述第一方面所提供的方法的步骤。

与现有技术相比,本发明的有益效果是:

本发明提供的公平竞争审查方法及系统,仅通过服务器可获取客户端上传的待审查文件,或主动从第三方服务器获取待审查文件,对待审查文件进行预处理并从中提取核心内容信息,读取审查标准信息集合并确定获得的审查标准信息集合和待审查文件的核心内容信息的一致性,根据一致性生成审查结论信息,从而可以自动对草案、规章、规范性文件和政策措施一类的文件进行公平竞争审查,提高了审查效率,有助于维护统一市场和公平竞争的市场环境。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的公平竞争审查方法流程示意图。

图2是本发明另一实施例提供的对审查文件进行预处理的方法流程示意图。

图3是本发明又一实施例提供的计算待审查文件的核心内容信息与审查标准信息相关度的方法流程示意图。

图4是本发明一实施例提供的一种服务器结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所列举实施例只用于解释本发明,并非用于限定本发明的范围。

图1为本发明一实施例提供的公平竞争审查方法流程示意图。该方法中的客户端可以是计算机、移动智能终端、平板电脑等设备,服务器可以是计算机、伺服器等设备,第三方服务器可以是计算机、伺服器等设备。本发明实施例中,所述服务器、客户端、第三方服务器通过网络进行通讯。

如图1所示,所述公平竞争审查方法,包括以下步骤:

s11、通过服务器获取客户端或第三方服务器的待审查文件,所述待审查文件至少包括草案、规章、规范性文件和政策措施文件。

该步骤中,所述客户端设于各个行政机关或政策制定机关内;所述第三方服务器可以是各个行政机关或政策制定机关搭建的用于发布草案、规章、规范性文件和政策措施文件的网站服务器,也可以是用于存储上述待审查文件的服务器。

一些实施方式中,各个行政机关或政策制定机关的工作人员在发布草案、规章、规范性文件或政策措施文件前,可先通过客户端将上述文件作为待审查文件上传到服务器,从而通过服务器对待审查文件进行公平竞争审查。服务器也可以主动通过网络获取的方式,获得各个行政机关或政策制定机关上传到第三方服务器的草案、规章、规范性文件和政策措施一类的文件,以便于对这些文件进行公平竞争审查。

另外,各个行政机关或政策制定机关的工作人员在通过客户端上传未公开、未发布的待审查文件到服务器时,客户端可以对上传的待审查文件进行前置操作,所述对待审查文件进行前置操作,可以是对待审查文件进行加密,也可以是对待审查文件添加字符,还可以是对待审查文件进行其他操作。

s12、对待审查文件进行预处理,从待审查文件中提取核心内容信息。

该步骤中,服务器在接收、获取到待审查文件后,对待审查文件进行预处理,并从经过预处理的待审查文件中提取核心内容信息。所述核心内容信息用于表述待审查文件公开的各项条文文本。

另外,所述对待审查文件进行预处理,可以是去除待审查文件中的指定符号、字符,也可以是让待审查文件仅保留文字,也可以是对待审查文件进行其他处理。

s13、读取审查标准信息集合,根据获得的审查标准信息集合以及待审查文件的核心内容信息,确定待审查文件与审查标准信息集合的一致性,其中,确定待审查文件与审查标准信息集合的一致性包括:计算待审查文件的核心内容信息与审查标准信息集合的相关度,与预设阈值进行比较,根据比较结果确定待审查文件与审查标准信息集合的一致性,所述审查标准信息集合由多条审查标准信息组成。

其中,组成审查标准信息集合的每条审查标准信息用于描述公平竞争审查制度中各条审查标准所禁止出现的内容,通过计算待审查文件的核心内容信息与审查标准信息集合的相关度,来判断待审查文件是否涉及违反公平竞争制度,所述相关度越高,说明待审查文件违反公平竞争制度的几率越高,当相关度未超过预设阈值时,说明待审查文件基本没有涉及违反公平竞争制度的条文;当相关度超过预设阈值时,说明该待审查文件非常有可能出现违反公平竞争制度规定的条文,所述预设阈值可以根据实际审查需要进行调整。

s14、根据待审查文件与审查标准信息集合的一致性生成审查结论信息。

该步骤中,服务器根据前一步骤获得的比较结果,生成审查结论信息,所述审查结论信息用于描述待审查文件是否涉嫌违反公平竞争制度。

另外,若待审查文件由客户端上传到服务器,服务器生成审查结论信息后将其反馈给相应的客户端;若待审查文件由服务器通过网络从第三方服务器获得,服务器可以根据待审查文件所携带的基本信息将审查结论信息反馈给相应的行政机关或政策制定机关,从而便于相应行政机关或政策制定机关的工作人员根据审查结论信息对待审查文件进行调整修改。所述基本信息包括但不限于发文单位地址、电子邮箱地址、社交软件账号等信息。

本实施例所提供的一种公平竞争方法,仅通过服务器可获取客户端上传的待审查文件,或主动从第三方服务器获取待审查文件,对待审查文件进行预处理并从中提取核心内容信息,读取审查标准信息集合并确定获得的审查标准信息集合和待审查文件的核心内容信息的一致性,根据一致性生成审查结论信息,从而实现自动对草案、规章、规范性文件和政策措施一类的文件进行公平竞争审查,提高了审查效率,有助于维护统一市场和公平竞争的市场环境。

图2为本发明另一实施例提供的对审查文件进行预处理的方法流程示意

如图2所示,上述对审查文件进行预处理,从待审查文件中提取核心内容信息,具体包括:

s21、判断待审查文件是否属于审查对象。

该步骤中,通过判断待审查文件是否属于公平竞争审查对象,以避免对不属于审查对象的文件进行进一步审查,从而提高审查效率。所述判断待审查文件是否属于审查对象,可以是搜索待审查文件中是否存在涉及市场主体经济活动的字段,所述涉及市场主体经济活动的字段包括但不限于市场准入、产业发展、招商引资、招标投标、经营行为规范、资质标准等。所述搜索待审查文件中是否存在涉及市场主体经济活动的字段,可以是通过设计正则表达式检索待审查文件中是否存在相应字段,也可以是采用其他方式对上述字段进行搜索。

s22、若待审查文件属于审查对象,则对待审查文件进行格式化处理,通过分词算法对格式化后的待审查文件进行处理,获得核心内容信息,所述核心内容信息为由多个特征文本组成的特征文本集合,所述特征文本通过采用分词算法对格式化后的待审查文件进行处理后获得。

其中,所述对待审查文件进行格式化处理,包括:基于关键字识别待审查文件的首部、尾部以及正文,删除正文部分不需要的图片、符号等内容,输出经过处理后的正文部分,以便于后续对正文部分进行识别审查。

另外,所述分词算法可以采用基于词表的分词算法,例如fmm、bmm;也可以采用基于统计模型的分析算法,例如基于n-gram语言模型的分词方法;也可以是采用基于序列标注的分词算法,例如基于hmm的分词方法、基于深度学习的分词方法;还可以是采用其他分词算法对格式化后的待审查文本进行处理。

s23、若待审查文件不属于审查对象,则将该待审查文件从待审查文件库中删除。

本实施例中,服务器接收、获取到的待审查文件存储在待审查文件库中,在抽取待审查文件库中的待审查文件准备进行识别审查时,若判断抽取出的待审查文件不属于审查对象,即不涉及到市场主体经济活动等相关内容,则将该待审查文件从待审查文件库中删除,并抽取下一待审查文件。

图3为本发明另一实施例提供的计算待审查文件的核心内容信息与审查标准信息相关度的方法流程示意图。

如图3所示,在前述实施例中,所述计算待审查文件的核心内容信息与审查标准信息的相关度,与预设阈值进行比较,具体包括:

s31、顺序抽取特征文本集合中的特征文本。

该步骤中,逐条顺序抽取特征文本集合中的特征文本,以便于后续步骤中对特征文本集合中的每一特征文本与审查标准信息集合的相关度进行计算。

s32、通过深度学习算法计算特征文本与审查标准信息集合中的每一条审查标准信息的相关度,判断所述相关度是否超过预设阈值。

具体而言,该步骤中,可以通过深度学习算法计算特征文本中的关键字段与审查标准信息的相关程度,若识别到特征文本中出现审查标准信息所描述的涉及违反公平竞争审查制度的关键字段频次较高,则认为该特征文本与审查标准信息的相关程度高,反之则认为该特征文本与审查标准信息的相关程度低。

一些实施方式中,所述深度学习算法可以采用cnn卷积神经网络,也可以采用dbn深度置信网络,还可以采用其他深度学习算法。

s33、若特征文本与其中一条审查标准信息的相关度超过预设阈值,则建立特征文本与该条审查标准信息的关联关系。

该步骤中,当特征文本与审查标准信息集合其中一条审查标准信息的相关度超过预设阈值时,则认为该特征文本很可能涉及违反该条审查标准信息所描述的公平竞争审查制度内容,通过建立该特征文本与该条审查标准信息的关联关系,以便于后续能够通过人工方式进行复核以免出现误判,或者为用户指出具体违反的公平竞争审查制度条例。

s34、若特征文本与审查标准信息集合中的每一条审查标准信息的相关度均未超过预设阈值,则抽取下一特征文本进行计算。

该步骤中,当特征文本与审查标准信息集合每一条审查标准信息的相关度都没有超过预设阈值时,则认为该特征文本涉及违反审查标准信息所描述的公平竞争审查制度内容的可能性较低,继续抽取下一特征文本进行识别审查。

可选的,上述实施例中,所述根据待审查文件与审查标准信息集合的一致性生成审查结论信息,具体包括:

若待审查文件与审查标准信息集合的相关度超过预设阈值,则获取待审查文件的基本信息、相应的审查标准信息,根据审查标准信息从知识库中获取相应的整改建议信息,将所获得的待审查文件基本信息、审查标准信息、整改建议信息添加到审查结论信息中,以便于相关人员在接收到审查结论信息后,能够根据审查结论信息对相关文件进行针对性的调整修改。所述知识库用于存储整改建议信息,不同的整改建议信息与不同的审查标准信息建立有关联关系,以便于根据审查标准信息查找相应的整改建议信息。

若待审查文件与审查标准信息集合的相关度未超过预设阈值,则直接生成相应的审查结论信息。

基于同样的发明构思,本发明一实施例提供一种服务器,如图4所示,所述服务器包括获取模块1、预处理模块2、一致性认定模块3、结论生成模块4。

其中,所述获取模块1,用于获取客户端或第三方服务器的待审查文件,所述待审查文件至少包括草案、规章、规范性文件和政策措施文件。

所述预处理模块2,用于对待审查文件进行预处理,从待审查文件中提取核心内容信息。

所述一致性认定模块3,用于读取审查标准信息集合,根据获得的审查标准信息集合以及待审查文件的核心内容信息,确定待审查文件与审查标准信息集合的一致性,其中,确定待审查文件与审查标准信息集合的一致性包括:计算待审查文件的核心内容信息与审查标准信息集合的相关度,与预设阈值进行比较,根据比较结果确定待审查文件与审查标准信息集合的一致性,所述审查标准信息集合由多条审查标准信息组成。

所述结论生成模块4,用于根据待审查文件与审查标准信息集合的一致性生成审查结论信息。

可选的,所述预处理模块具体包括:

判断子模块,用于判断待审查文件是否属于审查对象。

格式化子模块,用于在判断子模块判断待审查文件属于审查对象时,则对待审查文件进行格式化处理,通过分词算法对格式化后的待审查文件进行处理,获得核心内容信息,所述核心内容信息为由多个特征文本组成的特征文本集合,所述特征文本通过采用分词算法对格式化后的待审查文件进行处理后获得。

删除子模块,用于在判断子模块判断待审查文件不属于审查对象时,将该待审查文件从待审查文件库中删除。

可选的,所述一致性认定模块具体包括:

抽取子模块,用于顺序抽取特征文本集合中的特征文本。

计算子模块,用于通过深度学习算法计算特征文本与审查标准信息集合中的每一条审查标准信息的相关度,判断所述相关度是否超过预设阈值,还用于在特征文本与审查标准信息集合中的每一条审查标准信息的相关度均未超过预设阈值时,则抽取下一特征文本进行计算。

关联子模块,用于在特征文本与其中一条审查标准信息的相关度超过预设阈值时,建立特征文本与该条审查标准信息的关联关系。

可选的,所述结论生成模块具体包括:

添加子模块,用于在待审查文件与审查标准信息集合的相关度超过预设阈值时,获取待审查文件的基本信息、相应的审查标准信息,根据审查标准信息从知识库中获取相应的整改建议信息,将所获得的待审查文件基本信息、审查标准信息、整改建议信息添加到审查结论信息中。

生成子模块,用于在待审查文件与审查标准信息集合的相关度未超过预设阈值时,直接生成相应的审查结论信息。

所述服务器用于执行前述实施例,其实现原理和技术效果可以参照前述方法实施例,在此不再赘述。

本发明一实施例还提供一种公平竞争审查系统,所述系统包括上述任一实施例所述的服务器、客户端和第三方服务器,所述服务器分别与所述客户端、第三方服务器通信连接。

本发明一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现图1-3任一项所对应的方法的步骤。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路,或,一个或多个微处理器,或,一个或者多个现场可编程门阵列等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统的形式实现。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1