一种生成投标文件的方法、装置和计算机可读存储介质与流程

文档序号:33698695发布日期:2023-03-31 17:25阅读:52来源:国知局
一种生成投标文件的方法、装置和计算机可读存储介质与流程

1.本技术涉及自然语言处理领域,更为具体地,涉及一种生成投标文件的方法、装置和计算机可读存储介质。


背景技术:

2.招标文件的内容繁多,投标方需要对招标文件中的相关内容进行应答,编写投标文件。投标文件有很多固定的格式和要求,投标人员需要耗费大量的精力和时间编写投标文件,且在编写过程中很容易出现各种各样的错误。
3.现有的投标文件标书半自动生成系统或投标文件书辅助生成系统,也需要人工操作。例如,招标文件中大量的应答条款需要投标人员逐条逐项去回复。工作量大,耗时较长。因此,希望提供一种方法,实现对招标文件中应答条款的自动应答,从而实现投标文件的自动生成,减少人工操作,节省人力。


技术实现要素:

4.本技术提供了一种生成投标文件的方法、装置和计算机可读存储介质,以期实现对招标文件中应答条款的自动应答,从而实现投标文件的自动生成,减少人工操作,节省人力。
5.第一方面,本技术提供了一种生成投标文件的方法,该方法包括:从招标文件的点对点应答附件中识别出点对点应答条款;基于所述点对点应答条款,采用自然语言处理技术,生成点对点应答语句;基于所述点对点应答语句生成投标文件中的点对点应答文件;其中,所述点对点应答条款包括商务点对点应答条款,所述点对点应答文件包括商务点对点应答文件,和/或,所述点对点应答条款包括技术点对点应答条款,所述点对点应答文件包括技术点对点应答文件。
6.基于上述方案,通过从招标文件的点对点应答附件中识别出点对点应答条款,基于识别出来的商务点对点应答条款,采用自然语言处理技术,生成点对点应答语句,再将点对点应答语句进行整合,从而可以生成并输出投标文件中的点对点应答文件。由此,可以实现对招标文件中应答条款的自动应答,并可自动生成和输出投标文件中的点对点应答文件,减少人工操作,节省人力。
7.可选地,针对所述点对点应答条款中的每一个应答条款,执行如下操作,以生成所述点对点应答语句:提取所述应答条款的关键词,构建关键词的词向量;基于所述关键词的词向量,从资源库中抽取多个关联词;基于所述关键词的词向量和所述多个关联词中每个关联词的词向量,分别计算所述关键词与所述每个关联词的相似度,以确定相似度最高值;以及根据所述相似度最高值与预设阈值的大小关系,生成针对所述应答条款的应答语句;其中,在所述相似度最高值大于所述预设门限的情况下,所述点对点应答语句用于指示满足所述点对点应答条款;在所述相似度最高值小于或等于所述预设门限的情况下,所述点对点应答语句用于指示不满足所述点对点应答条款。
8.可选地,该方法还包括:统计对所述商务点对点应答条款中的不满足项的数目;基于所述不满足项的数目生成所述投标文件中的商务偏离表。
9.可选地,该方法还包括:统计对所述技术点对点应答条款中的不满足项的数目;基于所述不满足项的数目生成所述投标文件中的技术偏离表。
10.可选地,在从招标文件的点对点应答附件中识别出点对点应答条款之前,该方法还包括:从所述招标文件中识别出招标文件的正文、技术规范书、商务点对点应答附件、技术点对点应答附件。
11.可选地,该方法还包括:从所述招标文件中的正文中识别出商务条件要求语句;基于所述商务条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成所述商务资质应答文件。
12.可选地,该方法还包括:从所述招标文件中的技术规范书中识别出技术条件要求语句;基于所述技术条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成所述技术建议书。
13.第二方面,提供了一种生成投标文件的装置,包括用于实现第一方面和第一方面任一项中所述的生成投标文件的方法的单元。应理解,各个单元可通过执行计算机程序来实现相应的功能。
14.第三方面,提供了一种生成投标文件的装置,包括处理器,所述处理器用于执行第一方面和第一方面任一项中所述的生成投标文件的方法。
15.所述装置还可以包括存储器,用于存储指令和数据。所述存储器与所述处理器耦合,所述处理器执行所述存储器中存储的指令时,可以实现上述第一方面描述的方法。所述装置还可以包括通信接口,所述通信接口用于该装置与其它设备进行通信,示例性的,通信接口可以是收发器、电路、总线、模块或其它类型的通信接口。
16.第四方面,提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机实现第一方面和第一方面任一项中所述的方法。
17.应当理解的是,本技术的第二方面至第四方面与本技术的第一方面的技术方案相对应,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
附图说明
18.图1是适用于本技术实施例提供的生成投标文件的方法的系统结构示意图;
19.图2是本技术实施例提供的商务点对点问答模型和技术点对点问答模型的结构示意图;
20.图3是本技术实施例提供的商务条件识别模型和技术条件识别模型的结构示意图;
21.图4是本技术实施例提供的商务资质编写模型和技术建议书编写模型的结构示意图;
22.图5是本技术实施例提供的一种生成投标文件的方法的流程示意图;
23.图6是本技术实施例提供的另一种生成投标文件的方法的流程示意图;
24.图7是适用于本技术实施例提供的生成投标文件的方法的系统接口示意图;
25.图8是本技术实施例提供的一种生成投标文件的装置的示意性框图;
26.图9是本技术实施例提供的另一种生成投标文件的装置的示意性框图。
具体实施方式
27.下面将结合附图,对本技术中的技术方案进行描述。
28.为了便于理解,首先对本技术中涉及到的术语作简单说明。
29.1、招标文件:招标文件是招标项目的大纲,是向投标方公司提供参加投标所需要的一切情况。其中,正文包含了对投标方提出的商务条件要求和投标的一些注意事项等;招标文件的附件部分包括:商务点对点应答附件、技术点对点应答附件、技术规范书等。
30.2、投标文件:投标文件是指投标方公司应招标文件要求编制的应答性文件。一般由商务点对点应答文件、商务偏离表、技术点对点应答文件、技术偏离表、商务资质应答文件、技术建议书、报价文件和其他部分组成。
31.3、商务条件要求:可以指招标文件的正文中对投标方公司提出的商务方面的要求,包括对投标方公司资质、人员资质、业绩等方面的要求。
32.4、商务资质应答文件:可以指投标方公司针对招标文件的正文中提出的商务方面的要求编写的满足商务条件要求的应答文件。
33.5、商务点对点应答附件:可以指招标文件的附件中关于商务点对点应答的内容,投标方需要对该附件要求的条款进行点对点应答,必须在引用原文的基础上,逐条逐项答复、说明和解释,应答内容例如可以为“满足”或“不满足”。
34.6、商务点对点应答文件:可以指对招标文件的商务点对点应答附件中要求的商务条款进行逐条逐款地点对点应答的文件。
35.7、商务偏离表:可以指与招标文件的商务点对点应答附件中商务点对点应答条款有差异的地方的统计汇总表,通过统计商务点对点应答文件中的“不满足”项,得到商务偏离表。
36.8、技术条件要求:可以指招标文件的技术规范书中对投标方公司提出的技术方面的要求。
37.9、技术建议书:可以指投标方公司针对招标文件的技术规范书中提出的技术方面的要求编写的满足技术条件要求的应答文件。
38.10、技术点对点应答附件:可以指招标文件的附件中关于技术点对点应答的内容。应理解,与商务点对点应答附件类似,投标方也需要对该附件要求的条款进行点对点应答,必须在引用原文的基础上,逐条逐项答复、说明和解释,应答内容例如可以为“满足”或“不满足”。
39.11、技术点对点应答文件:可以指对招标文件的技术点对点应答附件中要求的技术条款进行逐条逐款地点对点应答的文件。应理解,与商务点对点应答文件类似。
40.12、技术偏离表:可以指与招标文件的技术点对点应答附件中技术点对点应答条款有差异的地方的统计汇总表,通过统计技术点对点应答文件中的“不满足”项,得到技术偏离表。
41.13、资源库:可以包括投标商务资源库、投标技术资源库和投标历史数据资源库。应理解,资源库可以是存储了投标商务资源、投标技术资源及投标历史数据的数据库。
42.其中,投标商务资源库主要由投标方公司的公司资质库、人员资质库、业绩库等组
成。公司资质库包括公司的营业执照和各种资质证书等的扫描件和文字说明信息;公司人员资质库存储的是投标经常用到的人员信息,包括人员的姓名、性别、年龄,及其资质证书,例如,身份证、毕业证、学位证、职称证及各类专业证书(例如,主机类、数据库类、网络类、存储类、云计算类、大数据类、物联网类、管理类等)等的扫描件和文字说明信息;业绩库主要包括已签约的合同信息(例如,合同名称、合同金额、相关产品、合同扫描件等)。
43.投标技术资源库主要由投标方公司的主要产品的相关技术文件组成,主要包括:产品名称、产品功能项、产品非功能项、产品测试方案、产品测试报告、产品配置方案、产品部署方案、产品培训方案、产品集成方案、项目管理方案等内容。
44.投标历史数据资源库主要包括投标方公司的商务点对点应答历史数据、技术点对点应答历史数据、商务资质应答文件历史数据、技术建议书历史数据、招标文件中的正文的历史数据、招标文件中的技术规范书的历史数据等。
45.为了便于理解,下面结合图1对适用于本技术的生成投标文件的系统进行详细说明。
46.如图1所示,在生成投标文件的系统中可以包括商务点对点问答模型、技术点对点问答模型以及资源库。其中,商务点对点问答模型可以从招标文件的商务点对点应答附件中识别出商务点对点应答条款;根据识别出来的商务点对点应答条款与资源库中的商务点对点应答历史数据的匹配程度,逐条逐款地生成商务点对点应答语句,该商务点对点应答语句例如可以为“满足”或“不满足”,以用于指示满足或不满足上述商务点对点应答条款。基于生成的商务点对点应答语句可进一步生成商务点对点应答文件。
47.与之相似地,技术点对点问答模型可以从招标文件的技术点对点应答附件中识别出技术点对点应答条款;根据识别出来的技术点对点应答条款与资源库中的技术点对点应答历史数据的匹配程度,逐条逐款地生成技术点对点应答语句,该技术点对点应答语句例如可以为“满足”或“不满足”,以用于指示满足或不满足上述技术点对点应答条款。基于生成的技术点对点应答语句生成技术点对点应答文件。
48.前文已述及,资源库实质就是一个数据库,该资源库可以包括投标商务资源库、投标技术资源库和投标历史数据资源库。其中,投标历史数据资源库中保存有商务点对点应答历史数据和技术点对点应答历史数据等。
49.可选地,生成投标文件的系统中还可以包括商务条件识别模型和商务资质编写模型,如图1所示。商务条件识别模型可以从招标文件的正文中识别出商务条件要求语句;商务资质编写模型可以基于商务条件识别模型识别出来的商务条件要求语句,对商务条件要求语句增加序号,生成有章节信息的商务资质应答文件模板,从资源库中调取匹配的内容,并将调取出来的内容放到商务资质应答文件模板的对应位置,从而生成商务资质应答文件。
50.可选地,生成投标文件的系统中还可以包括技术条件识别模型和技术建议书编写模型,如图1所示。技术条件识别模型可以从招标文件的技术规范书中识别出技术条件要求语句;技术建议书编写模型可以基于技术条件识别模型识别出来的技术条件要求语句,对技术条件要求语句增加序号,生成有章节信息的技术建议书模板,从资源库中调取匹配的内容,并将调取出来的内容放到技术建议书模板的对应位置,从而生成技术建议书。
51.应理解,该生成投标文件的系统是从产品形态上来说的,每个模型可以认为是处
理器中的不同功能模块,每个模块用于实现不同的功能而设立,也并不一定以独立的形式存在。图1所示仅为示例,该生成投标文件的系统还可以包括更多其他的模型、模块或单元等。该生成投标文件的系统可以是部署在计算机中的系统。
52.为了便于理解,以下结合附图对各个模型的结构进行简单说明。
53.商务点对点问答模型与技术点对点问答模型的结构和工作原理可以是相似的,以下结合图2对商务点对点问答模型和技术点对点问答模型的结构和工作原理进行简单说明。
54.图2中示出了商务/技术点对点问答模型的结构,这两个模型都可以采用自然语言处理(natural language processing,nlp)技术中的动机语言预训练(pre-training of deep bidirectional transformers for language understanding,bert)模型和双向长短记忆(bidirectional-directional long short-term memory,bilstm)神经网络为基础模型,其中bilstm由前向长短记忆(long short-term memory,lstm)神经网络和后向lstm神经网络组成。在bert模型之后添加词频-逆文本频率指数(term frequency-inverse document frequency,tf-idf)模型,使用该tf-idf抽取关键词,以此降低计算模型的复杂度;基于tf-idf抽取的关键词,bert模型还可以从资源库中抽取关联词;在bilstm上添加注意力(attention)机制(即,bilstm+注意力机制模型或bilstm+attention模型),将关键词和关联词输入到该模型中,以此加强远距离单词之间的关联性;在bilstm+注意力机制模型之后再添加一层卷积神经网络(convolutional neural network,cnn)和softmax模型(softmax模型是一种多分类模型)进行特征融合,输出关联词与关键词之间的相似度分数;再根据相似度分数与预设阈值之间的关系生成点对点应答语句,进而生成点对点应答文件。
55.需要说明的是,商务对点问答模型的训练数据集是投标历史数据中商务点对点应答的条款,例如可以选取近三年投标历史数据中商务点对点应答的条款;技术点对点问答模型的训练数据集是投标历史数据中技术点对点应答的条款,例如可以选取近三年投标历史数据中技术点对点应答的条款。
56.在本技术实施例中,商务点对点应答历史数据集、技术点对点应答数据集分别包含16528条数据,训练集、测试集、验证集分别包括15028、1000、500条数据。这两个模型训练时一次输入样本量的大小(batch_size)设置为64,优化器选用adam(一种优化器),学习率(learning-rate)采用0.001,训练轮数epoch设置为10000,每训练200轮保存一次模型。其中,epoch表示对所有的样本训练一轮。
57.由商务点对点应答历史数据集训练出来的商务点对点问答模型的准确率为0.942,召回率为0.893;由技术点对点应答历史数据集训练出来的技术点对点问答模型的准确率为0.935,召回率为0.906。
58.应理解,图2中示出了商务/技术点对点问答模型的结构只是示例性的,不对本技术构成任何限定。
59.商务条件识别模型与技术条件识别模型的结构和工作原理可以是相似的,因此以下结合图3对商务条件识别模型与技术条件识别模型的结构和工作原理进行简单说明。
60.图3中示出了商务/技术条件识别模型的结构,这两个模型都可以采用nlp技术中的文本(text)-cnn模型(text-cnn模型是一种用于文本分类的模型)为基础模型,该基础模
型由输入层卷积层、卷积层、池化层和全连接层构成。商务/技术条件识别模型在text-cnn模型的卷积层和池化层之间增加一层lstm神经网络,在全连接层后再加入3个独立的lstm单层网络(如图中所示的lstm_0、lstm_1和lstm_3)来构建投票机制,选用投票率最高的类型为最终类别。
61.商务条件识别模型可以把招标文件中正文文本内容的语句划分成两类:0代表商务条件要求语句,1代表其他语句。例如,如果第二层lstm神经网络的3个lstm单层网络中有两个的输出为“0”,则代表输入语句为商务条件要求语句。
62.技术条件识别模型可以把招标文件中技术规范书文本内容的语句划分成两类:0代表技术条件要求语句,1代表其他语句。例如,如果第二层lstm神经网络的3个lstm单层网络中有两个的输出为“0”,则代表输入语句为技术条件要求语句。
63.需要说明的是,商务条件识别模型的训练数据集为近三年招标文件中的正文的历史数据,技术条件识别模型的训练数据集为近三年招标文件中的技术规范书的历史数据,正文和技术规范的历史数据集的大小均为4200条,人工标注2000条数据,采用半监督方式标记剩余2200条数据。这两个模型训练时一次输入样本量大小batch_size设置为64,训练轮数epoch设置为1000,每训练100轮保存一次模型。
64.由标书正文的历史数据集训练出来的商务条件识别模型的准确率为0.961,召回率为0.902;由技术规范述的历史数据集训练出来的技术条件识别模型的准确率为0.943,召回率为0.914。
65.应理解,图3中示出了商务/技术条件识别模型的结构只是示例性的,不对本技术构成任何限定。
66.商务资质编写模型与技术建议书编写模型的结构和工作原理可以是相似的,因此以下结合图4对商务资质编写模型与技术建议书编写模型的结构和工作原理进行简单说明。
67.如4中示出了商务资质编写模型与技术建议书编写模型的结构,这两个模型都可以采用nlp技术中的transformer模型为基础模型,transformer模型由多层编码器(encoder)和多层解码器(decoder)构成。如图4所示,多层编码器包括编码层1和编码层2,多层解码器包括解码层1和解码层2。
68.在encoder与decoder之间加入了一层encoder计算互注意力获得融合特征,如图4中所示的互注意力层。将融合特征向量分别输入解码层1和解码层2中,计算出在投标资源库中对应答案的起始位置与结束位置,抽取对应段落作为应答输出,即商务资质应答文件或技术建议书的内容。
69.应理解,商务条件识别模型的输出的商务条件要求语句作为商务资质编写模型的输入,技术条件识别模型的输出的技术条件要求语句作为技术建议书编写模型的输入。
70.需要说明的是,商务资质编写模型的训练数据集为近三年商务资质应答文件历史数据,技术建议书编写模型的训练数据集为近三年技术建议书历史数据,商务资质应答文件历史数据集和技术建议书历史数据集的大小均为4200条,其中80%数据作为训练集,10%数据作为测试集,10%数据作为验证集。transformer中头(head)设置为8个,丢弃率(dropout)设置为0.5,优化器采用adam,一次输入样本量的大小batch_size设置为8,训练轮数epoch设置为100000,每训练1000轮保存一次模型。
71.由商务资质应答文件历史数据集训练出来的商务资质编写模型的准确率为0.942,召回率为0.891;由技术建议书历史数据集训练出来技术建议书编写模型的准确率为0.925,召回率为0.908。
72.应理解,图4中示出了商务资质编写模型和技术建议书编写模型的结构只是示例性的,不对本技术构成任何限定。
73.下面将结合附图对本技术实施例提供的生成投标文件的方法做详细说明。
74.图5是本技术实施例提供的一种生成投标文件的方法的流程示意图。应理解,图5所示的方法500可以由生成投标文件的装置来执行,该生成投标文件的装置例如可以部署有如图1所示的生成投标文件的系统的装置,或者,也可以是图1所示的生成投标文件的系统本身,本技术实施例对此不作限定。
75.下文中为便于理解,以图1所示的生成投标文件的系统为例来描述本技术实施例提供的生成投标文件的方法。
76.在步骤510中,从招标文件的点对点应答附件中识别出点对点应答条款。
77.应理解,点对点应答条款可以包括商务点对点应答条款和/或技术点对点应答条款。
78.如图1所示,商务点对点应答条款可以由生成投标文件的系统中的商务点对点问答模型从招标文件的商务点对点应答附件中识别出来,而技术点对点应答条款可以由技术点对点问答模型从招标文件的技术点对点应答附件中识别出来。
79.示例性地,如图2中示出的商务/技术点对点问答模型,以商务点对点问答模型为例,bert模型从招标文件的商务点对点应答附件中识别出商务点对点应答条款,并将商务点对点应答条款的语句转换成文本向量。更具体地说,bert模型将点对点应答附件转换为n*512维的问题表达向量,其中,n表示句子的个数。
80.应理解,上述bert模型的输入为商务点对点应答附件,输出为问题表达向量,该bert模型的参数设置为:batch_size=256,epoch=40,learning_rate=0.01,dropout=0。
81.还应理解,技术点对点问答模型也可以通过上述过程输出技术点对点应答条款对应的问题表达向量。为了简洁,此处不再赘述。
82.在步骤520中,基于所述点对点应答条款,采用自然语言处理技术,生成点对点应答语句。
83.具体而言,对点对点应答条款的处理可以是逐条逐款地处理。对于每一个点对点应答条款可以执行如下操作:抽取点对点应答条款中的关键词,构建关键词的词向量;基于关键词的词向量,从资源库中抽取关联词;基于关键词的词向量和关联词的词向量,分别计算每个关键词与每个关联词的相似度,确定出相似度数值最大的关联词;比较该关联词的相似度数值与预设阈值的大小关系,当该关联词的相似度数值大于预设阈值时,在引用点对点应答语句的基础上对该点对点应答语句回复“满足”,生成点对点应答语句;当该关联词的相似度数值小于等于预设阈值时,在引用点对点应答语句的基础上对该点对点应答语句回复“不满足”,生成点对点应答语句。
84.如图1所示,生成投标文件的系统中的商务点对点问答模型还可以基于识别出来的商务点对点应答条款,采用自然语言处理技术,生成商务点对点应答语句;同样地,技术
点对点问答模型可以基于识别出来的技术点对点应答条款,采用自然语言处理技术,生成技术点对点应答语句。
85.为便于理解,这里以商务点对点问答模型为例结合图2所示的模型来说明步骤520的具体过程。如图2所示,bert模型的输出数据作为加了attention机制的bilstm模型的输入数据,即,将步骤510中输出的问题表达向量输入到bilstm+attention模型中;tf-idf模型从bert模型识别出的商务点对点应答条款语句中根据词汇出现的频率和上下文语意抽取关键词,构建关键词向量k0,其大小为512维,该关键词向量k0也作为bilstm+attention模型的输入数据;同样使用bert模型,基于tf-idf模型从商务点对点应答条款语句中抽取出的关键词与商务点对点应答历史数据文本中的词汇进行相似度计算,抽取出关联词,关联词的词向量k1的大小设置为k*512维,k表示抽取出的关联词的个数,将关联词向量k1也作为bilstm+attention模型的输入数据。
86.由上述描述可知,bilstm+attention模型的输入数据包括问题表达向量、关键词向量k0和关联词向量k1。通过将关键词和关联词输入到bilstm+attention模型中,进一步提取关键词和关联词之间的关系,将距离向量作为权重进行计算,从而加强长距离单词之间的联系。bilstm+attention模型的输出为m*1024维的词向量,m为该词向量中所包含词汇的个数。接下来,将该词向量输入到cnn+softmax模型中,通过softmax层获取最终关联词与关键词匹配的相似度分数,取前几个匹配度最高的关联词作为可匹配项,例如,取前4个匹配度最高的关联词作为可匹配项,如图中所示的相似度分数1、相似度分数2、相似度分数3和相似度分数4。从这些可匹配项中选取相似度分数最大的关联词,当该相似度分数高于预设阈值时,说明该关联词与关键词强相关,则引用商务点对点应答文件中的与该关联词强相关的关键词所在的条款的基础上,对该条款回复“满足”,否则回答“不满足”,并生成商务点对点应答语句。
87.示例性地,假设上述4个相似度分数中的相似度最高值为相似度分数1,预设阈值为90。则可在相似度分数1>90的情况下,回复“满足”;在相似度分数1≤90的情况下,回复“不满足”。
88.应理解,技术点对点问答模型也可以通过上述过程生成技术点对点应答语句。为了简洁,此处不再赘述。
89.在步骤530中,基于所述点对点应答语句生成投标文件中的点对点应答文件。
90.基于点对点应答语句,按照点对点应答附件中点对点应答条款的相对位置,对与点对点应答条款对应的点对点应答语句的排序,生成点对点应答文件。
91.示例性地,仍然以商务点对点问答模型为例,基于商务点对点应答语句,按照商务点对点应答附件中商务点对点应答条款的相对位置,对与商务点对点应答条款对应的商务点对点应答语句的排序,生成商务点对点应答文件。
92.应理解,技术点对点问答模型也可以通过上述过程生成技术点对点应答文件。为了简洁,此处不再赘述。
93.可选地,统计对点对点应答条款中的不满足项的数目;基于不满足项的数目生成投标文件中的偏离表。
94.应理解,生成投标文件的系统可以通过统计商务点对点应答文件中的“不满足”项的数目,生成商务偏离表;同样地,生成投标文件的系统可以通过统计技术点对点应答文件
中的“不满足”项的数目,生成技术偏离表。
95.通过商务点对点问答模型从招标文件的商务点对点应答附件中识别出商务点对点应答条款;基于识别出来的商务点对点应答条款,采用自然语言处理技术,生成商务点对点应答语句,再将商务点对点应答语句进行整合,生成并输出投标文件中的商务点对点应答文件;以及,通过技术点对点问答模型从招标文件的技术点对点应答附件中识别出技术点对点应答条款;基于识别出来的技术点对点应答条款,采用自然语言处理技术,生成技术点对点应答语句,再将技术点对点应答语句进行整合,生成并输出投标文件中的技术点对点应答文件。还可以通过分别统计商务点对点应答文件和技术点对点应答文件中的不满足的条款的数目,生成并输出商务偏离表和技术偏离表。从而实现对招标文件中应答条款的自动应答,并自动生成和输出投标文件中的商务点对点应答文件、技术点对点应答文件、商务偏离表、技术偏离表,减少人工操作,节省人力。
96.可选地,在从招标文件的点对点应答附件中识别出点对点应答条款之前,可以先从招标文件中识别出招标文件的正文、技术规范书、商务点对点应答附件、技术点对点应答附件。
97.应理解,生成投标文件的系统可以先对招标文件中的各部分内容进行识别,识别出招标文件的正文、技术规范书、商务点对点应答附件、技术点对点应答附件,以便于生成投标文件的系统的各个模块对相应的内容进行处理。
98.示例性地,生成投标文件的系统识别出招标文件中的商务点对点应答附件后,将商务点对点应答附件的内容输入到商务点对点问答模型中进行处理。
99.除了上述的商务点对点问答模型和技术点对点问答模型之外,该装置还可以从招标文件中的正文中识别出商务条件要求语句;基于商务条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成商务资质应答文件。
100.应理解,生成投标文件的系统中还可以包括商务条件识别模型和商务资质编写模型。其中,商务条件识别模型可以从招标文件中的正文中识别出商务条件要求语句;商务资质编写模型可以基于商务条件识别模型识别出的商务条件要求语句,从资源库中调取匹配的内容,并基于调取的内容,生成商务资质应答文件。
101.可选地,可以从招标文件中的技术规范书中识别出技术条件要求语句;基于技术条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成投标文件中的技术建议书。
102.应理解,生成投标文件的系统中还可以包括技术条件识别模型和技术建议书编写模型。其中,技术条件识别模型可以从招标文件中的技术规范书中识别出技术条件要求语句;技术建议书编写模型可以基于技术条件识别模型识别出的技术条件要求语句,从资源库中调取匹配的内容,并基于调取的内容,生成技术建议书。
103.为便于理解,以下结合图3和图4对生成商务资质应答文件地过程进行详细说明。
104.如图3所示,通过商务条件识别模型从招标文件中的正文中识别出商务条件要求语句。
105.输入层输入数据为招标文件中的正文内容,将正文内容逐句处理,构建词向量,再采用word2vec模型将词向量转换为512维字向量,将字向量叠加获得句子向量,输出该句子向量。卷积层的输入数据为输入层输出的句子向量,卷积层的卷积核大小可以设为(2,3,
4),输出为3个4*2*512维向量。通过权重将这3个向量合并转换为3*2*4*512维向量,输入到增加的第一层lstm神经网络中,该第一层lstm神经网络的输出的向量维度设为3*2*4*512维。将第一层lstm神经网络的输出向量拆分成6个独立的4*512维向量,作为池化层的输入,池化层处理后输出6个独立的4*1维向量。将这6个独立的4*1维向量输入到全连接层,通过全连接层转换输出6*4维向量,再分别输入到增加的第二层的3个不同的lstm神经网络中,即lstm_0、lstm_1、lstm_2中,这3个神经网络分别输出0或1,代表两种类别。应理解,lstm_0、lstm_1、lstm_2这3个神经网络的内部结构和处理逻辑相同,只是在参数设置上有所不同,因此有可能会对同一个句子的类型做出不同的判断。对lstm_0、lstm_1、lstm_2的类别判断结果进行投票表决,即,若2个或3个类别判断结果为0,则判定该语句属于0类别,即,该语句是商务条件要求语句;若2个或3个类别判断结果为1,则判定该语句属于1类别,即,该语句是其他语句,不是商务条件要求语句。最终输出该语句对应的类别(即,0或1),并输出属于商务条件要求的语句。
106.应理解,技术条件识别模型也可以通过上述过程判断出技术规范书中属于技术条件要求的语句,并将技术条件语句输出。为了简洁,此处不再赘述。
107.如图4所示,商务资质编写模型基于商务条件识别模型输出的商务条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成商务资质应答文件。
108.bert模型用于获取语句所对应的文本向量。bert模型的参数设置为:batch_size=256,epoch=40,learning_rate=0.01,dropout=0;将商务条件要求语句和商务资质应答文件历史数据分别输入到bert模型中进行处理,获得512维句子向量。编码层1用于对商务条件要求语句进行自编码,编码层2用于对商务资质应答文件历史数据中的语句进行自编码。编码层的层数设置为4,每层包括自注意力层和前馈网络,输出大小为n*512的编码向量,其中,n代表n条语句。叠加器可以将编码层输出的编码向量进行叠加,即,将商务条件要求语句对应的编码向量n1*512和商务资质应答文件历史数据中的语句对应的编码向量n2*512叠加为(n1+n2)*512维向量。互注意力层对叠加器输出的(n1+n2)*512维向量进行自编码,层数设置为2,输出维度大小不变。解码层1用于输出答案的起始位置,解码层2transformer decoder用于输出答案的结束位置。解码层的层数设置为4,每层包括自注意力层和前馈网络。
109.通过上述处理过程可以对商务条件识别模型输出的商务条件语句增加序号,生成有章节信息的商务资质应答文件模板;调取商务资质应答文件的历史数据中匹配的内容,并将调取出来的内容放到商务资质应答文件模板的对应位置,从而生成商务资质应答文件。同样地,通过上述处理过程也可以对技术条件识别模型输出的技术条件要求语句增加序号,生成有章节信息的技术建议书模板。调取技术建议书的历史数据中匹配的内容,并将调取出来的内容放到技术建议书模板的对应位置,从而生成技术建议书。
110.为了更好地理解本技术提出的生成投标文件的方法,以下结合图6对生成投标文件的方法地流程进行简单说明。
111.如图6所示,流程可以同时启动多个线程,程序开始可以打开输入的招标文件,对招标文件的各部分内容进行识别,即,识别出招标文件的正文、技术规范书、商务点对点应答附件、技术点对点应答附件。商务点对点问答模型对商务点对点应答附件进行处理,得到投标文件中的商务点对点应答文件;系统还可以通过统计商务点对点应答文件中的“不满
足”项获得商务偏离表。技术点对点问答模型对技术点对点应答附件进行处理,得到投标文件中的技术点对点应答文件;系统还可以通过统计技术点对点应答文件中的“不满足”项获得技术偏离表。输出投标文件的商务点对点应答文件、商务偏离表、技术点对点应答文件、技术偏离表。
112.可选地,如图6所示,商务条件识别模型可以对招标文件的正文逐句进行判断是否为商务条件要求语句,直到最后一句,如果是商务条件要求语句,则用商务资质编写模型构造投标文件的商务资质应答文件。技术条件识别模型对招标文件的技术规范逐句进行判断是否为技术条件要求,直到最后一句,如果是技术条件要求语句,则用技术建议书编写模型构造投标文件的技术建议书。输出投标文件的商务资质应答文件和技术建议书。
113.图7中示出了适用于本技术提出的生成投标文件的方法的系统的系统接口示意图。以下结合图7,对各个系统接口进行简单说明。
114.如图7所示,接口c为资源库中的商务点对点应答文件的历史数据与商务点对点问答模型的接口,通过bert模型将商务点对点应答文件的历史数据的文本映射为句子向量,将该句子向量输入到商务点对点问答模型中;接口d为招标文件的商务点对点应答附件与商务点对点问答模型的接口,通过bert模型将招标文件的商务点对点应答附件的文本映射为句子向量,将该句子向量输入到商务点对点问答模型中;接口k为商务点对点问答模型与投标文件的商务点对点应答文件的接口,商务点对点问答模型通过该接口输出投标文件的商务点对点应答文件。
115.接口e为资源库中的技术点对点应答文件的历史数据与技术点对点问答模型的接口,通过bert模型将技术点对点应答文件的历史数据的文本映射为句子向量,将该句子向量输入到技术点对点问答模型中;接口f为招标文件的技术点对点应答附件与技术点对点问答模型的接口,通过bert模型将招标文件的技术点对点应答附件的文本映射为句子向量,将该句子向量输入到技术点对点问答模型中;接口p为技术点对点问答模型与投标文件的技术点对点应答文件的接口,技术点对点问答模型通过该接口输出投标文件的技术点对点应答文件。
116.可选地,接口b为招标文件的正文与商务条件识别模型的接口,通过word2vec将招标文件的正文的文本映射为句子向量,将句子向量输入到商务条件识别模型中;接口m为商务条件识别模型与商务资质编写模型之间的接口,将商务条件识别模型输出的商务条件要求语句作为商务资质编写模型的输入数据;接口a为资源库与商务资质编写模型的接口,通过bert模型将资源库中的招标文件的正文内容的文本映射为句子向量,将句子向量输入到商务资质编写模型中;接口j为商务资质编写模型与商务资质应答文件的接口,商务资质编写模型通过该接口输出满足商务条件要求的语句,并生成投标文件的商务资质应答文件。
117.可选地,接口g为招标文件的技术规范与技术条件识别模型接口,通过word2vec将招标文件的技术规范的文本映射为句子向量,将该句子向量输入技术条件识别模型中。接口n为技术条件识别模型与技术建议书编写模型之间的接口,将技术条件识别模型的输出的技术条件要求语句作为技术建议书编写模型的输入数据;接口h为资源库与技术建议书编写模型的接口,通过bert模型将资源库中的招标文件的技术规范书的文本映射为句子向量,将句子向量输入到技术建议书编写模型中。接口q为技术建议书编写模型与技术建议书的接口,技术建议书编写模型通过该接口输出满足技术条件要求的语句,并生成投标文件
的技术建议书。
118.应理解,上文中“满足”和“不满足”为应答语句的一个示例,不应对本技术构成任何限定。该应答语句还可以为其他可用于指示满足应答条款和不满足应答条款的其他语句。本技术实施例对此不作限定。
119.图8是本技术实施例提供的生成投标文件的装置的示意性框图。如图8所示,该生成投标文件的装置800可以包括:识别单元810和处理单元820。其中,该识别单元810,可用于识别单元用于从招标文件的点对点应答附件中识别出点对点应答条款,该处理单元820可用于基于所述点对点应答条款,采用自然语言处理技术,生成点对点应答语句;基于所述点对点应答语句生成投标文件中的点对点应答文件。其中,所述点对点应答条款包括商务点对点应答条款,所述点对点应答文件包括商务点对点应答文件,和/或,所述点对点应答条款包括技术点对点应答条款,所述点对点应答文件包括技术点对点应答文件。
120.可选地,处理单元820还可用于针对所述点对点应答条款中的每一个应答条款,执行如下操作,以生成所述点对点应答语句:提取所述应答条款的关键词,构建关键词的词向量;基于所述关键词的词向量,从资源库中抽取多个关联词;基于所述关键词的词向量和所述多个关联词中每个关联词的词向量,分别计算所述关键词与所述每个关联词的相似度,以确定相似度最高值;以及根据所述相似度最高值与预设阈值的大小关系,生成针对所述应答条款的应答语句;其中,在所述相似度最高值大于所述预设门限的情况下,所述点对点应答语句用于指示满足所述点对点应答条款;在所述相似度最高值小于或等于所述预设门限的情况下,所述点对点应答语句用于指示不满足所述点对点应答条款。
121.可选地,处理单元820还可用于统计对所述商务点对点应答条款中的不满足项的数目;基于所述不满足项的数目生成所述投标文件中的商务偏离表。
122.可选地,处理单元820还可用于统计对所述技术点对点应答条款中的不满足项的数目;基于所述不满足项的数目生成所述投标文件中的技术偏离表。
123.可选地,识别单元810还可以用于在从招标文件的点对点应答附件中识别出点对点应答条款之前,先从招标文件中识别出招标文件的正文、技术规范书、商务点对点应答附件、技术点对点应答附件。
124.可选地,识别单元810还可用于从所述招标文件中的正文中识别出商务条件要求语句;处理单元820还可用于基于所述商务条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成所述商务资质应答文件。
125.可选地,识别单元810还可用于从所述招标文件中的技术规范书中识别出技术条件要求语句;处理单元820还可用于基于所述技术条件要求语句,从资源库中调取匹配的内容;基于调取的内容,生成所述技术建议书。
126.应理解,本技术实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本技术各个实施例中的各功能单元可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
127.图9是本技术实施例提供的生成投标文件的装置的另一示意性框图。该装置可用于实现上述方法中生成投标文件的系统的功能。该装置可以为芯片系统。本技术实施例中,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
128.如图9所示,该生成投标文件的装置900可以包括至少一个处理器910,用于实现本技术实施例提供的方法中生成投标文件的系统的功能。示例性地,处理器910可用于从招标文件的点对点应答附件中识别出点对点应答条款;基于所述点对点应答条款,采用自然语言处理技术,生成点对点应答语句;基于所述点对点应答语句生成投标文件中的点对点应答文件;其中,所述点对点应答条款包括商务点对点应答条款,所述点对点应答文件包括商务点对点应答文件,和/或,所述点对点应答条款包括技术点对点应答条款,所述点对点应答文件包括技术点对点应答文件。具体参见方法示例中的详细描述,此处不做赘述。
129.该生成投标文件的装置900还可以包括至少一个存储器920,用于存储程序指令和/或数据。存储器920和处理器910耦合。本技术实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器910可能和存储器920协同操作。处理器910可能执行存储器920中存储的程序指令。所述至少一个存储器中的至少一个可以包括于处理器中。
130.该生成投标文件的装置900还可以包括通信接口930,用于通过传输介质和其它设备进行通信,从而用于生成投标文件的装置900中的装置可以和其它设备进行通信。所述通信接口930例如可以是收发器、接口、总线、电路或者能够实现收发功能的装置。处理器910可利用通信接口930收发数据和/或信息,并用于实现图5或图6所示实施例中任意一个实施例的方法。
131.本技术实施例中不限定上述处理器910、存储器920以及通信接口930之间的具体连接介质。本技术实施例在图9中以处理器910、存储器920以及通信接口930之间通过总线940连接。总线940在图9中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
132.本技术还提供一种计算机程序产品,所述计算机程序产品包括:计算机程序(也可以称为代码,或指令),当所述计算机程序被运行时,使得计算机执行图5或图6所示实施例中任意一个实施例的方法。
133.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)。当所述计算机程序被运行时,使得计算机执行图5或图6所示实施例中任意一个实施例的方法。
134.应理解,本技术实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成
上述方法的步骤。
135.还应理解,本技术实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
136.本说明书中使用的术语:“单元”、“模块”等,可用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。
137.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step),能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。在本技术所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
138.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
139.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
140.在上述实施例中,各功能单元的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令(程序)。在计算机上加载和执行所述计算机程序指令(程序)时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过
有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital video disc,dvd))、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
141.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
142.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1