一种企业合同智能生成系统及方法与流程

文档序号:20755726发布日期:2020-05-15 17:24阅读:254来源:国知局
一种企业合同智能生成系统及方法与流程

本发明涉及计算机技术领域,具体涉及一种企业合同智能生成系统及方法。



背景技术:

合同是当事人或当事双方之间设立、变更、终止民事关系的协议,是随着商品经济的发展而出现的产物,各种商业买卖、租赁、承揽、加工等活动中均会大量用到合同。由于纸质形式的合同不易保存、携带不便,很多的企业开始采用电子合同,以提高合同的管理效率。

对此,文件cn108132926a公开了一种合同生成装置及系统,包括:信息获取单元,用于根据待申报表格的填写信息生成申报表格,并获取所述申报表格中的所有目标信息;信息发送单元,与所述信息获取单元通信连接,用于传输所述申报表格;多重审核单元,与所述信息发送单元通信连接,用于对所述申报表格中的所有目标信息进行多次审核,以判断所述目标信息是否符合预设条件;目标生成单元,与所述多重审核单元通信连接,用于根据所述目标信息生成目标合同;电子印章签署单元,与所述目标生成单元通信连接,用于为所述目标合同签署电子印章。

随着电子签名法以及相关法律法规的完善,目前很多合同都可以采用电子文本的形式签订。然而受限于实际情况,人们的法律水平参差不齐,还仍然存在大规模使用手写合同的情况。手写的合同格式不规范、不易保存、携带不便。另外,无论是个人还是企业,在正式签订合同之前,彼此之间都会有磋商、会谈等类似的讨价还价过程。在磋商与会谈的过程中,关于双方的意向、合同的重要条款等都会有相应的文字记录;对于某些极其重要的合同,双方甚至还会彼此进行录音。双方完成达成合意后,再签订正式的合同。但是,这些文字记录与录音记录包含了双方当事人磋商的所有信息,通过这些信息可以直接生成合同文本,而不需要双方当事人再次拟定条款。因此,将手写的纸质合同或者磋商、会谈的文字记录与录音记录转换为特定形式的电子合同文本,可以省去签订合同的程序,从而提高合同签订与管理的效率。



技术实现要素:

本发明提供一种企业合同智能生成系统及方法,将手写的纸质合同或者磋商、会谈的文字记录与录音记录转换为特定形式的电子合同文本;省去了签订合同的程序,从而提高合同签订与管理的效率;解决了双方磋商、会谈后还需花费时间签订正式合同文本的技术问题。

本发明提供的基础方案为:一种企业合同智能生成系统,包括:图像采集单元,用于获取手写的合同图像并发送合同图像;图像预处理单元,用于接收合同图像、对合同图像去噪,并发送处理后的图像;文字提取单元,用于接收处理后的图像、提取该图像的文字,并发送提取的文字;文字分类单元,用于接收提取的文字、根据文字的含义进行合同分类,并发送分类结果;文字匹配单元,用于根据分类结果匹配合同模板库,并发送匹配结果;文本生成单元,用于接收匹配结果、根据该结果调用合同模板生成合同文本;文本输出单元,用于输出合同文本。

本发明的工作原理在于:首先提取磋商、会谈的记录中的文字,然后根据文字的含义进行分类,接着将该文字与相应的合同模板匹配,最后生成预设格式的合同文本。本发明的优点在于:合同双方磋商、会谈后,可以立刻根据磋商、会谈的记录生成合同文本,省去了合同签订的流程;同时将手写的磋商、会谈纪录转换为特定形式的电子文本,便于规范管理、容易保存、携带方便。

本发明根据磋商、会谈的记录直接生成合同文本,可以简化合同简化程序,快速处理磋商、会谈纪录;双方当事人若有新的想法。也可直接在生成的电子合同文本上进行修改。

进一步,图像预处理单元采用高斯滤波算法。图像大多数噪声均属于高斯噪声,该算法是对整幅图像进行加权平均,每一个像素点的值都由其本身和邻域内的其他像素值经过加权平均后得到,适用于消除高斯噪声。

进一步,文字提取单元提取文字的lbp特征,具体步骤包括:s1:求取窗口每个像素的基本的局部二值模式;s2:旋转不变的实现:循环右移二进制串得到所有可能的取值,取最小值作为当前窗口的lbp值;s3:利用等价模式降低特征维度;s4:利用每个像素的lbp值得到整个窗口的直方图;s5:判断是否遍历完整个图像,否:接步长移动窗口,返回步骤s1;是,执行步骤s6;s6:连接全部窗口的直方图,就得到该窗口尺度下的lbp特征,按照窗口缩放因子缩放窗口;s7:判断是否超过最大窗口上限,是:输出结果;否:返回步骤s1使用新的窗口尺寸从头遍历图像。lbp(localbinarypattern,局部二值模式)是一种用来描述图像局部纹理特征的算子,具有旋转不变性和灰度不变性,在光照变化剧烈的条件下也有较好的识别效果。

进一步,文字分类单元具体步骤包括:s1:切词,将一个汉字序列切分成单独的词。成功的进行中文分词,可以达到提高电脑自动识别语句含义的效果。s2:去除没有实际含义的停用词。将这些词去掉,可以减少索引量,增加检索效率,提高检索效果。停用词主要包括英文字符、数字、数学字符、标点符号及使用频率特高的单汉字。s3:构建词袋空间。忽略、词序、语法、句法,将其视为是一个词集合,文本中每个词的出现都是独立的。这样对自然语言进行了简化,便于模型化。s4:tf-idf构建词权重。tf-idf是一种统计方法,用以评估字词对于一个文件集或一个语料库中的其中一份文件的重要程度,字词的重要性随着它在文件中出现的次数成正比增加。s5:归类。该算法十分容易理解,也很容易实现。

进一步,文字匹配单元采用kmp算法,具体步骤包括:s1:寻找模式串的每个子串前缀和后缀最长公共元素长度;s2:求next数组;s3:根据next数组进行匹配。kmp算法是一种改进的字符串匹配算法,相对于bf、rk、kmp、bm算法来说,可提高匹配速度、降低内存要求。

进一步,文本生成单元还包括水印模块,用于接收合同文本,并在该合同文本指定位置生成水印。通过水印,可以起到防伪作用,有效地降低合同丢失造成的法律风险。

进一步,文本生成单元还包括日期模块,用于接收合同文本,并在该合同文本指定位置、按照指定的格式生成合同的签署日期。根据生成的日期,便于管理合同的履行期限和履行状况。

进一步,文本生成单元还包括页码模块,用于接收合同文本,并在该合同文本指定位置、按照指定的格式生成合同的每页的页码。根据页码,便于合同的整理、阅读与装订。

进一步,文本生成单元还包括签名模块,用于接收合同文本,并在该合同文本指定位置、按照指定的格式生成合同当事人的电子签名和印章。这样就不用双方签字,提高了合同的签订效率。

附图说明

图1为本发明一种企业合同智能生成系统实施例的系统结构框图。

具体实施方式

下面通过具体实施方式进一步详细的说明:

实施例1

本发明一种企业合同智能生成系统实施例基本如附图1所示,包括图像采集单元、图像预处理单元、文字提取单元、文字分类单元、文字匹配单元、文本生成单元和文本输出单元。在本实施例中,除了图像采集单元采用扫描仪以外,其它的都搭载在一台dellt440塔式服务器上。本发明中合同包括磋商、会谈的文字记录等跟合同有关的一切文件。

在本实施例中,合同当事人双方已经完成磋商和会谈,并形成了如下形式的、手写的会谈纪录。大致内容如下:

“甲方:我方打算向贵公司购买100-200块1500mm×4000mm×20mm规格的花纹钢板。

乙方:我公司该规格的花纹钢板货源充足,贵单位要买100到200块,随时有货。

甲方:贵单位的花纹钢板的价格是多少钱一块呢?多买会不会有折扣呢?

乙方:一般来说这种规格的4000元一块,如果量大,可以打八折。

甲方:目前我公司打算购买150块,如果质量好,再购买50块。

乙方:没问题,我公司包送货,绝对保质保量,付款后7天使用卡车送达。

甲方:好的,我公司使用中国建设银行的支票进行付款,发生争议由重庆市第×中级人民法院处理,您看如何?

乙方:没问题。”

图像采集单元采用fujitsuix500扫描仪,该扫描仪具有wifi无线传输功能。当合同当事双方结束会谈后,使用该扫描仪将上述手写的会谈纪录扫描成图像,并将该图像发送给dellt440塔式服务器。图像预处理单元搭载有adobephotoshop软件(或者编制有滤波算法的程序代码,各种图像滤波算法的源代码可以在csdn技术社区查到),在接收到图像后,采取高斯滤波的算法对该图像进行去噪处理,并将经过处理后的图像发送到文字提取单元。

文字提取单元接收到经过预处理后的图像后,通过提取该图像中文字的lbp特征提取文字。具体步骤:步骤一,求取窗口每个像素的基本的局部二值模式。步骤二,旋转不变的实现,循环右移二进制串得到所有可能的取值,取最小值作为当前窗口的lbp值。步骤三,利用等价模式降低特征维度。步骤四,利用每个像素的lbp值得到整个窗口的直方图。步骤五,判断是否遍历完整个图像,否:接步长移动窗口,返回步骤s1;是,执行步骤六。步骤六,连接全部窗口的直方图,得到该窗口尺度下的lbp特征,按照窗口缩放因子缩放窗口。步骤七,判断是否超过最大窗口上限,是:输出结果;否:返回步骤一使用新的窗口尺寸从头遍历图像。以上步骤均可以通过编制相应的程序实现(比如在csdn技术社区就能查到提取图像文字中lbp特征的算法的matlab、c语言和c++语言的源代码)。文字提取单元提取完图像中文字的lbp特征后,将提取的文字发送到文字分类单元。

文字分类单元接收到提取的文字后,根据文字的含义进行分类。具体步骤包括:步骤一,切词,将一个汉字序列切分成单独的词。比如将“一般来说这种规格的4000元一块,如果量大,可以打八折”这句话切成“一般来说这种规格的4000元一块,如果量大,可以打八折”。步骤二,去除没有实际含义的停用词。比如“一般来说这种规格的如果量大”这三个词没有太大的实际的含义,可以去掉;得到“4000元一块,可以打八折”。步骤三,构建词袋空间。忽略、词序、语法、句法,将“4000元一块,可以打八折”者三个词视为是一个词集合,每个词的出现都是独立的。步骤四,tf-idf构建词权重。tf-idf是一种统计方法,用以评估字词对于一个文件集或一个语料库中的其中一份文件的重要程度,字词的重要性随着它在文件中出现的次数成正比增加。比如构建出“4000元一块打八折”这两个词的权重都很大。步骤五,归类。比如,根据“4000元一块打八折”这两个词将其分到买卖合同的类别。分类后将该合同属于买卖合同类别的分类结果发送到文字匹配单元。

文字匹配单元接收到该合同属于买卖合同的分类结果后,采用kmp算法(该算法在csdn技术社区就查到matlab、c语言和c++语言形式的源代码)根据分类结果匹配合同模板库。具体步骤包括:步骤一,寻找模式串的每个子串前缀和后缀最长公共元素长度;步骤二,求next数组;步骤三,根据next数组进行匹配。在合同模板库里储存着买卖合同、借贷合同、租赁合同等各种合同的模板,kmp算法按照上述步骤将会谈内容匹配到合同模板库买卖合同的类别。匹配完毕后,文字匹配单元将匹配结果(一种合同模板的位置信息)发送到文本生成单元。

文本生成单元接收到匹配结果,也就是买卖合同模板的位置信息后,调用该买卖合同模板,并根据关键词匹配算法将会谈内容填入该买卖合同文本。买卖合同模板包括当事人,标的,数量,质量,价款或者报酬,履行期限、地点和方式,违约责任和解决争议的方法等栏目,将会谈的内容填入对应的栏目即可生成合同文本。倘若有栏目没有对应的内容,则在该处生成“待确定”的字样。

合同文本生成后,文本生成单元将生成的合同文本发送到输出单元。文本输出单元接收到合同文本后,在该合同文本的正文部分生成水印,在该合同文本的页脚最右处生成××年××月××日格式的签署日期,在该合同文本的页脚正中间生成阿拉伯数字格式的页码;并在该合同文本内容结束的最后位置处生成供合同当事人签名和印章的空白位置,以便当事人阅读无异议后直接签字。

最终输出的买卖合同文本如下:

“花纹钢板买卖合同

当事人:甲方:a公司,乙方:b公司

标的:1500mm×4000mm×20mm规格的花纹钢板

数量:150块

质量:待确定

价款或者报酬:4000×150×0.8=48万元

履行期限、地点和方式:7天,卖方送货上门,卡车运输

违约责任和解决争议的方法:向重庆市第×中级人民法院起诉

····

甲方:a公司签字盖章处,××年××月××日

乙方:b公司签字盖章处,××年××月××日”

实施例2

与实施例1不同之处仅在于:在dellt440塔式服务器上还搭载有praat语音分析软件。

在双方当事人进行会谈时,用录音笔实时录音。会谈结束后,将该录音文件导入到服务器。录音文件被导入服务器后,praat软件对录音中的语音信号进行分析与标注。praat软件读取录音文件后,可以显示音高曲线(pitchcontour)、共振峰曲线(formantcontour)和音强曲线(intensitycontour)等,也可以通过对信号数据的计算获得各种文字情报。

本实施例中,主要获取双方当事人会谈过程中,音高较高的a关键词,说话时长较长的b关键词,以及出现次数较多的c关键词。比如,在会谈过程中,提到花纹钢板的数量150块时,当事人的音高较高,比如高于正常音高的10%,那么“数量”就属于a关键词。提到花纹钢板的价格4000元/块时,当事人的说话时长较长,比如延迟了0.1秒,那么“价格”就属于b关键词。多次提到花纹钢板的履行方式是采用卡车运输,比如提到卡车运输3次以上,那么“运输”就属于c关键词。

合同文本生成后,系统提示双方当事人就合同文本中a、b和c关键词对应的相关内容进行重点核对,并将相应的内容标红。当事人根据提示现场进行核对,对于有问题的部分在服务器上进行修改、删除或者增添,修改、删除或者增添均采用键盘打字输入内容。

在当事人对合同文本进行修改、删除或者增添时,系统采集键盘打字输入的动作,并将该动作产生的内容变化标记为特征。比如:当对“价格:4000元/块”和“数量:150块”两句话进行删除时,如果是一次把这两句都删除,那么就把这两句话看成一个整体,作为特征i。特征i对应着b和a关键词,当删除后进行修改时,若检测到输入的内容包含b关键词(价格)或者a关键词(数量)时,就弹出特征i(价格:4000元/块;数量:150块)。如果弹出的特征i当事人认为没有问题,则直接一键输入特征i;如果弹出的特征i当事人认为有问题,则在特征i的基础上进行修改。

又如:当对“价格:4000元/块”和“数量:150块”两句话进行删除时,如果是分两次删除,第一次删除“价格:4000元/块”,第二次删除“数量:150块”。那么,就把“价格:4000元/块”作为特征i,特征i对应着b关键词(价格);就把“数量:150块”作为特征ii,特征ii对应着a关键词(数量)。当删除后进行修改时,若检测到输入的内容包含b关键词(价格)时,就弹出特征i(价格:4000元/块)。如果弹出的特征i当事人认为没有问题,则直接一键输入特征i;如果弹出的特征i当事人认为有问题,则在特征i的基础上进行修改。同样地,若检测到输入的内容包含a关键词(数量)时,就弹出特征ii(数量:150块)。如果弹出的特征ii当事人认为没有问题,则直接一键输入特征ii;如果弹出的特征ii当事人认为有问题,则在特征ii的基础上进行修改。可见,上述方法可以让当事人现场快速对输出的合同文本进行修改、删除或者增添,从而缩短订约周期、提高合同的签订效率。

以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1