一种工程概算表的定额标准化方法与流程

文档序号:18832299发布日期:2019-10-09 03:50阅读:272来源:国知局
一种工程概算表的定额标准化方法与流程

本发明涉及工程造价文件管理的方法,具体为一种工程概算表的定额标准化方法。



背景技术:

随着我国经济实力不断增强,城市化发展的步伐也在逐渐加快。目前城市工程建设过程中存在的主要问题是前期工作缺乏深度,项目决策与建设管理程序不规范,投资控制难度大,出现部分建设工程返工重建,既浪费了国家资金,又不能保证建设质量。所以,工程概算对工程造价进行审计和审核具有非常重大的意义。

工程概算对工程投资与造价有着重大意义,但是由于建设项目较为复杂,施工单位繁多,各个施工单位的资质良莠不齐,所填写的定额、定额编码、工程项目或费用名称等等都不一定按照国家或省级标准完整地填写,造成历史的工程概算数据比较杂乱,而且国家和地方针对各个行业以及各个相近似的行业也曾发布过不同版本的标准定义;目前的标准对定额标准的描述是空洞的,没有将标准的共性提取出来,且版本也会不断更换,造成各个时期制作的工程概算表对定额的描述也不一致,目前尚未将定额标准的性质归类,写成一套程序,将杂乱的统计表通过系统导入提取共性,形成标准化文件。



技术实现要素:

为了克服现有技术提及的缺点,本发明提供一种工程概算表的定额标准化方法,主要针对处理历史工程概算表,通过系统导入提取共性,形成标准化文件,方便解读和管理。

本发明为解决上述问题采取的方案是:一种工程概算表的定额标准化方法,其方法包括如下步骤:

s1.人工解析国家相应定额标准中的定额编码、定额名称以及建筑工程项目数据规则,将国家定额标准中的每一个定额名称进行词义分析并且拆分,根据每一个定额名称的不同特征拆分成为若干个特征词,然后对该定额名称中的特征词进一步地概括/提炼/定义成为特征项;通过计算机技术建立特征规则库,并将特征词和特征项数据录入特征规则库中,在所述特征规则库中,制定若干以所述特征词和特征项为关键词的逻辑函数,形成数据清洗用的若干条规则;其中所述特征规则库中定义了每一个定额名称对应含有的特征项的数量以及特征项的顺序,并且根据每一特征词在对应的特征项里的相关性,以数据清洗的规则的形式自定义每一特征词在对应的特征项里的权重值大小。

s2.通过计算机技术录入及管理历史工程项目数据,并将数据中的原定额名称、原定额编码、原计价依据进行数据清洗工作,把数据中的原定额名称、原定额编码、原计价依据分别清洗转换成较规范的定额名称、标准定额编码、标准版本号;所述数据清洗工作分以下步骤:

s2.1.对数据中的原定额名称、原定额编码、原计价依据进行一次清洗工作,包括对数据的字符转义及空格处理:字符转义,即对工程项目数据中,存在同一个字符,多种表达方式的情况,进行统一转义成同一种表达式,例如中文字符统一转义成英文字符,英文小写转义成大写;空格处理,去除工程项目数据中首尾空格,对数据中间存在多个空格的合并成一个空格,制表符、空格、换行符统一转义成一个空格等;

s2.2.对数据中的原计价依据进行二次清洗工作,根据原计价依据中的关键字进行拆分,匹配获取该关键字在预设的版本号字典数据库中对应国家标准的“标准定额版本号”,按照该“标准定额版本号”对应的国家/地方相关的标准定额编码规定原计价依据中的关键字中的编号及数字,形成“标准版本号”;

s2.3.与s2.2.同时进行对数据中的原定额编码进行二次清洗工作,首先去掉原定额编码字符数据开头的中文干扰词,然后按照国家/地方相关的标准定额编码规定,运用正值表达式提取数据中的编号及数字,遇字符、字母、中文截止,形成“标准定额编码”;

s2.4与s2.2.同时进行对数据中的原定额名称进行二次清洗工作,其清洗方法如下:通过“名词替换库”对定额名称内的字符数据中相同或相近似的关键字进行统一替换,形成“较规范的定额名称”。所述“名词替换库”中自定义了相关的相同或相近似的关键字;此处二次清洗的作用是对原始数据部分关键字进行替换,变成统一写法,方便标准化以及后续进行特征提取。

s2.5.在s2.2与s2.3步骤中二次清洗工作得出的标准版本号与标准定额编码通过字符识别,在预设的版本号字典数据库中识别出标准版本号与标准定额编码是否一一对应,若能对应则进行下一步标准化操作。

s3.将清洗后的得出的较规范的定额名称及标准定额编码根据特征规则库里面对应规则进行标准化处理,所述标准化处理的步骤如下:

s3.1.根据标准定额编码在特征规则库里面获取对应的特征项,然后依据特征项的顺序,依次在较规范的定额名称里搜寻匹配该特征项对应的特征词;

s4.2.搜寻的特征词数量假若为0,则判定标准化失败,报错处理;

s4.3.搜寻的特征词数量假若为1,则直接将该“特征词”和“特征项”作为输出标准化特征结果;

s4.4.搜寻的特征词数量假若为2个或以上,则采用决策树算法,依次进行规则权重大小判断,关键字长度判断和关键字位置判断,最后输出“特征词”和“特征项”作为输出标准化特征结果。

本发明的有益效果是:本发明提供的工程概算表的定额标准化方法,其能够将不同工作人员不同的语言描述的形成的历史工程项目定额数据进行智能识别、统一标准编码及自动归集,经过处理后的定额数据将具有标准定额编码,对应的标准特征信息,可实现智能识别、转换、清洗、分析、归类、统计等功能的自动化,无需人工操作,有助于提高工作效率,降低企业成本,更快推进建设工程项目的投资分析以及全过程造价管理。

附图说明

图1为本发明的原理流程框图;

图2为本发明的实施例的历史工程项目数据列举图表;

图3为本发明的实施例的针对图2标准化后输出标准化特征结果图表。

具体实施方式

下面结合附图对本发明进行进一步的说明。

如图1所示,一种工程概算表的定额标准化方法,其方法包括如下步骤:

s1.人工解析国家相应定额标准中的定额编码、定额名称以及建筑工程项目数据规则,将国家定额标准中的每一个定额名称进行词义分析并且拆分,根据每一个定额名称的不同特征拆分成为若干个特征词,然后对该定额名称中的特征词进一步地概括/提炼/定义成为特征项;

例如:定额编码“1-8”对应的定额名称是“挖土机挖土或松碎石方明挖法不带支撑一、二类土”,将其拆分提炼成若干个特征词:“挖土机挖土或松碎石方”、“明挖法”、“不带支撑”、“一、二类土”。然后自定义各个规则为:施工方法:明挖法;开挖方式:挖土机挖;土壤类别:一、二类土;支撑结构施工:不带支撑下。所述的“施工方法”、“开挖方式”、“土壤类别”和“支撑结构施工”为分别对各个“特征词”的简短的描述词/概括/提炼;将其定义为所述“特征项”;

通过计算机技术建立特征规则库,并将特征词和特征项数据录入特征规则库中,在所述特征规则库中,制定若干以所述特征词和特征项为关键词的逻辑函数,形成数据清洗用的若干条规则;其中,每一条规则中根据特征词和特征项的顺序排列及关联性,赋予某一定额名称中的特征词在该特征项里的权重;所述特征规则库中定义了每一个定额名称对应含有的特征项的数量以及特征项的顺序,并且根据每一特征词在对应的特征项里的相关性,以数据清洗的规则的形式自定义每一特征词在对应的特征项里的权重值大小。

s2.通过计算机技术录入及管理历史工程项目数据(如图2所示),并将数据中的原定额名称、原定额编码、原计价依据进行数据清洗工作,把数据中的原定额名称、原定额编码、原计价依据分别清洗转换成较规范的定额名称、标准定额编码、标准版本号;所述数据清洗工作分以下步骤:

s2.1.对数据中的原定额名称、原定额编码、原计价依据进行一次清洗工作,包括对数据的字符转义及空格处理:字符转义,即对工程项目数据中,存在同一个字符,多种表达方式的情况,进行统一转义成同一种表达式,例如中文字符统一转义成英文字符,英文小写转义成大写;空格处理,去除工程项目数据中首尾空格,对数据中间存在多个空格的合并成一个空格,制表符、空格、换行符统一转义成一个空格等;

s2.2.对数据中的原计价依据进行二次清洗工作,根据原计价依据中的关键字进行拆分,匹配获取该关键字在预设的版本号字典数据库中对应国家标准的“标准定额版本号”,按照该“标准定额版本号”对应的国家/地方相关的标准定额编码规定原计价依据中的关键字中的编号及数字,形成“标准版本号”;

s2.3.与s2.2.同时进行对数据中的原定额编码进行二次清洗工作,首先去掉原定额编码字符数据开头的中文干扰词,然后按照国家/地方相关的标准定额编码规定,运用正值表达式提取数据中的编号及数字,遇字符、字母、中文截止,形成“标准定额编码”;

例如:预设版本号字典库存储字段:标准版本号是广东省建筑与装饰工程综合定额(2010);标准定额编码格式是:a字母开头;标准定额编码连接符:1个‘-’;

历史工程项目数据:原始定额编码:a4-215-8换;原始定额名称:植筋胶植筋ф20;计价依据:广东省建筑与装饰工程综合定额(2010);

则s2.3根据标准定额版本号“广东省建筑与装饰工程综合定额(2010)”,判断预设版本号字典库里面标准版本号对应标准定额编码格式为a字母开头,标准定额编码连接符:1个‘-’,确定采用清洗规则为,开头去干扰值,开头出现中文及字符,先去除,再运用正值表达式提取a字母后面及第一个‘-’后面数字,提取结果为“a4-215”。如上所述工程项目数据的原始定额编码“a4-215-8换”并非标准的定额编码,标准定额编码应为“a4-215”,因此需要将该编码进行清洗处理,提取为正确的定额编码“a4-215”。当然,这只是举例说明,而当出现“a4-215换”、“补a4-215”,“a4-215+a4-49*2”数据时,清洗结果同样也会提取为“a4-215”。

s2.4.与s2.2.同时进行对数据中的原定额名称进行二次清洗工作,其清洗方法如下:通过“名词替换库”对定额名称内的字符数据中相同或相近似的关键字进行统一替换,形成“较规范的定额名称”。所述“名词替换库”中自定义了相关的相同或相近似的关键字;此处二次清洗的作用是对原始数据部分关键字进行替换,变成统一写法,方便标准化以及后续进行特征提取;

例如:原始项目工程数据中有不同表示高度的写法,如“高≤”、“高(mm)”、“高度”、“h:”、“苗高”、“株高”等,将其统一成“高度”(此为“名词替换库”中已自定义相关的相同或相近似的关键字),统一成较为规范的定额名称:“高度”后,再进行后续标准化特征提取时更加方便。

s2.5.在s2.2与s2.3步骤中二次清洗工作得出的标准版本号与标准定额编码通过字符识别,在预设的版本号字典数据库中识别出标准版本号与标准定额编码是否一一对应,若能对应则进行下一步标准化操作。

s3.将清洗后的得出的较规范的定额名称及标准定额编码根据特征规则库里面对应规则进行标准化处理,所述标准化处理的步骤如下:

s3.1.根据标准定额编码在特征规则库里面获取对应的特征项,然后依据特征项的顺序,依次在较规范的定额名称里搜寻匹配该特征项对应的特征词;

s4.2.搜寻的特征词数量假若为0,则判定标准化失败,报错处理;

s4.3.搜寻的特征词数量假若为1,则直接将该“特征词”和“特征项”作为输出标准化特征结果;

s4.4.搜寻的特征词数量假若为2个或以上,则采用决策树算法,依次进行规则权重大小判断,关键字长度判断和关键字位置判断,最后输出“特征词”和“特征项”作为输出标准化特征结果(如图3所示),具体为:

s4.4.1依据2个或以上的特征词分别在特征规则库里的权重大小,权重值大的特征词判定匹配该特征项,作为输出标准化特征结果;

s4.4.2权重值相等则进行关键字长度判断,关键字字节长的“特征词”判定匹配该“特征项”,作为输出标准化特征结果;

s4.4.3关键字字节长度相等则进行关键字位置判断,原数据中关键字的优先出现度,取左边优先的“特征词”判定匹配该“特征项”,作为输出标准化特征结果。

例如:标准定额编码:a22-36;

较规范的定额名称:

1.建筑工程靠脚手架安全挡板(钢管)高度(51.5m以内)垂直

2.独立安全防护挡板(不锈钢管)水平;

计价依据:广东省建筑与装饰工程综合定额(2010);

标准化处理过程:

将s2.3步骤获取的标准定额编码:a22-36在“特征规则库”进行匹配分析,获取a22-36对应“特征项”为:01种类、02搭设高度、03搭设方式、04脚手架种类、05脚手架材质。从而对每个定额特征进行标准化处理:

①、判断规则权重大小,权重值大则应用规则,输出标准化特征结果。

以‘脚手架材质’这一特征项定额特征标准化流程为例,

根据标准定额编码a22-36,调取“特征规则库”里面对应规则,特征项‘脚手架材质’对应的提取规则有

规则1:搜寻的关键字‘钢管’,等级3,“特征词”标准值:钢管。

规则2:搜寻的关键字‘不锈钢管’,等级1,“特征词”标准值:不锈钢管。

出现2个特征规则结果,需判断权重值大小,即特征对应自定义等级数字大小,确定选择哪个规则,等级3比1大,选择规则1,输出标准化结果,a22-36,脚手架材质:钢管(标准值)。

设置标准值的作用在于数据中当出现“刚管”、“纲管”,等关键字时,同样也会输出标准定额特征值为“钢管”。

②、权重值相等则判断关键字长度,关键字字节长则应用规则:

根据标准定额编码a22-36,调取“特征规则库”里面对应规则,特征项‘脚手架材质’对应的提取规则有:

规则1:搜寻的关键字‘钢管’,等级3,“特征词”标准值:钢管。

规则2:搜寻的关键字‘不锈钢管’,等级3,“特征词”标准值:不锈钢管。

出现2个特征规则结果,判断权重大小相等,则需判断关键字长度,确定选择哪个规则,关键字‘不锈钢管’比关键字‘钢管’字节长,故选择规则2,输出标准化结果,a22-36,脚手架材质:不锈钢管

③、关键字字节长度相等则判断原数据中关键字位置的优先出现,取左边优先的应用规则,输出标准化特征结果。

根据标准定额编码a22-36,调取“特征规则库”里面对应规则,特征项‘搭设方式’对应的提取规则有

规则1:关键字‘垂直’,等级3,标准值:垂直

规则2:关键字‘水平’,等级3,标准值:垂直

出现2个特征规则结果,判断权重大小相等,关键字字节长度相等后,则需判断关键字位置,确定选择哪个规则,关键字‘垂直’比关键字‘水平’取左边优先规则,选择规则1,输出标准化结果,a22-36,搭设方式:垂直。

以上所述者,仅为本发明的较佳实施例而已,当不能以此限定本发明实施的范围,即大凡依本发明申请专利范围及发明说明内容所作的简单等效变化与修饰,皆仍属本发明专利涵盖的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1