建设工程工料机数据自动编码方法及系统的制作方法

文档序号:9327013阅读:810来源:国知局
建设工程工料机数据自动编码方法及系统的制作方法
【技术领域】
[0001] 本发明属于建设行业数据分析领域,具体涉及一种利用自然语言技术对建设工程 人工材料机械设备(即工料机)数据进行自动识别,并根据识别结果进行自动编码的方法 及系统。
【背景技术】
[0002] 在建设工程的投资估算、设计概算、招标控制、施工预算、竣工结算和集中采购等 环节中,需要用到大量的建设工程工料机数据,这些数据品种繁多、称呼多样、规范不统一, 导致数据难以识别、归类,从而无法自动对数据进行比较、分析。当前这些数据的应用及管 理主要基于人的经验来判断,工作效率低,形成结果慢,企业成本高,并且影响建设工程项 目的投资分析以及全过程造价管理。

【发明内容】

[0003] 本发明针对现有技术中工料机数据难以识别、分析,工作效率低以及企业成本高 等问题,提出一种建设工程工料机数据自动编码方法。
[0004] 本发明提出的建设工程工料机数据自动编码方法,主要包括以下步骤:
[0005] AU将自然语言描述的工料机数据按行业标准进行规范化,将不规范字符替换为 规范字符;
[0006] A2、从规范化后的工料机数据中获取名称关键词,并将所述名称关键词在标准名 称库中进行匹配分析,确定所述工料机数据的标准名称;
[0007] A3、根据所述工料机数据的标准名称以及工料机数据中的单位信息仲裁工料机数 据所属的类别;
[0008] A4、根据所属的类别从所述工料机数据中获取工料机数据的特征值;
[0009] A5、基于所述工料机数据的标准名称、所属的类别以及所述特征值进行编码。
[0010] 在本发明的进一步优选方案中,所述步骤A2具体包括:
[0011] A21、对规范化后的工料机数据的名称信息和规格信息进行分词处理,以获取名称 关键词;
[0012] A22、若只获取到一个名称关键词,则将该名称关键词与所述标准名称库进行匹配 分析;若获取到多个名称关键词,则将各个名称关键词分别组合后与所述标准名称库进行 匹配分析;
[0013] A23、根据最高匹配度确定所述工料机数据的标准名称。
[0014] 在本发明的进一步优选方案中,所述步骤A3中仲裁工料机数据所属的类别是指 仲裁工料机数据在国标分类中所属分类号,具体可指仲裁工料机数据在《GB/T 50851-2013 建设工程人工材料设备机械数据标准》中所属的分类号;若仲裁得到的分类号不唯一,则结 合工料机数据中的规格信息做二次仲裁,以得到唯一的分类号。
[0015] 在本发明的进一步优选方案中,所述步骤A4具体包括:根据所述工料机数据在国 标分类中所属的分类号的特征项描述进行特征规则分析,并获取各项特征的数据值。
[0016] 在本发明的进一步优选方案中,所述步骤A5具体包括:
[0017] A51、以所述工料机数据在国标分类中所属的分类号为类别编码段,并基于所述工 料机数据的标准名称、所述特征值分别分配预设位数的标准名称编码段和特征值编码段;
[0018] A52、将所述类别编码段、标准名称编码段和特征值编码段依序组合,形成所述工 料机数据的编码。
[0019] 相应的,本发明还提出了一种建设工程工料机数据自动编码系统,主要包括规范 化模块、匹配分析模块、仲裁模块、特征值获取模块以及编码模块;
[0020] 所述规范化模块,用于将自然语言描述的工料机数据按行业标准进行规范化,将 不规范字符替换为规范字符;
[0021] 所述匹配分析模块,用于将从规范化后的工料机数据中获取名称关键词,并将名 称关键词在标准名称库中进行匹配分析,确定所述工料机数据的标准名称;
[0022] 所述仲裁模块,用于根据所述工料机数据的标准名称以及工料机数据中的单位信 息仲裁工料机数据所属的类别;
[0023] 所述特征值获取模块,用于根据所属的类别从所述工料机数据中获取工料机数据 的特征值;
[0024] 所述编码模块,用于基于所述工料机数据的标准名称、所属的类别以及所述特征 值进行编码。
[0025] 在本发明的进一步优选方案中,还包括工料机字符对照库,用于存储规范化的工 料机字符;所述规范化模块将工料机字符对照库中相应的工料机字符替换所述工料机数据 中的不规范字符。
[0026] 在本发明的进一步优选方案中,还包括工料机名词库,用于存储工料机关键词;所 述匹配分析模块通过所述工料机名词库对所述工料机数据的名称信息和规格信息进行分 词处理,以获取工料机数据中的名称关键词。
[0027] 在本发明的进一步优选方案中,还包括工料机特征规则库,所述工料机特征规则 库具有工料机在国标分类对应分类号中的特征项描述;所述特征值获取模块根据所述工料 机特征规则库对所工料机数据进行特征规则分析,以获取各项特征的数据值。
[0028] 在本发明的进一步优选方案中,还包括工料机标准名称编码库和工料机特征值编 码库;所述工料机标准名称编码库存储有工料机标准名称编码段,所述工料机特征值编码 库存储有工料机特征值编码段;所述编码模块以所述工料机数据在国标分类中所属的分类 号为类别编码段,并将所述工料机数据的标准名称在所述工料机标准名称编码库中进行匹 配以获取标准名称编码段,将所述特征值在所述工料机特征值编码库中进行匹配以获取特 征值编码段,将所述类别编码段、标准名称编码段、特征值编码段依序组合成所述工料机数 据的编码。
[0029] 本发明至少具备以下有益效果:
[0030] 1、通过编码的方式赋予各工料机数据唯一的编码,以便对工料机数据进行识别、 转换、分析、归类等应用及管理。
[0031] 2、各工料机数据具有与其对应的唯一的编码,可用于智能执行所述识别、转换、分 析、归类等应用及管理,而不需要人工操作,有助于提高工作效率,快速形成结果,并降低企 业成本,更快推进建设工程项目的投资分析以及全过程造价管理。
[0032] 3、在编码过程中能够智能识别工料机数据的名称、单位信息、规格信息等,形成标 准名称(聚集)且完成工料机数据特征化,并可进行关键特征标记,形成定长编码,以便于 工料机数据的进一步应用及管理。
【附图说明】
[0033] 图1是实施例一提出的一种建设工程工料机数据自动编码方法流程示意图。
[0034] 图2是实施例二提出的一种建设工程工料机数据自动编码系统结构示意图。
【具体实施方式】
[0035] 为了便于本领域技术人员理解,下面将结合附图以及实施例对本发明进行进一步 描述。
[0036] 实施例一
[0037] 以一条用自然语言描述的不规范的工料机数据为例,假设其包括名称、规格、单位 等信息,具体如下:
[0038] 名称:电力电缆
[0039] 规格:0。6/1KV I. 5mm2W-芯
[0040] 单位:KM
[0041] 请参阅图1,实施例一提出的建设工程工料机数据自动编码方法,对上述不规范的 工料机数据进行自动编码,主要过程包括以下步骤SlOO至S500 :
[0042] S100、将自然语言描述的工料机数据按行业标准进行规范化,将不规范字符替换 为规范字符。
[0043] 在步骤SlOO中的规范化主要是将不规范字符替换成规范(标准)字符,例如工数 机数据中的规格信息"0。6"包含有非规范字符,可以替换成"0. 6",单位信息"KM"可替换 成"km" ;当然,这里只是举例,若出现" φ"、"#"等,还可替换成规范的"Φ"
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1