一种查价方法以及查价装置与流程

文档序号:17015614发布日期:2019-03-02 02:26阅读:217来源:国知局
一种查价方法以及查价装置与流程

本申请涉及计算机应用技术领域,具体而言,涉及一种查价方法以及查价装置。



背景技术:

在很多领域,例如在建筑家装、招投标等领域,市场上的材料具有种类多样化、品牌多样化、价格差异性等多种特征,这导致大部分用户对材料的分类以及价格都没有总体的认知,使得用户对供应商报价的合理性不能有一个合理快速的评判,无法及时分析出供应商报价是否存在误填误报的情况。用户往往需要将多家供应商提供的相似功能或者相似品种的材料进行多次比对,甚至需要通过各种手段,例如网络、实地考察等,搜集同类产品的报价,才能够对供应商报价进行合理的评判。



技术实现要素:

有鉴于此,本申请实施例的目的在于提供一种查价方法以及查价装置,能够对供应商报价是否合理作出较为快速准确的评判。

第一方面,本申请实施例提供了一种查价方法,包括:

获取目标材料的描述信息;所述描述信息包括:材料名称、材料型号、材料工艺、材料材质以及材料性质描述信息中一项或者多项;

从所述目标材料的描述信息中,获取所述目标材料的关键词;

根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料;

根据所述目标材料的报价,以及所述相似材料的指导报价,确定所述目标材料报价的合理性。

结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述从所述目标材料的描述信息中,获取所述目标材料的关键词,包括:

将所述目标材料的描述信息进行分词处理,生成构成所述描述信息的词汇集;

对所述词汇集中的词汇进行筛选,获取多个所述关键词。

结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料,具体包括:

根据所述目标材料的关键词,基于词频-反文档频率tf-idf算法生成目标词频向量;

根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料。

结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料,包括:

计算所述目标词频向量与各个所述材料数据库中各个材料的词频向量之间的相似度;

将相似度大于预设的相似度阈值的所述材料确定为所述目标材料。

结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中包括:采用下述方式构建所述材料数据库:

从预设平台获取多种样本材料的历史报价信息;

针对每种所述样本材料,从所述历史材料报价信息中,获取该样本材料的关键词;

并基于词频-反文档频率tf-idf算法以及所述样本材料的关键词,生成该种样本材料的词频向量;

基于各种所述样本材料的词频向量以及对应的历史报价,构建所述材料数据库。

第二方面,本申请实施例还提供一种查价装置,包括:

信息获取模块,用于获取目标材料的描述信息;所述描述信息包括:材料名称、材料型号、材料工艺、材料材质以及材料性质描述信息中一项或者多项;

关键词获取模块,用于从所述目标材料的描述信息中,获取所述目标材料的关键词;

材料确定模块,用于根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料;

合理性确定模块,用于根据所述目标材料的报价,以及所述相似材料的指导报价,确定所述目标材料报价的合理性。

结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述关键词获取模块根据下述步骤从所述目标材料的描述信息中,获取所述目标材料的关键词:

将所述目标材料的描述信息进行分词处理,生成构成所述描述信息的词汇集;

对所述词汇集中的词汇进行筛选,获取多个所述关键词。

结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述材料确定模块具体用于根据下述步骤根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料:

根据所述目标材料的关键词,基于词频-反文档频率tf-idf算法生成目标词频向量;

根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料。

结合第二方面的第二种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,材料确定模块具体用于基于下述步骤根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料:

计算所述目标词频向量与各个所述材料数据库中各个材料的词频向量之间的相似度;

将相似度大于预设的相似度阈值的所述材料确定为所述目标材料。

结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述装置还包括构建模块;

所述构建模块具体用于根据下述步骤构建材料数据库:

从预设平台获取多种样本材料的历史报价信息;

针对每种所述样本材料,从所述历史材料报价信息中,获取该样本材料的关键词;

并基于词频-反文档频率tf-idf算法以及所述样本材料的关键词,生成该种样本材料的词频向量;

基于各种所述样本材料的词频向量以及对应的历史报价,构建所述材料数据库。

第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

本申请实施例提供的查价的方法以及查价装置,采用通过目标材料的描述信息获取目标材料的关键词,根据目标材料的关键词能够从材料数据库中确定与目标材料相似的相似材料以及相似材料的指导报价,其中,材料数据库并结合目标材料的报价以及相似材料的指导报价,进而确定目标材料报价的合理性,与现有技术相比,其能够对供应商报价是否合理作出较为快速准确的评判。

进一步地,采用词频-反文档频率(termfrequency–inversedocumentfrequency,tf-idf)算法构建材料数据库,有利于对材料的分类,并方便相关部门对材料价格的管理。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种查价方法的流程图;

图2示出了本申请实施例所提供的查价方法中,从目标材料的描述信息中获取关键词的具体方法的流程图;

图3示出了本申请实施例所提供的查价方法中,构建所述材料数据库的具体方法的流程图;

图4示出了本申请实施例所提供的一种查价装置的结构示意图;

图5示出了本申请实施例所提供的一种电子设备的结构示意图。

图示说明:

401-信息获取模块,402-关键词获取模块,403-材料确定模块,404-合理性确定模块,405-构建模块,31-处理器,32-存储器,33-总线。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,在很多领域,例如在建筑家装、招投标等领域,通常采用专家或者评委在评标过程中对供应商提供的材料对应的报价进行合理性评判,但是,市场上的材料具有种类多样化、品牌多样化、价格差异性等多种特征,导致平台对材料的价格并没有统一的标准,进而导致供应商不能够及时判断其提供的材料报价是否误填、误报等情况,而现有技术中,用户往往需要将多家供应商提供的相似功能或者相似品种的材料进行多次比对,甚至需要通过各种手段,例如网络、实地考察等,搜集同类产品的报价,才能够对供应商的材料报价进行合理的评判,因此,专家或者评委在评标过程中也不能快速合理对供应商提供的材料报价进行判断,基于此,本申请提供的一种查价方法以及查价装置,可以对供应商报价是否合理作出较为快速准确的评判。

为便于对本实施例进行理解,首先对本申请实施例所公开的一种查价方法进行详细介绍,

参见图1所示,本申请实施例提供的一种查价方法,包括:

s101:获取目标材料的描述信息;所述描述信息包括:材料名称、材料型号、材料工艺、材料材质以及材料性质描述信息中一项或者多项。

在具体实现的时候,目标材料是指供应商提供的材料,每一种材料都对应有各自的描述信息,例如:材料名称、材料型号、材料工艺、材料材质以及材料性质等,目标材料的描述信息可以是通过供应商提供的投标书中来获取,在获取目标材料的描述信息时,至少包括材料名称、材料型号、材料工艺、材料材质以及材料性质描述信息中的一项。例如:供应商提供的目标材料为齿轮,则目标材料的描述信息可以为:碳素结构钢,其为含碳量小于2%的铁碳合金,碳钢除含碳外一般还含有少量的硅、锰、硫、磷,焊接性能好,塑性,韧性好,有一定强度。其中,碳素结构钢被目标材料的材料名称,含碳量小于2%的铁碳合金,碳钢除含碳外一般还含有少量的硅、锰、硫、磷为目标材料的材料材质,焊接性能好,塑性、韧性好,有一定强度,可进行焊接,塑性,韧性好,有一定强度为目标材料的材料性质。

s102:从所述目标材料的描述信息中,获取所述目标材料的关键词。

在具体实现的时候,关键词是指能够体现目标材料描述信息的词汇,使用关键词能够在预先构建的材料数据库索引与关键词匹配的材料。根据目标材料的描述信息,能够提取目标材料的关键词。

具体地,参见图2所示,本申请实施例提供一种从目标材料的描述信息中获取关键词的具体方法,包括:

s201:将所述目标材料的描述信息进行分词处理,生成构成所述描述信息的词汇集。

s202:对所述词汇集中的词汇进行筛选,获取多个所述关键词。

词汇集是指能够将描述信息完整体现的词汇的集合,获取关键词时,需要对描述信息进行分词处理,分词处理是从描述信息中提炼出能够完整体现描述信息的词汇,形成词汇集。形成词汇集后,需要对词汇集进行筛选,进而获得多个关键词,多个关键词能够完整体现目标材料的描述信息。

例如,目标材料的描述信息为:碳素结构钢,其为含碳量小于2%的铁碳合金,碳钢除含碳外一般还含有少量的硅、锰、硫、磷,焊接性能好,塑性,韧性好,有一定强度,则目标材料的关键词可以是:钢材、含碳量小于2%、强度好,塑性好,可焊接等。

每一个关键词都有不同的出现次数,关键词出现的次数是与关键词一一对应的。

s103:根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料。

在具体实现的时候,在预先构建的材料数据库包含所有材料的历史报价,每一种材料对应有各自的关键词。根据目标材料的关键词,以及材料数据库中材料的关键词,从预先构建的材料数据库中确定与目标材料相似的至少一种相似材料。

具体地,本申请实施例提供一种根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料的具体方法,包括:

根据所述目标材料的关键词,基于词频-反文档频率tf-idf算法生成目标词频向量。

根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料。

在具体实现的时候,目标词频向量是指根据关键词出现的频率,也即关键词的权重生成的向量,目标词频向量中的各个元素表示每一个关键词出现的词频-逆文本频率。使用词频-反文档频率(termfrequency–inversedocumentfrequency,tf-idf)算法,计算每一个关键词出现的词频-逆文本频率,生成目标词频向量。

其中,每一个关键词出现的频率,也即词频可以通过下述公式来计算:

其中,tfw表示关键词出现的频率,fi表示关键词i出现的次数,m表示关键词的数目。

每一个关键词的逆向文件频率通过下述方式来计算:

其中,idfi表示关键词i的逆向文件频率,m表示材料数据库中所有材料的数目;n表示包含关键词i的文件的数目。

在这里,逆向文件频率是指关键词i在材料数据库中包含的所有报价信息中出现的频率,且关键词i出现的次数越多,则idfi的值越低,因此,称为逆向文件频率。

每一个关键词的词频-逆文本频率tfw-idfi可以通过下述公式来计算:

tfw-idfi=tfw×idfi;

其中,tfw表示关键词出现的频率,idfi表示关键词i的逆向文件频率。

根据每一种材料对应的关键词得到的关键词的词频-逆文本频率,生成该材料的词频向量。

调用材料数据库中各个材料的词频向量,计算目标词频向量与各个材料的词频向量之间的相似度,得到目标材料与材料数据库中各个材料的相似度,将相似度与预设的相似度阈值进行对比,如果相似度大于预设的相似度阈值,则将于该相似度对应的材料作为目标的相似材料。

此处,目标词频向量与各个材料的词频向量之间的相似度,包括:欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、夹角余弦、汉明距离、杰卡德距离或杰卡德相似系数、相关系数或相关距离以及信息熵中任意一种。

s104:根据所述目标材料的报价,以及所述相似材料的指导报价,确定所述目标材料报价的合理性。

在具体实现的时候,相似材料的指导报价是根据材料数据库中,不同平台对材料的历史报价,并结合材料材质,材料工艺,材料性质等信息给出的报价,并与各个材料对应保存在材料数据库中,指导报价可以是一个区间,也可以是一个数值,如果指导报价是一个区间,能够确定目标材料的报价是否在指导报价这个区间内,进而判断目标材料的报价是否合理,即如果目标材料的报价在指导报价的区间内,则目标材料的报价是合理的,如果目标材料的报价不在指导材料报价的区间内,则目标材料的报价是不合理的。如果指导报价是一个数值,可以根据指导报价与目标材料报价的大小关系,进而判断目标材料的报价是否合理。

具体地,参见图3所示,本申请实施例还提供一种构建所述材料数据库的具体方法,包括:

s301:从预设平台获取多种样本材料的历史报价信息;

s302:针对每种所述样本材料,从所述历史材料报价信息中,获取该样本材料的关键词;

s303:并基于词频-反文档频率tf-idf算法以及所述样本材料的关键词,生成该种样本材料的词频向量;

s304:基于各种所述样本材料的词频向量以及对应的历史报价,构建所述材料数据库。

在具体实现的时候,各个预设平台都有对不同材料的历史报价信息,将各个预设平台的材料作为样本材料,并从各个预设平台获取样本材料的历史报价信息,其中,历史报价信息不仅包括历史报价,还包括每个样本材料的描述信息,根据样本材料的历史报价信息不仅能够得到样本材料的历史报价,还能够获取各个样本材料的关键词,根据所述关键词,并基于tf-idf算法,生成该样本的词频向量,具体运算方法与生成目标材料的运算方法一致,这里不再赘述。根据每一个样本材料的词频向量以及对应的历史报价,构建材料数据库。

本申请实施例提供的查价的方法,采用通过目标材料的描述信息获取目标材料的关键词,根据目标材料的关键词能够从材料数据库中确定与目标材料相似的相似材料以及相似材料的指导报价,其中,材料数据库并结合目标材料的报价以及相似材料的指导报价,进而确定目标材料报价的合理性,其能够对供应商报价是否合理作出较为快速准确的评判。

基于同一发明构思,本申请实施例中还提供了与查价方法对应的查价装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述查价方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

本申请又一实施例还提供一种查价装置,参见图4所示,本申请实施例所提供的查价装置包括:

信息获取模块401,用于获取目标材料的描述信息;所述描述信息包括:材料名称、材料型号、材料工艺、材料材质以及材料性质描述信息中一项或者多项;

关键词获取模块402,用于从所述目标材料的描述信息中,获取所述目标材料的关键词;

材料确定模块403,用于根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料;

合理性确定模块404,用于根据所述目标材料的报价,以及所述相似材料的指导报价,确定所述目标材料报价的合理性。

可选地,所述关键词获取模块402根据下述步骤从所述目标材料的描述信息中,获取所述目标材料的关键词:

将所述目标材料的描述信息进行分词处理,生成构成所述描述信息的词汇集;

对所述词汇集中的词汇进行筛选,获取多个所述关键词。

可选地,所述材料确定模块403具体用于根据下述步骤根据所述关键词,从预先构建的材料数据库中确定与所述目标材料相似的至少一种相似材料:

根据所述目标材料的关键词,基于词频-反文档频率tf-idf算法生成目标词频向量;

根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料。

可选地,材料确定模块403具体用于基于下述步骤根据所述目标词频向量,以及所述材料数据库中各个材料的词频向量之间的相似度,从所述材料数据库中确定至少一种所述相似材料:

计算所述目标词频向量与各个所述材料数据库中各个材料的词频向量之间的相似度;

将相似度大于预设的相似度阈值的所述材料确定为所述目标材料。

可选地,所述装置还包括构建模块405;

所述构建模块405具体用于根据下述步骤构建材料数据库:

从预设平台获取多种样本材料的历史报价信息;

针对每种所述样本材料,从所述历史材料报价信息中,获取该样本材料的关键词;

并基于词频-反文档频率tf-idf算法以及所述样本材料的关键词,生成该种样本材料的词频向量;

基于各种所述样本材料的词频向量以及对应的历史报价,构建所述材料数据库。

对应于图1中的查价方法,本申请实施例还提供了一种计算机设备,如图5所示,包括:处理器31、存储器32和总线33,所述存储器32存储有所述处理器31可执行的机器可读指令,当电子设备运行时,所述处理器31与所述存储器32之间通过总线33通信,所述机器可读指令被所述处理器执行时执行上述查价方法的步骤。

具体地,上述存储器32和处理器31能够为通用的存储器32和处理器31,这里不做具体限定,当处理器31运行存储器32存储的计算机程序时,能够执行上述查价方法,从而解决专家或者评委在评标过程中也不能快速合理对供应商提供的材料报价进行判断的问题,进而达到对供应商报价是否合理作出较为快速准确的评判的效果。

对应于图1中的查价方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述查价方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述查价方法,从而解决专家或者评委在评标过程中也不能快速合理对供应商提供的材料报价进行判断的问题,进而达到对供应商报价是否合理作出较为快速准确的评判的效果。

本申请实施例所提供的查价方法以及查价装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1