基于大数据画像的招标项目的精准匹配方法、装置和介质

文档序号:36808473发布日期:2024-01-23 12:39阅读:25来源:国知局
基于大数据画像的招标项目的精准匹配方法、装置和介质

本发明涉及基于大数据画像的招标项目的精准匹配方法、装置和介质,属于大数据。


背景技术:

1、 当前企业为了可以及时的关注到招标项目,一般会派专门的人员进行处理,时刻关注着网络的动态,寻找该企业合适的、感兴趣的招标信息;目前也有像千里马招标网、权鸟招标网等进行招标信息的汇总,将全国的数据汇总起来,也可以通过企业定制关键词,来进行项目的推荐,但是该方法推荐到招标项目存在着不是很准确、并且服务费用偏高的情况。所以如果能通过企业的历史投中标数据、企业的经营信息、投标偏好等构建企业的企业画像,这样就可以为企业提供精准的匹配服务。通过企业的精准画像匹配,匹配出适合企业的招标信息,这样可以解决通过关键词匹配不准确的问题;但是像还未参与过采购的企业,没有历史投中标数据,这样会有无法匹配的问题。当前缺少一种有效的、准确的 招标项目的精准匹配方法。


技术实现思路

1、本发明目的是提供了基于大数据画像的招标项目的精准匹配方法、装置和介质,能实现及时、准确地根据企业画像进行招标项目匹配,从而为企业提供更充足时间准备,降低成本,提高效率。

2、本发明为实现上述目的,通过以下技术方案实现:

3、步骤1:采集企业历史投中标数据、企业经营范围信息、企业注册资本、企业注册地,所述历史投中标数据包括企业项目名称、中标价格区间、中标区域,根据企业项目名称划分项目类别,根据企业经营范围确立可参与投标的项目类别,将历史中投标数据中的中标价格区间的金额处理为区间形式,将企业经营范围信息处理为标签形式;

4、步骤2:构建项目标签和企业标签,所述项目标签包括:企业项目类别、中标价格区间、中标区域;所述企业标签包括:企业可投标项目类别、企业注册资本、企业注册地址;根据项目标签和企业标签构建企业项目画像和企业经营画像;

5、步骤3:通过网络爬虫技术获取招标信息发布网站公开公示的招标信息,包括:采购单位所在地区、采购需求概况、招标金额,根据爬取招标信息的采购需求概况、采购单位所在地区、招标金额进行招标项目画像构建;

6、步骤4:构建多文本分类模型,通过训练集训练多文本分类模型,所述训练集为企业项目画像中的企业项目名称和企业项目类别;提取采购需求概况中的招标项目名称,将招标项目画像中的招标项目名称输入到训练好的多文本分类模型中输出招标项目类别,构建招标项目标签,所属招标项目标签包括:招标项目类别、项目预算金额、项目所在地;

7、步骤5:获取企业项目画像、经营画像和招标项目画像中对应的标签数据,计算其相似度,通过相似度进行排序,获取与企业相似度高的前n个项目,作为匹配结果。

8、优选的,所述通过网络爬虫技术获取招标信息发布网站公开公示的招标信息,具体方式如下:

9、通过爬虫技术实时获取每个招标信息存放的网址,将网址存放到招标信息网址数据库;

10、获取数据库中日招标信息网址进入到存放招标信息的界面,解析获取到该界面的所有信息,招标信息的具体内容存放在一个个的列表当中;

11、根据招标信息的存放规则,取出存在网页列表中的招标信息,将招标信息的发布日期、采购单位、采购项目名称、采购需求概况、预算金额和预计采购时间存放至数据库招标项目数据表。

12、优选的,多文本分类模型分类方式具体如下:

13、获取招标项目画像中的招标项目名称进行去空和去重操作,根据停用列表将无用的标调符号进行去除,利用结巴分词技术将招标项目名称分词;

14、构建文本特征向量,用 tf-idf 权重计算方法构建文档向量空间,用 sklearn 特征提取模块的 tfidfvectorizer类构建词带对象,将特征矩阵保存为 sklearn 的 bunch数据结构;

15、将ovo策略和ovr策略结合,如果预测结果一致,则择一使用,如果预测不一致的采取预测结果概率更高的数据;输出一个项目类别作为招标项目标签。

16、优选的,所述分词阶段还加入政府采购品目库形成精准候选词;

17、通过组合关键词将提取的精准候选词进行两两组合,形成新的组合候选词,通过计算组合关键词和精准候选词权重,分别选出前5个候选词来组成政府采购项目的关键词。

18、优选的,所述相似度计算根据企业是否有中标历史分为两种,对于没有中标历史的企业通过计算企业经营画像和招标项目画像标签的相似度,对于有中标历史的企业通过企业项目画像和招标项目画像标签的相似度。

19、优选的,没有中标历史的企业通过计算企业经营画像和招标项目画像标签相似度的具体方法如下:

20、从企业经营画像中提取企业经营画像中的企业可投标项目类别标签,招标项目画像中提取招标项目类别标签;

21、计算企业经营范围和招标项目概况的标签最大相似度s1计算公式如下:

22、,

23、其中,表示企业经营画像中的企业可投标项目类别标签,表示招标项目类别标签;

24、计算金额相似度s2,具体公式如下:

25、,

26、其中,表示企业注册资本,表示项目预算金额;

27、计算区域相似度s3,具体如下:

28、若企业注册地和项目所在区域为同市地区,s3=1;若企业注册地和项目所在地为同省地区,s3=0.5;若企业注册地和项目所在地为非同省地区,则s3=0.3;

29、计算计算企业经营画像和招标项目画像标签相似度s,具体公式如下:

30、

31、其中,分别为s1、s2、s3的权重,并且。

32、优选的,有中标历史的企业通过计算企业项目画像、经营画像和招标项目画像标签相似度的具体方式如下:

33、从数据库中企业画像经营表取出企业可投标项目标签,企业画像项目表中取出企业项目类别标签,招标项目画像表中取出招标项目类别标签;

34、计算企业项目概况、经营范围和项目概况的相似度s1,具体公式如下:

35、;

36、其中,表示企业经营画像中企业可投标项目标签,表示招标项目画像中招标项目类别标签,表示企业项目画像中企业项目类别标签;

37、计算金额相似度s2,具体如下:

38、如果项目的价格在该企业的历史中标价格区间内,则s2=1;当高于企业历史中标价格区间,即企业能够接受的项目资金的最大额为历史中标价格的最大额,高于该最大额度,则s2为:

39、其中,表示历史中标最高价格,表示项目预算金额;

40、计算区域相似度s3,具体如下:

41、若企业注册地、历史中标区域和项目所在区域为同一地区或同一地市,s3=1;若企业注册地和项目所在地为同省地区,s3=0.5;若企业注册地和项目所在地为非同省地区,则s3=0.3;

42、计算企业项目画像、经营画像和招标项目画像标签相似度s,具体公式如下:

43、

44、其中,分别为s1、s2、s3的权重,并且。

45、优选的,n的取值范围为5-10。

46、本发明的优点在于:本发明通过加入企业的经营范围一起构建企业的画像,可以避免新参与采购的企业无法精准推荐的问题,当企业中标了新的项目,进行实时地企业画像更新,通过构建企业的大数据画像,解决企业招标信息的精准匹配问题,提高中标概率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1