基于自然语言处理的选型及报价方法、系统、设备及介质与流程

文档序号:33621685发布日期:2023-03-25 12:16阅读:126来源:国知局
基于自然语言处理的选型及报价方法、系统、设备及介质与流程

1.本技术涉及产品智能报价领域,尤其涉及一种基于自然语言处理的选型及报价方法、系统、设备及介质。


背景技术:

2.对于传统生产制造行业,产品报价是产品销售过程中必不可少的一个环节。随着企业不断成长,企业的产品线不断增多,低效的人工报价方式逐渐成为产品销售环节的瓶颈。
3.对于部分大型企业,其生产销售的产品类目和型号众多,少则几千种多则上万种。要从大量类似产品型号中选择合适的产品并完成报价,需要花费大量人力和时间。另外,产品报价过程虽然一定会消耗人力和时间,但是不一定总是能换来销售收益。随着公司销售业务的扩展,全年制作的报价单可能只有不到一半能形成销售订单。最后,由于产品销售环节往往并无固定时间,因此产品报价过程有时会在发生在周末、节假日,甚至是半夜。这种情况即占用员工休息时间,又无法快速响应客户需求。
4.然而,以往的选型报价系统缺少处理不同格式的需求文档的能力,只能提供固定模板或者产品列表给客户进行选择。对于各种各样的产品需求文档,不同的客户可能提供不同排版、不同格式,甚至不同形式(纸质文档、电子文档、照片)的产品需求文档。对于这些产品需求文档,以往只能通过人工方式进行阅读处理。有时企业不得不雇佣二三十人的团队专门处理所有客户的需求文档并完成其报价工作。
5.因此,如何提高产品选型及报价的自动化程度和效率,是一个函待解决的问题。


技术实现要素:

6.鉴于以上所述现有技术的缺点,本技术提供一种基于自然语言处理的选型及报价方法、系统、设备及介质,以解决上述技术问题之一。
7.在第一方面,本技术提供的一种基于自然语言处理的选型及报价系统,包括:
8.文档预处理模块,用于将待处理文档的文档格式转换为预设数字文档格式;
9.信息抽取模块,基于自然语言处理方式对所述待处理文档进行信息抽取,获得产品各类需求信息;
10.企业内部数据库,用于提供企业内部运营的关联数据;
11.信息汇总模块,用于对各类所述需求信息以及所述关联数据进行过滤、分类、汇总,获取所述产品选型及报价关联的产品需求信息、客户信息与企业信息;
12.产品推荐模块,用于根据所述产品需求信息、客户信息与企业信息推荐多种产品组成的候选方案,每组产品所对应的候选方案包括候选产品列表、产品型号以及产品数量;
13.报价规则模块,用于根据企业制定的报价规则,获取产品报价的边界条件,结合所述候选方案与所述产品报价的边界条件确定产品的选型及报价;
14.业务后台模块,用于将所述产品的选型及报价生成预设报价单,予以输出。
15.于本技术的一实施例中,所述文档预处理模块通过光学字符识别将纸质文档或图像文档转换为预设数字文档格式。
16.于本技术的一实施例中,所述信息抽取模块还包括:
17.实体识别单元,用于对所述待处理文档的各字符进行命名实体识别,获得各类所述需求信息的命名实体;
18.实体消解单元,用于对所述命名实体为共指关系的候选指称向量进行实体消解,获得各类所述需求信息消解后的命名实体;
19.关系抽取单元,用于对消解后的各所述命名实体之间的语义关系进行关系抽取,获得以三元组表征产品各类需求信息的关系抽取结果。
20.于本技术的一实施例中,所述企业内部数据库为所述信息汇总模块提供企业内部运营的关联数据,所述关联数据包括客户基本信息、客户历史采购记录、当前企业的库存情况、当前企业的生产排产情况、当前企业的促销策略、相关产品的历史报价单和历史销售明细、产品技术指标明细与产品生产成本等信息。
21.于本技术的一实施例中,所述产品推荐系统用于根据客户的产品需求、客户历史采购、产品销售记录、企业当前的库存、企业当前的生产情况以及产品的技术指标,生成由多种产品组成的候选方案,每组产品所对应的候选方案包括候选产品列表、产品型号以及产品数量。
22.于本技术的一实施例中,所述业务后台模块还包括以下至少之一:系统登录功能、系统权限管理功能、业务通知功能、文档审核功能、报价规则管理功能。
23.于本技术的一实施例中,所述业务通知包括以下至少之一:手机短消息通知、微信公众号通知和电子邮件通知。
24.在第二方面,本技术还提供了一种基于自然语言处理的选型及报价方法,包括:
25.将待处理文档的文档格式转换为预设数字文档格式;
26.基于自然语言处理方式对所述待处理文档进行信息抽取,获得产品各类需求信息;
27.获取企业内部运营的关联数据;
28.对各类所述需求信息以及所述关联数据进行过滤、分类、汇总,获取所述产品选型及报价关联的产品需求信息、客户信息与企业信息;
29.根据所述产品需求信息、客户信息与企业信息推荐多种产品组成的候选方案,每组产品所对应的候选方案包括候选产品列表、产品型号以及产品数量;
30.根据企业制定的报价规则,获取产品报价的边界条件,结合所述候选方案与所述产品报价的边界条件确定产品的选型及报价;
31.将所述产品的选型及报价生成预设报价单,予以输出。
32.在第三方面,本技术还提供了一种电子设备,包括处理器、存储器和通信总线;
33.所述通信总线用于将所述处理器和存储器连接;
34.所述处理器用于执行所述存储器中存储的计算机程序,以实现如上述中任一项实施例所述的基于自然语言处理的选型及报价方法。
35.在第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于使计算机执行如上述任一项实施例所述的基于自然语言处理的选型
及报价方法。
36.本技术的有益效果:本技术提出的一种基于自然语言处理的选型及报价方法、系统、设备及介质,(1)基于自然语言处理(nlp)技术的智能选型及报价系统,其让企业用户能方便、快捷地对客户需求文档进行分析整理,自动完成产品选型及报价操作,大大提高产品选型及报价效率,具有明显的快速、高效的特点。
37.(2)基于自然语言处理(nlp)技术的智能选型及报价系统,其自动化地完成需求分析、产品选型和产品报价,最后根据报价单格式模板自动生成报价单,最大程度地减少人力资源的介入,因此其具有自动化程度高、节省人力的优点。
38.(3)基于自然语言处理(nlp)技术的智能选型及报价系统,其具有处理不同排版、不同格式以及不同形式(纸质文档、电子文档、照片)产品需求文档的能力的特点。
附图说明
39.图1是本技术一实施例中提供的一种基于自然语言处理的选型及报价系统实施环境应用示意图;
40.图2是本技术一实施例中提供的基于自然语言处理的选型及报价系统框图;
41.图3是本技术一实施例中提供的基于自然语言处理的选型及报价系统原理框图;
42.图4是本技术一实施例中提供的基于自然语言处理的选型及报价方法流程图;
43.图5是本技术一实施例提供的一种电子设备的结构示意图。
具体实施方式
44.以下通过特定的具体实例说明本技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本技术的其他优点与功效。本技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
45.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本技术的基本构想,遂图式中仅显示与本技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
46.在下文描述中,探讨了大量细节,以提供对本技术实施例的更透彻的解释,然而,对本领域技术人员来说,可以在没有这些具体细节的情况下实施本技术的实施例是显而易见的,在其他实施例中,以方框图的形式而不是以细节的形式来示出公知的结构和设备,以避免使本技术的实施例难以理解。
47.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
48.请参见图1,为本技术一实施例中提供的一种基于自然语言处理的选型及报价方法实施环境应用示意图。如图1所示,该实施环境应用网络架构可以包括服务器01(服务器集群)和终端集群(即,客户端集群)。该终端集群可以包括一个或者多个终端,这里将不对终端的数量进行限制。如图1所示,具体可以包括用户终端100a、用户终端100b、用户终端
100c、

、用户终端100n。如图1所示,用户终端100a、用户终端100b、用户终端100c、

、用户终端100n可以分别与上述服务器10进行网络连接,以便于每个用户终端可以通过该网络连接与服务器10进行数据交互。其中,这里不限定该网络连接的具体连接方式,比如,可以通过有线通信方式进行直接或间接地连接,也可以通过无线通信方式进行直接或间接地连接。
49.如图1所示,本技术实施例中的服务器01可以为终端对应的服务器。该服务器01可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式装置,还可以是提供云计算服务的云服务器。为便于理解,用户终端可以通过采集待处理文档发送至务器01进行基于自然语言处理的选型及报价。其中,上述基于自然语言处理的选型及报价方法可以在服务器、服务器集群或云计算服务集群等任意设备中进行。例如,服务器兼具目标基于自然语言处理的选型及报价功能。
50.请参阅图2,为本技术一实施例中提供的基于自然语言处理的选型及报价系统框图,详述如下:
51.文档预处理模块21,用于将待处理文档的文档格式转换为预设数字文档格式;
52.具体地,所述文档预处理模块通过光学字符识别将纸质文档或图像文档转换为预设数字文档格式,例如,首先,对待处理的需求文档根据其形式进行分类;主要分成结构化文档和非结构化文档两大类;对于结构化文档可直接使用对应文件格式的解析软件进行处理,如,在python环境下,可使用python-docx对word文档进行处理,可使用pymupdf对pdf文档进行处理,可使用xlwings对excel文档进行处理;对于非结构化文档,则通过光学字符识别(ocr)技术将纸质文档及其文档照片转化为数字文本格式后,再进行后续处理。
53.信息抽取模块22,基于自然语言处理方式对所述待处理文档进行信息抽取,获得产品各类需求信息;
54.其中,所述信息抽取模块还包括:
55.实体识别单元,用于对所述待处理文档的各字符进行命名实体识别,获得各类所述需求信息的命名实体;
56.例如,从待处理文档中抽取实体的方式有多种,主要包括基于预设规则的抽取以及通过机器学习方式的抽取。其中,基于预设规则的实体抽取可以首先预先建立命名实体列表,然后,根据命名实体列表中的实体名称,依次从获取到的待处理文档文件中抽取关键字、关键词、关键特征或关键位置的文字信息作为命名实体;通过机器学习方式的抽取可以利用预先标注的语料训练语言模型,使语言模型学习到某个字或者此作为命名实体组成部分的概率,计算出一个候选字段作为命名实体的概率值,如果该命名实体的概率值大于阈值,则抽取该命名实体作为命名实体。
57.实体消解单元,用于对所述命名实体为共指关系的候选指称向量进行实体消解,获得各类所述需求信息消解后的命名实体;
58.具体地,进行实体消歧,实体消歧的目的在于对于相同的实体名称,由于在不同的文件环境下,其表达的内容完全不同。具体的,实体消歧可以采用基于聚类的实体消歧方法或者基于实体链接的实体消歧方法,其中,基于聚类的实体消歧方法指的是目标实体列表未给定,以聚类方式对实体指称项进行消歧,所有指向同一个目标实体的指称项被消歧系统聚类到同一类别下,聚类的结果中每一个类别对应一个目标实体;基于实体链接的实体
消歧方法指的是目标实体列表给定,将实体指称项与目标实体列表中的对应实体进行链接实现消歧。然后将抽取的实体按照左右实体顺序两两生成候选实体对(实体表做笛卡尔积),为后续关系抽取做准备。
59.又例如,获取文本内每个词的字符编码;将所述文本内每个字符编码与相邻的至少一个字符编码拼接,得到候选指称向量;将每个所述候选指称向量与其余的候选指称向量两两之间拼接,得到候选共指张量;判断所述候选共指张量所对应的候选指称向量是否为共指关系,根据共指关系完成共指消解,本发明能够得到任意位置的词组与其他词组之间是否为共指关系,一方面,无需分析输入文本的句法结构与语义结构,也无需分析命名实体;另一方面,能够嵌入到其他各种自然语言处理的任务和模型,适用范围广;进而可快速准确的完成共指消解。
60.关系抽取单元,用于对消解后的各所述命名实体之间的语义关系进行关系抽取,获得以三元组表征产品各类需求信息的关系抽取结果。
61.在实体识别和实体消歧之后,就可以对命名实体之间的关系进行抽取,关系抽取指的是识别命名实体之间的语义关系,关系抽取方法包括句子级关系抽取、语料级关系抽取、限定域关系抽取和开放域关系抽取等方法。在本实施例中,命名实体之间的关系可以有多种,例如分类关系、相近关系、成员关系、从属关系、属性关系、层级关系等等,并且,在每一种关系中,又有许多种具体的关系名称,标示着实体与实体之间的联系。
62.具体地,使用自然语言处理(nlp)技术从需求文档预处理模块输出的文本段落和电子表格中提取产品相关的各类需求信息;其包含实体识别、实体消歧和关系抽取三个步骤;特别的,该信息抽取模块可采用百度公司开源的跨模态通用文档预训练模型ernie-layout来处理各类非结构化文档,获取客户需求信息。
63.企业内部数据库23,用于提供企业内部运营的关联数据;
64.具体地,所述企业内部数据库为所述信息汇总模块提供企业内部运营的关联数据,所述关联数据包括客户基本信息、客户历史采购记录、当前企业的库存情况、当前企业的生产排产情况、当前企业的促销策略、相关产品的历史报价单和历史销售明细、产品技术指标明细与产品生产成本等信息。
65.例如,用于向信息汇总模块提供企业内部存储的相关信息,其包括部分客户信息和全部企业信息;企业内部数据库的数据来源由企业研发系统、企业生产系统和企业销售系统提供,如erp系统等。
66.信息汇总模块24,用于对各类所述需求信息以及所述关联数据进行过滤、分类、汇总,获取所述产品选型及报价关联的产品需求信息、客户信息与企业信息;
67.所述信息汇总模块,其用于过滤、汇总和整理用于产品选型和报价的所有相关信息;其包含产品需求信息、客户信息和企业信息;产品需求信息包括产品需达到的各类技术参数指标、客户潜在的产品采购数量、产品被采购的可能时间,以及其他客户提出的产品附加要求;客户信息包括该客户的公司类型、客户公司规模、客户以往的历史采购记录、历史回款记录以及回款周期、客户在企业内部的评级等;特别的,以上客户信息都可能会影响产品最终报价的价格;企业信息包括企业当前的库存情况、企业当前生产排产情况、企业当前在售产品目录、企业生产的所有产品技术指标明细、企业当前的促销策略、所有产品的历史销售明细以及所有产品当前的生成成本;以上企业信息会直接影响产品的选型和报价。
68.产品推荐模块25,用于根据所述产品需求信息、客户信息与企业信息推荐多种产品组成的候选方案,每组产品所对应的候选方案包括候选产品列表、产品型号以及产品数量;
69.其中,所述产品推荐系统用于根据客户的产品需求、客户历史采购、产品销售记录、企业当前的库存、企业当前的生产情况以及产品的技术指标,生成由多种产品组成的候选方案,每组产品所对应的候选方案包括候选产品列表、产品型号以及产品数量。
70.请参阅图3,为本技术一实施例中提供的基于自然语言处理的选型及报价系统原理框图;
71.所述产品推荐系统,即图2中产品推荐模块25,其根据客户的产品需求、客户历史采购和产品销售记录、企业当前的库存和生产情况、产品的技术指标等信息,生成多种产品候选方案给企业报价规则引擎;每种产品候选方案包含候选产品列表、对应产品型号和产品数量;其中,产品技术指标需求为产品选型的主要过滤条件,然后综合考虑产品数量需求与当前库存情况、产品时间需求与当前生产排产情况、附加需求与历史采购销售记录,最终生成多个产品候选方案,至少包含高性价比方案、高性能方案、客户偏好方案等。
72.报价规则模块26,用于根据企业制定的报价规则,获取产品报价的边界条件,结合所述候选方案与所述产品报价的边界条件确定产品的选型及报价;
73.即,图3中的所述企业报价规则引擎,其用于根据各类汇总信息和产品推荐系统的结果,完成最终产品的选型和定价;其根据企业管理者制定的报价规则完成产品报价;规则引擎可以确定产品报价的边界条件,以此避免系统产生一些违背常理,价格极端的报价结果。
74.具体地,根据企业管理者制定的报价规则,确定产品报价的边界条件,避免系统产生一些违背常理,价格极端的报价结果。
75.业务后台模块27,用于将所述产品的选型及报价生成预设报价单,予以输出。
76.其中,所述业务后台模块还包括以下至少之一:系统登录功能、系统权限管理功能、业务通知功能、文档审核功能、报价规则管理功能。所述业务通知包括以下至少之一:手机短消息通知、微信公众号通知和电子邮件通知。
77.所述业务后台模块,除了用于报价单的生成及输出,还提供系统管理功能及其管理界面;其中,报价单的生成采用填充预置的报价单格式模板的方式,自动完成报价单的生成工作;其中,系统管理功能及界面包括系统登录功能及其界面、系统权限管理功能及其界面、业务通知功能、文档审核功能及其界面、报价规则管理功能及其界面等;其中业务通知包括手机短消息通知、微信公众号通知和电子邮件通知等。
78.在本实施例中,第一,自然语言处理(nlp)技术的智能选型及报价系统,其让企业用户能方便、快捷地对客户需求文档进行分析整理,自动完成产品选型及报价操作,大大提高产品选型及报价效率,具有明显的快速、高效的特点。
79.第二,基于自然语言处理(nlp)技术的智能选型及报价系统,其自动化地完成需求分析、产品选型和产品报价,最后根据报价单格式模板自动生成报价单,最大程度地减少人力资源的介入,因此其具有自动化程度高、节省人力的优点。
80.第三,基于自然语言处理(nlp)技术的智能选型及报价系统,其具有处理不同排版、不同格式以及不同形式(纸质文档、电子文档、照片)产品需求文档的能力的特点。
81.请参阅图4,为本技术一实施例中提供的基于自然语言处理的选型及报价方法流程示意图,所述基于自然语言处理的选型及报价方法包括:
82.步骤s401,将待处理文档的文档格式转换为预设数字文档格式;
83.步骤s402,基于自然语言处理方式对所述待处理文档进行信息抽取,获得产品各类需求信息;
84.步骤s403,获取企业内部运营的关联数据;
85.在此,需要说明的是,步骤s403与步骤s401、步骤s402无先后执行顺序,步骤s403可在步骤s401、步骤s402之前执行,或,同时处理。
86.步骤s404,对各类所述需求信息以及所述关联数据进行过滤、分类、汇总,获取所述产品选型及报价关联的产品需求信息、客户信息与企业信息;
87.步骤s405,根据所述产品需求信息、客户信息与企业信息推荐多种产品组成的候选方案,每组产品所对应的候选方案包括候选产品列表、产品型号以及产品数量;
88.步骤s406,根据企业制定的报价规则,获取产品报价的边界条件,结合所述候选方案与所述产品报价的边界条件确定产品的选型及报价;
89.步骤s407,将所述产品的选型及报价生成预设报价单,予以输出。
90.在本实施例中,该基于自然语言处理的选型及报价方法与上述基于自然语言处理的选型及报价相对应,具体功能和技术效果参照上述系统实施例即可,此处不再赘述。
91.参见图5,本技术实施例还提供了一种电子设备500,包括处理器501、存储器502和通信总线503;
92.通信总线503用于将处理器501和存储器连接502;
93.处理器501用于执行存储器502中存储的计算机程序,以实现如上述实施例一中的一个或多个的方法。
94.本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序用于使计算机执行如上述实施例一中的任一项的方法。
95.本技术实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本技术实施例的实施例一所包含步骤的指令(instructions)。
96.需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于
由指令执行装置、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
97.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
98.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
99.附图中的流程图和框图,图示了按照本公开各种实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
100.上述实施例仅例示性说明本技术的原理及其功效,而非用于限制本技术。任何熟悉此技术的人士皆可在不违背本技术的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本技术所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本技术的权利要求所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1