汽车养护方向的智能沟通方法、装置、系统及应用

文档序号:10687126阅读:148来源:国知局
汽车养护方向的智能沟通方法、装置、系统及应用
【专利摘要】汽车养护方向的智能沟通方法、装置、系统及应用,属于智能沟通领域,答案库中存在问题解答的答案,但是,由于问题的表述问题,却无法匹配该答案的问题,本发明提供了一种汽车养护方向的智能沟通方法、装置、系统及应用,以此实现,问题与答案的高度匹配,加快问题匹配速度。技术要点是:建立汽车养护问题的答案库,将答案库中的客户问题分词,并提取得到关键字;汽车专业类语料库作近似词匹配,得到答案库中关键字的多个近似词,并计算得到关键字和近似词的相似度;自动机器问答实施,对客户问题分词,并提取关键字,将提取的关键字匹配答案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似词,并重新匹配答案库中的关键字。
【专利说明】
汽车养护方向的智能沟通方法、装置、系统及应用
技术领域
[0001] 本发明属于智能沟通领域,涉及汽车养护问题的自动机器问答沟通方法的建立和 应用。
【背景技术】
[0002] 近年来,随着汽车保有量的日益增多,汽车故障维修咨询的需求也越来越大,传统 汽车4S店由于其增长量远远不及汽车的增长量,导致服务不能到位,而且一些4S店存在不 诚信的行为,因此弊端日益凸显。
[0003] 另外,汽车养护方向问题智能人机沟通技术的出现,使得客户问题可以被收集,组 织技术人员对客户问题进行解答,形成对应于客户问题的答案库;经过大量的调研,对问题 中的关键字进行统计,客户问题往往集中于几个方面,大部分的问题,可以在答案库中寻求 答案,为了可以快速和精确的寻找问题答案,需要对答案库进行分词和提取关键字;而往往 由于语言系统的庞大,客户问题与答案库中的关键字不对应,或者是用答案库中关键字的 近似词表示,这会降低答案的准确率,存在这样的情况,答案库中存在问题解答的答案,但 是,由于问题的表述问题,却无法匹配该答案。

【发明内容】

[0004] 为了解决上述答案库中存在问题解答的答案,但是,由于问题的表述问题,却无法 匹配该答案的问题,本发明提供了一种汽车养护方向的智能沟通方法、装置、系统及应用, 以此实现,问题与答案的高度匹配,加快问题匹配速度。
[0005] 为了实现上述目的,本发明技术方案的要点是:
[0006] -种汽车养护方向的智能沟通方法,包括如下步骤:
[0007] S1.建立汽车养护问题的答案库,将答案库中的客户问题分词,并提取得到关键 字;
[0008] S2.汽车专业类语料库作近似词匹配,得到答案库中关键字的多个近似词,并计算 得到关键字和近似词的相似度;
[0009] S3.自动机器问答实施,对客户问题分词,并提取关键字,将提取的关键字匹配答 案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似词,并重新匹配 答案库中的关键字。
[0010] 有益效果:本发明可及时有效地回答车主关于汽车养护方法的问题,并可扩展到 故障及车辆保险方面的问题的回答,问题匹配时,匹配速度快,精度高,还可以在无法匹配 的情况下,进行关键词的近似词匹配,增加了问题回答的范围,避免了由于客户表述问题差 异,导致的具有答案,却无法匹配的问题。
【附图说明】
[0011] 图1是实施例中自动机器问答实施步骤的流程图。
【具体实施方式】
[0012] 实施例1: 一种汽车养护方向的智能沟通方法,包括如下步骤:
[0013] S1.建立汽车养护问题的答案库,将答案库中的客户问题分词,并提取得到关键 字;
[0014] S2.汽车专业类语料库作近似词匹配,得到答案库中关键字的多个近似词,并计算 得到关键字和近似词的相似度;
[0015] 其中,优选汽车专业类语料库作近似词匹配的步骤是:通过神经网络的词向量计 算模型,对汽车专业类语料库做近似词匹配,得到答案库中关键字的多个近似词,并通过余 弦相似度方法得到关键字和相似词的相似度,将相似度最大的词作为相似词保留。
[0016] S3.自动机器问答实施,对客户问题分词,并提取关键字,将提取的关键字匹配答 案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似词,并重新匹配 答案库中的关键字。
[0017]其中,优选自动机器问答实施的步骤是:
[0018] 第一步:得到客户问题,用基于隐马定理的常规语言自然方法将客户问题分词;
[0019] 第二步:通过TF-IDF方法得到分词里的关键字;
[0020]第三步:将客户问题里的关键字与答案库的关键字匹配,匹配成功则直接得到解 决问题的答案;
[0021] 第四步:第三步没有匹配成功,则通过神经网络的词向量计算模型得到客户问题 里的关键字的近似词再重新匹配答案库关键字,直到得到解决问题的答案。
[0022] 作为本实施例优选技术方案,所述客户问题分词,并提取关键字的方法是:
[0023]第一步:计算词频;
[0024]第二步:计算逆文档频率;
[0025] 第三步:计算TF-IDF。
[0026]该上述步骤的具体实现是:
[0027] 所述的计算词频的步骤是:
[0028] -个客户问题出现了(&1,&2〃^)共 111个词,每个词在客户问题中出现的频率分别 为(ni,n2,"_nm),则第i(l<i<m)个词的词频TF为
[0030] 所述的计算逆文档频率的步骤是:
[0031] 通过汽车专业类语料库模拟语言使用环境,汽车专业类语料库中的文档总数为q, 包含所述的第i个词的文档总数为P,则词ai的逆文档频率IDF为:
[0033] 所述计算TF-IDF的步骤是:
[0034] TF-IDF(ai)=TF(ai)XIDF(ai) (3.2.3)
[0035] 将TF-IDF算法,用于分词和关键字提取,并协同于近似词匹配,可以在加速匹配的 同时,可以增加问题匹配的宽度;使得问题被解答的可能性增加,且避免了提高速度,却牺 牲了准确度的缺陷。
[0036] 实施例2: -种汽车养护方向的智能沟通装置,包括:
[0037] 答案库建立模块,建立汽车养护问题的答案库,将答案库中的客户问题分词,并提 取得到关键字;
[0038] 近似词匹配模块,汽车专业类语料库作近似词匹配,得到答案库中关键字的多个 近似词,并计算得到关键字和近似词的相似度;
[0039] 自动机器问答实施模块,自动机器问答实施,对客户问题分词,并提取关键字,将 提取的关键字匹配答案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的 近似词,并重新匹配答案库中的关键字。
[0040] 该装置与实施例1中任意方法技术方案相对应,该装置可用于执行实施例1中所述 的任意种汽车养护方向的智能沟通方法的技术方案。
[0041 ]实施例3 :本实施例记载了实施例1中的方法和实施例2中的装置技术方案的形成 路线:
[0042] 3.1.大数据统计结果
[0043] 在建立上述方法和装置或者建立系统之前,我们针对几千名奥迪车主的咨询问题 做了大量细致的大数据分类研究,发现车主所提问题主要集中在表1所示的几个方面:
[0044]

[0046]表 1
[0047]在上述提问中,76%的问题都可以通过技术经理和专门的车险行业专家所建立的 答案库得到答案。
[0048] 3.2?建立答案库
[0049] 通过对上千名车主问题的提取,我们组成了专门的解答团队做解答,形成了答案 库,并通过TF-IDF算法提取了问题的关键词,以方便下一阶段机器自主回答技术的实现。如 表2所示:
[0051 ] TF-IDF算法步骤如下:
[0052]第一步:计算词频
[0053] 假设一个车主问题出现了(ai,a2,"_am)共m个词,每个词在车主问题中出现的频率 分别为(111,112,"_1〇,则第1(1<<111)个词的词频1?为
[0055]第二步:计算逆文档频率
[0056] 第二步中,我们通过一个汽车相关的语料库,来模拟了语言的使用环境。
[0057] 假设,语料库中的文档总数为q,包含该词的文档总数为p,则词ai的逆文档频率 IDF为
[0059] 通过3.2.2式可知,如果一个词越常见,那么分母就越大,逆文档频率IDF(ai)就越 接近于0。
[0060] 第三步:计算TF-IDF
[0061] TF-IDF(ai)=TF(ai)XIDF(ai) (3.2.3)
[0062] 通过3.2.3式可以看到,TF-IDF与一个词在文档中的出现次数成正比,与该词在整 个语言中的出现次数成反比。所以,自动提取关键词的算法就是计算出文档的每个词的TF-IDF值,然后按降序排列,取排在最前面的几个词做为关键词。
[0063] 3.3.语料库匹配近似词
[0064]通过神经网络的词向量计算模型,我们对汽车专业类语料库做了近似词匹配,得 到了答案库中关键字的多个近似词,并通过余弦相似度方法得到了关键字和相似词的相似 度,将相似度最大的词作为相似词保留。如胎压警告可以得到如表3所示的近似词表,我们 保留"胎压异常"作为"胎压警告"的相似词
[0066]表 3
[0067] 3.4.自动机器问答系统实施步骤
[0068]第一步:得到客户问题后,用基于隐马定理的常规语言自然方法将客户问题分词; [0069]第二步:通过TF-IDF方法得到分词里的关键词;
[0070]第三步:将客户问题里的关键词与答案库的关键字匹配,如果匹配成功则直接得 到解决方案;
[0071] 第四步:如果第三步没有匹配成功,则通过神经网络的词向量计算模型得到关键 词的近似词再重新匹配答案库关键字,得到解决方案。
[0072] 具体流程见图1。针对实施例1和2的技术方案,基于大数据的统计结果,将传统的 面对面问答模式由线下发展到线上,解决了 76%的客户所提出的问题,满足了车主的咨询 需求,而且以机器回答为主的方式,也节省了车主的时间,同时减少了车主的经济支出。
[0073] 实施例4: 一种汽车养护方向的智能沟通系统,包括:
[0074] 答案库,所述答案库具有汽车养护问题,答案库中的客户问题被分词,并提取得到 客户问题的关键字;
[0075] 汽车专业类语料库,为答案库中关键字提供多个近似词,并计算得到关键字和近 似词的相似度;
[0076] 匹配库,用于自动机器问答实施,对客户提出的问题分词,并提取关键字,将提取 的关键字匹配答案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似 词,并重新匹配答案库中的关键字。
[0077] 该系统与实施例1中任意方法技术方案相对应,该装置可用于执行实施例1中所述 的任意种汽车养护方向的智能沟通方法的技术方案。
[0078]实施例5:-种TF-IDF算法在汽车养护方向的智能沟通系统或汽车养护方向的智 能沟通方法中的应用。其应用过程,详见实施例1-4,另,本实施例还公开了近似词匹配和 TF-IDF算法协同在汽车养护方向的智能沟通系统或汽车养护方向的智能沟通方法中的应 用。
[0079]以上所述,仅为本发明创造较佳的【具体实施方式】,但本发明创造的保护范围并不 局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明 创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之 内。
【主权项】
1. 一种汽车养护方向的智能沟通方法,其特征在于:包括如下步骤:51. 建立汽车养护问题的答案库,将答案库中的客户问题分词,并提取得到关键字;52. 汽车专业类语料库作近似词匹配,得到答案库中关键字的多个近似词,并计算得到 关键字和近似词的相似度;53. 自动机器问答实施,对客户问题分词,并提取关键字,将提取的关键字匹配答案库 中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似词,并重新匹配答案 库中的关键字。2. 如权利要求1所述的汽车养护方向的智能沟通方法,其特征在于,所述客户问题分 词,并提取关键字的方法是: 第一步:计算词频; 第二步:计算逆文档频率; 第三步:计算TF-IDF。3. 如权利要求2所述的汽车养护方向的智能沟通方法,其特征在于, 所述的计算词频的步骤是: 一个客户问题出现了(a^as,一am)共m个词,每个词在客户问题中出现的频率分别为 (ni,n2,"_nm),则第i(Ki<m)个词的词频TF为所述的计算逆文档频率的步骤是: 通过汽车专业类语料库模拟语言使用环境,汽车专业类语料库中的文档总数为q,包含 所述的第i个词的文档总数为P,则词ai的逆文档频率IDF为:所述计算TF-IDF的步骤是: TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)4. 如权利要求1或4所述的汽车养护方向的智能沟通方法,其特征在于,汽车专业类语 料库作近似词匹配的步骤是:通过神经网络的词向量计算模型,对汽车专业类语料库做近 似词匹配,得到答案库中关键字的多个近似词,并通过余弦相似度方法得到关键字和相似 词的相似度,将相似度最大的词作为相似词保留。5. 如权利要求1或4所述的汽车养护方向的智能沟通方法,其特征在于,自动机器问答 实施的步骤是: 第一步:得到客户问题,用基于隐马定理的常规语言自然方法将客户问题分词; 第二步:通过TF-IDF方法得到分词里的关键字; 第三步:将客户问题里的关键字与答案库的关键字匹配,匹配成功则直接得到解决问 题的答案; 第四步:第三步没有匹配成功,则通过神经网络的词向量计算模型得到客户问题里的 关键字的近似词再重新匹配答案库关键字,直到得到解决问题的答案。6. -种汽车养护方向的智能沟通装置,其特征在于,包括: 答案库建立模块,建立汽车养护问题的答案库,将答案库中的客户问题分词,并提取得 到关键字; 近似词匹配模块,汽车专业类语料库作近似词匹配,得到答案库中关键字的多个近似 词,并计算得到关键字和近似词的相似度; 自动机器问答实施模块,自动机器问答实施,对客户问题分词,并提取关键字,将提取 的关键字匹配答案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似 词,并重新匹配答案库中的关键字。7. -种汽车养护方向的智能沟通系统,其特征在于,包括: 答案库,所述答案库具有汽车养护问题,答案库中的客户问题被分词,并提取得到客户 问题的关键字; 汽车专业类语料库,为答案库中关键字提供多个近似词,并计算得到关键字和近似词 的相似度; 匹配库,用于自动机器问答实施,对客户提出的问题分词,并提取关键字,将提取的关 键字匹配答案库中的关键字,匹配成功时返回答案;匹配不成功时,匹配关键字的近似词, 并重新匹配答案库中的关键字。8. -种TF-IDF算法在汽车养护方向的智能沟通系统或汽车养护方向的智能沟通方法 中的应用。
【文档编号】G06F17/30GK106055628SQ201610364478
【公开日】2016年10月26日
【申请日】2016年5月27日
【发明人】田雨农, 董向前
【申请人】大连楼兰科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1