本公开涉及智能问答,尤其涉及一种汽车领域话术关键词确定方法、装置、车机及车辆。
背景技术:
1、目前,在汽车领域的问答场景中,需要将话术内容与相应关键词存储在话术库中,在用户问题文本中的关键词匹配到话术库中的关键词时,可以将话术库中对应关键词保存的话术内容作为答案输出给用户。目前话术库中的关键词通常基于在历史问答文本中统计词频及词占比,将出现频率较高,占比较大的词确定为话术库中的关键词。但是这种方式确定的话术库中的关键词,其与话术内容的针对性不高,可能出现关键词不能精准匹配相关的话术内容,导致答非所问的情况出现。
技术实现思路
1、为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种汽车领域话术关键词确定方法,可以提高话术库中关键词的针对性,提高问答过程中话术内容与用户问题的匹配度。
2、为了实现上述目的,本公开实施例提供的技术方案如下:
3、第一方面,提供一种汽车领域话术关键词确定方法,包括:
4、从历史问答文本中获取目标问答文本,并确定历史问答文本中待选词对应的目标词性;
5、根据待选词对应的目标词性在目标问答文本中出现的次数,以及目标问答文本中涉及的总词数,计算目标词性在目标问答文本中的词频;
6、根据目标问答文本中涉及的总词数和历史问答文本中包含目标词性的文本数量,计算目标词性对应的逆文档频率;
7、根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重;
8、在目标权重大于或等于预设权重的情况下,将待选词确定为目标问答文本对应的关键词。
9、作为本公开一种可选实施方式,目标问答文本是目标车型对应的问答文本;
10、根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重之前,方法还包括:
11、根据目标车型的交付量和车辆的交付总量,确定目标车型的交付比例;
12、根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重,包括:
13、根据词频、逆文档频率和目标车型的交付比例,计算待选词在历史问答文本中的目标权重。
14、作为本公开一种可选实施方式,根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重,包括:
15、根据词频、逆文档频率和目标词性的词性权重,计算待选词在历史问答文本中的目标权重。
16、作为本公开一种可选实施方式,根据词频、逆文档频率和目标词性的词性权重,计算待选词在历史问答文本中的目标权重,包括:
17、根据词频、逆文档频率、目标词性的词性权重以及词性影响因子计算基于词性的第一权重;
18、根据包含待选词的问答语句对应的用户满意度参数和满意度影响因子,计算基于满意度的第二权重;
19、基于第一权重和第二权重,综合确定目标权重。
20、作为本公开一种可选实施方式,在目标权重大于或等于预设权重的情况下,将待选词确定为目标问答文本对应的关键词之后,方法还包括:
21、获取用户问题文本,并从用户问题文本中获取提问关键词;
22、在话术库中目标关键词与提问关键词匹配的情况下,获取与目标关键词对应保存的目标话术内容;
23、输出目标话术内容。
24、作为本公开一种可选实施方式,目标关键词与提问关键词匹配,包括:
25、目标关键词与提问关键词相同;
26、或,
27、目标关键词与提问关键词的语义相似度参数大于预设相似度参数。
28、作为本公开一种可选实施方式,在话术库中目标关键词与提问关键词匹配的情况下,获取与目标关键词对应保存的目标话术内容,包括:
29、在话术库中目标关键词与提问关键词匹配的情况下,获取与目标关键词对应保存的多条话术内容;
30、将多条话术内容输入目标排序模型,获取目标排序模型输出的多条话术内容的排序结果;
31、将多条话术内容的排序结果中排序最靠前的至少一条话术内容确定为目标话术内容;
32、其中,目标排序模型为基于从历史问答文本数据中提取的目标特征数据作为模型输入进行训练后得到的,目标特征数据包括以下至少一种:话术内容被推荐次数、话术内容被采纳次数、问题文本中的关键词数量、与问题文本对应的话术内容中的关键词数量、问题文本中的关键词与对应话术内容中的关键词的重合度参数。
33、第二方面,提供一种汽车领域话术关键词的确定装置,包括:
34、确定模块,用于从历史问答文本中获取目标问答文本,并确定历史问答文本中待选词对应的目标词性;
35、词频计算模块,用于根据待选词对应的目标词性在目标问答文本中出现的次数,以及目标问答文本中涉及的总词数,计算目标词性在目标问答文本中的词频;
36、逆文档频率计算模块,用于根据目标问答文本中涉及的总词数和历史问答文本中包含目标词性的文本数量,计算目标词性对应的逆文档频率;
37、权重计算模块,用于根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重;
38、存储模块,用于在目标权重大于或等于预设权重的情况下,将待选词确定为目标问答文本对应的关键词。
39、作为本公开一种可选实施方式,目标问答文本是目标车型对应的问答文本;
40、存储模块,根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重之前,还用于:
41、根据目标车型的交付量和车辆的交付总量,确定目标车型的交付比例;
42、根据词频和逆文档频率,计算待选词在历史问答文本中的目标权重,包括:
43、根据词频、逆文档频率和目标车型的交付比例,计算待选词在历史问答文本中的目标权重。
44、作为本公开一种可选实施方式,权重计算模块,具体用于:根据词频、逆文档频率和目标词性的词性权重,计算待选词在历史问答文本中的目标权重。
45、作为本公开一种可选实施方式,权重计算模块,具体用于:根据词频、逆文档频率、目标词性的词性权重以及词性影响因子计算基于词性的第一权重;
46、根据包含待选词的问答语句对应的用户满意度参数和满意度影响因子,计算基于满意度的第二权重;
47、基于第一权重和第二权重,综合确定目标权重。
48、作为本公开一种可选实施方式,存储模块,还用于:获取用户问题文本,并从用户问题文本中获取提问关键词;
49、在话术库中目标关键词与提问关键词匹配的情况下,获取与目标关键词对应保存的目标话术内容;
50、输出目标话术内容。
51、作为本公开一种可选实施方式,目标关键词与提问关键词匹配,包括:
52、目标关键词与提问关键词相同;
53、或,
54、目标关键词与提问关键词的语义相似度参数大于预设相似度参数。
55、作为本公开一种可选实施方式,存储模块,在话术库中目标关键词与提问关键词匹配的情况下,获取与目标关键词对应保存的目标话术内容,具体用于:在话术库中目标关键词与提问关键词匹配的情况下,获取与目标关键词对应保存的多条话术内容;
56、将多条话术内容输入目标排序模型,获取目标排序模型输出的多条话术内容的排序结果;
57、将多条话术内容的排序结果中排序最靠前的至少一条话术内容确定为目标话术内容;
58、其中,目标排序模型为基于从历史问答文本数据中提取的目标特征数据作为模型输入进行训练后得到的,目标特征数据包括以下至少一种:话术内容被推荐次数、话术内容被采纳次数、问题文本中的关键词数量、与问题文本对应的话术内容中的关键词数量、问题文本中的关键词与对应话术内容中的关键词的重合度参数。
59、第三方面,提供一种车机,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面或其任意一种可选的实施方式所述的汽车领域话术关键词确定方法。
60、第四方面,提供一种计算机可读存储介质,包括:所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面或其任意一种可选的实施方式所述的汽车领域话术关键词确定方法。
61、第五方面,提供一种计算机程序产品,包括:当所述计算机程序产品在计算机上运行时,使得所述计算机实现如第一方面或其任意一种可选的实施方式所述的汽车领域话术关键词确定方法。
62、本公开实施例提供的汽车领域话术关键词确定方法,可以在历史问答文本中先筛选出目标问答文本,之后在计算历史问答文本中待选词的目标权重的过程中,该待选词所对应目标词性在所述目标问答文本中的词频,以及所述目标词性对应的逆文档频率进行计算,也就是说在计算词频和逆文档频率的过程中考虑了词性,这样计算出的目标权重可以更好体现出该待选词在历史问答文本中的重要程度、确定出的关键词更加有针对性可以精准匹配相关的话术内容,提高在后续问答过程中话术内容与用户问题的匹配度。