基于AI大模型的智能化对话场景分析方法与流程

文档序号：43002868发布日期：2025-09-15 12:18阅读：36来源：国知局

本发明涉及人工智能，尤其涉及一种基于ai大模型的智能化对话场景分析方法。

背景技术：

1、随着人工智能和互联网信息技术的发展，智能化对话系统已经广泛应用于智能客服、智能音箱、智能车载、智能物联网、智能工业服务等众多场景。

2、中国专利申请公开号为cn116662511a的专利文献公开了一种采用ai模型识别的智能化对话场景分析方法及ai对话系统，通过获取目标用户在当前智能化对话场景产生的服务交互对话文本，并采用ai模型识别策略对服务交互对话文本进行兴趣挖掘，生成至少一个兴趣对话分句聚类簇，将兴趣对话分句数量大于设定数量的兴趣对话分句聚类簇所对应的兴趣标签确定为目标兴趣标签，基于目标兴趣标签向目标用户所在的智能化对话场景页面加载对应的对话反馈页面内容，从而在智能化对话场景中结合了不同兴趣标签的兴趣对话分句数量对目标用户进行兴趣挖掘。

3、现有技术中虽然通过ai模型识别策略可以对用户的兴趣进行挖掘，但对于用户口音的不同，现有技术往往无法准确地进行语音转化，导致对话信息的丢失或误解，从而无法给出精准的回答。

技术实现思路

1、为此，本发明提供一种基于ai大模型的智能化对话场景分析方法，通过深入分析用户的语音口音和文本信息，结合对话场景的特征可以解决ai大模型的智能化对话结果不准确的问题。

2、为实现上述目的，本发明提供一种基于ai大模型的智能化对话场景分析方法，该方法包括：

3、接收用户的初始语音数据，对初始语音数据进行分析，根据分析结果识别背景噪声和语音口音；

4、对所述背景噪声进行处理，获取处理语音数据，对所述语音口音进行分析，根据分析结果确定校准参数；

5、基于所述校准参数对初始语音转化模型中初始转化参数进行调整，获取调整语音转化模型，基于调整语音转化模型对所述处理语音数据进行转化处理，获取初始文字信息；

6、基于标准语言数据库对所述初始文字信息进行标准化调整，获取标准文字信息；

7、对所述标准文字信息进行分析，根据文字信息分析结果确定词汇特征，对所述处理语音数据进行分析，根据语音数据分析结果确定情感特征，基于所述词汇特征和所述情感特征确定对话特征；

8、对所述对话特征进行分析，根据对话特征分析结果确定场景标签，基于场景标签构建初始对话场景模型；

9、基于所述初始对话场景模型和所述处理语音数据生成初始回答信息；

10、采集对所述初始回答信息的反馈信息，基于反馈信息判断模型回答偏移程度，基于判断结果对调整语音转化模型进行调整或对所述初始对话场景模型进行调整，以使调整后获得的目标回答信息优于所述初始回答信息。

11、进一步地，所述根据分析结果识别背景噪声和语音口音的步骤包括：

12、识别所述初始语音数据的能量特征、韵律特征和音素特征；

13、基于所述能量特征识别所述背景噪声；

14、基于所述韵律特征和所述音素特征识别所述语音口音。

15、进一步地，所述根据分析结果确定校准参数的步骤包括：

16、基于所述韵律特征和所述音素特征确定所述语音数据与标准语音之间的偏差值；

17、基于所述偏差值确定所述校准参数。

18、进一步地，所述基于标准语言数据库对所述初始文字信息进行标准化调整的步骤包括：

19、将所述标准语言数据库中标准词汇与所述初始文字信息进行逐一比对，确定异常词汇，计算异常词汇与标准词汇间的相似度，将相似度大于预设词汇相似度对应的异常词汇替换为标准词汇；

20、识别所述初始文字信息中实际语法规则，将实际语法规则与所述标准语言数据库中标准语法规则进行比较，根据比较结果确定错误语法并修正。

21、进一步地，所述根据文字信息分析结果确定词汇特征的步骤包括：

22、对所述标准文字信息进行分词处理，获取若干分词；

23、识别若干分词出现频次，确定出现频次最多分词对应的语义特征作为所述词汇特征。

24、进一步地，所述根据语音数据分析结果确定情感特征的步骤包括：

25、提取所述语音数据的音色特征和语速特征；

26、基于所述音色特征和所述语速特征构建语音特征向量；

27、基于所述语音特征向量和情感分析模型确定所述情感特征。

28、进一步地，所述基于所述词汇特征和所述情感特征确定对话特征的步骤包括：

29、基于所述词汇特征和所述情感特征构建特征向量；

30、基于所述特征向量确定所述对话特征。

31、进一步地，根据对话特征分析结果确定场景标签建立初始对话场景模型的步骤包括：

32、基于所述对话特征与预设场景分类模型进行匹配，确定所述场景标签；

33、根据所述场景标签和预设场景模板，构建所述初始对话场景模型。

34、进一步地，所述基于所述初始对话场景模型和所述处理语音数据生成初始回答信息的步骤包括：

35、基于所述初始对话场景模型确定所述处理语音数据所属的目标对话场景；

36、根据所述目标对话场景和预设场景回复策略，生成初始回答信息；

37、其中，所述预设场景回复策略包括不同对话场景下的回复模板和回复内容。

38、进一步地，所述基于反馈信息判断模型回答偏移程度的步骤包括：

39、收集用户对于初始回答信息的反馈数据，包括满意度评分和回复内容评价；

40、提取所述回复内容评价中关键词，对关键词进行分析，根据分析结果确定文本满意度；

41、根据所述满意度评分和文本满意度确定实际满意度；

42、基于所述实际满意度与预设满意度确定所述偏移程度。

43、与现有技术相比，本发明的有益效果在于，通过对初始语音数据的分析，能够准确识别并处理背景噪声，有效减少噪声对语音识别准确性的干扰，根据语音口音的分析结果调整语音转化模型的参数，使模型能更好地适应不同口音的语音识别，提高识别准确率，通过标准语言数据库对初始文字信息进行标准化调整，确保输出的文字信息更加规范、准确，对词汇特征和情感特征的分析，有助于更深入地理解用户意图和情感状态，使得智能化对话更加自然、流畅，基于对话特征的分析，能够自动确定场景标签，并构建初始对话场景模型，使得系统能够根据不同场景提供个性化的对话服务，通过优化场景模型，更准确地识别和理解用户在不同场景下的需求，提高对话的针对性和有效性，通过采集对初始回答信息的反馈信息，并根据反馈信息判断模型回答偏移程度，有助于系统实时了解用户反馈，发现潜在问题，基于判断结果对调整语音转化模型或初始对话场景模型进行调整，实现系统的持续学习与优化，不断提升对话系统的准确性。

44、尤其，通过能量特征反映语音信号中能量的分布和变化，通过识别能量特征准确地识别出背景噪声，从而有效减少噪声对后续语音识别和处理的影响，韵律特征和音素特征反映语音的发音特点和口音差异，基于这些特征进行口音识别能够更准确地判断用户的口音类型，为后续语音转化模型的调整提供准确依据，通过识别能量特征来识别背景噪声，使系统能够适应不同的噪声环境，提高系统的鲁棒性，基于韵律特征和音素特征进行口音识别，能够使系统更好地适应不同口音的用户，提高系统的适应性和鲁棒性，提供更加准确、个性化的服务。

45、尤其，通过分析语音数据的韵律特征和音素特征，并与标准语音进行对比，准确地确定语音数据与标准语音之间的偏差值，基于这个偏差值，精确地调整初始语音转化模型的参数，使得模型能够更好地适应和识别不同的语音数据，从而提高语音识别的准确率。

46、尤其，通过逐一比对标准语言数据库中的标准词汇与初始文字信息中的词汇，能够识别出异常词汇，通过计算相似度并替换相似度高于预设阈值的异常词汇，显著减少文本中的错误词汇，提高文本的准确性，异常词汇的替换有助于确保文本遵循标准语言规范，使文本更加清晰准确，通过识别初始文字信息中的实际语法规则，并将其与标准语言数据库中的标准语法规则进行比较，能够准确发现语法错误并进行修正，有助于优化文本的结构，提高文本的语法正确性，对初始文字信息进行全面的标准化调整，有效提升文本的整体质量，提高处理效率和准确性。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许泽玮,宋传胜,刘文潇
技术所有人：先智创科（北京）科技有限公司
我是此专利的发明人

上一篇：连接器的制作方法
下一篇：一种薄层罩面修补砂浆的施工刮平装置的制作方法

该领域下的技术专家

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！