本发明涉及油管领域,具体为一种基于ai智能的旅游用英语讲解系统。
背景技术:
1、自然语言处理技术领域包含对自然语言文本及语音数据进行结构化解析和语义理解的技术集合。该领域核心是通过算法模型实现语言符号与计算机可处理数据之间的双向转换,涉及语义特征提取、语法规则匹配、语境关联分析等基础技术,在智能交互系统、多语种翻译平台、知识图谱构建等应用场景形成完整技术链条。
2、其中,基于ai智能的旅游用英语讲解系统是指通过声纹特征识别技术建立多语种语音数据库,运用深度神经网络进行语义向量映射,结合旅游场景知识图谱实现语境适配的语音转换系统。该系统针对跨语言语音交互中的声学模型训练、语义歧义消除、领域术语适配三个技术事项,采用声学特征分层提取、语义相似度计算、领域词典动态加载等技术手段完成多模态数据处理。
3、现有技术声学模型依赖固定场景数据集,无法实时感知噪声频谱变化,导致抑制系数与环境失配,引发语音失真。传统语义计算缺乏空间维度参数,文本向量匹配难以关联用户方位与展品坐标,产生节点定位偏差。跨语言生成过度依赖通用模板,未建立艺术领域参数化字段,导致术语失准与文化缺失。语音合成采用单声道输出,缺乏声学空间定位参数,无法还原真实传播特性,降低听觉引导效果。知识图谱更新基于固定周期而非实时密度监测,高峰时段推送冗余,造成信息过载与体验下降。
技术实现思路
1、本发明的目的在于提供一种基于ai智能的旅游用英语讲解系统,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于ai智能的旅游用英语讲解系统,包括环境噪声频谱识别模块,采集展馆声信号提取频谱,计算与预设场景特征库的欧氏距离,根据比较结果调整衰减系数,生成环境噪声衰减系数值;
3、用户请求空间定位模块,依据环境噪声衰减系数值对多路信号滤波,通过互相关运算获取时间差与电平差,转换为声源方位角后实施波束成形,建立用户语音请求及空间方位数据;
4、语义关联知识图谱剪枝模块,调用用户语音请求及空间方位数据定位目标画作节点,计算用户语义与画作构图、色彩基调、作者生平子节点及特展信息的相似度,结合游客密度变化调整关联强度,筛选最高值节点建立待讲解知识节点集合;
5、跨语言讲解内容生成模块,调用待讲解知识节点集合提取色彩基调与笔触参数,填充英文模板并拼接艺术评论引用,生成目标英文讲解文本;
6、空间化语音讲解合成模块,基于目标英文讲解文本合成语音,应用方位角与俯仰角调整声学定位,生成空间定位英文讲解音频。
7、优选的,所述环境噪声衰减系数值包括预设场景匹配系数、动态频段调整系数,所述用户语音请求及空间方位数据具体为方位角数值、俯仰角数值、去噪语音波形,所述待讲解知识节点集合包括构图特征数据、色彩基调描述、作者生平事件,所述目标英文讲解文本由参数化模板字段、艺术评论引用段落构成,所述空间定位英文讲解音频包含方位时间差参数、俯仰声级差参数。
8、优选的,所述环境噪声频谱识别模块包括信号采集子模块、场景特征匹配子模块、动态衰减调整子模块;
9、信号采集子模块,采集展馆环境声音信号,对原始信号进行预加重与分帧处理,应用快速傅里叶变换获取1/3倍频程频谱数据,生成展馆声波频谱数据;
10、场景特征匹配子模块,调用展馆声波频谱数据,计算其与预设旅游场景特征库中十二类场景频谱向量的欧氏距离,提取最小距离值与噪声场景匹配阈值对比,生成场景匹配度值;
11、动态衰减调整子模块,判断场景匹配度值是否低于噪声场景匹配阈值,若满足条件则调用对应场景预设衰减系数,否则基于各频段信噪比与滑动窗口均值的差值调整基准衰减系数,生成环境噪声衰减系数值。
12、优选的,所述用户请求空间定位模块包括信号预处理子模块、时差电平计算子模块、空间坐标转换子模块、波束成形子模块;
13、信号预处理子模块,调用环境噪声衰减系数值,对多路麦克风信号施加巴特沃斯带通滤波,抑制预设频段外噪声成分,生成滤波信号组;
14、时差电平计算子模块,选取滤波信号组中三组信号对,计算每对信号的归一化互相关函数峰值位置,提取最大互相关值对应的时间偏移量,同步计算信号对的均方根能量比值,生成时间差序列与电平差值;
15、空间坐标转换子模块,基于麦克风阵列几何参数,将时间差序列转换为球坐标系下的方位角分量,结合电平差值计算俯仰角分量,生成方位俯仰参数;
16、波束成形子模块,调用方位俯仰参数构建波束成形权重矩阵,对原始麦克风信号进行空域滤波,提取目标方向语音成分,建立用户语音请求及空间方位数据。
17、优选的,所述语义关联知识图谱剪枝模块包括空间坐标匹配子模块、语义关联计算子模块、动态强度修正子模块、节点筛选子模块;
18、空间坐标匹配子模块,调用用户语音请求及空间方位数据中的方位角参数,与知识图谱内展品空间坐标进行极坐标转换,计算方位角偏差绝对值小于预设角度阈值的展品节点,生成目标画作节点;
19、语义关联计算子模块,提取目标画作节点的构图特征向量、色彩基调向量、作者生平向量,分别与用户语义关键词向量计算余弦相似度,获得各子节点相似度数值,生成初始关联强度集合;
20、动态强度修正子模块,监测实时游客密度变化率,当变化率超过预设阈值时,将初始关联强度集合各值乘以拥挤场景衰减系数,生成修正关联强度集合;
21、节点筛选子模块,对修正关联强度集合按数值降序排列,选取关联强度最高的预设数量子节点,建立待讲解知识节点集合。
22、优选的,所述跨语言讲解内容生成模块包括参数提取子模块、模板匹配子模块、评论拼接子模块;
23、参数提取子模块,调用待讲解知识节点集合中关联强度最高的节点,提取其色彩基调分类标识符与笔触风格类型标识符,生成艺术特征标识组;
24、模板匹配子模块,根据艺术特征标识组中的色彩基调分类标识符,在英文模板库中筛选匹配该分类的模板条目,将色彩基调标识符与笔触风格标识符填入模板预设字段,生成基础讲解文本;
25、评论拼接子模块,从艺术特征标识组关联的艺术评论库中随机选取一条评论文本,将其附加至基础讲解文本末尾,插入分段标识符,生成目标英文讲解文本。
26、优选的,所述空间化语音讲解合成模块包括单声道语音合成子模块、声学参数转换子模块、空间化音频渲染子模块;
27、单声道语音合成子模块,基于目标英文讲解文本的词汇与音素序列,调用预设音色库匹配并发声,将合成的音素片段进行拼接并调整韵律节奏,生成单声道语音波形;
28、声学参数转换子模块,调用用户语音请求及空间方位数据中的方位角与俯仰角,根据头部传递函数模型计算与方位角对应的双耳时间差数值,并查找与俯仰角关联的频谱滤波系数作为双耳声级差,得到双耳声学参数集;
29、空间化音频渲染子模块,针对单声道语音波形,依据双耳声学参数集中的时间差对左右声道施加相位偏移,并应用声级差调整各声道在不同频段的能量增益,建立空间定位英文讲解音频。
30、与现有技术相比,本发明的有益效果是:
31、通过动态频谱匹配与场景特征库的欧氏距离计算实现噪声抑制系数自适应调整,区分展馆声学特征差异,提升复杂声场信噪比。多路信号互相关运算结合阵列几何模型转换,将声源定位精度提升至角度参数级别,波束成形技术增强目标语音空间分离度,确保方位数据具备毫米级分辨率。知识图谱节点与特展主题词的多维度语义相似度计算构建动态关联强度模型,游客密度变化率实时修正节点权重,实现讲解内容与用户兴趣及场景状态精准适配。色彩基调参数化模板与艺术评论引用拼接机制保留专业术语准确性,增强文本文学感染力,减少跨语言文化信息流失。双耳时间差与声级差参数合成技术使语音具备三维空间传播特性,提升听觉沉浸感与方位辨识度。