乐器;声学设备的制造及制作,分析技术
  • 语音情感转换方法、装置、计算机设备及存储介质与流程
    本申请涉及人工智能技术、自然语言处理,适用于金融科技领域和医疗健康领域,尤其涉及一种语音情感转换方法、装置、计算机设备及存储介质。、语音情感转换方法可以用于在保留语音内容与说话人身份特征的前提下,修改语音情感状态的技术。语音情感转换方法可以应用于多个应用场景,以金融科技场景为例,通过语音情...
  • 一种多语言及方言识别的人机交互控制方法及系统与流程
    本发明涉及语音识别,特别涉及一种多语言及方言识别的人机交互控制方法及系统。、随着人工智能技术的飞速进步,语音交互已成为智能终端设备中最自然便捷的沟通方式,广泛应用于智能家居、服务机器人、儿童玩具及老人陪护设备等领域。该技术通过自动语音识别、自然语言理解及语音合成等核心环节,将用户的语音指令...
  • 多专家混合的通用音频伪造检测方法及系统、终端设备
    本发明涉及一种多专家混合的通用音频伪造检测方法及系统、终端设备,属于音频检测。、在真实应用中,不同的伪造生成技术(如文本转语音tts、语音转换vc等)留下的伪造痕迹差异显著;与此同时,叠加多样的信道干扰(如电话信道传输、多媒体编解码压缩、录音设备噪声等)会导致声学特征在流形空间中发生剧烈偏...
  • 一种多工况下车辆声振性能协同的联合控制系统的制作方法
    本发明涉及一种多工况下车辆声振性能协同的联合控制系统,属于车辆联合控制。、当前提升车辆声振性能通常采用驱动电机控制器、主动悬架控制器以及主动噪声控制器执行独立调节,各子系统在反馈回路内针对转矩脉动、路面激励或舱内噪声执行抑制逻辑,随着整车控制架构趋向于多域融合,子系统间的执行逻辑仍维持物理...
  • 语音交互方法、装置、介质、设备及程序产品与流程
    本申请属于人工智能,具体涉及一种语音交互方法、语音交互装置、计算机可读介质、电子设备以及计算机程序产品。、相关技术中,人工智能语音交互依赖单一语音识别链路,在判定用户结束语音输入时,等待一段时间,若该时间段内未检测到用户持续语音输入,再通过语音识别链路基于此前累积的所有语音数据进行语音识别...
  • 音频生成方法、装置、计算设备、存储介质及程序产品与流程
    本说明书实施例涉及计算机,特别涉及一种音频生成方法、装置、计算设备、存储介质及程序产品。、在数字创意产业中的数字文化产品制作软件的领域中,实时音效生成技术普遍采用预录制音频样本库触发的方式,即预先在特定环境下采集固定场景的音频样本并按类型分类存储,当检测到物理交互事件时,通过简单的场景匹配...
  • 一种音频检测方法、装置、设备及存储介质与流程
    本申请实施例涉及人工智能,尤其涉及一种音频检测方法、装置、设备及存储介质。、随着音视频通信系统的普及,不可避免地会碰到各式各样复杂的声学环境,这也对音视频通信系统提出了更高的要求,即保证音视频通信系统在不同的声学环境下都能保持高效能。、在实时语音通信过程中,由于前景人声(也称有效声音)的能...
  • 使用生成式神经网络生成音频的制作方法
    、本说明书涉及使用神经网络生成以条件化输入为条件的音频。、神经网络是采用一层或多层非线性单元来预测针对所接收的输入的输出的机器学习模型。除了输出层之外,一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出用作网络中的一个或多个其他层(即,一个或多个其他隐藏层、输出层或两者)的输入。网络的每...
  • 一种多语言语音混合小模型的交互方法和系统与流程
    本发明涉及语音信号处理,尤其涉及一种多语言语音混合小模型的交互方法和系统。、人工智能技术快速发展推动智能语音交互成为人机交互的重要形式,全球经贸与文化交流的频繁化,让多语言实时语音交互的市场需求持续攀升,其在跨境商务、国际客服、多语言智能设备等场景中应用前景广阔。而混合小模型因轻量化、推理...
  • 用于参数化多声道编码的方法与流程
    本文档涉及音频编码系统。具体地说,本文档涉及用于参数化多声道音频编码的高效方法和系统。、参数化多声道音频编码系统可以用于以特别低的数据速率提供提高的收听质量。尽管如此,仍需要进一步改进这样的参数化多声道音频编码系统,尤其是针对带宽效率、计算效率和/或鲁棒性。技术实现思路、根据一方面,描述了...
  • 一种基于VME-SVD的小波域音频零水印方法及系统
    本发明属于数字水印,具体涉及一种基于平稳小波变换(swt)、变分模式提取(vme)、奇异值分解(svd)的小波域音频零水印版权保护方法。、在互联网环境高速发展的时代,丰富的媒体信息正飞速地占据人们的生活。与此同时,涌现出很多个人信息泄露、知识产权侵权等问题。这对数字信息保护提出了挑战。为应...
  • 一种基于机器学习的智能语音合成方法与流程
    本发明涉及语音信号处理,尤其涉及一种基于机器学习的智能语音合成方法。、随着人工智能、人机交互和语音信息处理技术的不断发展,智能语音合成技术已广泛应用于智能客服、车载交互、数字人播报、教育辅助、无障碍阅读及智能终端语音输出等场景。现有语音合成方法通常通过对输入文本进行编码处理,再结合声学模型...
  • 一种歌声毛刺噪声去除方法、装置、设备及存储介质与流程
    本申请涉及音频处理,具体而言,涉及一种歌声毛刺噪声去除方法、装置、设备及存储介质。、歌声录音在合成或传输过程中,常因声码器帧边界处理缺陷、数字音频工作站量化误差、多段音频拼接不连续等原因,在时域波形中产生持续时间极短(.至毫秒)的高频毛刺脉冲噪声,严重影响歌声质量。、现有去噪方案主要存在三...
  • 基于生成对抗网络的异常音频非平衡样本数据扩增方法
    本发明属于声学测试与人工智能交叉,具体涉及一种基于生成对抗网络的异常音频非平衡样本数据扩增方法。、在耳机质量检测与声学故障诊断领域,基于音频信号的状态监测与缺陷诊断技术发挥着重要作用。在实际测试中耳机绝大多数时间处于正常播放状态,异音等故障数据较难获取,导致收集到的数据集呈现严重的非平衡特...
  • 一种基于多维度语音特征的帕金森病辅助评估系统及方法
    本发明涉及语音信号处理,具体为一种基于多维度语音特征的帕金森病辅助评估系统及方法。、帕金森病(parkinson's disease, pd)是一种常见的神经系统退行性疾病,其早期症状的识别对于临床干预具有重要意义。现有研究表明,帕金森病患者的语音信号存在特征性改变,这为基于语音信号处理的...
  • 语音合成方法、装置、设备、介质与流程
    本公开涉及音频处理,尤其是一种语音合成方法、装置、设备、介质。、目前,大模型语音合成系统层出不穷,用户可以使用预设定的语音、或者使用语音提示词(prompt)快速克隆的方式,进行特定风格的语音合成。然而,其方案通常难以准确地控制合成语音的风格。技术实现思路、为了解决上述技术问题,本公开提供...
  • 语音信号传输方法、电子设备及计算机可读存储介质与流程
    本申请涉及通信,具体而言,涉及一种语音信号传输方法、电子设备及计算机可读存储介质。、自适应多速率窄带语音编码(adaptive multi-rate narrowband,amr-nb)是移动通信的核心技术,其作为gpp协议中广泛采用的语音压缩方案,支持从.kbps到.kbps共种编码速率...
  • 一种基于声纹识别的变电站故障判定方法及系统与流程
    本发明属于声纹处理,具体涉及一种基于声纹识别的变电站故障判定方法及系统。、随着网络通信技术与视频监控技术的持续升级,高清视频系统支撑下的设备远方巡视已成为变电运维领域的发展趋势。传统变电站视频系统多聚焦于安防、消防及设备外观概览与回看,摄像头部署集中于通道、出入口等区域,未针对在线智能巡视...
  • 主动自适应噪声与振动控制的制作方法
    本公开一般涉及主动自适应噪声与振动控制。更具体地,本公开涉及消除由一个或多个医疗设备产生的噪声和/或振动的方法和系统。、医疗设备可能会产生巨大的噪音和强烈的振动,这可能会烦扰和/或打扰患者。当医疗设备以更高的功率水平、更频繁地和/或与其他医疗设备一起操作时,会产生更大的声音和振动。这可能会...
  • 一种咳嗽音精细化识别定位模型的构建方法以及模型
    本发明属于音频信号处理与深度学习,特别涉及一种咳嗽音精细化识别定位模型的构建方法以及模型。、咳嗽检测技术已从基于隐马尔可夫模型与手工特征的传统方法,逐步演进至以卷积神经网络(cnn)和卷积循环神经网络(crnn)为代表的深度学习范式,在呼吸健康监测、临床病情跟踪等场景中具有重要应用价值。、...
技术分类