乐器;声学设备的制造及制作,分析技术
  • 一种生物特征识别方法、系统、设备及介质
    本发明属于身份识别,特别是涉及一种生物特征识别方法、系统、设备及介质。、随着可穿戴智能设备与移动安全认证技术的快速发展,基于多模态生物特征融合的身份识别方法因其更高的安全性与鲁棒性受到广泛关注。其中,将声纹(语音特征)与耳纹(耳道回声特征)相结合的识别技术尤为突出。声纹采集便捷但易受环境噪...
  • 一种基于变压器声纹的复合故障诊断方法与流程
    本发明一般涉及变压器故障诊断,具体涉及一种基于变压器声纹的复合故障诊断方法。、声纹诊断作为一种非接触式在线监测技术,在变压器机械故障识别中具有重要应用前景。当前主流方法通常包含以下步骤:通过声纹传感器采集声音信号,利用时频变换(如短时傅里叶变换、小波变换)将信号转换为二维时频图像,随后采用...
  • 一种车载音频异常检测方法及装置与流程
    本发明涉及汽车电子,尤其涉及一种车载音频异常检测方法及装置。、随着汽车智能化和网联化水平不断提升,车机的多媒体系统已成为用户与车辆交互的重要媒介,其音频播放质量直接关系到驾乘体验。、然而,车机在实际运行中常受到车内复杂环境因素的影响,例如,机械振动、电磁干扰、电路元器件老化以及车厢内声学反...
  • 音频渲染方法、装置、存储介质及程序产品与流程
    本公开涉及音频,尤其涉及一种音频渲染方法、装置、存储介质及程序产品。、音乐人工智能是一种将人工智能应用在音乐生成、音乐信息检索等音乐相关领域的技术。目前涉及人工智能的音乐相关应用例如有智能音乐分析、智能音乐教育、乐谱跟随、智能混音、音乐机器人、基于智能推荐的音乐治疗、图片视频配乐等应用。对...
  • 音色遗忘方法、装置、计算机设备及存储介质与流程
    本申请涉及人工智能技术、自然语言处理,适用于金融科技场景和医疗健康场景,尤其涉及一种音色遗忘方法、装置、计算机设备及存储介质。、语音合成模型的音色遗忘方法可以用于消除预训练语音合成模型中特定说话人音色特征。音色遗忘方法可以应用于多个应用场景,以金融科技场景为例,通过音色遗忘技术可以对用于合...
  • 一种电吹管防口水装置的制作方法
    本发明涉及电吹管辅助配件,具体是指一种电吹管防口水装置。、电吹管作为一种常见的电子乐器,在音乐演奏和音乐教学等方面有着广泛应用。然而,在演奏电吹管的过程中,演奏者常常会因口腔唾液分泌等原因产生口水,这些口水容易顺着吹口进入电吹管内部。口水进入电吹管内部后,不仅可能滋生细菌,影响电吹管的卫生...
  • 一种基于三视角特征解耦与门控融合的语音情感识别方法
    本发明涉及语音信号处理与情感计算,具体涉及一种基于三视角特征解耦与门控融合的语音情感识别方法、语音情感识别旨在通过分析语音信号中的声学特征自动识别说话者的情感状态,在人机交互、心理健康监测等领域具有重要应用价值。语音中的情感信息通过韵律、频谱、时序等多维度声学线索传递,分布于不同的表征层次...
  • 一种声纹识别方法、装置、电子设备及存储介质与流程
    本发明涉及跨信道声纹识别领域,具体而言,涉及一种声纹识别方法、装置、电子设备及存储介质。、声纹识别是一种通过分析个体语音独特声学特征来判别说话者身份的生物特征识别技术。基于深度学习的方案是当前主流技术路径,但该技术的跨信道识别性能仍存在提升空间。、跨信道声纹识别,是指注册语音与验证语音来源...
  • 基于互谱矩阵的发动机管道声模态辨识方法
    本发明涉及航空发动机管道声模态识别。、航空燃气涡轮喷气发动机独特的进/排气管道布局方式,使得其噪声向外辐射时总是首先通过气流管道以特有的声模态形式传播。众所周知,航空发动机各部件所产生的噪声,除了喷流噪声源暴露在大气自由空间,按照球面波在空间传播,发动机其他部件噪声总是首先通过发动机进/排...
  • 识别声纹的装置、方法及计算机可读介质与流程
    一种声纹识别装置及其方法与计算机可读介质,特别是指一种基于时空情境快速识别声纹的装置、方法及计算机可读介质。、随着人工智能与生物识别技术的普及,声纹识别(voiceprint recognition)已广泛应用于身份验证、智能家居及会议记录等领域。、传统的声纹识别技术多是以语音信号本身的声...
  • 一种基于声场景条件化的声音事件检测与定位方法及系统
    本发明涉及音频信号处理、人工智能与边缘计算的交叉,尤其是指一种基于声场景条件化的声音事件检测与定位方法及系统。、声音事件检测与定位(seld)技术的核心目标是赋予机器对环境声学活动的感知与理解能力,凭借其对环境声音的精准识别与位置判断特性,该技术已在智能监控、人机交互、智能可穿戴设备等多个...
  • 基于强化学习的语音文本匹配方法、装置、设备及介质与流程
    本发明涉及人工智能,尤其涉及一种基于强化学习的语音文本匹配方法、装置、设备及介质。、随着多媒体技术的迅猛发展,跨模态语音文本匹配技术在语音识别、智能人机交互以及多媒体检索等领域的应用日益广泛。该技术致力于构建语音数据与文本数据之间的语义关联,实现不同模态数据的智能匹配。然而,传统的跨模态语...
  • 应用深度学习的耳机质量测试数据处理方法、装置及介质与流程
    本发明涉及深度学习应用领域,特别涉及应用深度学习的耳机质量测试数据处理方法、装置及介质。、在耳机生产制造过程中,传统的质量检测(qc)环节主要依赖人工听音或基于固定阈值的声学参数测试,如频响曲线容差带。人工听音效率低下且主观性强,难以保证标准的一致性;而传统的参数测试虽然客观,但仅能覆盖频...
  • 用于处理用户语音的电子装置和方法与流程
    本公开的实施例涉及一种用于处理用户语音的电子装置和方法。、包括基于用户话语提供服务的语音助理功能的电子装置已经广泛分布。电子装置可以使用人工智能服务器来识别用户话语,并且可以确定用户话语的含义和意图。人工智能服务器可以解释用户话语以推断用户的意图,并且可以根据推断的意图执行任务。人工智能服...
  • 基于多模态融合的实时语音翻译方法及智能终端与流程
    本发明涉及语音信号处理,特别是指基于多模态融合的实时语音翻译方法及智能终端。、在实时语音翻译领域,现有技术通常采用语音识别与机器翻译相结合的级联处理流程,已能够为跨国会议、商务洽谈等场景提供基础的语言转换支持。然而,在涉及情感传递与表达细节的交流场合中,现有系统仍存在一定的局限性,具体而言...
  • 语音活动检测时长的配置方法、装置、电子设备、可读存储介质和计算机程序产品与流程
    本公开涉及语音处理领域,尤其涉及语音识别、语音交互、车载操作系统,具体涉及一种语音活动检测时长的配置方法、装置、电子设备、计算机可读存储介质和计算机程序产品。、语音活动检测作为语音交互系统的核心组件,其中,语音活动检测时长作为语音活动检测中的关键参数,直接影响系统对语音检测的精准识别,尤其...
  • 一种适用于物联网离线场景的语音合成方法
    本申请涉及语音数据处理,特别涉及一种适用于物联网离线场景的语音合成方法。、物联网(iot)设备已广泛应用于智能家居(如智能开关、温控器)、工业控制(如传感器、小型控制器)、智能穿戴(如低功耗手环)等领域,离线语音交互是核心功能之一,多数场景下设备无稳定网络(如工业车间、偏远地区设备),需脱...
  • 一种基于双阶段谱减和双掩码融合的实时语音增强方法及系统与流程
    本发明涉及语音信号处理,特别是指一种基于双阶段谱减和双掩码融合的实时语音增强方法及系统。、在智能语音交互等嵌入式应用中,从混合音频中实时分离人声与噪声是一大挑战,尤其当噪声源为文本转语音(tts)合成声音时。现有语音增强方法在数据处理层面存在以下缺陷,可能难以兼顾效果与嵌入式设备的严格约束...
  • 一种基于深度学习的实验室强噪声环境语音识别方法与流程
    本发明涉及语音信号处理,具体为一种基于深度学习的实验室强噪声环境语音识别方法。、随着实验室自动化水平的提升,非接触式语音控制成为保障科研人员在化学合成、生物实验等“忙双手”及高危场景下安全操作的核心技术。实验室环境具备独特的声学异质性,复杂的噪声场对语音识别系统的稳健性提出了严苛要求。、当...
  • 人机交互方法、装置、电子设备、介质及产品与流程
    本申请涉及人工智能,具体涉及一种人机交互方法、装置、电子设备、可读存储介质及计算机程序产品。、随着大语言模型在智能对话系统中的广泛应用,用户对交互体验的需求日益多样化,尤其在智能潮玩、心理陪伴等情感交互场景中,亟需同时保障回答的专业性、生成自由度和安全性。现有技术中存在一种固定流程调用方案...
技术分类