乐器;声学设备的制造及制作,分析技术
  • 本发明涉及音乐创作,更具体地说,涉及基于音乐理论的智能音乐创作辅助方法。、随着人工智能技术的发展,基于数据驱动的音乐生成模型,如深度学习模型(包括rnn、lstm、transformer、diffusion model等),已成为研究热点。这些模型通过在海量音乐数据上进行训练,学习音乐的统...
  • 一种音频包格式元数据生成方法、装置、设备及介质与流程
    本公开涉及音频处理的,尤其涉及一种音频包格式元数据生成方法、装置、设备及介质。、随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕.扬声器系统则对多个通道进行排序约束,进而环绕.扬声器系统、...
  • 一种基于公共安全管理的声纹识别及身份认证方法、系统及介质
    本发明涉及声纹识别,尤其涉及一种基于公共安全管理的声纹识别及身份认证方法、系统及介质。、随着公共安全管理的智能化发展,声纹识别技术因其具备非接触、易采集、难以仿冒等优势,在边境安检、关键设施门禁、远程身份核实等场景中发挥着日益重要的作用。声纹作为人的生物特征之一,具有独特的稳定性,使得通过...
  • 一种基于路线坡度与音频高潮的声学负载优化方法及系统与流程
    本发明涉及电动汽车负载优化,具体涉及一种基于路线坡度与音频高潮的声学负载优化方法及系统。、随着智能网联汽车,尤其是纯电动汽车的快速普及与技术迭代,车载信息娱乐系统的功能日益强大,用户对高品质音频播放体验的需求不断增长,目前主流车型普遍配备多声道、高功率的音响系统,能够支持无损音源和高动态范...
  • 视频中确定语音关键词的方法、装置、设备及存储介质与流程
    本公开涉及视频分析领域,尤其涉及视频中确定语音关键词的方法、装置、设备及存储介质。、随着人工智能、计算机视觉与语音识别技术的发展,视频分析广泛应用在多个领域。例如,可以应用于金融、安防等行业。在金融行业中,特别是在业务办理或远程视频见证场景下,通常要求用户表达特定关键词,如“我知道”“我同...
  • 一种基于历史会议音频反向注册的说话人身份方法及系统与流程
    本发明涉及语音信息处理,尤其涉及一种基于历史会议音频反向注册的说话人身份方法及系统。、在各类企业会议、远程协作和司法取证等场景中,自动生成带有说话人身份标签的会议记录具有重要价值。当前,实现这一目标的技术方案主要依赖于声纹识别技术,即在会议开始前,要求每位参会者朗读指定文本以完成声纹注册,...
  • 音频处理方法、装置及电子设备与流程
    本申请属于人工智能,具体涉及一种音频处理方法、装置及电子设备。、音频数据中蕴含文字、情感、性别等丰富的信息,是人们进行信息交流和分享的主要媒介之一。随着数字内容消费的升级,使用有声书、播客等音频媒体的用户不断增长。与此同时,越来越多的人参与到音频创作中去。由于录制音频时可能出现口误、口癖和...
  • 风电机组声纹自适应检测方法、系统、设备及存储介质与流程
    本发明属于风电,具体涉及风电机组声纹自适应检测方法、系统、设备及存储介质。、在工业设备状态监测、户外声学检测等场景中,环境噪声的有效抑制是保障声音数据质量与后续特征分析准确性的关键环节,其中降雨产生的雨噪是典型且难以处理的干扰源之一。目前,行业内普遍采用传统带通滤波技术对雨噪进行抑制,该技...
  • 多模式的音乐节奏多维度感知与效果生成展示方法及系统与流程
    本申请涉及人工智能和多媒体交互,尤其涉及一种多模式的音乐节奏多维度感知与效果生成展示方法及系统。、音乐作为一种重要的艺术表现形式,其感知与体验方式随着多媒体技术的发展不断扩展。传统音乐节奏感知主要依赖单一听觉维度,辅以基础视觉反馈(如声控灯光),但随着用户对沉浸式体验需求的提升,现有技术在...
  • 一种适用于路噪主动控制系统的块坐标下降LMS-Newton方法
    本发明属于主动噪声控制的,具体涉及一种适用于路噪主动控制系统的块坐标下降lms-newton方法。、道路噪声主要源于轮胎与路面的相互作用,经空气传播和车身板件振动传递至座舱内部。路噪受路面状况、轮胎特性、行驶车速、天气条件等多种因素影响,具有低频时变的特性。传统的被动噪声控制仅对中高频段噪...
  • 一种多路音频信号混合编码方法、设备及存储介质与流程
    本发明涉及音频信号处理,尤其涉及一种多路音频信号混合编码方法、设备及存储介质。、在音频处理,随着多媒体应用的不断发展,音频信号的处理和传输变得越来越重要,从早期简单的单声道音频,到如今广泛应用的立体声、环绕声等多声道音频,音频技术的进步极大地提升了用户的听觉体验,在各种音频场景中,...
  • 燃气轮机故障诊断方法、装置、存储介质、设备及产品与流程
    本公开涉及燃气轮机故障检测,具体地,涉及一种燃气轮机故障诊断方法、装置、存储介质、设备及产品。、相关技术中,基于声纹识别技术对燃气轮机进行故障诊断时,容易在相似声音背景中产生误判,且无法有效分离异常识别与类型分类,难以适应实际燃气轮机故障数据稀缺的场景。技术实现思路、为了解决相关技术的不足...
  • 音频信号的压缩处理方法及其相关装置与流程
    本申请涉及音频信号处理,尤其涉及一种音频信号的压缩处理方法及其相关装置。、随着数字音频技术的快速发展,音频信号压缩处理在多媒体通信、数字广播、流媒体服务等领域发挥着越来越重要的作用。传统的音频压缩技术主要采用固定参数的编码方案,如mp、aac等标准格式,这些方法虽然能够实现一定程度的压缩,...
  • 一种鼓面振动传导件、鼓面组件及电子静音鼓的制作方法
    本发明涉及电子乐器领域,尤其涉及一种鼓面振动传导件、鼓面组件及电子静音鼓。、在现代音乐领域,电子鼓作为一种模拟原声鼓的电子乐器,因其独特的优势而被广泛应用。电子鼓的鼓声通常采样自真实的原声鼓,它摆脱了传统原声鼓对空间和环境的诸多限制,同时能够方便地进行音量调节、音色切换以及与其他电子音乐设...
  • 结合大语言模型纠错的语言识别系统、方法、设备及介质与流程
    本发明涉及自动语音识别,具体为一种结合大语言模型纠错的语言识别系统、方法、设备及介质。、自动语音识别(asr)作为人机交互的核心技术,自年贝尔实验室发明语音数字识别系统audrey以来,已发展成为智能终端、智能家居、车载系统等场景的关键支撑技术。语音识别纠错技术能解决asr系统因口音、噪音...
  • 一种语音合成方法、模型与电子设备与流程
    本申请涉及数据处理,尤其涉及一种语音合成方法、模型与电子设备。、语音合成(text-to-speech,tts)是将文本信息转化为自然语音的技术,广泛应用于智能助手、有声阅读、车载交互等场景。随着多模态输入和大语言模型(large languagemodel,llm)的发展,tts系统已从...
  • 基于语音识别和文本生成模型的创作方法及系统与流程
    本公开涉及自然语言处理与人工智能,具体而言,涉及基于语音识别和文本生成模型的文本创作方法及系统。、目前,行业内语音识别的传统及主流方法已从早期的基于隐马尔可夫模型与高斯混合模型的架构,转向基于深度学习的端到端模型,如连接主义时序分类模型。这些模型在标准普通话、匀速清晰的语音上已发展成熟。然...
  • 车载语音的语义解析方法、装置、电子设备及存储介质与流程
    本发明涉及车辆,特别是涉及一种车载语音的语义解析方法、装置、电子设备及存储介质。、在智能汽车的发展浪潮中,车载语音交互系统已成为提升驾驶体验与安全性的关键技术。、语义理解能力是用户使用车载语音交互系统的关键一环。为了更好的保障用户体验,语义理解功能分为了在线语义解析和离线语义解析两部分。在...
  • 语音翻译方法及装置与流程
    本发明涉及自然语言处理,尤其涉及一种语音翻译方法及装置。、语音翻译技术因低资源语种的语音训练数据严重匮乏而受限,难以满足教育、旅游、媒体等行业在这些地区的广泛应用需求。、在现有技术中,为解决数据稀疏问题,一种方法是通过文本模拟语音特征,该方法通常利用声学模型获取文本的音素序列及发音时长,以...
  • 一种可重构局域共振谷拓扑声弹波导的单胞结构、声子晶体板及其应用
    本发明涉及一种可重构局域共振谷拓扑声弹波导的单胞结构、声子晶体板及其应用,属于声子晶体。、弹性常数及密度周期分布的材料或结构被称为声子晶体,声子晶体是由弹性固体周期排列在另一种固体或流体介质中形成的一种功能材料。声弹波在声子晶体中传播时,受其内部结构的作用,在一定频率范围(带隙)内被阻止传...
技术分类