乐器;声学设备的制造及制作,分析技术

一种基于模态自适应掩码融合网络的多模态情感识别方法

本发明涉及语音情感识别技术，特别是涉及一种基于模态自适应掩码融合网络的多模态情感识别方法。、在人工智能快速发展的背景下，语音情感识别（speech emotion recognition，ser）已经成为一项重要研究方向。尤其在人机交互中，先进的情感识别技术不仅能提高系统的智能化，还能改善...

2024-10-22 访问量：6
一种自适应多频段语音混合情感感知方法

本发明涉及语音情感识别技术，特别是涉及一种自适应多频段语音混合情感感知方法。、语音情感识别（ser）技术是旨在分析语音信号特征，自动识别出说话者当前情绪状态的。这项技术在人机交互领域至关重要，可以在虚拟助手、网络学习平台、健康检测系统等各类场景中提供情绪感知，使交互系统能够更好地理解用户的...

2024-10-22 访问量：5
高频音频重建技术的集成的制作方法

实施例涉及音频信号处理，且更具体来说，实施例涉及使用指定对音频数据执行高频重建(“hfr”)的基本形式或hfr的增强形式的控制数据来编码、解码或转码音频位流。、典型音频位流包含指示音频内容的一或多个频道的音频数据(例如经编码音频数据)及指示音频数据或音频内容的至少一个特性的元数据两者。用于...

2024-10-22 访问量：5
高频音频重建技术的集成的制作方法

实施例涉及音频信号处理，且更具体来说，实施例涉及使用指定对音频数据执行高频重建(“hfr”)的基本形式或hfr的增强形式的控制数据来编码、解码或转码音频位流。、典型音频位流包含指示音频内容的一或多个频道的音频数据(例如经编码音频数据)及指示音频数据或音频内容的至少一个特性的元数据两者。用于...

2024-10-22 访问量：5
语音质量评估方法、装置及存储介质与流程

本申请涉及通信，尤其涉及一种语音质量评估方法、装置及存储介质。、通常情况下，运营商通过评估语音质量进行网络问题定位和优化语音质量。在语音质量评估中，发生用户接不通和掉话的现象很少，但是通话中发生单通或断续的现象非常多。语音的单通或断续是以用户面数据来评估语音质量，可以直接反映出用户的实际通...

2024-10-22 访问量：5
一种双麦语音信号降噪方法、装置、芯片及存储介质与流程

本发明属于语音增强，具体涉及一种双麦语音信号降噪方法、装置、芯片及存储介质。、随着移动电话的广泛使用，移动语音通信已成为越来越重要的应用，如果远端讲话者处于嘈杂的声学环境中，则接收语音的质量和可懂度会因为背景噪声而严重降低。为了减弱带噪语音信号的背景噪声，大多数移动电话都已集成了语音增强算...

2024-10-22 访问量：6
演奏乐曲的评分方法、装置、电子设备、存储介质及计算机程序产品与流程

本申请涉及人工智能，尤其涉及一种演奏乐曲的评分方法、装置、电子设备、存储介质及计算机程序产品。、乐器比赛或考试过程中，相关技术基于相同乐谱，将考生的演奏乐曲与标准乐曲二者的乐器数字接口(midi，musical instrument digital interface)序列进行比较，从而得...

2024-10-22 访问量：6
场景音频信号的解码方法和装置与流程

本申请涉及音频编解码技术，尤其涉及一种场景音频信号的解码方法和装置。、三维音频技术是通过计算机、信号处理等方式对真实世界中声音事件和三维声场信息进行获取、处理，传输和渲染回放的音频技术。三维音频使声音具有强烈的空间感、包围感及沉浸感，给人以“声临其境”的非凡听觉体验。其中，高阶立体混响(h...

2024-10-22 访问量：6
场景音频解码方法及电子设备与流程

本申请实施例涉及音频编解码领域，尤其涉及一种场景音频解码方法及电子设备。、三维音频技术是通过计算机、信号处理等方式对真实世界中声音事件和三维声场信息进行获取、处理，传输和渲染回放的音频技术。三维音频使声音具有强烈的空间感、包围感及沉浸感，给人以“声临其境”的非凡听觉体验。其中，hoa(hi...

2024-10-22 访问量：6
面向预训练语言模型微调的参数高效型适配器微调方法

本发明属于预训练语言模型微调领域，具体涉及一种面向预训练语言模型微调的参数高效型适配器微调方法。、近年来，预训练语言模型已席卷人工智能的各个领域，并取得了巨大成功。预训练语言模型适应下游任务的主流范式是微调。由于大多数预训练语言模型如t、gpt都有大量的参数，因此对它们进行微调通常是昂贵且...

2024-10-22 访问量：5
语音信号处理方法、语音信号处理设备及存储介质与流程

本申请涉及语音信号处理，尤其涉及语音信号处理方法、语音信号处理设备及存储介质。、在相关的噪声处理方式中，通常通过谱减法、维纳滤波及自适应滤波的方式对复杂环境噪声进行处理。然而，这些处理方式依赖于对噪声的准确估计，并且在处理非平稳噪声或与语音信号频率相近的噪声时存在局限性，使得噪声估计不准确...

2024-10-22 访问量：5
一种基于模板技术的声音采集数据压缩与存储方法及其系统与流程

本发明涉及声音数据表示与存储，特别是涉及一种基于模板技术的声音采集数据压缩与存储方法及其系统。、机器声音反映了机器的运行状况并可能预示着设备问题，利用机器声音进行异常检测是方便、易用、无损不停机检测的一种方法，也是工业智能化、自动化领域的热门研究方向。而为了更加准确地分析出机器声音表达出来...

2024-10-22 访问量：6
一种基于VITS的实时语音转换方法与装置

本发明涉及语音转换，尤其涉及一种基于vits的实时语音转换方法与装置。、语音转换(vc)是一项旨在修改说话人信息的语音特征的任务，例如说话人的身份、情感和口音，同时保留语音的内容信息。随着对语音转换领域的研究不断深入，该领域的技术正在迅速发展。从最初的基于统计建模的方法，到如今的基于深度学...

2024-10-22 访问量：5
一种用于高速风机马达的阻抗复合吸声结构的制作方法

本发明属于高速风机马达，涉及一种用于高速风机马达的阻抗复合吸声结构。、现代高速风机马达一般采用数码马达，马达运行转速高达转/分钟以上；而在如此高转速的工作状态下，除风叶产生的宽频噪音外，异音问题点中的一阶倍频(处在～hz之间(中高频音的范畴)，处于人耳听阈敏感区)造成的“高频声”占据了异音...

2024-10-22 访问量：5
合成语音切换方法及相关装置、设备和存储介质与流程

本申请涉及语音处理，特别是涉及一种合成语音切换方法及相关装置、设备和存储介质。、随着深度学习技术的不断发展，语音合成技术得到了发展，用于实现将文本自动转换为语音。、现有技术中，在进行合成语音播放时，为了支持用户在播放过程中对合成语音执行新的参数配置，会先暂停当前播放，等待新的语音合成完成后...

2024-10-22 访问量：6
用于生成文本的神经网络的制作方法

至少一个实施例涉及使用诸如语音识别任务的持续时间的处理。例如，至少一个实施例涉及用于使用一个或更多个神经网络至少部分地基于一个或更多个预测的符号和持续时间来生成文本的处理器或计算设备。在至少一个实施例中，一种处理器包括一个或更多个电路，该一个或更多个电路用于使用一个或更多个神经网络以至少部分地基于...

2024-10-22 访问量：5
一种基于频域空间的语音降噪方法

本发明涉及语音降噪，具体地说，涉及一种基于频域空间的语音降噪方法。、音频放大器是对声音信号进行放大的装置，输出信号中语音和噪声混杂在一起，频谱相互重叠，很难在时域范围进行降噪处理。语音和噪声具有调制特性，在混杂过程中，由上边带和下边带造成的频谱搬移，会产生很多的边带频率成分，为了从带噪语音...

2024-10-22 访问量：6
智能终端的语音控制方法及装置、可读存储介质与流程

本申请涉及通信，尤其涉及一种智能终端的语音控制方法及装置、可读存储介质。、随着智能终端的快速发展，各种各样的智能终端进入千家万户，比如，智能照明设备、智能电视、智能冰箱以及智能空调等等。在使用该类智能终端的过程中，为了操作方便，用户可以通过语音来控制智能终端。比如，用户可以通过语音“打开冰...

2024-10-22 访问量：5
语音唇读识别的方法及模型的训练方法、装置、电子设备与流程

本公开涉及数据处理，尤其涉及一种语音唇读识别的方法及模型的训练方法、装置、电子设备。、语音唇读是一种根据输入的说话人脸视频序列来重建说话语音的技术，是一种视频到语音的映射，其重建的语音应该包含视频的说话内容信息和说话人语音相关信息。在语音唇读任务中，研究者一开始选择文字作为视频到语音的中间...

2024-10-22 访问量：5
一种音频测试方法、装置、设备及计算机存储介质与流程

本申请属于音频测试，尤其涉及一种音频测试方法、装置、设备及计算机存储介质。、随着科技发展，处于各地的不同用户之间往往可以通过视频会议来交换信息。、目前，在视频会议过程中，参会人员中的发言者需要在发言前先进行试音，以确认其他参会人员是否能听到发言者的声音，现有的试音方式是由发言者向其他参会人...

2024-10-22 访问量：4

1 2 3 4 5 6 >> 尾页

技术分类