乐器;声学设备的制造及制作,分析技术
  • 一种适用于手持设备的双端语音分离方法、系统、手持设备及存储介质与流程
    本发明涉及语音信号处理,尤其涉及一种适用于手持设备的双端语音分离方法、系统、手持设备及存储介质。、在手持收银终端、手持对讲设备、移动服务终端、便携式人机交互设备等应用场景中,设备通常需要同时面对设备正面和背面两个方向的说话人。例如,在手持收银场景中,收银员位于设备一侧,顾客位于设备另一侧,...
  • 一种少样本无参考的双耳空间音频质量评估方法
    本发明属于音频信号处理领域,涉及一种音频质量评估技术,尤其是涉及一种少样本无参考的双耳空间音频质量评估方法。、随着虚拟现实(vr)、增强现实(ar)以及沉浸式影音的普及,双耳空间音频作为呈现空间声音的核心技术,其质量直接决定了用户的沉浸式体验。、目前,双耳空间音频质量评估的黄金标准仍是主观...
  • 一种基于参考音频和文本提示的歌声合成方法及装置
    本发明涉及基于扩散模型技术和大语言模型思维链推理机制的歌声合成领域,具体来说,本发明提供了一种基于参考音频和文本提示的歌声合成方法及装置。、歌声合成是语音合成领域的分支之一,其核心任务是依据给定的乐谱与歌词,自动生成自然流畅且具备艺术表现力的歌声输出。近年来,深度学习与人工智能算法的快速迭...
  • 基于语音的交互方法、电子设备、存储介质及程序产品与流程
    本公开涉及计算机,本公开尤其涉及基于语音的交互方法、电子设备、存储介质及程序产品。、随着语音技术的发展,语音交互技术在越来越多的场景中得到的应用。比如,人工客服等场景。、在现有人机交互场景中,语音对交互操作从参与很有限,往往采用直接触摸操作或外接鼠标控制,工作人员需接触屏幕或由专人协助操作...
  • 基于端云协同流式处理的车载多模态交互方法、装置、设备及存储介质与流程
    本申请涉及新能源汽车,尤其涉及基于端云协同流式处理的车载多模态交互方法、装置、设备及存储介质。、随着汽车智能化的不断深入,车载人机交互系统正从传统的物理按键、触控屏操作,向以语音为主、融合视觉、手势等多模态信息的自然交互方式演进,用户期望在与车辆的交互中,获得更加智能、流畅、情感化的体验,...
  • 基于语音对话的三维数字孪生场景控制方法、介质及产品与流程
    本发明涉及一种数字孪生与智能人机交互方法,尤其涉及一种基于语音对话的三维数字孪生场景控制方法、介质及产品。、随着数字化转型的深入,数字孪生技术在智能制造、智慧城市、建筑运维及工业元宇宙等领域的应用价值日益凸显。作为连接物理世界与虚拟空间的核心载体,三维数字孪生系统正朝着实时交互与智能决策的...
  • 一种离线连续语音转写与动态替换方法及电子设备与流程
    本发明涉及人工智能与人机交互,尤其涉及一种端侧边缘计算场景下的离线连续语音转写与动态替换方法及电子设备。、随着人工智能技术的发展,语音输入已成为智能终端(如智能手机、计算机、可穿戴设备等)的重要人机交互方式。目前,主流的连续语音转写技术主要分为“云端识别方案”与“端侧离线识别方案”两种路径...
  • 一种车载语音离线/在线切换系统、方法、介质及设备与流程
    本发明涉及车载语音交互系统,特别涉及一种车载语音离线/在线切换系统、方法、介质及设备。、随着车联网技术和人工智能的快速发展,车载语音交互系统已成为现代汽车的核心配置之一,用户通过语音指令可实现导航、车控、媒体播放、信息查询等多种功能。车载语音处理通常分为离线模式和在线模式:在线模式依赖云端...
  • 用于车辆的语音激活高级驾驶员辅助系统的制作方法
    本发明总体涉及用于车辆的语音激活高级驾驶员辅助系统。、本部分中提供的信息是为了总体呈现本公开的背景。在本部分中描述的程度上,目前命名的发明人的工作,以及在提交时可能不符合现有技术的描述的各方面,既不明确也不隐含地被承认为相对于本公开的现有技术。、车辆通常配备有驾驶员辅助系统,例如巡航控制和...
  • 基于骨传导交互的语音识别知识问答方法及系统与流程
    本发明属于语音识别知识问答,具体涉及基于骨传导交互的语音识别知识问答方法及系统。、在基于骨传导交互的语音识别知识问答过程中,系统需要在嘈杂环境和长时多轮对话中稳定采集用户语音,并将语音准确转换为问题文本,再基于知识库,完成术语解读和条目匹配,生成回复语音,而由于骨传导拾音和空气声麦克风的采...
  • 一种全链路异步处理的端对端语音交互加速方法与流程
    本发明属于端对端语音交互,具体涉及一种全链路异步处理的端对端语音交互加速方法。、端对端语音交互技术被广泛应用于智能助手、云呼叫中心等实时交互场景,其核心流程为语音采集、语音识别、语义推理及语音合成的连续执行。现有技术中,该流程普遍采用串行同步处理架构,需完成语音识别得到完整文本后,再将文本...
  • 一种基于改进型Transformer结构的端到端语音识别方法与流程
    本发明涉及语音识别与人工智能,尤其涉及一种基于改进型transformer结构的端到端语音识别方法。、随着人工智能和语音交互技术的快速发展,端到端语音识别方法逐渐成为语音识别研究的核心方向,广泛应用于智能客服、智能家居、车载语音助手、会议转写等场景。端到端语音识别通过深度神经网络直接将语音...
  • 融合生成式与判别式学习的端到端流匹配语音增强方法
    本发明涉及融合生成式与判别式学习的端到端流匹配语音增强方法,属于语音信号处理。、语音是人类日常信息交流中使用频率最高的载体之一,然而语音信号在产生、传播和接收过程中,极易受到环境噪声(如抽油烟机轰鸣、公共场所嘈杂声、交通噪声等)和网络传输干扰的影响,导致语音质量和可懂度下降。随着人工智能技...
  • 一种基于时变特征响度和时序感知网络的降雨声学分类方法
    本发明涉及降雨等级分类领域,具体涉及一种基于时变特征响度和时序感知网络的降雨声学分类方法。、降雨等级的准确分类对气象监测、水文预报以及地质灾害预警具有重要的工程与现实意义。传统的降雨监测设备受限于空间覆盖率低、易受地形遮挡及设备维护成本高等问题,难以满足高密度、细粒度的监测需求。近年来,基...
  • 一种排气放空消声器的制作方法
    本发明涉及消声器装置,具体为一种排气放空消声器。、在电力、化工、冶金等行业的锅炉运行过程中,烟气排放处理是不可或缺的环保关键环节,锅炉烟气的消声降噪、气液固杂质分离与co碳捕集效果直接影响工业生产环保达标、设备运行稳定性及碳减排目标实现,该技术属于气体分离与净化领域,烟气处理、碳捕集技术的...
  • 一种环境噪声污染智能实时识别与定位监测方法及系统与流程
    本发明涉及环境噪声监测与智能识别,具体涉及一种环境噪声污染智能实时识别与定位监测方法及系统。、随着城市功能分区的精细化发展以及对声环境质量控制要求的不断提高,在医院重症监护区、微电子洁净厂房、精密仪器实验室及野生动物保护区等高度敏感场景中,存在大量持续时间极短、频带极窄、声压级较低但具有结...
  • 风冷变压器类设备用组合式降噪模块、降噪墙体及安装方法与流程
    本申请涉及电力设施,具体地,涉及风冷变压器类设备用组合式降噪模块、降噪墙体及安装方法。、变电站等电力设施中,在风冷变压器运行过程中,由于风冷变压器噪声的特点为:除变压器本体内部的铁心、绕组振动带来的噪声(主要频率分量为、、、、hz)之外,冷却风机的启动运行,会在本体噪声的基础上再叠加风机的...
  • 一种面向密闭式循环呼吸器的潜水员呼吸监测方法及系统
    本发明涉及呼吸监测,尤其涉及一种面向密闭式循环呼吸器的潜水员呼吸监测方法及系统。、随着技术潜水、深海科考及军事特种作战等专业领域水下任务的日益频繁,相关从业人员规模显著增长。在此类任务中,密闭式循环呼吸器(ccr)以其优异的续航与隐蔽性,成为专业人员们的首选。、现有研究致力于使用穿戴式传感...
  • 一种基于优先级排序的车载音频音量动态控制方法和系统与流程
    本发明涉及车载音频控制,特别涉及一种基于优先级排序的车载音频音量动态控制方法和系统。、随着智能座舱技术的发展,车载音频系统已从单一播放设备演变为集成告警提醒、导航语音、蓝牙电话、语音助手、多媒体娱乐等多种功能的复杂系统,各类音频在时空上的冲突日益凸显。、现有技术中,基于固定优先级的音频混合...
  • 音频数据处理方法、系统、设备及介质与流程
    本发明涉及数据处理,具体涉及一种音频数据处理方法、系统、设备及介质。、在ktv、家庭影院、直播房间等固定或半固定演唱空间中,现有的音频处理方案为实现听感优化而施加的音频效果(如混响、均衡)通常基于对声学环境的静态或预设评估,但实际声学环境却由房间物理特性、背景噪声、人员活动等多个时变量共同...
技术分类