多事件音频-文本对生成方法及装置与流程技术资料下载

技术编号:37235191

提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明涉及人工智能,尤其涉及一种多事件音频-文本对生成方法及装置。背景技术、近年来,音频-文本学习越来越受到关注。与视觉语言学习类似,与标签为预定义类别的分类数据相比,机器在文本监督信号下学习声音概念的效率更高。音频-文本跨模态任务的开发为开发更自然的人机交互系统带来了希望。、现有的人工标注数据数量有限,这给音频-文本学习带来了巨大挑战。有几项研究利用模板或生成模型将类别标签或网络抓取的描述转换为描述语句,从而整理出更大的数据集。然而,无论是人工标注还是自动生成,这些数据集中的文字描述主要局...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。

详细技术文档下载地址↓↓

提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。
该分类下的技术专家--如需求助专家,请联系客服