一种声音的语义分析方法及装置的制造方法_3

文档序号:9397901阅读:来源:国知局
筛选单元,用于根据描述信息在声音样本库中对标签进行筛选,得到筛选出的标签。第二匹配单元,用于在筛选出的标签对应的基础声音样本中对待识别声音进行匹配,得到匹配结果。
[0083]可选地,反馈模块403可以包括:标签获取单元、基础声音样本数量计算单元、排序单元和反馈单元。
[0084]其中,标签获取单元,用于根据匹配结果确定待识别声音对应的至少一个基础声音样本,并获取至少一个基础声音样本对应的标签,得到至少一个标签。基础声音样本数量计算单元,用于计算至少一个标签中相同标签对应的基础声音样本的数量。排序单元,用于根据基础声音样本的数量对至少一个标签进行排序,得到排序结果。反馈单元,用于将基础声音样本的数量最多的基础声音样本对应的标签,或者排序结果,或者基础声音样本的数量反馈给用户。
[0085]本发明实施例四提供的声音的语义分析装置,为获取的每个来自生物的无语义的基础声音样本设置标签,形成声音样本库后,在声音样本库中对接收的用户输入的待识别声音进行匹配,并根据匹配后的匹配结果将待识别声音对应的基础声音样本的标签反馈给用户。经上述技术方案之后,该装置实现了为用户提供待识别声音的语义,进而使得用户了解无语义的声音的语义,从而使得用户了解生物所要表达的含义。
[0086]本发明实施例所提供的声音的语音分析装置可用于执行本发明任意实施例所提供的声音的语义分析方法,具备相应的功能模块。
[0087]注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
【主权项】
1.一种声音的语义分析方法,其特征在于,包括: 获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库; 接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果; 根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。2.根据权利要求1所述的方法,其特征在于,接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果包括: 接收用户输入的待识别声音,并获取所述待识别声音的抽象属性值; 将所述待识别声音的抽象属性值与所述声音样本库中的基础声音样本的抽象属性值进行匹配,得到匹配结果。3.根据权利要求2所述的方法,其特征在于,所述抽象属性值包括声波、波长、频率、音量和关键声音片段中的至少一个。4.根据权利要求3所述的方法,其特征在于,所述关键声音片段包括出现至少两次的声音片段或音量达到预设阈值的声音片段。5.根据权利要求1所述的方法,其特征在于,接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果包括: 接收用户输入的待识别声音和描述信息; 根据所述描述信息在所述声音样本库中对标签进行筛选,得到筛选出的标签; 在所述筛选出的标签对应的基础声音样本中对所述待识别声音进行匹配,得到匹配结果O6.根据权利要求5所述的方法,其特征在于,所述描述信息包括所述生物的属性信息或所述生物所处场景的属性信息。7.根据权利要求1所述的方法,其特征在于,根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户包括: 根据所述匹配结果确定所述待识别声音对应的至少一个基础声音样本,并获取所述至少一个基础声音样本对应的标签,得到至少一个标签; 计算所述至少一个标签中相同标签对应的基础声音样本的数量; 根据所述基础声音样本的数量对所述至少一个标签进行排序,得到排序结果; 将所述基础声音样本的数量最多的基础声音样本对应的标签,或者所述排序结果,或者所述基础声音样本的数量反馈给所述用户。8.根据权利要求1所述的方法,其特征在于,根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户之后,还包括: 获取所述用户的反馈信息; 根据所述反馈信息对所述声音样本库中的基础声音样本和/或所述基础声音样本对应的标签进行更新。9.根据权利要求8所述的方法,其特征在于,根据所述反馈信息对所述声音样本库中的基础声首样本和/或所述基础声首样本对应的标签进彳丁更新包括: 如果所述反馈信息为对错值或正确比例值,则: 统计所述待识别声音对应的基础声音样本与所述基础声音样本对应的标签的对应关系的正确率; 根据所述正确率更改所述基础声音样本对应的标签,或者将所述正确率添加至所述基础声音样本对应的标签中。10.根据权利要求8所述的方法,其特征在于,根据所述反馈信息对所述声音样本库中的基础声首样本和/或所述基础声首样本对应的标签进彳丁更新包括: 如果所述反馈信息为所述待识别声音的语义描述信息,则: 根据所述语义描述信息提取标签; 将所述待识别声音作为新的基础声音样本,与提取的标签对应存储到所述声音样本库中。11.根据权利要求1所述的方法,其特征在于,来自生物的无语义的基础声音样本具体为来自婴儿或宠物的声音。12.—种声音的语义分析装置,其特征在于,包括: 声音样本库形成模块,用于获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库; 匹配模块,用于接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果; 反馈模块,用于根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。13.根据权利要求12所述的装置,其特征在于,所述匹配模块包括: 接收单元,用于接收用户输入的待识别声音和描述信息; 筛选单元,用于根据所述描述信息在所述声音样本库中对标签进行筛选,得到筛选出的标签; 第二匹配单元,用于在所述筛选出的标签对应的基础声音样本中对所述待识别声音进行匹配,得到匹配结果。14.根据权利要求12所述的装置,其特征在于,所述反馈模块包括: 标签获取单元,用于根据所述匹配结果确定所述待识别声音对应的至少一个基础声音样本,并获取所述至少一个基础声音样本对应的标签,得到至少一个标签; 基础声音样本数量计算单元,用于计算所述至少一个标签中相同标签对应的基础声音样本的数量; 排序单元,用于根据所述基础声音样本的数量对所述至少一个标签进行排序,得到排序结果; 反馈单元,用于将所述基础声音样本的数量最多的基础声音样本对应的标签,或者所述排序结果,或者所述基础声音样本的数量反馈给所述用户。15.根据权利要求12所述的装置,其特征在于,还包括: 反馈信息获取模块,用于获取所述用户的反馈信息; 更新模块,用于根据所述反馈信息对所述声音样本库中的基础声音样本和/或所述基础声音样本对应的标签进行更新。16.根据权利要求15所述的装置,其特征在于,所述更新模块包括: 正确率统计单元,用于如果所述反馈信息为对错值或正确比例值,则:统计所述待识别声音对应的基础声音样本与所述基础声音样本对应的标签的对应关系的正确率; 第一更新单元,用于根据所述正确率更改所述基础声音样本对应的标签,或者将所述正确率添加至所述基础声音样本对应的标签中; 标签提取单元,用于如果所述反馈信息为所述待识别声音的语义描述信息,则:根据所述语义描述信息提取标签; 第二更新单元,用于将所述待识别声音作为新的基础声音样本,与提取的标签对应存储到所述声音样本库中。
【专利摘要】本发明实施例提供一种声音的语义分析方法及装置,其中,该方法包括:获取多个来自生物的无语义的基础声音样本,为各个所述基础声音样本设置标签,形成声音样本库;接收用户输入的待识别声音,在所述声音样本库中对所述待识别声音进行匹配,得到匹配结果;根据所述匹配结果将所述待识别声音对应的基础声音样本的标签反馈给所述用户。本发明实施例提供的声音的语义分析方法及装置能够反馈给用户无语义的声音的语义。
【IPC分类】G10L25/48
【公开号】CN105118518
【申请号】CN201510415970
【发明人】李华明, 王道龙, 刘晓伟, 刘孟, 燕宇飞, 袁艺, 吕文玉, 袁正沧, 张钰, 易敏文
【申请人】百度在线网络技术(北京)有限公司
【公开日】2015年12月2日
【申请日】2015年7月15日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1