一种分析语言特征的方法及装置的制造方法_4

文档序号:8223558阅读:来源:国知局
0:B将子音频文件I采用ASR技术转换为文本1,并根据室外这种场景类型采用NLP技术对文件I中与预设语音特征信息对应的信息进行语义分析,得到第一分析值;
[0229]步骤250:B根据室外这种场景类型将第一预设权重值设置为70 %,将第二预设权重值设置为30 % ;
[0230]步骤260:计算第一分析值和70 %的第一乘积,第二分析值和30 %的第二乘积;
[0231]步骤270:B判断第一乘积和第二乘积之和是否达到暴力语言特征对应的预设门限值,若是,则确定子音频文件I具有暴力语言特征,否则,确定子音频文件I未具有暴力语言特征。
[0232]上述实施例中,音频文件和预设的语言特征信息是分两个步骤来执行的,在实际应用中,也可以是一个步骤来执行,其他过程类似,在此不再进行一一详述。
[0233]如图3所示,为了更好地理解本发明实施例,以下给出具体应用场景,针对分析成人跟小孩的对话的语言特征的过程,做出进一步详细描述,A为终端,B为分析语言特征的服务器:
[0234]步骤300:A进行录音,得到音频文件,并将得到的音频文件发送至B,及指定音频文件发送至B ;
[0235]步骤310:B将接收到的音频文件划分为两个子音频文件:子音频文件I和子音频文件2,并从接收到的指定音频文件中获取指定语音特征信息;
[0236]该实施例中,针对子音频文件I和子音频文件2的操作过程是相同的,以下以对子音频文件I的执行过程为例进行说明。
[0237]步骤320:B将子音频文件I采用ASR技术转换为文本1,并根据室外这种场景类型采用NLP技术对文本I中与预设语音特征信息对应的信息进行语义分析,得到第一分析值;
[0238]步骤330:B对子音频文件I进行物理属性分析,获得物理属性信息,对子音频文件I进行非物理属性分析,获得非物理属性信息;
[0239]步骤340:B确定场景类型,并根据确定的场景类型、物理属性信息、非物理属性信息对第一分析值进行调整;
[0240]步骤350:B确定调整得到的第一分析值所属的取值范围是属于礼貌语言特征对应的取值范围的话,因此确定子音频文件I具有礼貌语言特征。
[0241]基于上述相应方法的技术方案,参阅图4所示,本发明实施例提供一种分析语言特征的装置,该装置包括划分单元40、第一分析单元41和确定单元42,其中:
[0242]划分单元40,用于将待分析的音频文件划分为至少一个子文件;
[0243]第一分析单元41,用于针对至少一个子文件中的任意一子文件,对任意一子文件进行语义分析,得到第一分析值,第一分析值用于表征任意一子文件在语义维度的语言特征;
[0244]确定单元42,用于根据第一分析值确定任意一子文件的语言特征。
[0245]本发明实施例中,进一步的,还包括第一获取单元,用于获取预设语音特征信息;或者,获取指定音频文件,并从指定音频文件中获取指定语音特征信息;
[0246]第一分析单元41在对任意一子文件进行语义分析时,具体为:
[0247]将任意一子文件中与预设语音特征信息或者与指定语音特征信息对应的信息进行语义分析。
[0248]本发明实施例中,可选的,划分单元40具体用于:
[0249]将待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件-M /或
[0250]将待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
[0251]本发明实施例中,进一步的,还包括第二分析单元,用于:
[0252]对任意一子文件进行语音分析,得到第二分析值,第二分析值用于表征任意一子文件在语音维度的语言特征;
[0253]确定单元42在根据第一分析值确定任意一子文件的语言特征时,具体为:
[0254]计算第一分析值与第一预设权重值的第一乘积,及第二分析值与第二预设权重值的第二乘积;
[0255]根据第一乘积和第二乘积之和确定任意一子文件的语言特征。
[0256]本发明实施例中,可选的,第二分析单元在对任意一子文件进行语音分析时,具体为:
[0257]对任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
[0258]对任意一子文件进行物理属性分析,获得物理属性信息。
[0259]本发明实施例中,进一步的,确定单元42还用于:
[0260]对任意一子文件进行场景识别,确定场景类型。
[0261]本发明实施例中,可选的,第一分析单元具体用于:
[0262]根据确定的场景类型对任意一子文件进行语义分析。
[0263]本发明实施例中,可选的,第二分析单元具体用于:
[0264]根据确定的场景类型对任意一子文件进行语音分析。
[0265]本发明实施例中,进一步的,还包括第一调整单元,用于:
[0266]根据确定的场景类型调整第一预设权重值和第二预设权重值。
[0267]本发明实施例中,可选的,还包括第二获取单元,用于:
[0268]对任意一子文件进行物理属性分析,获得物理属性信息;
[0269]还包括第二调整单元,用于:
[0270]根据物理属性信息对第一分析值进行调整。
[0271]本发明实施例中,进一步的,确定单元42还用于:
[0272]对任意一子文件进行场景识别,确定场景类型;
[0273]第二调整单元在根据物理属性信息对第一分析值进行调整时,具体为:
[0274]根据确定的场景类型、物理属性信息对第一分析值进行调整。
[0275]本发明实施例中,进一步的,还包括第三获取单元,用于:
[0276]对任意一子文件进行非物理属性分析,获得非物理属性信息;
[0277]还包括第三调整单元,用于:
[0278]根据非物理属性信息对得到第一分析值进行调整。
[0279]本发明实施例中,进一步的,确定单元42还用于:
[0280]对任意一子文件进行场景识别,确定场景类型。
[0281]本发明实施例中,具体的,第三获取单元对任意一子文件进行非物理属性分析,获得非物理属性信息时,具体为:
[0282]根据确定的场景类型,对任意一子文件进行非物理属性分析,获得非物理属性信息。
[0283]本发明实施例中,可选的,第三调整单元根据非物理属性信息对得到第一分析值进行调整时,具体为:
[0284]根据确定的场景类型、非物理属性信息对得到第一分析值进行调整。
[0285]本发明实施例中,进一步的,还包括第四获取单元,用于:
[0286]对任意一子文件进行物理属性分析,获得物理属性信息;
[0287]对任意一子文件进行非物理属性分析,获得非物理属性信息;
[0288]还包括第四调整单元,用于:
[0289]根据物理属性信息、非物理属性信息对第一分析值进行调整。
[0290]本发明实施例中,进一步的,确定单元42还用于:
[0291]对任意一子文件进行场景识别,确定场景类型。
[0292]本发明实施例中,可选的,第四获取单元对任意一子文件进行非物理属性分析,获得非物理属性信息时,具体为:
[0293]根据确定的场景类型,对任意一子文件进行非物理属性分析,获得非物理属性信息。
[0294]本发明实施例中,可选的,第四调整单元根据物理属性信息、非物理属性信息对第一分析值进行调整时,具体为:
[0295]根据确定的场景类型、物理属性信息、非物理属性信息对第一分析值进行调整。
[0296]本发明实施例中,进一步的,确定单元42根据第一分析值确定任意一子文件的语言特征时,具体为:
[0297]判断第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定任意一子文件具有指定语言特征;否则,确定任意一子文件未具有指定语言特征;或者
[0298]确定第一分析值所属的取值范围;并
[0299]确定任意一子文件具有取值范围对应的语言特征。
[0300]本发明实施例中,进一步的,确定单元42根据第一乘积和第二乘积之和确定任意一子文件的语言特征时,具体为:
[0301]判断第一乘积和第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定任意一子文件具有指定语言特征;否则,确定任意一子文件未具有指定语言特征;或者
[0302]确定第一乘积和第二乘积之和所属的取值范围;并
[0303]确定任意一子文件具有取值范围对应的语言特征。
[0304]如图5所示,为本发明实施例提供的分析语言特征的另一种结构示意图,包括至少一个处理器501,通信总线502,存储器503以及至少一个通信接口 504。
[0305]其中,通信总线502用于实现上述组件之间的连接并通信,通信接口 504用于与外部设备连接并通信。
[0306]其中,存储器503用于存储有可执行的程序代码,处理器501通过执行这些程序代码,以用于:
[0307]将待分析的音频文件划分为至少一个子文件;
[0308]针对至少一个子文件中的任意一子文件,对任意一子文件进行语义分析,得到第一分析值,第一分析值用于表征任意一子文件在语义维度的语言特征;
[0309]根据第一分析值确定任意一子文件的语言特征。
[0310]综上所述,本发明实施例中,确定待分析的音频文件的语言特征时,先将所述待分析的音频文件划分为至少一个子文件;针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;根据所述第一分析值确定所述任意一子文件的语言特征,这样,避免了人工去判断音频文件的语音特征,提高了准确度和效率,尤其在语义分析基础上综合语音分析、综合场景更能较大提升准确度。
[0311]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1