一种分析语言特征的方法及装置的制造方法

文档序号:8223558阅读:339来源:国知局
一种分析语言特征的方法及装置的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,特别涉及一种分析语言特征的方法及装置。
【背景技术】
[0002]众所周知,语言暴力在社会生活中随处可见,近年来已经成为语言学界研宄的热门话题。语言暴力指用不合逻辑和法律规范的语言风暴,从而以语言霸权的形式,孤立和剥夺他人的某种权利,对他人造成伤害。作为一种隐性暴力,它造成的伤害容易被人忽视或者遗忘。语言暴力通常是由强势的一方向弱势的一方发出的。例如:上级对下级,警察对百姓,医生对病人,教师对学生,家长对子女,教练对队员。
[0003]随着社会的文明度的提高,通过对音频文件分析出语言暴力,进而减少语言暴力显得尤为重要。但是,目前分析音频文件的方法是由分析人员人工进行分析的,人为因素较大,因此,分析音频文件的方法存在准确度较低、效率较差的缺陷。

【发明内容】

[0004]本发明实施例提供一种分析语言特征的方法及装置,用以解决现有技术中存在的准确度较低、效率较差的缺陷。
[0005]本发明实施例提供的具体技术方案如下:
[0006]第一方面,提供一种分析语言特征的方法,包括:
[0007]将所述待分析的音频文件划分为至少一个子文件;
[0008]针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;
[0009]根据所述第一分析值确定所述任意一子文件的语言特征。
[0010]结合第一方面,在第一种可能的实现方式中,对所述任意一子文件进行语义分析之前,还包括:
[0011]获取预设语音特征信息;或者
[0012]获取指定音频文件,并从所述指定音频文件中获取指定语音特征信息;
[0013]对所述任意一子文件进行语义分析,具体包括:
[0014]将所述任意一子文件中与所述预设语音特征信息或者与所述指定语音特征信息对应的信息进行语义分析。
[0015]结合第一方面,以及第一方面的第一种可能的实现方式,在第二种可能的实现方式中,将所述待分析的音频文件划分为至少一个子文件,具体包括:
[0016]将所述待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
[0017]将所述待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
[0018]结合第一方面,以及第一方面的第一至第二种可能的实现方式,在第三种可能的实现方式中,根据所述第一分析值确定所述任意一子文件的语言特征之前,还包括:
[0019]对所述任意一子文件进行语音分析,得到第二分析值,所述第二分析值用于表征所述任意一子文件在语音维度的语言特征;
[0020]根据所述第一分析值确定所述任意一子文件的语言特征,具体包括:
[0021]计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积;
[0022]根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征。
[0023]结合第一方面的第一至第三种可能的实现方式,在第四种可能的实现方式中,对所述任意一子文件进行语音分析,具体包括:
[0024]对所述任意一子文件进行非物理属性分析,获得非物理属性信息;和/或
[0025]对所述任意一子文件进行物理属性分析,获得物理属性信息。
[0026]结合第一方面的第一至第三种或者第四种可能的实现方式,在第五种可能的实现方式中,对所述任意一子文件进行语音分析之前,还包括:
[0027]对所述任意一子文件进行场景识别,确定场景类型;
[0028]对所述任意一子文件进行语义分析,具体包括:
[0029]根据确定的场景类型对所述任意一子文件进行语义分析;
[0030]对所述任意一子文件进行语音分析,具体包括:
[0031]根据确定的场景类型对所述任意一子文件进行语音分析。
[0032]结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,计算所述第一分析值与第一预设权重值的第一乘积,及所述第二分析值与第二预设权重值的第二乘积之前,还包括:
[0033]根据确定的场景类型调整所述第一预设权重值和所述第二预设权重值。
[0034]结合第一方面,以及第一方面的第一至第二种,或者第五种可能的实现方式,在第七种可能的实现方式中,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
[0035]对所述任意一子文件进行物理属性分析,获得物理属性信息;
[0036]对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
[0037]根据所述物理属性信息对所述第一分析值进行调整。
[0038]结合第一方面的第七种可能的实现方式,在第八种可能的实现方式中,根据所述物理属性信息对所述第一分析值进行调整之前,还包括:
[0039]对所述任意一子文件进行场景识别,确定场景类型;
[0040]根据所述物理属性信息对所述第一分析值进行调整,具体包括:
[0041]根据确定的场景类型、所述物理属性信息对所述第一分析值进行调整。
[0042]结合第一方面,以及第一方面的第一至第二种,或者第五种可能的实现方式,在第九种可能的实现方式中,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
[0043]对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
[0044]对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
[0045]根据所述非物理属性信息对得到第一分析值进行调整。
[0046]结合第一方面的第九种可能的实现方式,在第十种可能的实现方式中,根据所述非物理属性信息对得到第一分析值进行调整之前,还包括:
[0047]对所述任意一子文件进行场景识别,确定场景类型。
[0048]结合第一方面的第十种可能的实现方式,在第^^一种可能的实现方式中,对所述任意一子文件进行非物理属性分析,获得非物理属性信息,具体包括:
[0049]根据确定的场景类型,对所述任意一子文件进行非物理属性分析,获得非物理属性信息。
[0050]结合第一方面的第十或者第^^一种可能的实现方式,在第十二种可能的实现方式中,根据所述非物理属性信息对得到第一分析值进行调整,具体包括:
[0051]根据确定的场景类型、所述非物理属性信息对得到第一分析值进行调整。
[0052]结合第一方面,以及第一方面的第一至第二种,或者第五种可能的实现方式,在第十三种可能的实现方式中,对所述任意一子文件进行语义分析,得到第一分析值之前,还包括:
[0053]对所述任意一子文件进行物理属性分析,获得物理属性信息;
[0054]对所述任意一子文件进行非物理属性分析,获得非物理属性信息;
[0055]对所述任意一子文件进行语义分析,得到第一分析值之后,还包括:
[0056]根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
[0057]结合第一方面的第十三种可能的实现方式,在第十四种可能的实现方式中,根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整之前,还包括:
[0058]对所述任意一子文件进行场景识别,确定场景类型。
[0059]结合第一方面的第十四种可能的实现方式,在第十五种可能的实现方式中,对所述任意一子文件进行非物理属性分析,获得非物理属性信息,具体包括:
[0060]根据确定的场景类型,对所述任意一子文件进行非物理属性分析,获得非物理属性信息。
[0061]结合第一方面的第十四或者十五种可能的实现方式,在第十六种可能的实现方式中,根据所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整,具体包括:
[0062]根据确定的场景类型、所述物理属性信息、所述非物理属性信息对所述第一分析值进行调整。
[0063]结合第一方面,以及第一方面的第一至第十六种,或者第十七种可能的实现方式,根据所述第一分析值确定所述任意一子文件的语言特征,具体包括:
[0064]判断所述第一分析值是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
[0065]确定所述第一分析值所属的取值范围;并
[0066]确定所述任意一子文件具有所述取值范围对应的语言特征。
[0067]结合第一方面的第三至第六种可能的实现方式,在第十八种可能的实现方式中根据所述第一乘积和所述第二乘积之和确定所述任意一子文件的语言特征,具体包括:
[0068]判断所述第一乘积和所述第二乘积之和是否达到指定语言特征所对应的预设门限值,若是,确定所述任意一子文件具有所述指定语言特征;否则,确定所述任意一子文件未具有所述指定语言特征;或者
[0069]确定所述第一乘积和所述第二乘积之和所属的取值范围;并
[0070]确定所述任意一子文件具有所述取值范围对应的语言特征。
[0071]第二方面,提供一种分析语言特征的装置,包括:
[0072]划分单元,用于将所述待分析的音频文件划分为至少一个子文件;
[0073]第一分析单元,用于针对所述至少一个子文件中的任意一子文件,对所述任意一子文件进行语义分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在语义维度的语言特征;
[0074]确定单元,用于根据所述第一分析值确定所述任意一子文件的语言特征。
[0075]结合第二方面,在第一种可能的实现方式中,还包括第一获取单元,用于获取预设语音特征信息;或者,获取指定音频文件,并从所述指定音频文件中获取指定语音特征信息;
[0076]所述第一分析单元在对所述任意一子文件进行语义分析时,具体为:
[0077]将所述任意一子文件中与所述预设语音特征信息或者与所述指定语音特征信息对应的信息进行语义分析。
[0078]结合第二方面,以及第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述划分单元具体用于:
[0079]将所述待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件;和/或
[0080]将
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1