一种分析语言特征的方法及装置的制造方法_3

文档序号：8223558阅读：来源：国知局

部分只针对与预设语言特征信息或者指定语言特征信息对应的部分。
[0155]本发明实施中，获取预设语音特征信息或者指定语音特征信息后，可以对待分析的音频文件中相应的部分进行标注，标注为待确定语言特征的部分。
[0156]本发明实施例中，将待分析的音频文件划分为至少一个子文件的方式有多种，可选的，可以采用如下方式:
[0157]将待分析的音频文件中对应的对话主题为同一个对话主题的对话作为一个子文件。
[0158]例如，音频文件中有三段老板和员工的对话，有两段员工和员工的对话，其中，第一段对话、第二段对话、第三段对话都是针对项目进度的报告，第四段对话和第五段对话是关于午餐订餐的内容，那么，此时，前三段对话作为一个子文件，第四段对话和第五段对话作为另一个子文件。
[0159]或者，也可以采用如下方式，将待分析的音频文件中对应的对话间隔小于或者等于预设间隔的任意两段对话作为一个子文件。
[0160]例如，音频文件中有三段老板和员工的对话，有两段员工和员工的对话，其中，第一段对话、第二段对话、第三段对话都是针对项目进度的报告，虽然，这三段对话的主题是一个主题，但是，由于第一段对话与第二段对话之间的间隔为3小时，第二段对话和第三段对话的间隔为15分钟，第三段对话和第一段对话的间隔为3小时15分钟，且预设间隔为I小时，则第一段对话和第二段对话作为一个子文件，第三段对话作为一个子文件。
[0161]本发明实施例中，对任意一子文件进行语义分析时，可选的，可以采用如下方式:
[0162]米用NLP (Natural Language Processing，自然语言处理技术)对任意一子文件进行语义分析。
[0163]步骤100-步骤120是讲从语义方面来确定子文件的语言特征。在实际应用中，也可以结合语音方面来确定子文件的语言特征，因此，根据第一分析值确定任意一子文件的语言特征之前，还包括如下操作:
[0164]对任意一子文件进行语音分析，得到第二分析值，第二分析值用于表征任意一子文件在语音维度的语言特征；
[0165]此时，根据第一分析值确定任意一子文件的语言特征时，可选的，可以采用如下方式:
[0166]计算第一分析值与第一预设权重值的第一乘积，及第二分析值与第二预设权重值的第二乘积；
[0167]根据第一乘积和第二乘积之和确定任意一子文件的语言特征。
[0168]本发明实施例中，对任意一子文件进行语音分析时，可选的，可以采用如下方式:
[0169]对任意一子文件进行非物理属性分析，获得非物理属性信息；和/或
[0170]对任意一子文件进行物理属性分析，获得物理属性信息。
[0171 ] 本发明实施例中，在对任意一子文件进行非物理属性分析时，可选的，可以采用如下方式:
[0172]对任意一子文件进行语调分析和/或情绪分析。
[0173]在对任意一子文件进行物理属性分析时，可选的，可以采用如下方式:
[0174]对任意一子文件进行音量分析和/或语音语速分析。
[0175]在实际应用中，同一物理属性信息或者同一非物理属性信息在不同场景下得到的分析值是不同的，例如:同样的音量在室外可能正常，在室内可能就靠近愤怒、不礼貌的负面结果，因此，音量比较大时，在室外场景下得到的第二分析值和在室内场景下得到的第二分析值是不同的。因此，本发明实施例中，对任意一子文件进行语音分析之前，还包括如下操作:
[0176]对任意一子文件进行场景识别，确定场景类型。
[0177]那么，在对任意一子文件进行语义分析时，可选的，可以根据确定的场景类型对任意一子文件进行语义分析，在对任意一子文件进行语音分析时，可选的，根据确定的场景类型对任意一子文件进行语音分析。
[0178]也就是说，语义分析时可以参考场景类型，或者语音分析时也可以参考场景类型。
[0179]本发明实施例中，可选的，喇叭声对应室外场景，广播体操对应学校场景。
[0180]上述讲述的是场景类型对语音分析和语义分析时的影响，在本发明实施例中，如果根据第一分析值和第二分析值共同来确定子文件的语言特征的话，第一预设权重值和第二预设权重值在不同场景下是不同的。例如，在室外场景下，第一预设权重值是70%，第二预设权重值是30%，在室内场景下，第一预设权重值是50%，第二预设权重值是50%。
[0181]因此，本发明实施例中，计算第一分析值与第一预设权重值的第一乘积，及第二分析值与第二预设权重值的第二乘积之前，还包括如下操作:
[0182]根据确定的场景类型调整第一预设权重值和第二预设权重值。
[0183]前面讲述的是子文件从语义方面分析得到第一分析值，从语音方面分析得到第二分析值，然后，再综合第一分析值和第二分析值确定子文件的语言特征，本发明实施例中，也可以是在从语义方面得到第一分析值时参考语音方面的分析，因此，本发明实施例中，对任意一子文件进行语义分析，得到第一分析值之前，还包括如下操作:
[0184]对任意一子文件进行物理属性分析，获得物理属性信息；
[0185]此时，在对任意一子文件进行语义分析，得到第一分析值之后，还包括如下操作:
[0186]根据物理属性信息对第一分析值进行调整。
[0187]本发明实施例中，进行调整的第一分析值可以是根据确定的场景类型得到的，也可以是没有参考确定的场景类型得到的。本发明实施例中，进一步的，根据物理属性信息对第一分析值进行调整之前，还包括如下操作:
[0188]对任意一子文件进行场景识别，确定场景类型；
[0189]此时，根据物理属性信息对第一分析值进行调整时，可选的，可以采用如下方式:
[0190]根据确定的场景类型、物理属性信息对第一分析值进行调整。
[0191]同理，对任意一子文件进行语义分析，得到第一分析值之前，还包括如下操作:
[0192]对任意一子文件进行非物理属性分析，获得非物理属性信息；
[0193]此时，可选的，对任意一子文件进行语义分析，得到第一分析值之后，还包括如下操作:
[0194]根据非物理属性信息对得到第一分析值进行调整。
[0195]本发明实施例中，根据非物理属性信息对得到第一分析值进行调整之前，还包括如下操作:
[0196]对任意一子文件进行场景识别，确定场景类型。
[0197]可选的，对任意一子文件进行非物理属性分析，获得非物理属性信息时，可以采用如下方式:
[0198]根据确定的场景类型，对任意一子文件进行非物理属性分析，获得非物理属性信息。
[0199]那么，在根据非物理属性信息对得到第一分析值进行调整时，可选的，可以采用如下方式:
[0200]根据确定的场景类型、非物理属性信息对得到第一分析值进行调整。
[0201]其中，得到的第一分析值可以是参考确定的场景类型确定的，也可以是未参考确定的场景类型确定的。
[0202]上述讲述的是根据物理属性信息对第一分析值进行调整，或者是根据非物理属性信息对第一分析值进行调整，本发明实施例中，也可以是根据物理属性信息、非物理属性信息来对第一分析值进行调整，具体在实现时，可以采用如下方式:对任意一子文件进行语义分析，得到第一分析值之前，还包括如下操作:
[0203]对任意一子文件进行物理属性分析，获得物理属性信息；
[0204]对任意一子文件进行非物理属性分析，获得非物理属性信息；
[0205]此时，对任意一子文件进行语义分析，得到第一分析值之后，还包括如下操作:
[0206]根据物理属性信息、非物理属性信息对第一分析值进行调整。
[0207]本发明实施例中，根据物理属性信息、非物理属性信息对第一分析值进行调整之前，还包括如下操作:
[0208]对任意一子文件进行场景识别，确定场景类型。
[0209]此时，对任意一子文件进行非物理属性分析，获得非物理属性信息时，可选的，可以采用如下方式:
[0210]根据确定的场景类型，对任意一子文件进行非物理属性分析，获得非物理属性信息。
[0211]此时，可选的，根据物理属性信息、非物理属性信息对第一分析值进行调整时，可选的，可以采用如下方式:
[0212]根据确定的场景类型、物理属性信息、非物理属性信息对第一分析值进行调整。
[0213]本发明实施例中，根据第一分析值确定任意一子文件的语言特征时，可选的，可以采用如下方式:
[0214]判断第一分析值是否达到指定语言特征所对应的预设门限值，若是，确定任意一子文件具有指定语言特征；否则，确定任意一子文件未具有指定语言特征；或者
[0215]确定第一分析值所属的取值范围；并
[0216]确定任意一子文件具有取值范围对应的语言特征。
[0217]同理，若根据第一乘积和第二乘积之和来确定任意一子文件的语言特征的话，根据第一乘积和第二乘积之和确定任意一子文件的语言特征时，可以采用如下方式:
[0218]判断第一乘积和第二乘积之和是否达到指定语言特征所对应的预设门限值，若是，确定任意一子文件具有指定语言特征；否则，确定任意一子文件未具有指定语言特征；或者
[0219]确定第一乘积和第二乘积之和所属的取值范围；并
[0220]确定任意一子文件具有取值范围对应的语言特征。
[0221]本发明实施例中，可选的，语言特征为如下几种形式中的一种或者任意组合:粗鲁语言特征、礼貌语言特征、平常语言特征。
[0222]如图2所示，为了更好地理解本发明实施例，以下给出具体应用场景，针对分析老师跟学生的对话是否有语言暴力的过程，做出进一步详细描述，A为终端，B为分析语言特征的服务器:
[0223]步骤200:A进行录音，得到音频文件，并将得到的音频文件发送至B ;
[0224]步骤210:A将预设语言特征信息发送至B，其中，预设语言特征信息为老师和学生的语音特征信息；
[0225]步骤220:B将接收到的音频文件划分为两个子音频文件:子音频文件I和子音频文件2 ；
[0226]该实施例中，针对子音频文件I和子音频文件2的操作过程是相同的，以下以对子音频文件I的执行过程为例进行说明。
[0227]步骤230:B确定场景类型为室外，并根据室外这种场景类型对子音频文件I中与预设语音特征信息对应的信息进行语音分析，得到第二分析值；
[0228]步骤24

完整全部详细技术资料下载

当前第3页1 2 3 4 5