技术特征:
技术总结
本发明实施例提供一种低质言论识别方法、装置、设备及计算机可读存储介质。本发明实施例的方法,通过语言模型计算言论数据的困惑度值,根据言论数据的困惑度值,识别出不符合客观语言表达习惯的无意义类型的低质言论;利用对应低质类型的训练集训练得到的多个对应不同低质类型的识别模型,若言论数据不属于无意义类型,将言论数据输入多个对应不同低质类型的识别模型,分别对言论数据是否是各识别模型对应低质类型的低质言论进行识别,也就是分别针对各低质类型对言论数据进行识别;确定言论数据为低质言论后,还可确定言论数据的低质类型;提高了低质言论识别的准确性和效率,且语言模型和识别模型有很好的泛化能力,应用范围非常广。
技术研发人员:曹宇慧;冯仕堃;何径舟
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2018.12.17
技术公布日:2019.05.21