技术特征:
技术总结
本发明提供了一种基于语义理解的中文实词提取算法,该方法包括:采用散列树词典建立数据检索结构;根据断句表,将中文句子切分为短句,在进行匹配分词的同时保存匹配过程中字符串的匹配信息;通过字符串的匹配信息以及逐词扫描来判断存在的二义字段,将预切分的中间结果交给细分过程进行处理。本发明提出了一种基于语义理解的中文实词提取算法,改进了对分词的二义字段处理的过程,具备更理想的时间复杂度和切分正确率。
技术研发人员:张鹏
受保护的技术使用者:成都布林特信息技术有限公司
技术研发日:2017.06.21
技术公布日:2017.10.20