技术编号:6630726
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明实施例提供一种中文字符序列的编码方式的识别方法和装置。该方法包括从待识别中文字符序列中获取字符序列特征,所述字符序列特征包括字符序列的长度特征,或者字符序列的长度特征以及字符序列的异常编码点特征;根据所述字符序列特征,基于设定的中文编码识别策略,确定所述待识别中文字符序列的编码方式。由于无需事先建立复杂的字符概率分布模型,因此简化了识别编码方式的识别流程;对于海量网络数据中的待识别中文字符序列,采用长度特征缩小了检测范围,避免了直接对待识别中文字符序...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。