技术编号:6336595
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本申请涉及文字信息处理,尤其涉及一种建立分词词典的方法、一种提供多粒度分词结果的方法、一种建立分词词典的装置以及一种提供多粒度分词结果的装置。背景技术从是否具有词边界标记的角度,可以将世界范围的语言文字分为两种,其中一种为有词边界标记的语言,如英文、德文等,一般单词之间采用空格作为词边界标记来划界; 另一种是无词边界标记语言,如中文、日文或韩文,在一个句子中单词彼此之间没有定界符。在搜索引擎、机器翻译、语音合成等应用中都涉及语言文本的处理问题,计算机如何对...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。