一种英文音标检测方法

文档序号:6424790阅读:632来源:国知局
专利名称:一种英文音标检测方法
技术领域
本发明涉及一种检测方法,尤其涉及一种英文音标检测方法。
背景技术
在一些小型出版社编辑的词典或自行开发的英语词典中,英语单字的音标往往容易被忽视,出现不少的错误。为杜绝英文音标的错误和确保较少的英文音标标注错误,编辑人员需要逐个对英文单字的音标检查,对于一些稍偏僻的单字的音标需要再检索大的权威字典比对确认。这种工作方法的缺陷在于发现问题点的随机性大,不够完全,而且维护成本高。相比英文拼写规则,英文音标要复杂许多,但是又有其固有的规则。

发明内容
为了解决背景技术中所存在的技术问题,本发明提出了一种英文音标检测方法, 利用统计英文音标的组合频度自动对英文音标做合法性检测,发现问题点比较完全,提高了工作效率,节省了维护成本。本发明的技术解决方案是一种英文音标检测方法,其特殊之处在于所述检测方法包括以下步骤1)制作音标库,建立音标转换表,将单字的音标转换为标准国际音标;2)判断转换后单字的音标是否属于步骤1)中的音标库;若是,则进行步骤3);3)判断音标库中的转换后单字的音标是否是同词性的多音字或缩写字,若是,则进行步骤4);4)输出单字的音标检测结果。上述步骤1)的具体步骤是1. 1)收集权威字典的单字、音标;1. 2)对收集的单字和音标进行分析,建立音标转换表;1. 3)将音标转换表统一转化为标准音标库;上述不步骤2)中若转换后单字的音标不属于步骤1)中的音标库,则进行下面步骤2. 1)对音标库中的英文音标进行扫描,根据音标组合的词频找出组合次数少于或等于2的单字音标,若找到,则进行步骤2. 2);2. 2)对步骤2. 1)中找到的音标进行确认,确认完成的加入音标库。本发明的英文音标检测方法对数据中英文音标转化为标准音标并同事先建好的音标库比对检测。比对不存在的音标再通过扫描音标的组合,将音标组合出现频度很少的, 少于工具设定值的异常音标及其单字和所在位置生成档案供人工再核对,利用统计英文音标的组合频度自动对英文音标做合法性检测,发现问题点比较完全,提高了工作效率,节省了维护成本。


图1是本发明的方法流程图;图2是本发明的音标库建立方法流程图;图3. 1-图3. 2是本发明的具体实施例示意具体实施例方式参见图1、图2,本发明的英文音标检测方法,该方法包括以下步骤1)制作音标库,建立音标转换表,将单字的音标转换为标准国际音标;步骤1)的具体步骤是1. 1)收集权威字典的单字、音标;1. 2)对收集的单字和音标进行分析,建立音标转换表;1. 3)将音标转换表统一转化为标准音标库;1. 4)过滤去掉重复的音标。2)判断转换后单字的音标是否属于步骤1)中的音标库;若是,则进行步骤3);若转换后单字的音标不属于步骤1)中的音标库,则进行下面步骤2. 1)对音标库中的英文音标进行扫描,根据音标组合的词频找出组合次数少于或等于2的单字音标,若找到,则进行步骤2. 2);2. 2)对步骤2. 1)中找到的音标进行确认,确认完成的加入音标库;3)判断音标库中的转换后单字的音标是否是同词性的多音字或缩写字,若是,则进行步骤4);4)输出单字的音标检测结果。英语音标是对英语发音的一种标注方法,但各种英文字典的标注并不完全相同。 以下以单字“happy”举例在四本字典中不同的音标标注,参见表一;其实这四本字典对于 “happy”的发音基本相同,只是标注略有差异。表一
单字词典音标happyThe American Heritage Dictionary of the English Languagehap’ eCollins English Dictionary□ h^pithe Random House Dictionaryhap-eethe Oxford Advanced Learner's Dictionary□ h^pi
通过以上分析我们采用如下方法1)首先搜集权威字典的音标标注,分析其标注方法,然后将不同字典的标注都转为国际音标或KK的标注并形成最大集合的音标库。有些字典的音标无法正常显示就用Unicode代码页示。2)相同首字母,按照词性区分。多种发音用“;”隔开。3)对音标库中的英文音标进行扫描,新辞典或数据的单字是否在音标库中,不在的或特殊的非唯一的(多音字/缩写字)人工double check。4)对音标库中的英文音标进行扫描,根据音标组合的词频找出组合次数少于或等于2的单字音标,最后对检测结果生成报告文档。人工确认修改,特殊的经确认OK的加入音标总库中。将以上四部份功能进行整合,最后生成英文音标检测工具.本发明的具体实施方式
参见图3. 1,图3. 2 利用权威英文字典或搜集整理经过人工检查正确的英文单字及音标,分析其不同字典音标的标注,建立转化表,转化为统一格式的标准音标库并过滤掉重复的。使用工具打开工具,根据具体路径选取各文件,如图3. 1所示打开要处理的字典文件E :New dictionary\Ec diet, txt音标库文件:E standard File, t xt扫描生成疑似错误音标文件E :0ut Put File\Error.txt工具的设定选取后可对工具监测的严格程度设定可以选取要检测的音标组合最小至最大,如图3. 2,选取2 3 ;可以选取要检测的音标组合最大出现频度,如2 ;完成后, 选取&ive Window,然后Exit退出;之后执行工具。
权利要求
1.一种英文音标检测方法,其特征在于所述检测方法包括以下步骤1)制作音标库,建立音标转换表,将单字的音标转换为标准国际音标;2)判断转换后单字的音标是否属于步骤1)中的音标库;若是,则进行步骤3);3)判断音标库中的转换后单字的音标是否是同词性的多音字或缩写字,若是,则进行步骤4);4)输出单字的音标检测结果。
2.根据权利要求1所述的英文音标检测方法,其特征在于所述步骤1)的具体步骤是1.1)收集权威字典的单字、音标;1. 2)对收集的单字和音标进行分析,建立音标转换表;1.3)将音标转换表统一转化为标准音标库;
3.根据权利要求2所述的英文音标检测方法,其特征在于所说不步骤幻中若转换后单字的音标不属于步骤1)中的音标库,则进行下面步骤2.1)对音标库中的英文音标进行扫描,根据音标组合的词频找出组合次数少于或等于 2的单字音标,若找到,则进行步骤2. 2);2.2)对步骤2.1)中找到的音标进行确认,确认完成的加入音标库。
全文摘要
本发明提出了一种英文音标检测方法,包括以下步骤1)制作音标库,建立音标转换表,将单字的音标转换为标准国际音标;2)判断转换后单字的音标是否属于步骤1)中的音标库;若是,则进行步骤3)判断音标库中的转换后单字的音标是否是同词性的多音字或缩写字,若是,则进行步骤4)输出单字的音标检测结果。本发明的英文音标检测方法,利用统计英文音标的组合频度自动对英文音标做合法性检测,发现问题点比较完全,提高了工作效率,节省了维护成本。
文档编号G06F17/21GK102207931SQ20111013678
公开日2011年10月5日 申请日期2011年5月26日 优先权日2011年5月26日
发明者蒋阳安, 陈淮琰 申请人:无敌科技(西安)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1