一种中文语音输入法及语句定位与纠错方法

文档序号:9396503阅读:594来源:国知局
一种中文语音输入法及语句定位与纠错方法
【技术领域】:
[0001 ] 本发明应用于台式电脑、笔记本电脑、手机、平板电脑及其他语音输入的平台。
【背景技术】:
[0002] 随着语音输入技术的飞速发展以及在手机上的普及应用,人们对于打字技术,越 来越青睐和追求【君子动口不动手】的境界。目前的语音输入法技术基本上是语音输入系统 在获取人的语音后,对语音信号直接进行解码得到文字,然后反馈给用户。这种语音解码的 输入模式,其语音分析结果受制于语音速度,停顿时间,因而导致识别率差,准确率不高。而 且,语音输入解析后得到的文字,是直接进入文档中,发生文字识别错误时,修改费时费力。
[0003] 本发明通过采用将用户口音矫正为普通话标准音,再转换为键盘汉语拼音,其语 音分析结果相当于汉语拼音打字,它不受语音速度和停顿时间的影响,再加上利用系统拼 音字词库、语料库和云输入技术,大大的提高了语音识别的准确率;同时,本发明采用输入 法界面,语音输入转换的文字不是直接上屏幕文档而是缓存在输入法界面的语句行中,并 且对语句汉字采用数字标序定位,大大的方便了语音识别错误的修改。

【发明内容】

[0004] -种中文语音输入法及语句定位与纠错方法,其特征是:将人类语言同步转化成 键盘语言(即将语音输入同步转换为拼音输入)并同步识别出汉字缓存在输入法界面语句 行,并对语句行汉字及拼音音节用数字序标定位并纠正错误,语音输入流程包括语音过滤、 语音矫正、语言转换,汉字识别、序标定位、汉字纠错等过程,其中:
[0005] 语音过滤过程的功能是:将由话筒传输过来的语音(包括周围环境噪音和杂音), 通过设置声音的振幅、频率、波长、声响、音调、音色等各种技术参数的阈值,过滤各种噪音 及杂音甄别出当前行为人的语音(即实施中文输入行为者的口音)。
[0006] 语音矫正过程的功能是:将行为人的非标准普通话语音(即行为人的口音)同步 校正为系统预置的标准普通话语音。
[0007] 语言转换过程的功能是:将人类语言同步转换为键盘语言,即将人的标准普通话 语音流同步转换为键盘汉语拼音音节序列。
[0008] 汉字识别过程的功能是:同步对照汉语拼音识别出汉字并输出到输入法界面语句 行。
[0009] 序标定位过程的功能是:在语句行的汉字及音节正下方用数字序标定位标序。 [0010] 汉字纠错过程的功能是:应用序标定位功能,纠正语音输入中识别错误的汉字。 [0011] 使用语音输入法,先要开启语音输入法界面,界面由语句行和候选汉字版面组成。
[0012] 语句行是长条框,分文本行与拼音行,文本行缓存语句汉字,拼音行缓存语句拼音 音节序列,语音输入识别转换而来的汉字不是直接上屏幕而是先缓存显示在输入法界面的 语句行中,语句行可显示20个汉字,当语句超过20个汉字时,前面的汉字会自动顶入屏幕。 按【空格】或【回车】键,可把语句行文字输上屏幕。 CN 105117034 A 兄明 2/3 页
[0013] 在语句行中缓存显示的汉字,系统会用数字在汉字正下方定位标序,前10个汉 字以数字①、②、③、④、⑤、⑥、⑦、⑧、⑨、◎的排序方式定位标序,后10个汉字以数字〇、 θ、Θ、?、β、Θ、β、Θ、Φ、Θ的排序方式定位标序;(本方案,在具体的软件输入法 中,前10个数字序标也可以用绿色1234567890来标识,后10个数字序标也可采用红色 1234567890 来标识)。
[0014] 语句行中的汉语拼音,用音节分隔符【·】自然分割,一个音节对应于一个汉字, 一个汉字对应于一个音节,系统在对汉字定位标序的同时也用相同序标对拼音音节定位标 序。
[0015] 候选汉字版面为分栏式方形框,位于语句行上面,显示当前语音的候选字词。
[0016] 语音输入,难免会发生两种错误:一种是口语语音矫正为普通话标准音时发生错 误,从而导致转换的汉语拼音错误,识别的汉字错误;一种是普通话标准音转换成汉语拼音 时发生同音字错误。当语音输入发生汉字识别错误时,可采用下列方法修改:
[0017] 方法一,语句移位修改:按错误字前面字的序标号,让错误字前面的所有正确字上 屏幕,剩余的汉字重新定位标序,同时,光标反白定位在错误字上,选取正确候选字替代错 误字,或者重新输入正确的语音。
[0018] 序标为①、②、③、④、⑤、⑥、⑦、⑧、⑨、◎的汉字,直接按键盘上的数字键上屏幕; 序标为0、?、?、0、Θ、Θ、β、?、?、Θ的汉字,按【〇+数字】上屏幕。
[0019] 方法二,光标定位修改:移动光标,定位到错误字处修改,当光标定位汉字时,汉字 会反白显示。
[0020] 方法三,序标定位修改:序标为①、②、③、④、⑤、⑥、⑦、⑧、⑨、◎的汉字,按 【Ctrl+数字】,一键快速定位到错误字处;序标为〇、?、β、?、β、Θ、β、?、Θ、Θ 的汉字,按【Alt+数字】,一键快速定位到错误字处。
[0021] 采用光标定位修改和序标定位修改,光标在定位和反白汉字的同时也定位和反白 汉字对应的拼音音节。
[0022] 本方案用来给汉字及音节定位标序的序标,不限定于①、②、③、④、⑤、⑥、⑦、⑧、 ⑨、◎、0、β、Θ、?、θ、Θ、β、θ、?、Θ序列,可以采用其他数字形式、字母或者符 号组合标序,也可以同时采用1、2、3、4、5、6、7、8、9、0以前后组不同的颜色区分来标序;序 标的位置,不限定于汉字及音节的正下方,也可以在正上方,或是上标或下标。
【附图说明】
[0023] 图1:语音输入流程图。
[0024] 图2 :语音输入过程输入法界面示意图。
[0025] 图3 :语句修改--语句移位。
[0026] 图4 :语句修改--光标定位或序标定位。
【具体实施方式】:
[0027] 要使用语音输入,必须先开启语音输入法,显示输入法界面。按【空格】或【回车】 键,可把语句行文字输上屏幕文档。
[0028] 当用户对着话筒说【语音输入
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1