一种音形双模中文输入方法、系统、设备和计算机可读存储介质与流程

文档序号:21175827发布日期:2020-06-20 17:28阅读:151来源:国知局
一种音形双模中文输入方法、系统、设备和计算机可读存储介质与流程

本发明涉及中文输入方法的技术领域,具体地涉及一种音形双模中文输入方法、系统、设备和计算机可读存储介质。



背景技术:

目前,计算机的发明与应用为生活带来了极大的便利。如何将非拼音式文字的输入计算机,一直以来都是一个问题。

在计算机引入中国初期,计算机的计算与存储能力受限严重。此时汉字输入主流研究倾向于使用“字形码”,即通过对于汉字的分解,使用固定长度的击键序列,唯一的确定一个汉字或词组。以“五笔字型输入法”(cn85100837a)为代表的字形码从汉字书写的角度出发,在需要准确输入一个汉字的场合具有极大的优势。但因为汉字具有的,以偏旁部首的形式相互组合成新的汉字的特性,在不使用分隔符的前提下,无法进行多个词组的连续输入。同时现有字形输入法的学习难度也比较高。

随着计算机计算存储能力的发展,计算机有能力存储大量词组,并可以通过统计学概率计算来选择最有可能出现的词组。此时对于汉字输入的主流研究开始转向更容易操作的“字音码”,即通过输入整个句子的发音,计算机通过读取预先存储的数据,并进行概率计算来确定用户要输入的内容。以“紫光拼音输入法”与各种云计算拼音输入法为代表,在日常语句的输入方面,字音码已经成为广大用户不二的选择。但是当输入人名,专有名词等,前后文关联不强,同时没有被收录进词库的内容,从大量同音字中寻找一个汉字非常困难。

为了解决上面两种输入法的问题,人们设计了“音形码”。以“自然码”(cn1107897c)和“小鹤音形”为代表,以拼音的方式输入发音,添加若干字形辅助码组成完整的汉字编码。相比“字形码”降低了学习难度。同时还有但依旧没有很好的解决连续输入问题。

同时还出现了以“搜狗拼音输入法”为代表的辅助码技术。但需要占用“tab”键作为辅助码开始标识,破坏了输入的节奏感;同时缺少相关文档,使得很多场合用户并不知道该如何拆字。



技术实现要素:

本发明所要解决的技术问题是提供一种音形双模中文输入方法,区别于需要安装多个输入法并反复切换,或小鹤音形或自然码等强制要求输入辅助码的方式,本方案允许同步使用纯音码和纯形码而无需进行切换。

已有的许多输入法只追求易用性或追求更低的重码率,但并不能很好的融合双方面的要求。因此这些输入法虽然在上述两个性能指标的某一个上可能做的比较优秀,但在应对复杂的输入场景时却暴露不足。本发明克服了这个缺点。在保证易用性与拼音输入法高度一致的前提下,本发明补充了基于字形的单字输入方式,在输入准确与操作连贯方面具有明显优势。

通过本发明可以实现的技术目的不限于上文已经特别描述的内容,并且本领域技术人员将从下面的详细描述中更加清楚地理解本文中未描述的其他技术目的。

本发明解决上述技术问题的技术方案如下:

根据本公开的一方面,本发明提供一种音形双模中文输入方法,所述方法包括:

用户自定义设置拼音编码规则和字形编码规则;

在用户输入时,通过使用前后文概率计算的方式推算可能的拼音输入,并将按照字形输入计算得到的可能的输入的内容在显示器的固定位置处呈现;

用户输入同时参与拼音编码和字形编码的计算。其中使用拼音编码规则计算时,输入的中文参与概率计算,使用字形编码规则计算时,输入的中文不参与概率计算。可能的拼音输入的内容与可能的字形输入的内容同时在显示器处呈现而无需切换,也无需额外的按键进行字形输入。

可选地,在如上所述的方法中,所述拼音编码规则包括全拼、双拼、注音编码规则,所述字形编码规则包括仓颉、五笔、拆字编码规则。

根据本公开的一方面,本发明提供一种音形双模中文输入系统,其特征在于,所述系统包括:

处理器;

输入装置;

显示器;

所述处理器被配置为执行以下方法,所述方法包括:

通过所述输入装置,用户自定义设置拼音编码规则和字形编码规则;

在用户通过所述输入装置输入中文时,通过使用前后文概率计算的方式推算可能的拼音输入,并将按照字形输入计算得到的可能的输入的内容在显示器的固定位置处呈现;

用户输入同时参与拼音编码和字形编码的计算。其中在使用拼音编码规则计算时,输入的中文参与概率计算,在使用字形编码规则计算时,输入的中文不参与概率计算。可能的拼音输入的内容与可能的字形输入的内容同时在显示器处呈现而无需切换,也无需额外的按键进行字形输入。

可选地,在如上所述的系统中,所述拼音编码规则包括全拼、双拼、注音编码规则,所述字形编码规则包括仓颉、五笔、拆字编码规则。

可选地,在如上所述的系统中,所述可能的字形输入的内容在所述可能的拼音输入的内容之后的固定位置处呈现。

根据本公开的一方面,本发明提供一种音形双模中文输入设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的音形双模中文输入方法的步骤。

根据本公开的一方面,本发明提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如上所述的音形双模中文输入方法的步骤。

本发明的关键内容在于:针对每个人都会遇到的,不可避免地要输入诸如姓名、古文、专业词汇一类的内容的场合。临时应用字形输入法,来准确有效的输入希望输入的汉字。因为这一类内容不符合中文的统计学规律,拼音输入法无法高效的计算需要输入的内容。而基于字形输入法的优势恰恰在于其确定性:通过对于字形的编码,实现准确的输入。

技术实现方面同样应用了字形输入法的输入序列和字符几乎一一对应的特征。将所有合法的单字编码整理为一份单独的码表。在使用统计学模型计算可能的合法输入内容同时,如果匹配到字形码表中某一合理编码,将此汉字呈现在非第一位的某一固定位置。选择非第一位的理由是为了保证拼音输入体验的连贯性,而选择将此选项某一固定位置的理由是为了延续字形输入法的确定性。基于查表并在固定位置展示的方式,与基于统计模型计算按照概率排序的方式不矛盾,因此可以同时展示两种输入模式的结果。

上述技术方案仅为本发明实施例的一些部分,本领域技术人员从以下本发明的详细描述中可以导出和理解包含了本发明的技术特征的各种实施例。

本领域技术人员将会理解,通过本发明可以实现的效果不限于上文已经具体描述的内容,并且从以下详细说明中将更清楚地理解本发明的其他优点。

附图说明

被包括以提供对本发明的进一步理解的附图示出本发明的实施例,并且与说明书一起用于解释本发明的原理。

图1为本发明实施例提供的一种音形双模中文输入方法的流程图。

图2为本发明实施例提供的一种音形双模中文输入方法的界面的示意图。

图3为本发明实施例提供的一种音形双模中文输入系统的示意图。

图4为本发明实施例提供的一种音形双模中文输入设备的示意图。

具体实施方式

现在将详细参考本发明的示例性实施例,其示例在附图中示出。下面将参考附图给出的详细描述旨在解释本发明的示例性实施例,而不是示出可以根据本发明实现的唯一实施例。以下详细描述包括具体细节以便提供对本发明的透彻理解。然而,对于本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下实践本发明。

在一些情况下,已知的结构和设备被省略或以框图形式示出,集中于结构和设备的重要特征,以免模糊本发明的概念。在整个说明书中将使用相同的附图标记来表示相同或相似的部分。

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

在本发明的描述中,需要理解的是,术语“上”、“下”、“中心”、“内”、“外”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例1

本发明实施例提供一种音形双模中文输入方法。所述方法包括:用户自定义设置拼音编码规则和字形编码规则;在用户输入时,通过使用前后文概率计算的方式推算可能的拼音输入,并将按照字形输入计算得到的可能的输入的内容在显示器的固定位置处呈现;用户输入同时参与拼音编码和字形编码的计算。其中在使用拼音编码规则计算时,输入的中文参与概率计算,在使用字形编码规则计算时,输入的中文不参与概率计算。可能的拼音输入的内容与可能的字形输入的内容同时在显示器处呈现而无需切换,也无需额外的按键进行字形输入。根据本发明的实施例,拼音编码规则包括全拼、双拼、注音编码规则。根据本发明的实施例,所述字形编码规则包括仓颉、五笔、拆字编码规则。根据本发明的实施例,所述可能的字形输入的内容可以在所述可能的拼音输入的内容之后的固定位置处呈现。

根据具体的实施方式,将用户输入的内容分两路,进入拼音编码处理程序和字形编码处理程序。拼音编码处理程序接收了用户设置的拼音编码规则;同时字形编码处理程序则接收用户设置的字形编码规则。两个处理程序的输出一起送进一个综合排名器,在综合排名器中将字形处理器的输出插入到拼音处理器输出的固定序号处。然后将此排序内容送到界面显示,如图1所示。

根据本发明的具体实施方式,本发明在拼音输入法的基础上集成字形编码。当用户输入序列匹配到某一汉字或词组的字形编码序列时,在显示器的固定的选项(或界面的固定位置)处显示与字形编码对应的汉字。

本输入法整体表现为基于统计模型的拼音输入法。在输入词组或整句时,通过称为“联想”的概率计算方式,即根据用户给出的输入序列,根据预先保存的前后文概率模型,计算所有可能的汉字组合出现的概率,进而推导出用户想要输入的汉字内容。大多数人在使用计算机时,输入符合中文统计学规律的内容(通常为聊天写文章等,符合现代汉语语法现象的内容)的机会较高。而拼音输入法对于输入这类内容具有极大的优势。因此将能够更好的适应这种场合的,通过拼音输入模型计算出的输入内容放在最前。

根据本发明的具体实施方式,拼音输入部分可以根据用户的需求,选择使用标准汉语拼音方案(俗称“全拼”),或使用某种声韵各使用一个字母的方案(俗称“双拼”)。例如使用自然码双拼方案时,“vr”对应“zhuan”,“li”依旧表示“li”,合起来可以表示“zhuanli”的拼音。而在输入“vrliufqy”的时候,按照“zhuanlishenqing”参与计算,根据概率模型可以计算出“专利申请”这样的组合出现概率远高于“专利深情”,因此在第一个候选项的位置展现“专利申请”这一内容。

根据本发明的具体实施方式,字形输入部分同样可以根据用户的需求进行选择。例如,熟悉五笔字形输入法的用户可以在第5个备选选项的位置固定展示五笔输入法的结果(只处理单字)。同时提供了基于拼音的字形编码:将汉字拆解为若干个,在gb2312(信息交换用汉字编码字符集)中的字符。例如在选择了全拼和五笔字形组合时,在用户输入“de”时,输入法的前四位会展现出「1.的2.地3.得4.德」,而第五位开始(具体开始的位置可以由用户指定)会出现「5.胡」,如图2所示。而胡的五笔编码恰恰是“de”。又如当用户选择了自然码和仓颉输入法的组合时,用户输入“ehgr”的时候,前几位会出现「1.王冠2.网管3.忘关4.网关」,而由用户指定的第五位将会出现仓颉输入法的单字结果「5.浩」。

考虑到不熟悉五笔字形输入法或其他字形输入法的用户,本输入方案同时提供了基于gb2312(信息交换用汉字编码字符集)中收录的字符的字形编码。只需按照书写顺序,依次输入对应汉字的各个组件的名称第一个声母,应用同样的法则,从某一个用户自定义的序号开始,提供若干基于字形码的输入选项。

通过本发明的技术方案,可以在享受基于大数据的拼音输入法带来的便捷的同时,应用字形编码来克服拼音输入法选字难的缺点。同时无需切换输入法操作,并且省略了现有拼音输入法输入辅助码前的“tab”引导字符。用户可以在预料到接下来输入的词组无法被拼音输入法计算时,临时应用字形输入而不破坏整体体验。

根据本发明的具体实施方式,“双拼”+“五笔”的方案可以达到最高的输入效率,例如日常文本2.0次击键每字,专有名词平均2.7次击键每字,根据二者出现的比例,此输入方案的平均击键序列长度在2.0-2.7之间,优于绝大多数字形码。同时根据用户的习惯,在一定程度上消除选字带来的困扰。在设定字形方案选项从5(第5个选项位置)开始,一页合计显示7条备选字的场合,仅有不足1%的汉字需要翻页查找。

根据本发明的具体实施方式,如图2所示,在输入“de”的时候,前四个选项为拼音对应的输入内容,第五个选项被设置为五笔输入法对应的“胡”,通过这个选项可以随时便捷地调用五笔输入法输入单独的汉字。

实施例2

根据本发明的实施例,本发明还提供一种音形双模中文输入系统,如图3所示,所述系统包括:处理器32;输入装置30;显示器34;所述处理器32被配置为执行以下方法,所述方法包括:通过所述输入装置30,用户自定义设置拼音编码规则和字形编码规则;在用户通过所述输入装置30输入中文时,通过使用前后文概率计算的方式推算可能的拼音输入,可能的字形输入的内容在所述显示器34的固定位置处呈现;其中如果用户输入使用拼音编码规则,则输入的中文参与概率计算,如果用户输入使用字形编码规则,则输入的中文不参与概率计算可能的拼音输入的内容与可能的字形输入的内容同时在所述显示器34处呈现而无需切换,也无需额外的按键进行字形输入。可选地,在如上所述的系统中,所述拼音编码规则包括全拼、双拼、注音编码规则,所述字形编码规则包括仓颉、五笔、拆字编码规则。可选地,在如上所述的系统中,所述拼音编码规则是双拼编码规则,所述字形编码规则是五笔编码规则。可选地,在如上所述的系统中,所述可能的字形输入的内容在所述可能的拼音输入的内容之后的固定位置处呈现。

实施例3

根据本发明的实施例,本发明提供一种音形双模中文输入设备,如图4所示,包括:存储器40、处理器42及存储在所述存储器10上并可在所述处理器42上运行的计算机程序,所述计算机程序被所述处理器42执行时实现如上实施例1中所述的音形双模中文输入方法的步骤。

实施例4

根据本发明的实施例,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如上实施例1中所述的音形双模中文输入方法的步骤。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

如上所述,已经给出了本发明的优选实施例的详细描述,以使本领域技术人员能够实施和实践本发明。虽然已经参照示例性实施例描述了本发明,但是本领域技术人员将会理解,在不脱离所附权利要求书中描述的本发明的精神或范围的情况下,可以在本发明中进行各种修改和改变。因此,本发明不应限于在此描述的特定实施例,而应被赋予与本文公开的原理和新颖特征一致的最宽范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1