一种排序方法及其装置的制造方法

文档序号:9579378阅读:290来源:国知局
一种排序方法及其装置的制造方法
【技术领域】
[0001]本发明涉及文字输入技术领域,尤其涉及一种排序方法及其装置。
【背景技术】
[0002]随着办公自动化的发展,电子文档的输入已经取代了传统的手写文字输入。如果能有效地提高文字的输入速度,那么就能在一定程度上提高办公效率。目前广泛使用的文字输入法的重字率都较高,出现重字时需要在输入候选框中花费一定的时间来寻找目标文字。
[0003]为解决上述问题,现有技术采用的方法是,当出现重字时,使用频率越高的文字,出现在输入候选框中的位置越靠前,从而在一定程度上提高了文字输入的速度。然而,上述方法不具有针对性,不能针对特定文档提高文字输入速度。

【发明内容】

[0004]为解决上述问题,本发明提供一种排序方法及其装置,用于解决现有技术不具有针对性,不能针对特定文档提高文字输入速度的问题。
[0005]为此,本发明提供一种排序方法,包括:
[0006]对文档进行语义分析以获取文档的类别特征;
[0007]根据所述类别特征对输入候选框的词汇进行排序。
[0008]可选的,所述类别特征包括题材特征、思想特征和感情特征中的一个或多个。
[0009]可选的,所述根据所述类别特征对输入候选框的词汇进行排序的步骤包括:
[0010]将所述类别特征与词库中词汇的类别特征进行匹配;
[0011 ]根据匹配结果对输入候选框的词汇进行排序。
[0012]可选的,所述对文档进行语义分析以获取文档的类别特征的步骤之前包括:
[0013]形成词库,所述词库包括多个词汇和与每个词汇对应的类别特征。
[0014]可选的,所述根据匹配结果对输入候选框的词汇进行排序的步骤包括:
[0015]若匹配结果为匹配度高,将所述词汇设置在所述输入候选框的靠前位置;
[0016]若匹配结果为匹配度低,将所述词汇设置在所述输入候选框的靠后位置。
[0017]本发明还提供一种排序装置,包括第一获取单元和第一排序单元;
[0018]所述第一获取单元用于对文档进行语义分析以获取文档的类别特征;
[0019]所述第一排序单元用于根据所述类别特征对输入候选框的词汇进行排序。
[0020]可选的,所述类别特征包括题材特征、思想特征和感情特征中的一个或多个。
[0021]可选的,所述第一排序单元包括第一匹配模块和第一排序模块;
[0022]所述第一匹配模块用于将所述类别特征与词库中词汇的类别特征进行匹配;
[0023]所述第一排序模块用于根据匹配结果对输入候选框的词汇进行排序。
[0024]可选的,还包括第一形成单元;
[0025]所述第一形成单元用于形成词库,所述词库包括多个词汇和与每个词汇对应的类别特征。
[0026]可选的,所述第一排序模块包括第一设置子模块和第二设置子模块;
[0027]所述第一设置子模块用于若匹配结果为匹配度高,将所述词汇设置在所述输入候选框的靠前位置;
[0028]所述第二设置子模块用于若匹配结果为匹配度低,将所述词汇设置在所述输入候选框的靠后位置。
[0029]本发明具有下述有益效果:
[0030]本发明提供的排序方法及其装置中,所述排序方法对文档进行语义分析以获取文档的类别特征,根据所述类别特征对输入候选框的词汇进行排序,从而能够进行更精准的目标文字匹配,使得目标文字在出现多个重字时显示在输入候选框的靠前位置,以减少用户寻找目标文字的时间,最终提高了文字输入的速度。
【附图说明】
[0031]图1为本发明实施例一提供的一种排序方法的流程图;
[0032]图2为本发明实施例二提供的一种排序装置的结构示意图;
[0033]图3为图2所示排序装置的具体结构示意图。
【具体实施方式】
[0034]为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的排序方法及其装置进行详细描述。
[0035]实施例一
[0036]图1为本发明实施例一提供的一种排序方法的流程图。如图1所示,所述排序方法包括:
[0037]步骤1001、对文档进行语义分析以获取文档的类别特征。
[0038]可选的,所述类别特征包括题材特征、思想特征和感情特征中的一个或多个。优选的,所述类别特征包括题材类型、主题思想和感情色彩。需要说明的是,本实施例只针对题材类型、主题思想和感情色彩三种类别特征进行描述,但是本发明要求保护的类别特征并不限于上述三种情况,其它类别特征只要能够作为对输入候选框的词汇进行排序的依据都属于本发明的保护范围。
[0039]本实施例中,所述文档为已输入文档,通过对已输入文档的语义分析和推理,判断出文档的题材类型、主题思想和感情色彩。由于文字输入是通过一个字或者一个词进行输入的,因此整个文档输入是一个连续的过程。本实施例可以间隔预定的时间获取已输入的文字,对已输入文档进行语义分析,从而获取当前时间的输入文档的题材类型、主题思想和感情色彩。通过上述方式,可以不断更新文档的题材类型,主题思想以及感情色彩。
[0040]本实施例所述语义分析是基于本体的语义推理。具体来说,在相关领域专家的帮助下,构建相关领域的领域本体。本体是一种复杂的知识网络,领域本体实际上就是对特定领域之中特定概念以及概念之间关系的形式化表达。具体来说,获取输入文档后,从领域本体中读取与所述输入文档相关的概念、关系、规则和定理,借助语义解析和推理工具,在语义层面对输入文档进行概念分析、关系校验和关系推理,从而实现对输入文档的语义分析,最终判断出文档的题材类型、主题思想和感情色彩。本实施例将输入文档的题材类型、主题思想和感情色彩作为整篇文档的题材类型、主题思想和感情色彩。也就是说,本实施例将输入文档的类别特征作为整篇文档的类别特征。
[0041]步骤1002、根据所述类别特征对输入候选框的词汇进行排序。
[0042]本实施例中,所述对文档进行语义分析以获取文档的类别特征的步骤之前包括:形成词库,所述词库包括多个词汇和与每个词汇对应的类别特征。需要说明的是,本发明所述的“词汇”是一种广义词汇,包括单个的字和由多个字组成的词。
[0043]本实施例中,词库中每个词汇具有至少一个类别特征。优选的,所述词汇具有三个类别特征:题材类型、主题思想和感情色彩,也就是标明本词汇通常用于哪些题材类型的文档中,通常用于什么主题思想的文档中,通过用于表达什么感情色彩。因此,词库中存储有所有常用词汇以及每个词汇对应的上述三个类别特征。当然,词库也是在动态调整的,需要时也可以形成新的词汇和与所述新的词汇对应的类别特征。另外,用户在输入文档时发现词库中没有需要的词汇,则可以根据需要自己形成词汇,再将上述新形成词汇存储在词库中,而且将文档的三个类别特征(文档输入完成后最终确定的三个类别特征)作为新形成词汇的类别特征也存储在词库中,从而完成对词库的更新。
[0044]可选的,所述根据所述类别特征对输入候选框的词汇进行排序的步骤包括:将所述类别特征与词库中词汇的类别特征进行匹配;根据匹配结果对输入候选框的词汇进行排序。优选的,所述根据匹配结果对输入候选框的词汇进行排序的步骤包括:若匹配结果为匹配度高,将所述词汇设置在所述输入候选框的靠前位置;若匹配结果为匹配度低,将所述词汇设置在所述输入候选框的靠后位置,从而能够进行更精准的目标文字匹配,使得目标文字在出现多个重字时显示在输入候选框的靠前位置,以减少用户寻找目标文字的时间,最终提高了文字输入的速度。
[0045]本实施例中,将输入文档的三个类别特征与词库中词汇的三个类别特征进行匹配,从而使得在出现重字时,匹配率高的词汇优先出现在输入候选框中靠前的位置。也就是说,根据文档的题材类型、主题思想和感情色彩对用户词库进行动态调整,对用户输入候选框中的文字进行优先性排序,使得目标文字排序靠前。
[0046]本实施例提供的排序方法对文档进行语义分析以获取文档的类别特征,根据所述类别特征对输入候选框的词汇进行排序,从而能够进行更精准的目标文字匹配,使得目标文字在出现多个重字时显示在输入候选框的靠前位置,以减少
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1