一种词典笔的文字识别方法及装置与流程

文档序号:11729798阅读:537来源:国知局
一种词典笔的文字识别方法及装置与流程

本发明属于计算机技术领域,尤其涉及一种词典笔的文字识别方法及装置。



背景技术:

学生们只需使用词典笔对文字扫一扫,便能得到该文字的读音、释义以及翻译等信息,而不需要多次去翻查词典书,也不必每次上学携带笨重的词典书,可见词典笔的出现是学生群体的一大福音。

目前,大多数的词典笔都只限于识别印刷书本上的印刷体文字,而在日常生活中,手写稿件或材料(例如医生开出的处方单子)还是比较常见的,在印刷书本上也经常出现一些作家的手稿,由于手写体文字变化较大、极具个人风格,和印刷体文字的差别较大,只限于识别印刷体文字的词典笔并不能很好地识别手写体文字。



技术实现要素:

本发明的目的在于提供一种词典笔的文字识别方法及装置,旨在解决由于现有技术无法提供一种有效的词典笔的文字识别方法,使得词典笔通常只用于识别印刷体文字,而无法较好地识别手写体文字的问题。

一方面,本发明提供了一种词典笔的文字识别方法,所述方法包括下述步骤:

当接收到用户的扫描命令时,通过预设的扫描端获取待识别文字;

根据预设的手写字体库和印刷通用字体库,对所述待识别文字进行识别;

根据所述待识别文字对应的识别结果,在预设的词典库中获取所述待识别文字的文字信息,显示输出所述待识别文字的文字信息。

另一方面,本发明提供了一种词典笔的文字识别装置,所述装置包括:

扫描模块,用于当接收到用户的扫描命令时,通过预设的扫描端获取待识别文字;

识别模块,用于根据预设的手写字体库和印刷通用字体库,对所述待识别文字进行识别;以及

查询输出模块,用于根据所述待识别文字对应的识别结果,在预设的词典库中获取所述待识别文字的文字信息,显示输出所述待识别文字的文字信息。

本发明在接收到用户的扫描命令时,通过预设的扫描端获取待识别文字,并根据预设的手写字体库和印刷通用字体库,对待识别文字进行识别,在获得识别结果后,根据识别结果在预设的词典库中获取待识别文字的文字信息,最后显示输出该文字信息,从而通过在词典笔上增添手写字体库和印刷通用字体库,实现了词典笔上手写体文字和印刷通用字体文字的识别,有效地提高了词典笔的文字识别率。

附图说明

图1是本发明实施例一提供的词典笔的文字识别方法的实现流程图;

图2是本发明实施例二提供的词典笔的文字识别装置的结构示意图;以及

图3是本发明实施例二提供的词典笔的文字识别装置的优选结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述:

实施例一:

图1示出了本发明实施例一提供的词典笔的文字识别方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:

在步骤s101中,当接收到用户的扫描命令时,通过预设的扫描端获取待识别文字。

本发明实施例适用于具有文字扫描功能的词典笔。在接收到用户的扫描命令后,打开预设的扫描端,并通过扫描端扫描用户指定区域的文字,以获取这些文字。具体地,预设的扫描端可位于词典笔的笔尖处,扫描端可获取到用户指定区域的所有文字,待识别文字可为这些文字中的一个或多个文字。

在步骤s102中,根据预设的手写字体库和印刷通用字体库,对待识别文字进行识别。

在本发明实施例中,手写字体库中存储了多种手写字体的文字,具体可从网络或者由用户输入得到这些手写字体,印刷通用字体库中存储了在印刷文本上通用字体的文字。当获取到待识别文字后,可先提取待识别文字的特征,将该特征与印刷通用字体库中文字的特征进行匹配,当匹配成功时,获取印刷通用字体库中与待识别文字匹配成功的文字,该文字即待识别文字的识别结果。

当待识别文字的特征与印刷通用字体库中文字的特征匹配失败时,可将待识别文字的特征与手写字体库中文字的特征进行匹配,当匹配成功时,获取手写字体库中与待识别文字匹配成功的文字,接着,根据手写字体库与印刷通用字体库之间预先建立好的文字映射关系,获取手写字体库中匹配成功的文字在印刷通用字体库中对应的文字,此时,印刷通用字体库中对应的文字即待识别文字的识别结果。

可选地,可先建立印刷通用字体库,再获取印刷通用字体库中文字对应的手写字体,再建立手写字体库,把这些手写字体存储在手写字体库中,同时根据手写字体库中文字和印刷通用字体库中文字的对应关系,建立手写字体库和印刷通用字体库之间的文字映射关系,具体地,一个印刷通用字体的文字可对应多个不同手写字体的文字。

在步骤s103中,根据待识别文字对应的识别结果,在预设的词典库中获取待识别文字的文字信息,显示输出待识别文字的文字信息。

在本发明实施例中,待识别文字在印刷通用字体库和手写字体库中匹配后,得到对应的文字,该对应的文字即为识别结果,在词典库中查找该文字的文字信息,并将该文字信息设置为待识别文字的文字信息,最后显示输出待识别文字的文字信息。具体地,词典库中存储着多类文字的文字信息,其中,文字信息可包括文字的读音、释义、组词以及翻译等。具体地,可通过语音、文字等方式输出待识别文字的文字信息。

在本发明实施例中,在扫描获取到待识别文字后,通过预设的手写字体库中和印刷通用字体库对待识别文字进行识别,再根据识别结果,在预设的词典库中获取待识别文字对应的文字信息,最后显示输出待识别文字的文字信息,从而实现了词典笔对印刷字体和手写字体的识别,有效地提高了词典笔的文字识别率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如rom/ram、磁盘、光盘等。

实施例二:

图2示出了本发明实施例二提供的词典笔的文字识别装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:

扫描模块21,用于当接收到用户的扫描命令时,通过预设的扫描端获取待识别文字。

在本发明实施例中,在接收到用户的扫描命令后,打开预设的扫描端,并通过扫描端扫描用户指定区域的文字,以获取这些文字。具体地,预设的扫描端可位于词典笔的笔尖处,扫描端可获取到用户指定区域的所有文字,待识别文字可为这些文字中的一个或多个文字。

识别模块22,用于根据预设的手写字体库和印刷通用字体库,对待识别文字进行识别。

在本发明实施例中,手写字体库中存储了多种手写字体的文字,具体可从网络或者由用户输入得到这些手写字体,印刷通用字体库中存储了在印刷文本上通用字体的文字。当获取到待识别文字后,可先提取待识别文字的特征,将该特征与印刷通用字体库中文字的特征进行匹配,当匹配成功时,获取印刷通用字体库中与待识别文字匹配成功的文字,该文字即待识别文字的识别结果。

当待识别文字的特征与印刷通用字体库中文字的特征匹配失败时,可将待识别文字的特征与手写字体库中文字的特征进行匹配,当匹配成功时,获取手写字体库中与待识别文字匹配成功的文字,接着,根据手写字体库与印刷通用字体库之间预先建立好的文字映射关系,获取手写字体库中匹配成功的文字在印刷通用字体库中对应的文字,此时,印刷通用字体库中对应的文字即待识别文字的识别结果。

查询输出模块23,用于根据待识别文字对应的识别结果,在预设的词典库中获取待识别文字的文字信息,显示输出待识别文字的文字信息。

在本发明实施例中,待识别文字在印刷通用字体库和手写字体库中匹配后,得到对应的文字,该对应的文字即为识别结果,在词典库中查找该文字的文字信息,并将该文字信息设置为待识别文字的文字信息,最后显示输出待识别文字的文字信息。具体地,词典库中存储着多类文字的文字信息,其中,文字信息可包括文字的读音、释义、组词以及翻译等。具体地,可通过语音、文字等方式输出待识别文字的文字信息。

优选地,如图3所示,词典笔的文字识别装置还包括初始化模块31,其中:

初始化模块31,用于根据印刷通用字体库,获取印刷通用字体库中文字对应的手写字体,并根据手写字体,建立手写字体库和文字映射关系。

在本发明实施例中,可先建立印刷通用字体库,再获取印刷通用字体库中文字对应的手写字体,再建立手写字体库,把这些手写字体存储在手写字体库中,同时根据印刷通用字体库中文字和手写字体库中文字的对应关系,建立印刷通用字体库和手写字体库之间的文字映射关系。具体地,一个印刷通用字体的文字可对应多个不同手写字体的文字。

优选地,如图3所示,识别模块22还包括第一匹配模块321、第一匹配结果获取模块322、第二匹配模块323、第二匹配结果获取模块324以及映射文字获取模块325,其中:

第一匹配模块321,用于提取待识别文字的特征,将待识别文字的特征与印刷通用字体库中文字的特征进行匹配;

第一匹配结果获取模块322,用于当待识别文字的特征与印刷通用字体库中文字的特征匹配成功时,获取印刷通用字体库中匹配成功的文字;

第二匹配模块323,用于当待识别文字的特征与印刷通用字体库中文字的特征匹配失败时,将待识别文字的特征与手写字体库中文字的特征进行匹配;

第二匹配结果获取模块324,用于当待识别文字的特征与手写字体库中文字的特征匹配成功时,获取手写字体库中匹配成功的文字;以及

映射文字获取模块325,用于根据手写字体库与印刷通用字体库之间预设的文字映射关系,获取手写字体库中匹配成功的文字在印刷通用字体库中对应的文字。

优选地,如图3所示,查询输出模块23包括文字信息获取模块331,其中:

文字信息获取模块331,用于获取待识别文字识别后对应的文字,在词典库中查找识别后对应文字的文字信息,将识别后对应文字的文字信息设置为待识别文字的文字信息。

在本发明实施例中,在扫描获取到待识别文字后,通过预设的手写字体库中和印刷通用字体库对待识别文字进行识别,再根据识别结果,在预设的词典库中获取待识别文字对应的文字信息,最后显示输出待识别文字的文字信息,从而实现了词典笔对印刷字体和手写字体的识别,有效地提高了词典笔的文字识别率。

在本发明实施例中,词典笔的文字识别装置的各模块可由相应的硬件或软件模块实现,各模块可以为独立的软、硬件模块,也可以集成为一个软、硬件模块,在此不用以限制本发明。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1