用于将重叠手写的笔画分割成一组或多组的方法和装置的制作方法

文档序号:6352389阅读:260来源:国知局
专利名称:用于将重叠手写的笔画分割成一组或多组的方法和装置的制作方法
技术领域
本发明的示例性实施方式涉及重叠手写的处理,并且更具体地,涉及将包括重叠手写的一系列笔画分割成一组或多组笔画。
背景技术
各种设备通过触摸屏或其他输入设备捕获或接收手写输入。例如,很多计算机、平板电脑、手机、个人数字助理(PDA)和其他类型的电子设备包括触摸屏,其允许用户如以手写的形式提供触觉输入。手写输入可由电子设备捕获,并且被处理以试图识别手写字符以便告知电子设备的未来动作,包括例如手写输入的表示的存储或传送。为了使字符识别更容易,手写输入通常被处理以便将手写输入分割成不同字符,如字母、数字或其他字符。存在几种不同的用于分割手写输入的技术。一种技术利用每个字符输入之间的暂停。根据该技术,用户接口,如触摸屏,只需要包括一个书写区域。用户可在该书写区域内书写一个字符。然后暂停,以便接收该字符并且清除该书写区域以为下一字符的接收准备好该书写区域。因此,每个字符输入之间的暂停用于手写的分割。另一种技术采用具有两个或更多书写区域,如两个或更多触摸屏的用户接口。用户可在这些书写区域中的一个中书写一个字符,然后可切换到其他书写区域以便写下一字符。当用户正在这些书写区域中的一个中书写字符时,之前书写在其他书写区域中的字符可被接收并处理,并且其他书写区域可接着被清除以便为下一字符的接收准备好该其他书写区域。因此,不同书写区域之间的切换用于手写的分割。再一种技术采用相当大的单个书写区域。在书写区域内,用户可以采用可比于将字符书写在一张纸上的方式一个接一个地连续书写几个字符。该技术利用位于所书写字符之间的空间间隔以及底层智能以便适当地分割手写输入。在又一种技术中,用户接口提供单个书写区域,在该书写区域中,用户可以采用字符之间无空间间隔地彼此重叠的方式连续书写几个字符。通过利用底层智能,重叠的字符可被分割以便将一个字符和其他字符分开。然而,该程序比上面使用通常采用的识别处理的技术更加复杂。在最大似然估计下,该识别处理可有误差地将一系列笔画分割成字符。该识别处理有很大的计算强度,并且对于实时操作特别是小型设备,很有挑战性。利用重叠连续手写的多种技术,允许具有相对小的用户接口的电子设备接收使用用户的手指或其他手写笔的连续手写输入,以便手写输入可以相比于一次一个字符的输入相对快的方式提供。然而,关于分割和用户交互,对重叠连续手写的依赖可能提出挑战。在这方面,重叠连续手写会增加与有效地分割重叠手写以便将每个字符和其他字符分开相关的困难,特别是相比于更普遍的所写字符之间具有空间间隔的连续手写。另外,多个字符的重叠会对用户造成困难,因为用户可能由于其他重叠的字符造成的嘈杂且复杂的背景不能清楚地查看用户当前正在写什么
发明内容
根据示例性实施方式,提供了一种方法、装置和计算机程序产品,以便将包括重叠手写的一系列笔画分割成一组或多组笔画。该分割可在分割成一个或多个字符的任何分割操作之前执行,并且事实上每组笔画可以是字符或字符的一部分,但是无论如何没有一组笔画包括来自多于一个字符的笔画。通过将一系列笔画分割成一组或多组笔画,后续将该系列笔画分割成一个或多个字符变得更有效。另外,之前的一组或多组笔画可以以较不明显不同的方式显示,同时连续接收重叠手写以便允许用户更加清楚地查看最新的笔画。在一个实施方式中,提供了一种方法,该方法包括接收包括重叠手写的一系列笔画,并且对于这多个笔画中的每一个笔画,通过处理器,基于该系列笔画的几何特性确定与当前笔画相关联的多个特征。该实施方式的方法还基于与笔画相关联的特征将一系列笔画分割成一组或多组笔画。如上面提到的,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。一个实施方式的方法还可基于该系列笔画已被分割成的一组或多组笔画将该系列笔画分割成一个或多个字符,从而增加了将一系列笔画分割成字符的效率。根据示例性实施方式,该方法可通过仅基于该系列笔画的几何特性确定与当前笔画相关联的多个特征,从而确定与当前笔画相关联的多个特征。在一个实施方式中,该方法还可引起对所述组中的至少一些组的显示,以使得至少一组被以明显不同于至少另一组的方式显示。因此,重叠手写的显示图像可被简化以方便用户查看例如最新的笔画。在一个实施方式中,该方法还将与当前笔画相关联的多个特征标准化。在这方面,可基于一系列笔画的总尺寸将该多个特征标准化。在确定与当前笔画相关联的该多个特征时,该多个特征可从由当前笔画的终点、当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含当前笔画的最小矩形、包含下一笔画的最小矩形和包含前一笔画的最小矩形构成的组中选择。该方法可以以递增模式或批处理模式执行。在递增模式中,多个特征的确定和一系列笔画的分割的步骤在接收每个连续笔画之后重复执行。在批处理模式中,多个特征的确定和一系列笔画的分割的步骤在接收多个笔画之后重复执行。在另一实施方式中,提供了一种装置,包括至少一个处理器和包括计算机程序代码的至少一个存储器。该实施方式的装置的至少一个存储器和计算机程序代码被配置为与至少一个处理器一起使得该装置至少接收包括重叠手写的一系列笔画,并且对于这多个笔画中的每一个笔画,基于该系列笔画的几何特性确定与当前笔画相关联的多个特征。该实施方式的装置的至少一个存储器和计算机程序代码还被配置为与至少一个处理器一起使得该装置基于与笔画相关联的特征将一系列笔画分割成一组或多组笔画。如上面提到的,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。一个实施方式的装置的至少一个存储器和计算机程序代码还可被配置为与至少一个处理器一起使得该装置基于该系列笔画已被分割成的一组或多组笔画将该系列笔画分割成一个或多个字符,从而增加了将一系列笔画分割成字符的效率。一个示例性实施方式的装置的至少一个存储器和计算机程序代码还被配置为与至少一个处理器一起使得该装置通过仅基于该系列笔画的几何特性确定与当前笔画相关联的多个特征,确定与当前笔画相关联的多个特征。在一个实施方式中,该装置的至少一个存储器和计算机程序代码还可被配置为与至少一个处理器一起使得该装置引起对所述组中的至少一些组的显示,以使得至少一组以明显不同于至少另一组的方式被显示。因此,重叠手写的显示图像可被简化以方便用户查看例如最新的笔画。在一个实施方式中,该装置的至少一个存储器和计算机程序代码还可被配置为与至少一个处理器一起使得该装置将与当前笔画相关联的多个特征标准化。在这方面,可基于一系列笔画的总尺寸将多个特征标准化。在确定与当前笔画相关联的多个特征时,多个特征可从由当前笔画的终点、当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含当前笔画的最小矩形、包含下一笔画的最小矩形和包含前一笔画的最小矩形构成的组中选择。可以以递增模式或批处理模式执行对笔画的分析。在递增模式中,多个特征的确定和一系列笔画的分割的步骤在接收每个连续笔画之后重复执行。在批处理模式中,多个特征的确定和一系列笔画的分割的步骤在接收多个笔画之后重复执行。在再一个实施方式中,提供了 一种设备,其包括用于接收包括重叠手写的一系列笔画的装置,以及对于这多个笔画中的每一个笔画,基于该系列笔画的几何特性确定与当前笔画相关联的多个特征的装置。该实施方式的设备还可包括用于基于与笔画相关联的特征将一系列笔画分割成一组或多组笔画的装置。如上面提到的,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。一个实施方式的设备还可包括用于基于一系列笔画已被分割成的一组或多组笔画将该系列笔画分割成一个或多个字符的装置,从而增加将一系列笔画分割成字符的效率。在一个示例性实施方式中,用于确定与当前笔画相关联的多个特征的装置包括用于仅基于该系列笔画的几何特性确定与当前笔画相关联的多个特征的装置。在一个实施方式中,该设备还可包括用于引起对所述组中的至少一些组的显示的装置,以使得至少一组被以明显不同于至少另一组的方式显示。因此,重叠手写的显示图像可被简化以方便用户查看例如最新的笔画。在一个实施方式中,该设备还包括用于将与当前笔画相关联的多个特征标准化的装置。在这方面,可基于一系列笔画的总尺寸将多个特征标准化。在确定与当前笔画相关联的多个特征时,多个特征可从由当前笔画的终点、当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含当前笔画的最小矩形、包含下一笔画的最小矩形和包含前一笔画的最小矩形构成的组中选择。该设备可以以递增模式或批处理模式分析笔画。在递增模式中,多个特征的确定和一系列笔画的分割的步骤在接收每个连续笔画之后重复执行。在批处理模式中,多个特征的确定和一系列笔画的分割的步骤在接收多个笔画之后重复执行。在又一实施方式中,提供了一种计算机程序产品,其包括具有存储于其中的计算机可执行代码部分的至少一个计算机可读存储器。该计算机可执行代码部分包括用于接收包括重叠手写的一系列笔画的程序代码指令和用于对于这多个笔画中的每一个笔画,基于该系列笔画的几何特性确定与当前笔画相关联的多个特征的程序代码指令。该实施方式的计算机可执行代码部分还包括用于基于与笔画相关联的特征将一系列笔画分割成一组或多组笔画的程序代码指令。如上面提到的,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。一个实施方式的计算机可执行代码部分还可包括用于基于一系列笔画已被分割成的一组或多组笔画将该系列笔画分割成一个或多个字符的程序代码指令,从而增加了将一系列笔画分割成字符的效率。一个示例性实施方式的计算机可执行代码部分还可包括用于通过仅基于该系列笔画的几何特性确定与当前笔画相关联的多个特征,确定与当前笔画相关联的多个特征的程序代码指令。在一个实施方式中,该计算机可执行代码部分还可包括用于引起对所述组中的至少一些组的显示的程序代码指令,以使得至少一组被以明显不同于至少另一组的方式显示。因此,重叠手写的显示图像可被简化以方便用户查看例如最新的笔画。在一个实施方式中,该计算机可执行代码部分还包括用于将与当前笔画相关联的多个特征标准化的程序代码指令。在这方面,可基于一系列笔画的总尺寸将多个特征标准化。在确定与当前笔画相关联的多个特征时,该多个特征可从由当前笔画的终点、当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含当前笔画的最小矩形、包含下一笔画的最小矩形和包含前一笔画的最小矩形构成的组中选择。该计算机程序产品可以以递增模式或批处理模式分析笔画。在递增模式中,多个特征的确定和一系列笔画的分割的步骤在接收每个连续笔画之后重复执行。在批处理模式中,多个特征的确定和该系列笔画的分割的步骤在接收多个笔画之后重复执行。


已经以通用术语描述了本公开的某些示例性实施方式,现在将参照附图,附图并不需要按比例绘制,其中图1是对其中四个字符重叠的重叠手写的说明;图2是根据本发明的示例性实施方式的设备的框图;图3是根据本发明的示例性实施方式执行的操作的功能框图;图4是示出根据本发明的示例性实施方式执行的操作的流程图;图5是对根据本发明的示例性实施方式的其中三个连续笔画的特征被识别的重置手与的说明;图6是对根据本发明的示例性实施方式的图1的重叠手写可被处理以便识别四个字符的方式的说明;图7是示出根据本发明的示例性实施方式的递增模式执行的操作的流程图;以及图8是示出根据本发明的另一示例性实施方式的批处理模式执行的操作的流程图。
具体实施例方式现在将参考附图在下文中更充分地描述本发明的一些实施方式,其中,示出了本发明的一些而非全部实施方式。实际上,本发明的各种实施方式可以很多不同形式体现并且不应当理解为受限于这里陈述的各实施方式;更确切地说,提供这些实施方式以便本说明书将满足适用的法律要求。自始至终,同样的附图标记指代同样的元件。如这里使用的,根据本发明的各实施方式,术语“数据”、“内容”、“信息”和类似的术语可以可互换地用于指代能够被传送、接收和/或存储的数据。因此,任何这种术语的使用不应当用于限制本发明的各实施方式的精神和范围。
另外,如这里使用的,术语“电路”指的是(a)只有硬件的电路实现(如,以模拟电路和/或数字电路实现);(b)电路和包括存储在一个或多个计算机可读存储器上的软件和/或固件指令的(各)计算机程序产品的组合,其一起运行以使得装置执行这里描述的一个或多个功能;以及(C)电路,例如,微处理器或微处理器的一部分,其需要用于操作的软件或固件,即使该软件或固件并不是物理存在的。“电路”的该定义适用于该术语在这里的全部使用,包括任意权利要求中。作为再一个示例,如这里使用的,术语“电路”还包括包含一个或多个处理器和/或其部分以及附带的软件和/或固件的实现。作为另一示例,如这里使用的,术语“电路”还包括,例如,用于手机的基带集成电路或应用处理器集成电路,或服务器、蜂窝网络设备、其他网络设备和/或其他计算设备中的类似的集成电路。如这里定义的,指代永久、物理的存储介质(例如,易失性或非易失性存储设备)的“计算机可读存储介质”可区别于指代电磁信号的“计算机可读传送介质”。如图1中所示,手写可以以重叠方式经由用户接口如触摸屏输入,在该重叠方式中,字符连续地重叠,而字符之间无空间或时间间隔。在这方面,图1的示例示出在该图的下部中分别列出并以100标示的四个字符的顺序重叠。在这方面,显示102示出第一字符的输入,显示104示出第一和第二字符的重叠输入,显示106示出第一、第二和第三字符的重叠输入,并且显示108示出全部四个字符的重叠输入。重叠手写允许用户充分利用用户接口,这对于利用他们的手指例如在相对较小且分辨率低的触摸屏上提供手写输入的用户特别有用。另外,重叠手写的使用提供相对自然和快速的用于接收手写输入的技术。参照图1的逐渐拥挤的显示,将认识到,由于另外的字符与之前的字符重叠,因而依赖于重叠手写以提供手写输入对于不同字符的分割提出了挑战。另外,由于很多其他重叠字符的同时显示,重叠手写还会使得用户查看用户当前正在书写的字符或前一字符变得相当困难。因此,根据本发明的示例性实施方式提供了一种用于预分割重叠手写的技术。可被预分割的重叠手写可经由各种各样的输入设备中的任一个来接收,如用户接口,例如触摸屏等。不仅重叠手写可经由各种各样的不同输入设备接收,而且这些输入设备可被证实并可包括各种不同类型的电子设备的一部分。例如,图2示出可体现本发明的示例性实施方式的移动终端10的框图。然而,应当理解,示出并且在下文中描述的移动终端10仅仅是可从本发明的示例性实施方式获益的一种类型的设备的示例,并且,各种类型的移动终端,如便携式数字助理(PDA)、手机、寻呼机、移动电视、游戏设备、手提电脑、照相机、录像机、音频/视频播放器、收音机、定位设备如全球定位系统(GPS)设备、或上述的和其他类型的声音和文本通信系统的组合,可容易地使用本发明的示例性实施方式。移动终端10可包括可操作地与发射器14和接收器16通信的天线12或多个天线。移动终端10可进一步包括分别提供信号至或接收信号自发射器14和接收器16的装置,如处理器20。该信号包括根据适用的蜂窝系统的空中接口标准的信号信息,并且还包括用户语音、接收数据和/或用户生成数据。在这方面,移动终端10能够根据多种第一、第二、第三和/或第四代通信协议等中的任一个操作。例如,移动终端10能够根据第二代(2G)无线通信协议IS-136、时分多址(TDMA)、全球移动通信系统(GSM)和IS-95码分多址(CDMA),或根据第三代(3G)无线通信协议如通用移动通信系统(UMTS)、CDMA2000、宽带CDMA (WCDMA)和时分同步CDMA (TD-CDMA),根据3. 9G无线通信协议如演进UMTS陆地无线电接入网(E-UTRAN),根据第四代(4G)无线通信协议等操作。作为替代或附加地,移动终端10能够根据非蜂窝通信机制操作。例如,移动终端10能够在无线局域网(WLAN)或其他通信网络中通信。在一些实施方式中,处理器20可包括期望用来实现移动终端10的音频和逻辑功能的电路。例如,处理器20包括一个或多个数字信号处理器和/或一个或多个微处理器。该处理器可进一步包括一个或多个模数转换器、一个或多个数模转换器和/或其他支持电路。移动终端10的控制和信号处理功能根据它们各自的能力在这些器件之间分配。因此,处理器20还可包括调制和传送之前卷积编码和交错消息和数据的功能。处理器20可另外包括内部语音编码器,并且可包括内部数据调制解调器。此外,处理器20可包括操作可存储在存储器中的一个或多个软件程序的功能。例如,处理器20能够操作连接性程序,如传统的Web浏览器。然后,连接性程序可允许移动终端10根据例如无线应用协议(WAP)、超文本传送协议(HTTP)和/或类似协议传送和接收Web内容,如基于位置的内容和/或其他网页内容。移动终端10还可包括用户接口,该用户接口包括输出设备和输入设备,输出设备例如为传统的耳机或扬声器24、振铃器22、麦克风26、显不器28,输入设备例如为用户输入接口,这些全部耦合至处理器20。允许移动终端10接收数据的该用户输入接口可包括多个允许移动终端10接收数据的设备中的任一个,如小键盘30,触摸屏显示器(如以显示器28表示),或其他输入设备。在包括小键盘30的各实施方式中,该小键盘可包括传统的数字(0-9)键和相关键(#,*)以及用于操作移动终端10的其他硬键和软键。可替代地,小键盘30还可包括各种传统的QWERTY键盘布置。小键盘30还可包括带有相关功能的软键。另外或可替代地,移动终端10可包括接口设备,如操纵杆或其他用户输入接口。移动终端10可进一步包括电池34,如振动电池组,用于供电给操作移动终端10需要的各种电路,以及可选地用于提供机械振动作为可检测输出。如上所述,该用户输入接口可包括触摸屏显示器28,其可体现为任何已知的触摸屏显示器。因此,例如,触摸屏显示器28可构成为通过任何适当的技术实现触摸识别,如电阻、电容、红外、应变仪、表面波、光学成像、分散信号技术、声学脉冲识别等技术。触摸屏显示器28可构成为接收用户输入的指示并且将用户输入的表示提供至处理器20。移动终端10可进一步包括用户标识模块(UH038。UIM38典型地是具有内置处理器的存储设备。UM38可以例如包括用户标识模块(SM)、通用集成电路卡(UICC)、通用用户标识模块(USM)、可移除用户标识模块(R-ΠΜ)等。UIM38典型地存储与移动用户相关的信息元素。除了 ΠΜ38之外,移动终端10还可配备有存储器。例如,移动终端10可包括易失性存储器40,如包括用于数据的暂时存储的缓存区域的易失性随机存取存储器(RAM)。移动终端10还可包括其他非易失性存储器42,其可以是嵌入式的和/或可以是可移除的。存储器可存储移动终端10所使用的多条信息和数据以执行移动终端10的各功能。例如,存储器可包括能够唯一地标识移动终端10的标识符,如国际移动设备标识(MEI)码。此夕卜,这些存储器可存储用于确定小区id信息的指令。具体地,这些存储器可存储用于由处理器20执行的应用程序,其确定移动终端10与其处于通信中的当前小区的身份,如小区id身份或小区id信息。不管输入设备的类型和包括该输入设备的电子设备的类型如何,重叠手写输入可根据如图3中所示示例性实施方式进行分析。在该实施方式中,重叠手写可经由触摸屏110接收,如图2的触摸屏显示器28等。然后,手写输入的每个笔画可经过特征提取112,其中,如下面所述确定与该笔画相关的一个或多个特征。然后,例如由分类器114对当前笔画是否是与前一笔画相同的笔画组的一部分,或当前笔画是否是另一笔画组的一部分进行确定。尽管各种分类器114可被用于分析与当前笔画相关的特征以确定当前笔画所属的组,可采用常用的统计分类器,如支持向量机或人工神经网络。如图3中所示,分类器114通过利用分割规则116分析当前笔画。可以各种方式确定分割规则116。然而,在示出的实施方式中,提供了手写数据库118,手写数据库118包括多个不同系列的手写笔画。然后,手写数据库118的每个笔画系列可经过特征提取120,其中,分析该手写数据库的每个笔画系列以便识别与该笔画系列相关的特征和包括该系列的各个笔画。在一个实施方式中,已被提取并与手写数据库118的当前笔画关联的这些特征经过训练122以便完善分割规则。在这方面,手写数据库118可包含由不同人书写的不同单词和/或句子很多样本。这些单词和/或句子可被手动地分离成字符。基于该分离成字符,每个笔画可被分类为字符的最后一个笔画或除了字符的最后一个笔画之外的笔画。因此,训练122可从手写数据库118中的笔画中学习以便建立定义在确定笔画是或不是字符的最后一个笔画时要考虑的参数的分割规则。如下所述,可基于笔画的各种参数由特征向量来表示该笔画,然后该特征向量的值可基于分割规则116由分类器114确定。接着,该分类器可比较表示该笔画的特征向量的值和预定义阈值以确定该笔画是或不是字符的最后一个笔画。因此,训练122可用于确定对于手写数据库118中的全部各种笔画提供适当地分类笔画方面的最大成功率的参数集。基于训练122,分割规则116被定义,其继而定义可被分类器114利用以基于手写数据库118所存储的不同系列的笔画对笔画进行分类的参数集,例如根据与每个笔画系列相关的特征和/或包括每个系列的各个笔画。通过比较基于已从当前笔画提取的特征的特征向量的值和预定义阈值,分类器114可因此确定当前笔画是与前一笔画相同的笔画组的一部分还是当前笔画开始于不同的笔画组。因为目的是将笔画分割成完整的字符,所以如果分割的组只包括字符的一部分或者如果分割的组包括来自多于一个字符的笔画,则可能出现误差。由于一个示例性实施方式的方法和装置会更容易适应和校正与只包括字符的一部分的分割的组相关的任何误差,因为分割的组可能组合有下面的预分割,所以在一个实施方式中,可调节预定义阈值,例如通过增加该阈值,以便减少分割的组将包括来自多于一个字符的笔画的可能性。在图3的示例性实施方式中,虚线之上的操作包括训练阶段126。如此,可预先执行这些操作并且不需要在重叠手写输入由触摸屏Iio接收时重复这些操作。然而,虚线之下的操作包括执行阶段124并且在重叠手写输入的接收之时或之后执行,如在触摸屏110上输入一个或多个笔画之后。作为进一步的解释,现在参照图4,其中示出由根据本发明的示例性实施方式的装置执行的操作。该装置可例如被应用在移动终端10上。然而,可替代地,该装置可体现在各种其他设备上,包括移动和固定设备两者,例如,任何上面列出的设备。该装置可包括用于接收一系列笔画的装置,如处理器20,用户输入接口(例如触摸屏显示器28)等。参见图4的操作130。如上所述,所接收的多个笔画包括重叠手写,其中,多个字符被一个接着一个地连续写出。对于每个笔画,可确定多个特征。参见操作132。在这方面,装置可包括用于确定与每个笔画相关的多个特征的装置,如处理器20。根据本发明的示例性实施方式可确定各种特征。然而,在一个实施方式中,对于当前笔画所确定的多个特征包括与当前笔画相关的特征以及与前一和下一笔画相关的特征。在这方面,图5示出包括当前笔画200、前一笔画210和下一笔画220的多个重叠手写字符。举例而言,对于当前笔画所确定的特征可包括当前笔画的终点、当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含当前笔画的最小矩形、包含下一笔画的最小矩形和包含前一笔画的最小矩形。关于定义特定点或位置的那些特征,通常用一对坐标来定义那些特征,如X、y坐标。类似地,对于用矩形或其他二维形状定义的那些特征,每个形状如每个矩形可用四个特征定义,如该形状的左侧和右侧的坐标以及该形状的上部和下部的坐标。参照图5,根据示例性实施方式,从当前笔画提取的特征可包括以204标示的当前笔画的终点的X、y坐标(endX, endY),以206标示的当前笔画的几何中心(currentGCX, currentGCY),以 222 标不的下一笔画的起点(startX, startY),以 226 标不的下一笔画的几何中心(nextGCX, nextGCY)和包含当前笔画、下一笔画和前一笔画的最小矩形。参照图5,每个矩形可由四个特征定义,S卩,与左侧、右侧、上部和下部相关的坐标。在这方面,在图5中,与当前笔画、下一笔画和前一笔画相关的最小矩形的左、右、上和下坐标分别以前缀current (当前)、next (下一个)和previous (前一个)标示。举例而言,与当前笔画的最小矩形相关的特征在图5中以currentLeft (当前左)、currentRight (当前右)、currentTop (当前上)和currentBottom (当前下)标示。为了定向而在图5中标示的其他点包括以202标示的当前笔画的起点、下一笔画的终点224和分别以212和214标示的前一笔画的起点和终点,尽管这些其他点在该示例性实施方式中未被提取作为特征。尽管可以以各种方式定义笔画的几何中心,但是根据一个示例性实施方式,笔画的几何中心被定义为笔画中全部点的平均点。举例而言,包含终点(Xi, Yi) (i=0…n-ι)的笔画,具有几何中心(GCX,GCY),其被定义如下:GCX=Sum(Xi)Ai, GCY=Sum(Yi) /n ;i=0…n_l`
多个重叠的字符和包括这些字符的对应笔画可能具有不同的尺寸,因为这些字符可能被书写得较小或较大同时仍想传达相同的含义。如此,该装置可包括用于将从当前笔画提取的特征标准化以考虑(例如通过移除)相同笔画尺寸上不同的任何影响的装置,如处理器20。参见图4的操作134。在一个实施方式中,基于一系列笔画的总尺寸将这些特征标准化。在这方面,包含每个手写笔画的最小矩形可如图5中所示被定义。在这方面,包含全部笔画的最小矩形可由与重叠手写字符的上、下、左和右相关的坐标定义。在其中包含全部系列笔画的最小矩形被定位以便具有该坐标系的原点处的一角并且具有沿该坐标轴延伸的边的示例性实施方式中,包含全部笔画的最小矩形可通过它的宽度如totalWidth (总宽度)和它的高度如totalHeight (总高度)以简化形式表示。在一个示例中,上面已描述的特征可如下所示那样被标准化,其中,前缀Current(当前)、Next (下一个)和Pre (前一个)分别指与当前笔画、下一笔画和前一笔画相关的特征。
`
C iiirentStrokeEndX = endX/totalWidth*2-1;CurrentGCX = currentGCX/totalWidth^1-1;
CurrentStrokeEndY = endY^toialI Ieight^2-1;CurrentGCY = ciUTentGCY/totall ieight*2-l:
NextStrokeStartX = startX/total Width*2-1;NextGCX = nextGCX/total WidthsjiZ-1;
NextStrokeStartV = startY/totalWidth2-1;NextGCY = nextGCY/totail Ieigiit*2-1;
CurrentLeft = currentLeft/totaiWidtii;! 2-lPreLeft = previousLeft/totalWidthiii2-!
CurrentRight = currentRight/EotalWidth:ii2-l; PieRight = previousRight/totalWidthiii2-1;CurrentTop = ciuTcn(Top/toialHcight>:i2-1;PrcTop = prcviousTop/totalHcight^2-1;
CurrentBottOTii=CLtrrentBottoni/tota]Height>!i2-1; PreBottoni = previousBottom/totalHeight1^- NextLclt — nextLcit/totalWidth^2-]
NextRight = nextRight/totalWidth^2-l;
NextTop = nextTop/toialHeight”.1;
NextBottom = nextBottdmHeight* ,-1; _如此,CurrentStrokeEndX和CurrentStrokeEndY是当前笔幽的终点的标准化的X和y坐标。NextStrokeStartX和NextStrokeStartY是下一笔幽的起点的标准化的X和y坐标。CurrentGCX和CurrentGCY是当前笔画的几何中心的标准化的x和y坐标。NextGCX和 NextGCY是下一笔画的几何中心的标准化的X和y坐标。CurrentLeft、CurrentRight、CurrentTop和CurrentBottom分别是当前笔幽的左、右、上和下坐标。NextLeft、NextRight、NextTop和NextBottom分别是下一笔幽的左、右、上和下坐标。最后,PreLeft、PreRight、PreTop和PreBottom分别是前一笔幽的左、右、上和下坐标。在一个实施方式中,从当前笔画提取的这多个特征然后可被组合,例如通过处理器20组合成特征向量。在其中正被分析的当前笔画是初始笔画的实例中,将不存在前一笔画。如此,与前一笔画相关的特征可被设置为预定义值,例如-1。一旦对于当前笔画已确定多个特征,并且在一个示例中,多个笔画已被标准化,则可基于与笔画相关的特征将该系列笔画分割成一组或多组笔画。参见图4的操作136。如此,该装置可包括用于基于这些特征将多个系列笔画分割成一组或多组笔画的装置,如处理器20。如上所述,这些笔画可由分类器114并且根据下面更详细描述的技术分割成一组或多组笔画。该装置还可包括用于基于多个系列笔画已被分割成的一组或多组笔画,将多个系列笔画分割成一个或多个字符的装置,如处理器20。参见操作138。基于这些组到字符的分割可以以各种方式执行,包括通过利用分割规则116等,分割规则116定义将被分类器114利用的参数以便适当地估计笔画的特征向量。如此,一个示例性实施方式的处理器20可包括或执行特征提取112、分类器114和分割规则116,如上面结合图3所述。相比于在不对笔画进行中间分组的情况下对多个重叠字符进行分割的实例,通过初始地定义笔画组并继而基于这些组定义字符,可以以更有计算效率的方式执行笔画到字符的分割。参照图6,在230处示出多个重叠字符。通过将多个系列笔画分割成笔画组,可如232处所示定义多个组。此后,可基于234处所示的组将多个系列笔画分割成多个字符。然后,产生的字符可被识别,如通过模式识别等,如236处所示,以便多个重叠手写字符可被非常有效地分割且识别为各系列字符。在图6的示例性实施方式中,基于这些组将笔画分割成字符,可以识别这些组的多个可能的组合,例如这些组的全部可能的组合,如234和236处所示。在这方面,由这些组的不同组合表示的各字符可由手写识别引擎识别,该手写识别引擎可由处理器20或与该处理器保持通信的另一计算设备体现。在一个实施方式中,该手写识别引擎还可确定这些组的每种组合与当前字符集之间的相似性。然后,由这些组的组合表示的每个字符集可被分析,如通过由处理器20或与该处理器保持通信的另一计算设备体现的语言模型,以便确定每个字符集是否有意义。然后,该装置(如处理器20)、手写识别引擎和/或语言模型,可对基于对已由手写识别引擎确定的相似性的测量、对已由语言模型确定的当前字符集是否有意义的测量和在一些实施方式中对各组的预定义几何特性的测量的组合的每个可能的字符集指定分数。在这方面,可以例如通过处理器20分析每个组以确定该组是否满足一个或多个预定义几何特性,例如,一个几何特性可与组的尺寸相关,小于预定义阈值的组被认为太小而不是完整的字符。作为几何特性的另一示例,位于沿着书写区域的边,如沿着触摸屏显示器28的最左或最右部分的组,可不认为是完整的字符。例如基于相似性、有意义和几何特性中的一个或多个被如处理器20确定具有最高分数的字符集,可被识别为最能表示该多个重叠字符的字符集,如238处所示。在一个实施方式中,可对识别这些组的多个可能组合的过程施加一个或多个限制,以增加识别这些组合以及随后处理这些组合的效率。例如,这些可能的组合可通过将任何潜在组合或字符限制为最大四组进行限制。除了增加可对多个重叠字符进行分割的效率外,一系列笔画到一组或多组笔画的分割还可方便手写输入的显示。在这方面,该装置还可包括用于使得这些组中的至少一些显示以使得至少一组以明显不同于至少另一组的方式显示的装置,如处理器20、显示器28等。参见图4的操作140。例如,只有这些组的子集可被显示,以使得至少一组不被显示。在这方面,可显示相对小数目的最新组而从显示器28移除之前的全部组。如此,显示器28不那么杂乱并且用户可更容易地查看当前正在输入的笔画以及之前紧接着的各笔画。在其他实施方式中,可以以不同笔画组之间有明显区别的方式显示这些笔画组。例如,这些笔画组可用不同颜色和/或亮度水平显示,如基于笔画被接收的顺序变化的不同颜色或亮度水平。在一个示例性实施方式中,最新的笔画组可用最暗的颜色(和/或亮度)显示,之前紧接着的笔画组可用稍亮一些的颜色(和/或亮度)显示,依此类推直至用最亮的颜色(和/或亮度)显示的初始笔画组。可替代地,可通过不同类型的线表示不同笔画组,例如用实线表示最新的笔画组,用点划线表示之前紧接着的笔画组,依次类推。在每个实施方式中,笔画组被显示以致不同笔画组明显不同,并且在一些实施方式中,越新的笔画组越明显。在一个实施方式中,与笔画相关的特征的确定和该笔画到当前组的分割可在输入每个笔画之后执行,例如如图7中所示。关于图7的后续描述,当前笔画和下一笔画(如上面讨论的)分别表示为笔画k-Ι和笔画k。参照图7的操作250、252和254,输入笔画k之后,确定该笔画是否是初始笔画,即,确定是否k=0。在其中已输入的笔画是初始笔画的实例中,可初始化实际书写区域。参见操作256。在这方面,实际书写区域可初始化成包围该初始笔画的最小矩形,并且可用如图5中所示相对于坐标系统定向和定位的矩形的总宽度和总高度或用位于其他方向和位置的矩形的上、下、左和右坐标定义。此后,计数器k可在等待下一笔画的输入之前递增。参见操作258。在输入下一笔画之后,可重新计算实际书写区域以便重新计算的实际书写区域表示包围每个笔画的最小矩形。参见操作260。此后,可确定当前笔画k-Ι的特征。参见操作262。基于对于笔画k-Ι已确定的特征,分类器114可基于笔画k-Ι的特征提供值SPM。在这方面,分类器114可基于笔画k-Ι的特征向量和分割规则116提供值Spm,分割规则116定义被该分类器利用以估计笔画的特征向量的参数。参见图7的操作264。然后,由分类器114提供的值Spm可与用于分类的预定义阈值Tpre进行比较。参见操作266。如果由分类器114提供的值Spm超过用于分类的预定义阈值TPM,则笔画k-Ι和笔画k被认为属于不同的组。参见操作268。相反,如果由分类器114提供的值Spm不大于用于分类的预定义阈值TPM,则笔画k-Ι和笔画k被认为属于相同的组。参见操作270。上面描述并在图7中示出的该过程可对于输入的每个笔画递增地重复以便将该系列笔画适当地分割成组。作为在每个笔画输入之后个别地分析这些笔画以便适当地将这些笔画分组的替代方案,可以以批处理流程分析多个笔画,例如如图8中所示。在这方面,可确定实际书写区域,如包围多个笔画0,1,...,M-1的最小矩形。参见操作280。然后,可初始化计数器k,如k=l,并且可确定该批的全部笔画是否已被考虑,例如通过比较该计数器和笔画M的数目。参见操作282和284。在其中全部笔画还没有被考虑的实例中,确定笔画k-Ι的特征并且接着可基于笔画k-Ι的特征例如通过分类器114确定笔画k-Ι的值SPM。参见操作286和288。如同之前,可进行值Spm与阈值Tpm的比较,其中,笔画k-Ι和笔画k属于不同的组还是相同的组分别取决于值Spie是否大于用于分类的阈值ΤΡΜ。参见操作290、292和294。可对于操作296中计数器k的递增所指示的该批的每个笔画重复该过程,直至每个笔画已被考虑在内并且被适当地分入各组。图4、图7和图8是根据本发明的示例性实施方式的方法和程序产品的流程图。将理解的是,这些流程图的每个块以及这些流程图中各块的组合,可以各种方式实施,例如硬件、固件、处理器、电路和/或与包括一个或多个计算机程序指令的软件的执行相关的其他设备。例如,上面描述的一个或多个流程可由计算机程序指令体现。在这方面,体现上面描述的各流程的计算机程序指令,可由移动终端10的存储设备存储并且由该移动终端中的处理器20执行。将理解的是,任何这种计算机程序指令可加载到计算机或其他可编程装置(例如,硬件)上,以产生机器,以便在该计算机或其他可编程装置上执行的这些指令生成用于执行(各)流程图块中所指定功能的装置。这些计算机程序指令还可存储在可引导计算机或其他可编程装置以特定方式运行的计算机可读存储器中,以便存储在该计算机可读存储器中的这些指令产生包括执行(各)流程图块中所指定功能的指令装置的制品。这些计算机程序指令还可加载到计算机或其他可编程装置以使得一系列操作在该计算机或其他可编程装置上执行以产生计算机执行过程,以便在该计算机或其他可编程装置上执行的这些指令执行流程图块中所指定的功能。因此,这些流程图的块支持用于执行所指定功能的装置的组合,用于执行所指定功能的操作和用于执行所指定功能的程序指令的组合。还将理解的是,这些流程图的一个或多个块,以及这些流程图中各块的组合,可由执行所指定功能的专用基于硬件的计算机系统,或专用硬件和计算机指令的组合来实施。
在之前的描述和相关附图中呈现的有益教导下,发明所属领域的技术人员将想到这里阐述的本发明的很多修改和其他实施方式。因此,要理解的是,本发明并不限于所公开的具体实施方式
,并且修改和其他实施方式将包括在所附权利要求的范围内。此外,尽管之前的描述和相关附图在各元件和/或功能的某些示例性组合的上下文中描述了各示例性实施方式,应当理解的是,各元件和/或功能的不同组合还可由替代实施方式提供,而不脱离所附权利要求的范围。在这方面,例如,除了上面明确地描述的那些之外的各元件和/或功能的不同组合也被考虑并且可在所附权利要求中的一些中提出。尽管这里采用具体的术语,它们只在一般和描述性的意义上使用并且不用于限制。
权利要求
1.一种方法,包括: 接收包括重叠手写的一系列笔画; 针对多个笔画中的每个笔画,利用处理器基于所述一系列笔画的特性确定与当前笔画相关联的多个特征;以及 基于与所述笔画相关联的所述特征将所述一系列笔画分割成一组或多组笔画,其中,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。
2.如权利要求1所述的方法,进一步包括:基于所述一系列笔画已被分割成的所述一组或多组笔画将所述一系列笔画分割成一个或多个字符。
3.如权利要求1或2所述的方法,其中,分割所述一系列笔画包括将所述一系列笔画分割成多个组,并且其中所述方法进一步包括:引起对所述组中的至少一些组的显示,以使得至少一组被以明显不同于至少另一组的方式显示。
4.如权利要求1-3中的任一项所述的方法,进一步包括:将与所述当前笔画相关联的所述多个特征标准化。
5.如权利要求4所述的方法,其中,将所述多个特征标准化包括:基于所述一系列笔画的总尺寸将所述多个特征 标准化。
6.如权利要求1-5中的任一项所述的方法,其中,确定所述多个特征包括确定从由以下各项构成的组中选择的多个特征:所述当前笔画的终点、所述当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含所述当前笔画的最小矩形、包含所述下一笔画的最小矩形和包含前一个相邻笔画的最小矩形。
7.如权利要求1-6中的任一项所述的方法,其中,确定所述多个特征和分割所述一系列笔画在接收每个连续笔画之后重复进行。
8.如权利要求1-6中的任一项所述的方法,其中,确定所述多个特征和分割所述一系列笔画在接收多个笔画之后进行。
9.如权利要求1-8中的任一项所述的方法,其中,确定与所述当前笔画相关联的所述多个特征包括:仅基于所述一系列笔画的几何特性确定与所述当前笔画相关联的所述多个特征。
10.一种装置,包括至少一个处理器和包括计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置为与所述至少一个处理器一起使得所述装置至少: 接收包括重叠手写的一系列笔画; 针对多个笔画中的每个笔画,基于所述一系列笔画的几何特性确定与当前笔画相关联的多个特征;以及 基于与所述笔画相关联的所述特征将所述一系列笔画分割成一组或多组笔画,其中,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。
11.如权利要求10所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为:与所述至少一个处理器一起使得所述装置基于所述一系列笔画已被分割成的所述一组或多组笔画,将所述一系列笔画分割成一个或多个字符。
12.如权利要求10或11所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所述至少一个处理器一起使得所述装置通过将所述一系列笔画分割成多个组而分割所述一系列笔画,并且引起对所述组中的至少一些组的显示,以使得至少一组被以明显不同于至少另一组的方式显示。
13.如权利要求10-12中的任一项所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所述至少一个处理器一起使得所述装置将与所述当前笔画相关联的所述多个特征标准化。
14.如权利要求13所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所述至少一个处理器一起使得所述装置通过基于所述一系列笔画的总尺寸将所述多个特征标准化而将所述多个特征标准化。
15.如权利要求10-14中的任一项所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所述至少一个处理器一起使得所述装置通过确定从由以下各项构成的组中选择的多个特征而确定所述多个特征:所述当前笔画的终点、所述当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含所述当前笔画的最小矩形、包含所述下一笔画的最小矩形和包含前一个相邻笔画的最小矩形。
16.如权利要求10-15中的任一项所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所述至少一个处理器一起使得所述装置在接收每个连续笔画之后重复地确定所述多个特征和分割所述一系列笔画。
17.如权利要求10-15中的任一项所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所述至少一个处理器一起使得所述装置在接收多个笔画之后确定所述多个特征和分割所述一系列笔画。
18.如权利要求10-17中的任一项所述的装置,其中,所述至少一个存储器和计算机程序代码被进一步配置为与所 述至少一个处理器一起使得所述装置通过仅基于所述一系列笔画的几何特性确定与所述当前笔画相关联的多个特征,从而确定与所述当前笔画相关联的所述多个特征。
19.一种设备,包括: 用于接收包括重叠手写的一系列笔画的装置; 用于针对多个笔画中的每个笔画,基于所述一系列笔画的几何特性确定与当前笔画相关联的多个特征的装置;以及 用于基于与所述笔画相关联的所述特征将所述一系列笔画分割成一组或多组笔画的装置,其中,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。
20.如权利要求19所述的设备,进一步包括:用于基于所述一系列笔画已被分割成的所述一组或多组笔画将所述一系列笔画分割成一个或多个字符的装置。
21.如权利要求19或20所述的设备,其中,所述用于分割所述一系列笔画的装置包括用于将所述一系列笔画分割成多个组的装置,并且其中所述设备进一步包括:用于引起对所述组中的至少一些组的显示的装置,以使得至少一组被以明显不同于至少另一组的方式显不O
22.如权利要求19-21中的任一项所述的设备,进一步包括:用于将与所述当前笔画相关联的所述多个特征标准化的装置。
23.如权利要求22所述的设备,其中,所述用于将所述多个特征标准化的装置包括用于基于所述一系列笔画的总尺寸将所述多个特征标准化的装置。
24.如权利要求19-23中的任一项所述的设备,其中,所述用于确定所述多个特征的装置包括用于确定从由以下各项构成的组中选择的所述多个特征的装置:所述当前笔画的终点、所述当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含所述当前笔画的最小矩形、包含所述下一笔画的最小矩形和包含前一个相邻笔画的最小矩形。
25.如权利要求19-24中的任一项所述的设备,其中,所述用于确定所述多个特征的装置和所述用于分割所述一系列笔画的装置在接收每个连续笔画之后重复地操作。
26.如权利要求19-24中的任一项所述的设备,其中,所述用于确定所述多个特征的装置和所述用于分割所述一系列笔画的装置在接收多个笔画之后操作。
27.如权利要求19-24中的任一项所述的设备,其中,所述用于确定与所述当前笔画相关联的多个特征的装置包括用于仅基于所述一系列笔画的几何特性确定与所述当前笔画相关联的所述多个特征的装置。
28.一种计算机程序产品,包括其中存储有计算机可执行代码部分的至少一个计算机可读存储器,所述计算机可执行代码部分包括: 用于接收包括重叠手写的一系列笔画的程序代码指令; 用于对于多个笔画中的每个笔画,基于所述一系列笔画的几何特性确定与当前笔画相关联的多个特征的程序代码指令;以及 用于基于与所述笔画相 关联的所述特征将所述一系列笔画分割成一组或多组笔画的程序代码指令,其中,每组笔画是字符或字符的一部分,但是没有一组笔画包括来自多于一个字符的笔画。
29.如权利要求28所述的计算机程序产品,进一步包括:用于基于所述一系列笔画已被分割成的一组或多组笔画将所述一系列笔画分割成一个或多个字符的程序代码指令。
30.如权利要求28或29所述的计算机程序产品,其中,用于分割所述一系列笔画的所述程序代码指令包括用于将所述一系列笔画分割成多个组的程序代码指令,并且其中所述计算机可执行代码部分进一步包括:用于引起对所述组中的至少一些组的显示,以使得至少一组被以明显不同于至少另一组的方式显示的程序代码指令。
31.如权利要求28-30中的任一项所述的计算机程序产品,进一步包括:用于将与所述当前笔画相关联的所述多个特征标准化的程序代码指令。
32.如权利要求31所述的计算机程序产品,其中,用于将所述多个特征标准化的所述程序代码指令包括用于基于所述一系列笔画的总尺寸将所述多个特征标准化的程序代码指令。
33.如权利要求28-32中的任一项所述的计算机程序产品,其中,用于确定所述多个特征的所述程序代码指令包括用于确定从由以下各项构成的组中选择的所述多个特征的程序代码指令:所述当前笔画的终点、所述当前笔画的几何中心、下一笔画的起点、下一笔画的几何中心、包含所述当前笔画的最小矩形、包含所述下一笔画的最小矩形和包含前一个相邻笔画的最小矩形。
34.如权利要求28-33中的任一项所述的计算机程序产品,其中,用于确定所述多个特征的所述程序代码指令和用于分割所述一系列笔画的所述程序代码指令在接收每个连续笔画之后被执行。
35.如权利要求28-33中的任一项所述的计算机程序产品,其中,用于确定所述多个特征的所述程序代码指令和用于分割所述一系列笔画的所述程序代码指令在接收多个笔画之后被执行。
36.如权利要求28-35中的任一项所述的计算机程序产品,其中,用于确定与所述当前笔画相关联的多个特征的所述程序代码指令包括仅基于所述一系列笔画的几何特性确定与所述当前笔画相关联的所 述多个特征的程序代码指令。
全文摘要
提供了一种方法、装置和计算机程序产品,以便基于一系列笔画的几何特性确定与当前笔画相关联的多个特征,并且然后基于与这些笔画相关联的特征将包括重叠手写的一系列笔画分割成一组或多组笔画。该分割可在任何分割成一个或多个字符的步骤之前执行,并且事实上每组笔画可以是字符或字符的一部分,但是不管怎样没有一组笔画包括来自多于一个字符的笔画。
文档编号G06F3/0488GK103080878SQ201080068735
公开日2013年5月1日 申请日期2010年8月24日 优先权日2010年8月24日
发明者邹燕明, 陈胤子, 刘长松, 万祥 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1