将先前手写实例用于手写美化和其他应用_4

文档序号:9438964阅读:来源:国知局
指示笔提离输入设备104的书写表面。(注意图9仅描绘了直方图中的几个密度阴影以方 便说明,但在实际实践中,直方图可表达附加的密度梯度。)第二描述符908也由两个直方 图(914、915)组成,这两个直方图表达与以上所述的直方图(910、912)相同的信息。
[0094] 更一般地,图9中的直方图使用时间表不来描述记号(902、904)。即,当用户在输 入设备104的书写表面上进行书写时,以零碎方式逐样本地创建每一记号。这意味着每一 直方图的水平轴是一连串时间实例的代理。
[0095] 总体上,观察到第一描述符906类似于第二描述符908。这部分归因于使用基于曲 率的重采样来表示手写。例如,考虑其中重采样模块602使用恒定距离重采样来为图9中 示出的字符"abc"的两个实例产生描述符的替换情况。这些记号的描述符(未示出)不会 展现出与图9中描绘的相同的相关性程度。
[0096] 通过该描述,TFM 106还可使用除基于曲率的采样以外的其他类型的重采样策略 (包括恒定距离采样策略)来实现。此外,在使用曲率采样的那些情况下,重采样模块602 可使用除图7中示出的过程702之外的其他用于定义样本的技术。
[0097] C.相似件评估樽块
[0098] 图10示出了相似性评估模块(SAM) 110的一个实现。如章节A中记录的,SAM 110 确定新记号和先前记号之间的相似性。新记号对应于TFM 106已经定义的最新近的记号, 而先前记号对应于TFM 106先前已经定义的记号。数据存储108存储这些先前记号。
[0099] 一般来说,SAM 110可通过形成新记号的描述符和先前记号的另一描述符来将该 新记号与先前记号进行比较。SAM 110可随后使用任何技术来对这两个描述符进行比较。如 果这两个描述符之间的差小于指定阈值,则SAM 110可推断出该新记号类似于先前记号。
[0100] 在一个实现中,SAM 110可通过将新记号与每一个体记号进行比较来起作用。在 另一实现中,聚类管理模块1002可形成记号的聚类1004。每一聚类包括先前已被评估为彼 此相似的记号集合。每一聚类还包括聚类表示,诸如聚类均值Ψ。聚类均值Ψ表示聚类内 的记号的平均值。在该实现中,SAM 110通过将新记号与每一聚类表示而非各个先前记号 进行比较来起作用。
[0101] 聚类管理模块1002还可将新记号添加到其最接近地匹配的任何聚类中。聚类管 理模块1002可通过更新聚类均值以考虑新记号的贡献(例如,通过对聚类均值与新记号求 平均以产生新的聚类均值)来执行该任务。替换地,如果不存在足够相似的现有聚类,则聚 类管理模块1002可创建新聚类。最初,新聚类包括对应于新记号的单个成员。
[0102] SAM 110可采用任何方案来确定两个记号之间(例如,新记号和记号均值之间) 的相似性。在一个方案中,SAM 110包括粗略相似性确定模块1006和精细相似性确定模块 1008。粗略相似性确定模块1006使用时间分析来对两个记号之间的相似性作出第一级评 估。该时间分析得到例如与同新记号匹配的候选聚类均值集合(如果有的话)相对应的候 选记号集合。精细相似性确定模块1008使用空间分析来验证每一候选令牌是否实际上是 对新记号的合适匹配。
[0103] 图11示出归纳SAM 110的操作的过程1102。在框1104, SAM 110确定新记号和每 一先前记号(或聚类均值)之间的粗略相似性以产生候选记号集合。在框1106, SAM 110 使用空间分析来验证每一候选记号是否实际上是对新记号的合适匹配。框1104和1106中 的各个体子步骤将在此章节的稍后时刻处描述。
[0104] 在一个实现中,SPS 102可为它执行的所有相似性比较执行框1104和1106中的 操作,这些相似性比较包括其中SPS 102出于更新聚类的目的而使用相似性分析来寻找最 接近匹配聚类的情况A,以及其中SPS 102出于美化新记号的目的而使用相似性分析来寻 找相似聚类集合的情况B。在另一实现中,对于情况A,SPS 102可执行框1104,但不执行框 1106〇
[0105] 图12示出归纳聚类管理模块1002的操作的过程1202。在框1204,聚类管理模块 1002接收新记号。在框1206,聚类管理模块1002依赖于SAM 110来确定新记号和各聚类 表示(例如,各聚类均值)之间的相似性。在框1208,聚类管理模块1002(仅使用框1104 中的分析或使用框1104和1106的两阶段的分析)确定是否存在在预定阈值τ内与新记 号匹配的任何聚类。如果存在至少一个这样的聚类,则在框1210,聚类管理模块1002可使 用TRM 112(按以下描述的方式)将新记号合并到最接近匹配的聚类中。在另一实现中(未 示出),聚类管理模块1002可潜在地将该记号添加到满足以上相似性阈值的两个或更多个 聚类中。
[0106] 替换地,在框1212,假设聚类管理模块1002确定没有聚类与新记号合适地相似。 在该情况下,聚类管理模块1002创建新聚类来表示新记号。该新聚类最初包括对应于新记 号的一个成员。
[0107] 图11中的框1104与图13的示例一起示出用于对要比较的每一对记号执行粗略 级别时间分析的一个技术。SAM 110通过使用单个描述符1302来表达每一记号开始。那个 描述符1302对应于图9中示出的直方图910类型;即,描述符1302描述作为样本(Φ)的 函数的取向(Θ )和幅度(r)值。在框1104的步骤(I. I),SAM 110将单个描述符1302分 成两个分开的描述符(1304、1306)。第一描述符1304描述针对指不笔与显不表面接触时的 时间的笔划样本。第二描述符1306描述针对指示笔不与显示表面接触时的时间的笔划样 本。
[0108] 在步骤(1. 2),SAM 110例如通过使用高斯函数修改两个描述符(1304, 1306)中 的值来在时间维度中模糊化这两个描述符(1304、1306)。这得到经模糊化的描述符(1308、 1310)。在步骤(1.3),SAM 110在经模糊化的描述符(1304、1306)中采用幅度的对数。由 于小笔划样本可与大笔划样本一样在视觉上显著,因此执行该操作;该操作有助于均衡跨 比例的改变。在步骤(1.4),SAM 110通过时间居中高斯来对步骤(1.3)的结果进行加权。 所得的经处理的落笔和提笔描述符可随后被组合以形成单个矢量。
[0109] SAM 110对要比较的每一记号执行以上描述的操作。更具体地,考虑正将新记号与 聚类均值进行比较的情况。SAM 110对新记号并分开地对聚类均值执行以上描述的处理。 这最终得到供比较的两个矢量。在步骤(2),SAM 110随后使用任何比较技术来比较这两个 矢量,诸如通过计算这些矢量之间的距离L2。通过对新记号和聚类均值的每一配对执行该 相同的过程,SAM 110可标识出在新记号的指定阈值距离内的聚类集合(如果有的话)。这 得到零个、一个或更多个候选记号以供在过程1102的框1106中进行验证。
[0110] 图11中的框1106与图14的示例一起示出用于对要与新记号进行比较的每一候 选记号执行精细级别空间分析的一个技术。在步骤(1. 1),SAM 110通过形成要比较的每一 记号的低分辨率描述符(诸如图14中不出的低分辨率描述符1402)来开始。换言之,SAM 110提供对记号的空间渲染,从而重复其如由用户画出的外观。在步骤(1.2),SAM 110用 所渲染的笔划各自距记号的中心的相应时间距离来对所渲染的笔划的强度进行加权。换言 之,在绘出记号时,用户按特定时间次序产生笔划;SAM 110对在该过程的开始和结束处作 出的笔划加权最少,并对在该过程的中间处发生的笔划加权最多。在步骤(1.3),SAM 110 在空间上将步骤(1.2)的结果模糊化几个像素以例如产生经模糊化的描述符1404。在步 骤(1.4),SAM 110使标记内容位于步骤(1.3)产生的经模糊化的描述符的中心,例如使得 记号的中间被放置在描述符的中间。SAM 110对要比较的每一记号对执行上述过程以供验 证。例如,SAM 110可对新记号和通过在框1104执行的粗略级分析标识出的特定聚类均值 执行上述过程。这得到针对正被比较的两个相应记号的两个描述符。在步骤(2),SAM 110 随后使用任何技术(诸如通过形成距离L2)来计算每一描述符对之间的距离。更具体地, SAM 110可形成在第一描述符中的每一位置与第二描述符中的每一相应位置之间的差,从 而从整体上得到多个差。相似性评估模块对这些差进行求和以生成最终距离测量q。在步 骤(3),SAM 110可使用距离测量q上的正态分布(例如,使用等式λ = exp (_q/2 σ 2))来 形成最终置信分数λ。
[0111] SAM 110执行以上描述的精细粒度空间分析(在框1106),因为粗略粒度时间分析 (在框1104)无法总是足以标识出相似的记号。图14的示例证明了这一点。如那里所示 出的,双"e"记号1406和"a"字符记号1408得到相应的时间描述符(1410、1412)。通过 比较,两个双"e"记号(1414、1416)得到相应的时间描述符(1418、1420)。观察者可明白 双"e"记号1406与"a"字符记号1408不是良好匹配。然而,描述符1410和1412之间的 区别不比描述符1418和1420之间的区别大很多。换言之,时间分析没有清楚地展现出双 "e"记号1406和"a"字符记号1408之间的差。为了解决这一缺点,SAM 110执行上述在描 述符之间的空间比较。事实上,空间描述符1402(对应于双"e"记号1406)和空间描述符 1422 (对应于"a"字符记号1408)之间存在相对于空间描述符1424和1426 (对应于两个双 "e"记号1414和1416)之间的差而言显著的差。
[0112] 如上所述,SAM 110可将每一新记号与每一个体先前记号进行比较。或者为了更 高效,SAM 110可将每一新记号与每一聚类均值进行比较。但是使用聚类均值的比较本身 可表示资源密集型计算。为了解决该问题,本章节的其余部分描述用于进一步加速搜索以 寻找到相似的先前标记的一种技术。
[0113] 首先考虑图15的示例。该图示出了当前记号(Φ·),其表示SPS 102已经处理 的最新近记号。该当前记号之前是先前记号(Φμ?)。如上所述,当前记号有30个样本与 先前记号一样,其对应于部分1502。即,新记号添加了先前记号中不存在的一个样本1504, 并省略了先前记号中存在的一个记号1506。进一步假设SAM 110已经确定先前记号与特定 聚类均值最相似。如果Φμ?和现有聚类均值之间不存在良好匹配,则将Φμ?分配 给新聚类,其中ψ最接近=φ先前。
[0114] SAM 110
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1