将先前手写实例用于手写美化和其他应用_5

文档序号:9438964阅读:来源:国知局
可预先计算类似于的聚类。例如假设聚类管理模块1002由于不 存在足够类似于的现有聚类而被迫为定义新聚类的情况。在创建了新聚类后, SAM 110将部分1502与其他现有聚类均值进行比较,并且省略在这些其他聚类均值中的末 端样本(例如对应于样本1504)。例如,假设当将末端样本从聚类均值Ψ3、Ψ#Ρ Ψ。中移 除时,SAM 110确定部分1502类似于这些聚类均值。SAM 110随后将该关联存储在例如查 找表等中。即,该关联使与聚类均值Ψ3、Ψ#Ρ Ψ。链接。随后,在计算当前聚类和 聚类均值(Φ3#?)之间的相似性的时间到来时,SAM 110可将当前记号与相关的聚类均值 Ψ3、Ψ#Ρ Ψ。进行比较,而非与整个聚类均值集合(其可以有很大的数目)进行比较。该 比较通过考虑这些相关聚类均值中的每一个的完全版本(例如通过现在将这些聚类均值 的末端样本包括在该比较中)来作出。
[0115] 图16示出用于建立记号和相关聚类集合之间的关系(例如在以上情况下,通过 建立部分1502及其相关聚类均值(Ψ3, Wb,Ψ。)的集合之间的关系)的过程1602。过程 1602由聚类管理模块1002使用SAM 110来执行。在框1604,聚类管理模块1002接收新记 号(Φ3#?)。在框1606,聚类管理模块1002确定新记号是否与现有聚类之一足够相似。如 果如此,则在框1608,聚类管理模块1002将新记号与最接近匹配聚类的聚类均值合并。由 于该聚类已经存在,因此不必计算与该最接近匹配聚类相关的其他聚类集合;即该假设是 聚类管理模块1002已经在例如该最接近匹配聚类最初被创建时为其确定了该相关集合。
[0116] 替换地,在框1610,假设新记号不与任何现有聚类匹配。作为响应,聚类管理模块 1002创建与新记号相关联的新聚类。在框1612,聚类管理模块1002随后尝试寻找到与新 记号相关的其他聚类的集合(其中更精确地说,比较在部分1502和每一聚类均值的省略 该聚类均值的末端样本的版本之间进行)。在一个方案中,聚类管理模块1002可通过将新 记号与每一个现有的个体聚类均值进行比较来执行该任务。在另一方案中,聚类管理模块 1002可通过随机地采样指定数目γ的聚类均值来执行该任务。假设在该随机搜索中,聚类 管理模块1002发现了与新记号相关的聚类均值t。查找表将展示出聚类t,并进而与预定 聚类集合(例如,聚类f、g等)相关。基于该知识,聚类管理模块1002随后例如通过将新 记号与聚类均值f、聚类均值g和聚类均值h等等进行比较来确定新记号与发现的每一相关 记号之间的相似性。在框1614,聚类管理模块1002通过存储将已经创建(以保持新记号) 的新聚类与所发现的相关聚类均值的集合链接的索引来存储在框1612建立的关系。过程 1602作为整体来考虑会建立聚类的交叉链接集合,其中查找表将每一聚类与相关的聚类集 合(如果有的话)链接。
[0117] 图17示出用于应用经由图16的过程1602习得的关系的过程1702。在框1704, SAM 110接收新记号(Φ·),该新记号在先前记号(Φ·)后面。在框1706, SAM 110标 识与先前记号匹配的聚类均值)。(注意,SAMllO已在先前步骤中在先前记号构成 当前记号时确定了该聚类均值。)在框1708, SAM 110标识已被预先确定为与相似的 相关聚类均值的集合。在框1710, SAM 110将新记号与标识出聚类均值的集合中的每一个 聚类均值进行比较。
[0118] D. iP,号细化樽块
[0119] 图18示出了图1的记号细化模块(TRM) 112的一个实现。TRM 112接收新记号和 由SAM 110标识出的相似记号中的每一者。考虑将仅合并两个记号的简要情况。对齐确定 模块1802将第一记号的各样本与第二样本的各相应记号进行比较。这会产生相关的记号。 记号混合模块1804随后将相关记号彼此混合。
[0120] 在一个应用中,SPS 102在TFM 112上调用以将新记号与被确定为与新记号最接 近地匹配的聚类均值混合。SPS 102在它操作以更新其存储在数据存储108中的聚类集合 时执行该任务。在另一应用中,SPS 102在TRM 112上调用以将新记号与在某一阈值相似 性水平内已被确定为与该新记号匹配的聚类均值集合混合。SPS 102在其寻求基于先前相 似记号来细化新记号的外观时执行该任务。
[0121] 图19示出归纳TRM 112的操作的过程1902。在框1904, TRM 112接收新记号。 在框1906, TRM 112从SAM 110接收一个或多个相似记号。在框1908, TRM 112 (使用以下 描述的技术)将每一个先前记号与新记号对齐。在框1910, TRM 112可将新记号的样本与 (诸)相似的先前记号中的相关样本混合。
[0122] 更具体地,TRM 112可通过把将对平均值有贡献的每一端点从极坐标转换到笛卡 尔坐标来执行框1910的操作,例如使用xk= r kcos( Θ k)和yk= r ksin( Θ k),其中(rk,Θ k) 对应于要被求平均的样本之一。TRM 112可随后将(与有贡献的样本相关联的)所有x值 一起求平均以提供所得的平均样本的平均值X,并且对于各y值进行相似的处理。TRM 112 可随后将所得的平均样本点转换回成极坐标。TRM 112可通过对各个体p值求平均来计算 经混合的压力值,其中每一个体P值被加权其相应样本的幅度(r)。注意,在出于美化新记 号的目的来执行混合时,TRM 112可执行附加计算,这些附加计算在图19中没有指定但在 以下将被描述。
[0123] 图20不出用于确定第一记号2002和第二记号2004中的样本之间的相关性的一 种技术。第一记号2002用呈现作为样本(Φ)的函数的取向(Θ )和幅度(r)值的第一描 述符2006和呈现作为样本(Φ)的函数的压力(p)值的第二描述符2008来表示。同样,第 二记号2004用第一和第二描述符(2010、2012)来描述。对齐确定模块1802首先计算成本 矩阵2014。成本矩阵中的每一单元由标识第一记号2002中的样本的第一索引和标识第二 记号2004中的样本的第二索引来定义。该单元具有描述在第一和第二记号中标识出的各 样本之间的差(ω)的值。在一种情况下,该差可被计算成:
[0124] ω = Δ r+ Δ θ + δ ρ
[0125] 在该等式中,值应于两个记号的幅度之间的绝对差,例如Δ r= |riH号厂riH g2|。值八0对应于两个记号的取向值之间的绝对角距离,例如Δ e = I Θ I . 如果P记号i = 0且P记号2 = 0或者如果P ?Ξ号I〉〇且Ρ?Ξ号2〉0,则5 P= I ;否则,5 P的值为I。 对齐确定模块1802随后通过成本矩阵2014寻找出从单元C11到单元C nn的最低成本路径 2016。在选择路径时,对齐确定模块1802可在每一步骤{(0, 1)、(1,0)和(1,1)}处从三 个移动中进行选择,这三个移动对应于:(a)从左移到右一;(b)以向上的方向移动丨;以及 (3)对角线移动/到目的地单元的每一移动均具有与其相关联的特定成本值,该特定成 g 本值被定义为ω+ξ,其中小成本值与大成本值相比更优选。以上定义了值ω ;在该上下文 中,ω测量由目的地单元的索引标识的两个记号之间的相似性。值ξ通过向对角线移动 分配为〇的值并向其他情况分配很小的正数值(例如,0.2)来支持对角线移动。对齐确定 模块1802可使用任何技术(诸如但不限于动态编程技术)来计算路径2016。
[0126] 记号混合模块1804可(出于笔划美化的目的)按以下方式将新记号与相似的先 前记号混合。首先,考虑以下观察:新记号中的任何给定笔划样本可实际上表示η个不 同的记号中的一样本,即O1Jlj Φ i(也即假设O1为"原来的"至少一个记号长度)。这些 记号Φ,(其中j e [i-n,i])中的每一个具有其自己的拥有相应的置信分数A]k(k e m]) 的候选聚类匹配叫的集合。置信分数λ ]k指示记号φ ,与聚类均值φ k匹配的程度,其可 使用距离L2上的正态分布来计算。对于聚类均值Φ,,样本Wk(其中I = i-j)将对 笔划样本t的细化有贡献。向样本Φ i分配的权重Wljk可使用下式计算:
[0127] CN 105190645 A 说明书 15/17 页
[0128] 在该等式中,AT指代例如具有均值n/2和标准差σ = n/6的正态分布。对高斯 加权的使用确保在细化时各记号的贡献之间的平滑转变。
[0129] 使用以上权重,记号混合模块1804现在可如下计算经细化的端点的笛卡尔值鳥::
[0131] 在该等式中,xi指代要细化的新记号的X坐标值,并且^对应于聚类均值中对新 记号的细化有贡献的坐标值。这些笛卡尔值可按以上描述的方式从存储的极坐标中计算 出。值w1]k对应于按上述方式计算出的加权因子。值^反映聚类k的大小,例如对应于聚 类的大小的平方根;因此以上等式将较高的权重分配给较大的聚类。笛卡尔坐标幾的经细 化的值和压力热的经细化的值可使用与上述针对竭描述的相似的方式来计算。具体地,记 号混合模块1804就一直等待,直到样本为在对其进行细化之前的"原来的"至少一个记号 长度。
[0132] E.其他应用
[0133] 图21示出搜索功能2102的一个实现,取代细化应用或作为其补充,该搜索功能表 示SPS 102的另一应用。搜索功能2102包括用于创建和管理索引的索引管理模块2104。 数据存储2106存储索引。更具体地,索引管理模块2104存储先前遇见的记号和这些记号 在文档内的相应位置之间的链接。例如,假设用户在过去已书写了单词"Sue"若干次。SAM 110可标识包含与该单词相关联的记号的一个或多个聚类。索引管理模块2014还将描述这 些记号在用户先前已创建的文档内的位置的信息存储在索引中。
[0134] 搜索模块2108可响应于用户的输入记号而提供任何搜索结果。例如,假设用户 再次输入单词"Sue"。搜索模块2108可首先从SAM 110接收指示与单词"Sue"相关联的 (诸)记号的信息。搜索模块2108可随后与索引进行交互以确定单词"Sue"的先前实例 在用户先前已创建的文档中的相应位置。搜索模块2108可随后按任何方式来向用户通知 这些先前的出现,诸如通过显示包含单词Sue 2112的文档2110并按任何方式将那个单词 Sue 2112突出显示在那个文档2110中。
[0135] 图22示出自动完成功能2202的一个实现,取代细化应用或作为其补充,该自动完 成功能表示SPS 102的另一应用。自动完成功能2202包括预测一个记号将跟随另一记号 的可能性的预测确定模块2204。自动完成功能2202可按任何方式来执行该任务,例如通过 对训练语料库内的记号
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1