检索设备和检索方法

文档序号:6539814阅读:147来源:国知局
检索设备和检索方法
【专利摘要】根据实施例,提供一种检索设备和检索方法。设备包括获取部、分割部、提取部、计算部和检索部。获取部被配置成获取多个第一点序列。分割部被配置成将多个第一点序列的每一个分割成多个第二点序列。提取部被配置成提取多个第二点序列中的每一个的特征向量。计算部被配置成基于多个第二点序列之间的最佳路径,计算多个第一点序列之间的距离,多个第二点序列属于多个第一点序列中的每一个。检索部被配置成使用距离来检索与多个第一点序列相对应的数据。
【专利说明】检索设备和检索方法
[0001] 相关申请的交叉引用
[0002] 本申请是基于并且要求2013年5月31日提交的第2013-116419号日本专利申请 的优先权;其全部内容通过引用而结合在本文中。

【技术领域】
[0003] 这里所述的实施例一般与检索设备和检索方法有关。

【背景技术】
[0004] 已知一种从数据库检索与由点序列组成的查询相匹配或类似的数据的技术。


【发明内容】

[0005] 实施例的目的在于提供一种检索设备,该检索设备能够在提高检索精确度的同时 抑制检索速度的减少。
[0006] 根据实施例,设备包括获取部、分割部、提取部、计算部和检索部。获取部被配置成 获取多个第一点序列。分割部被配置成将多个第一点序列的每一个分割成多个第二点序 列。提取部被配置成提取多个第二点序列中的每一个的特征向量。计算部被配置成基于多 个第二点序列之间的最佳路径来计算多个第一点序列之间的距离,该多个第二点序列属于 多个第一点序列中的每一个。检索部被配置成使用距离来检索与多个第一点序列相对应的 数据。
[0007] 根据如上所述的设备,检索速度的减少能够被抑制并且检索精确度能够被提高。

【专利附图】

【附图说明】
[0008] 图1是图解实施例的典型检索设备的配置图;
[0009] 图2是图解实施例中的笔划的实例的图;
[0010] 图3是图解实施例中的笔划的实例的图;
[0011] 图4是图解实施例中的墨水数据(ink data)的数据结构的实例的图;
[0012] 图5是图解表示实施例中的副笔划的数据的数据结构的实例的图;
[0013] 图6是图解实施例中的DP匹配的实例的图;
[0014] 图7是图解实施例的检索实例的图;
[0015] 图8是图解实施例的显示实例的图;
[0016] 图9是图解实施例的处理实例的流程图;
[0017] 图10是图解实施例的检索设备的典型硬件配置的图;
[0018] 图11是图解实施例的检索设备的实例的图。

【具体实施方式】
[0019] 下面参照附图将给出实施例的详细描述。
[0020] 在实施例中,将给出以下情况的描述:由用户手写的手写字符串被用作从预先书 写的(例如,大量的)手写文档进行检索的查询。这里,在实施例中,主要地,例如,将给出字 符串的描述。但是,查询可以是自由手写的,由用户绘画的诸如线或者标记的字符码没有被 分割给自由手写。任何方法可以被用作用于通过用户指定手写字符串的方法。例如,用户可 以实际上手写字符串以指定查询。用户可以从现存的手写文档选择要被用作查询的部分。 用户可以从用于查询的模板中选择要被用作查询的部分。可以使用这些方法的结合。
[0021] 图1是图解实施例的典型检索设备10的配置图。如图1所示,检索设备10包括 输入单元11、获取单元13、墨水数据存储单元15、分割单元17、提取单元19、特征向量存储 单元21、计算部23、检索单元25、显示控制单元27和显示单元29。
[0022] 输入单元11能够通过例如输入装置来实现,输入装置允许手写输入,输入装置诸 如是触摸屏、触摸板、电子笔或者计算机鼠标。获取单元13、分割单元17、提取单元19、计算 部23、检索单元25和显示控制单元27可以通过例如由诸如中央处理单元(CPU)的处理单 元执行程序来实现,即,通过软件来实现,或者可以通过诸如集成电路(1C)的硬件来实现。 换句话说,这些单元可以通过结合软件和硬件来实现。墨水数据存储单元15和特征向量存 储单元21可以通过例如存储装置来实现,该存储装置允许磁的、光的或电的存储,例如可 以是硬盘驱动器(HDD)、固态驱动器(SSD)、存储卡、光盘或者随机存取存储器(RAM)。显示 单元29可以通过例如诸如触摸显示器和液晶显示器的显示装置来实现。
[0023] 输入单元11将多个第一点序列输入到检索设备10。在实施例中,输入单元11将 多个笔划(多个第一点序列的一个实例)输入到检索设备10,笔划是用户以字符和类似的内 容为意图而手写(绘画)或指定的。但是,不应该以限定意义来解释。在实施例中,输入单元 11是触摸屏。假定用户使用用于在触摸屏上手写的记录笔或者手指,以便输入多个笔划。 但是,不应该以限定意义来解释。输入单元11可以通过例如触摸板、电子笔或者计算机鼠 标来实现。
[0024] 笔划意思是通过用户手写的一个笔划,即,从记录笔或者手指与触摸屏的输入表 面开始接触的时间直到记录笔或者手指举起离开输入表面(从笔向下状态直到笔向上状 态)的轨迹。例如,表示笔划的数据包括在记录笔或者手指相对于触摸屏的输入表面的轨迹 上的采样点(时间序列坐标值)、轨迹的外接矩形和轨迹的笔压力。
[0025] 具体地,当记录笔或者手指相对于触摸屏的输入表面变成笔向下状态时,触摸屏 对记录笔或者手指相对于输入表面的轨迹上点、轨迹的笔压力和从开始输入轨迹的时间所 经过的时间进行周期性采样。当记录笔或者手指变成笔向上状态时,触摸屏提取轨迹的外 接矩形,以便生成表示笔划的数据,并且将该数据输入到检索设备10。
[0026] 图2和图3是图解实施例中的笔划的实例的图。在图2所示的实例中,图解笔划 的采样点。在图3所示的实例中,图解在图2中所示的采样点按时间顺序经过线性插值的 笔划。在图2和图3所示的实例中,周期性地执行采样(以固定周期)。但是,由于用户的书 写速度而改变了采样点之间的坐标距离。这里,笔划中的采样点的数目对于每个笔划是不 同的。
[0027] 获取单元13获取多个第一点序列。在实施例中,获取单元13从输入单元11顺序 地获取笔划输入,以便获取多个笔划。当笔划的获得完成时,即,当从输入单元11完成笔划 的输入时,获取单元13将墨水数据存储在墨水数据存储单元15中,该墨水数据为表示获取 的笔划的一组数据。这里,从输入单元11输入笔划的完成包括用户结束书写手写字符串的 情况,进行手写字符串的保存操作的情况,以及类似的情况。即,墨水数据起到表示对于每 个页面(文档)的笔划组的数据。
[0028] 在获取单元13将多个笔划组存储在墨水数据存储单元15中的情况下,墨水数据 能够与页面(文档)ID相关联,以便识别个别笔划组。换句话说,获取单元13能够使表示笔 划的数据与笔划ID相关联,以便识别个别笔划。
[0029] 图4是图解实施例中的墨水数据的数据结构的实例的图,并且图解通过获取单元 13在墨水数据存储单元15中存储的墨水数据的数据结构。在实施例中,墨水数据通过三层 数据结构被表示,该三层数据结构包括墨水数据结构,笔划结构和点结构。但是,不应该以 限定意义来解释。
[0030] 墨水数据结构是包括构成笔划组的笔划的总数和构成笔划组的各个笔划的笔划 结构的结构。笔划结构是包括以下的结构:构成笔划的采样点的总数、开始输入笔划的开始 时间(笔向下状态开始的时间)、笔划的外接矩形、和构成笔划的各个采样点的点结构。在实 施例中,笔划的外接矩形具有包含笔划的最小面积的矩形形状。但是,不应该以限定意义来 解释。点结构是包括X坐标、y坐标、笔压力和距离采样点的开始时间的时间差的结构。这 里,包括X坐标和y坐标的坐标系统能够是这样的坐标系统,原点在触摸屏的输入表面上的 左上角(角度),X坐标的值朝着触摸屏的右侧变得更大,并且y坐标的值朝着触摸屏的下侧 变得更大。
[0031] 在触摸屏不能对笔压力进行采样的情况下,或者在笔压力不被用于随后的处理的 情况下,点结构中的压力可以被省略或者指示无效的值可以被设定成点结构中的笔压力。 在触摸屏不能对诸如开始时间和距离开始时间的时间差的时间进行采样的情况下,或者在 时间不被用于随后的处理的情况下,指示点结构的次序可以被设定成点结构中的时间差, 点结构中的时间差可以被省略,或者指示无效的值可以被设定成点结构中的时间差。
[0032] 在笔划结构的每个项目中,可以书写实际数据。为了分别管理来自彼此的墨水数 据结构的数据和笔划结构的数据,对应笔划结构的链接信息可以被写入墨水数据结构中的 笔划结构的区域中。类似地,在点结构的每个项目中,可以书写实际数据。为了分别管理来 自彼此的笔划结构的数据和点结构的数据,对应点结构的链接信息可以被写入笔划结构中 的点结构的区域中。
[0033] 分割单元17将通过获取单元13获取的多个第一点序列中的每一个分割成多个第 二点序列。在实施例中,分割单元17将构成笔划组(多个笔划)的每个笔划分割成多个副笔 划,笔划组由存储在墨水数据存储单元15中的墨水数据指示。分割单元17将表示各个副 笔划的数据和指示哪个数据表示这个数据所属于的笔划的链接信息添加到墨水数据存储 单元15中存储的墨水数据。
[0034] 图5是图解表示实施例中的副笔划的数据的数据结构的实例的图,并且图解通过 分割单元17添加到墨水数据存储单元15中的数据的数据结构。在实施例中,表示副笔划 的数据通过两层数据结构被表示,两层数据结构包括副笔划结构和点结构。但是,不应该以 限定意义来解释。
[0035] 副笔划结构是包括以下的结构:构成副笔划的采样点的总数、开始输入副笔划的 开始时间、对于副笔划所属于的笔划的笔划结构的指针、副笔划的外接矩形、和构成副笔划 的各个采样点的点结构。
[0036] 分割单元17将笔划分割成多个副笔划,因此例如多个副笔划的各个曲率变成等 于或小于阈值。这里,笔划的曲率可以在每个采样点被计算。但是,采样点的数目依赖于笔 划的尺寸和采样率而改变。因此,在这样的情形下,允许计算曲率的点对于每个笔划改变。
[0037] 因此,分割单元17通过固定数量的采样点来近似笔划,并且进行重新采样,以便 确保采样点之间的恒定距离。分割单元17例如通过线性插值计算重新采样点的坐标值,以 便确保采样点之间的恒定距离。在这种情况下,在分割单元17减少重新采样点的数目时, 笔划被近似成直线。
[0038] 例如,在作为分割目标的笔划S中从重新采样点Sbase到重新采样点Si的曲率C s (base,i )由方程式(1)来表不。
[0039]

【权利要求】
1. 一种设备,其特征在于,所述设备包含: 获取部,所述获取部被配置成获取多个第一点序列; 分割部,所述分割部被配置成将所述多个第一点序列中的每一个分割成多个第二点序 列; 提取部,所述提取部被配置成提取所述多个第二点序列中的每一个的特征向量; 计算部,所述计算部被配置成基于所述多个第二点序列之中的最佳路径,来计算所述 多个第一点序列之间的距离,所述多个第二点序列属于所述多个第一点序列中的每一个, 和 检索部,所述检索部被配置成使用所述距离来检索与所述多个第一点序列相对应的数 据。
2. 如权利要求1所述的设备,其特征在于, 所述分割部被配置成将所述多个第一点序列中的每一个分割成所述多个第二点序列, 以使所述多个第二点序列中的每一个的曲率变成等于或小于阈值。
3. 如权利要求1所述的设备,其特征在于, 所述分割部被配置成将所述多个第一点序列中的每一个分割成所述多个第二点序列, 以使所述多个第二点序列中的每一个的长度变成等于或小于阈值。
4. 如权利要求1所述的设备,其特征在于, 所述分割部被配置成将所述多个第一点序列中的每一个分割成所述多个第二点序列, 以使所述多个第二点序列的数目变成第一数目。
5. 如权利要求1所述的设备,其特征在于,进一步包含显示控制器,所述显示控制器被 配置成在显示单元上显示检索的数据。
6. 如权利要求5所述的设备,其特征在于, 所述多个第一点序列构成由用户手写的字符串的笔划组, 所述多个第二点序列中的每一个与所述笔划组的笔划的副笔划相对应, 所述数据是指示字符串的字符串数据, 所述获取部被配置成通过顺序地获取构成所述笔划组的笔划,来获取所述笔划组, 所述分割部被配置成将构成所述笔划组的每个所述笔划分割成多个副笔划, 所述计算部被配置成基于属于构成所述笔划组的每个所述笔划的所述副笔划之间的 最佳路径,来计算构成所述笔划组的所述笔划之间的距离, 所述检索部被配置成使用所述距离,来检索与所述笔划组相对应的所述字符串数据, 并且 所述显示控制器被配置成在所述显示单元上显示检索的所述字符串数据。
7. 如权利要求1所述的设备,其特征在于, 所述获取部被配置成获取由用户指定的所述多个第一点序列。
8. -种方法,其特征在于,包含: 获取多个第一点序列; 将所述多个第一点序列中的每一个分割成多个第二点序列; 提取所述多个第二点序列中的每一个的特征向量; 基于属于所述第一点序列中的每一个的所述多个第二点序列之间的最佳路径,来计算 所述多个第一点序列之间的距离;并且 使用所述距离来检索与所述多个第一点序列相对应的数据。
【文档编号】G06F17/30GK104216940SQ201410082975
【公开日】2014年12月17日 申请日期:2014年3月7日 优先权日:2013年5月31日
【发明者】柴田智行, 登内洋次郎 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1