基于倒排表的数据检索方法、系统、介质及装置与流程

文档序号:26484215发布日期:2021-08-31 17:40阅读:82来源:国知局
基于倒排表的数据检索方法、系统、介质及装置与流程

本发明属于数据检索技术领域,具体涉及一种基于倒排表的数据检索方法、系统、介质及装置。



背景技术:

在智慧社区、智能安防和ai城市等方面都会涉及到大规模的图片或视频数据的检索,而基于倒排索引进行检索是在大规模向量相似度检索中常用的方法。

目前,在构建倒排表的过程中,以大规模人脸特征的检索为例,人脸照片由特定区域的某个特定的摄像头拍摄而具有了空间属性,同时该人脸照片的拍摄时间能够作为其时间属性,一般会将人脸照片的时间和空间属性编码到人脸特征中,将其看作是人脸特征的一部分,再进一步将该人脸特征添加到倒排表,从而加入数据库。

但是,现有的将人脸照片的时间和空间属性编码到特征中的方法会使得人脸特征变长,对设备储存的要求较高,同时也使得检索过程变得更加漫长。

相应地,本领域需要一种改进的基于倒排表的数据检索方法来解决上述问题。



技术实现要素:

为了解决或至少部分解决:现有的将人脸照片的时间和空间属性编码到特征中的方法会使得人脸特征变长,对设备储存的要求较高,同时也使得检索过程变得更加漫长的问题。本发明提供了一种基于倒排表的数据检索方法、系统、介质及装置。

第一方面,本发明提供了一种基于倒排表的数据检索方法,包括:获取数据检索所需的输入特征向量以及输入标签信息;基于所述输入特征向量以及所述输入标签信息在所有的倒排表中进行数据检索;其中,所述倒排表存储有数据的特征向量以及标签信息,所述标签信息具有时空属性。

作为本发明提供的上述数据检索方法的一种优选的技术方案,“基于所述输入特征向量以及所述输入标签信息在所有的倒排表中进行数据检索”的步骤包括:将所述输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与所述输入特征向量相似的多个相似倒排表;依据所述输入标签信息的起始标签和终止标签在所述多个相似倒排表中分别进行数据查找,以找到位于所述起始标签和所述终止标签区间内的标签信息对应的多个第一特征向量;将所述输入特征向量与所述多个第一特征向量分别进行向量相似性检索,以确定出与所述输入特征向量最相似的topk个第二特征向量所对应的目标数据。

作为本发明提供的上述数据检索方法的一种优选的技术方案,在“将所述输入特征向量与所述多个第一特征向量分别进行向量相似性检索,以确定出与所述第一特征向量最相似的topk个第二特征向量对应的目标数据”的步骤具体包括:将每个相似倒排表中的多个第一特征向量分别与所述输入特征向量进行扫描比对,并通过一个大小为topk的最大堆/最小堆根据对比的结果收集得到所有的第二特征向量,然后将所有的第二特征向量进行堆排序,并以所述堆排序的结果确定所有的第二特征向量对应的目标数据。

作为本发明提供的上述数据检索方法的一种优选的技术方案,所述输入特征向量为待新增的数据的特征向量,且所述输入标签信息为待新增的数据的标签信息;“基于所述输入特征向量以及所述输入标签信息在所有的倒排表中进行数据检索”的步骤包括:将所述输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与所述输入特征向量最相似的最相似倒排表;基于所述输入标签信息在所述最相似倒排表中查找所述待新增的数据的待插入位置,并将所述待新增的数据存储到所述待插入位置。

作为本发明提供的上述数据检索方法的一种优选的技术方案,所述倒排表的生成的方法包括:获取训练样本中包含特征向量以及标签信息的数据;根据预设的簇中心的数量将训练样本中的所有数据的特征向量进行聚类;将聚类后各簇中的数据以标签信息升序的方式排序后形成多个所述倒排表。

作为本发明提供的上述数据检索方法的一种优选的技术方案,所述倒排表中的数据的删除方法包括:基于待删除的数据的起始标签和终止标签在所有的所述倒排表中进行二分查找;将所述倒排表中位于起始标签和终止标签区间中的待删除的数据的标签信息和特征向量全部移出。

第二方面,本发明还提供了一种基于倒排表的数据检索系统,包括:第一获取模块,用于获取数据检索所需的输入特征向量以及输入标签信息;检索模块,用于基于所述输入特征向量以及所述输入标签信息在所有的倒排表中进行数据检索;其中,所述倒排表存储有数据的特征向量以及标签信息,所述标签信息具有时空属性。

作为本发明提供的上述数据检索系统的一种优选的技术方案,所述检索模块具体包括:第一相似度检索模块,用于将所述输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与所述输入特征向量相似的多个相似倒排表;第一查找模块,用于依据所述输入标签信息的起始标签和终止标签在所述多个相似倒排表中分别进行数据查找,以找到位于所述起始标签和所述终止标签区间内的标签信息对应的多个第一特征向量;向量相似性检索模块,用于将所述输入特征向量与所述多个第一特征向量分别进行向量相似性检索,以确定出与所述输入特征向量最相似的topk个第二特征向量所对应的目标数据。

作为本发明提供的上述数据检索系统的一种优选的技术方案,所述向量相似性检索模块具体用于:将每个相似倒排表中的多个第一特征向量分别与所述输入特征向量进行扫描比对,并通过一个大小为topk的最大堆/最小堆根据对比的结果收集得到所有的第二特征向量,然后将所有的第二特征向量进行堆排序,并以所述堆排序的结果确定所有的第二特征向量对应的目标数据。

作为本发明提供的上述数据检索系统的一种优选的技术方案,所述输入特征向量为待新增数据的特征向量,且所述输入标签信息为待新增数据的标签信息;所述检索模块具体还包括:第二相似度检索模块,用于将所述输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与所述输入特征向量最相似的最相似倒排表;第二查找模块,用于基于所述输入标签信息在所述最相似倒排表中查找所述待新增的数据的待插入位置,并将所述待新增的数据存储到所述待插入位置。

作为本发明提供的上述数据检索系统的一种优选的技术方案,还包括用于建立所述倒排表的训练模块;所述训练模块具体包括:第二获取模块,用于获取训练样本中包含特征向量以及标签信息的数据;聚类模块,用于根据预设的簇中心的数量将训练样本中的所有数据的特征向量进行聚类;排序模块,用于将聚类后各簇中的数据以标签信息升序的方式排序后形成多个所述倒排表。

第三方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行前述第一方面中任一技术方案中的所述数据检索方法。

第四方面,本发明还提供了一种基于倒排表的数据检索的装置,包括处理器和存储器,所述存储器中存储有多条程序代码,所述程序代码适于由所述处理器加载并运行以执行前述第一方面中任一技术方案的所述数据检索方法。

在本发明提供的一种基于倒排表的数据检索方法中,通过基于输入特征向量以及输入标签信息在所有的倒排表中进行数据检索,其中的倒排表存储有数据的特征向量以及标签信息,标签信息具有时空属性。从而,该方法不仅能够支持具有时间/空间范围要求的大规模向量相似性检索,还减少了数据的特征向量的长度,降低了对设备存储能力的要求。同时,通过基于输入特征向量以及输入标签信息在所有的倒排表中进行数据检索,还能够减少倒排表中特征向量需要与输入特征向量进行匹配的数量,使得数据检索的过程更加高效。

进一步,在本发明提供的一种基于倒排表的数据检索方法中,一方面通过先将输入特征向量先与所有的倒排表的簇中心分别进行相似度检索,以缩小数据检索的范围;然后再依据输入标签信息的起始标签和终止标签在相似度检索得到的多个相似倒排表中分别进行数据查找,进一步缩小了数据检索的范围;最后将输入特征向量与数据查找得到的多个第一特征向量进行向量相似性检索后得到目标数据。如此,极大的提高了数据检索的效率。

附图说明

下面参照附图来描述本实施例的具体实施方式,附图中:

图1为本实施例的基于倒排表的数据检索方法的主要流程示意图;

图2为本实施例的基于倒排表的数据检索方法的详细流程示意图;

图3为本实施例的基于倒排表的数据检索方法中所用的倒排表的示意图;

图4为本实施例提供的第一种终端设备的硬件结构示意图;

图5为本实施例提供的第二种终端设备的硬件结构示意图。

具体实施方式

下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。

在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。

术语“a和/或b”表示所有可能的a与b的组合,比如只是a、只是b或者a和b。术语“至少一个a或b”或者“a和b中的至少一个”含义与“a和/或b”类似,可以包括只是a、只是b或者a和b。单数形式的术语“一个”、“这个”也可以包含复数形式。当然,上述可以替换的实施方式之间、以及可以替换的实施方式和优选的实施方式之间还可以交叉配合使用,从而组合出新的实施方式以适用于更加具体的应用场景。

为了解决或至少部分解决:现有的将人脸照片的时间和空间属性编码到特征中的方法会使得人脸特征变长,对设备储存的要求较高,同时也使得检索过程变得更加漫长的问题。本实施例提供了一种基于倒排表的数据检索方法、系统、介质及装置。

第一方面

本实施例提供了一种基于倒排表的数据检索方法,如图1所示,该包括:

s1、获取数据检索所需的输入特征向量以及输入标签信息。

s2、基于输入特征向量以及输入标签信息在所有的倒排表中进行数据检索;其中,倒排表存储有数据的特征向量以及标签信息,标签信息具有时空属性。

其中,如图3所示,该倒排表包括存储数据的特征向量的特征容器以及存储数据的标签信息的标签容器,且标签信息具有时空属性。具体地,图3中示出了n个倒排表,每个倒排表对应一个簇中心。标签容器为有序容器,每个倒排表中的数据均按照标签升序的方式进行排列,而特征容器中的特征向量也按照数据的标签信息的顺序进行排列。例如在图3示出的倒排表1中包括第1个数据至第m个数据,其中,通过“id_1_1”表示倒排表1中第1个数据在标签容器中的标签信息,而“特征1_1”表示倒排表1中第1个数据在特征容器中的特征向量。

示例性地,适用于本实施例的基于倒排表的数据检索方法的数据可以为视频数据、图片数据、声音数据、文字数据等,这些数据能够通过特征向量进行表示,且数据一般会有标签信息(id)。例如,特定区域进行监控所用的摄像头的编号能够表示其获取的照片数据或者视频数据的空间信息,同时记录的拍照时间或者摄像时间能够表示该照片数据或者视频数据的时间信息。具体地,数据的标签信息可以由一个64位二进制数进行表示,前32位表示空间信息(例如摄像头编号),后32位根据表示时间信息,这样数据的标签信息就具有了时空属性。本实施例通过将含有时空属性的信息储存在数据的标签信息中,减少了数据的特征向量的长度,能够支持具有时间/空间范围要求的大规模向量相似性检索。

可以理解的是,在本实施例提供的一种基于倒排表的数据检索方法中,通过基于输入特征向量以及输入标签信息在所有的倒排表中进行数据检索,其中的倒排表存储有数据的特征向量以及标签信息,标签信息具有时空属性。从而,该方法不仅能够支持具有时间/空间范围要求的大规模向量相似性检索,还减少了数据的特征向量的长度,降低了对设备存储能力的要求。同时,通过基于输入特征向量以及输入标签信息在所有的倒排表中进行数据检索,还能够减少倒排表中特征向量需要与输入特征向量进行匹配的数量,使得数据检索的过程更加高效。

作为本实施例提供的上述数据检索方法的一种优选的实施方式,当需要通过检索以访问某个时间和/或空间内具有某些特征的数据时,例如需要根据输入的人脸照片查找出该人在不同时间的移动轨迹时,该输入特征向量为该人的人脸照片对应的特征向量,如图2所示,步骤s2具体包括:

s211、将输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与输入特征向量相似的多个相似倒排表。

示例性地,每个倒排表对应一个簇,其簇中心可以根据该簇中所有数据的特征向量得到的平均特征向量。计算输入特征向量到n个倒排表的簇中心的距离,然后按照距离由近及远的顺序将各簇中心排序,将距离输入特征向量最近的s个的簇中心对应的倒排表作为多个相似倒排表。

s212、依据输入标签信息的起始标签和终止标签在多个相似倒排表中分别进行数据查找,以找到位于起始标签和终止标签区间内的标签信息对应的多个第一特征向量。

示例性地,通过遍历s个相似倒排表,对s个相似倒排表中的每个倒排表的标签容器中执行二分查找,以找到位于起始标签和终止标签区间内的数据,以及这些数据对应的第一特征向量。

s213、将输入特征向量与多个第一特征向量分别进行向量相似性检索,以确定出与输入特征向量最相似的topk个第二特征向量所对应的目标数据。

在步骤s213中可以具体包括:将每个相似倒排表中的多个第一特征向量分别与输入特征向量进行扫描比对,并通过一个大小为topk的最大堆/最小堆根据对比的结果收集得到所有的第二特征向量,然后将所有的第二特征向量进行堆排序,并以堆排序的结果确定所有的第二特征向量对应的目标数据。

示例性地,在将每个相似倒排表中的多个第一特征向量分别与输入特征向量进行扫描比对时能够得到每个第一特征向量对应的相似性得分,在每个相似倒排表中,都可以筛选出topk个最相似的数据并按照得分进行堆排序。

可以理解的是,在本实施例提供的一种基于倒排表的数据检索方法中,一方面通过先将输入特征向量先与所有的倒排表的簇中心分别进行相似度检索,以缩小数据检索的范围;然后再依据输入标签信息的起始标签和终止标签在相似度检索得到的多个相似倒排表中分别进行数据查找,进一步缩小了数据检索的范围;最后将输入特征向量与数据查找得到的多个第一特征向量进行向量相似性检索后得到目标数据。如此,极大的提高了数据检索的效率。

作为本实施例提供的上述数据检索方法的一种优选的实施方式,输入特征向量为待新增的数据的特征向量,且输入标签信息为待新增的数据的标签信息;例如,当需要新增一辆车的照片时,需要找到存储该车类型的倒排表,并将其插入到指定的位置,这时步骤s2具体可以包括:

s221、将输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与输入特征向量最相似的最相似倒排表。

示例性地,可以计算输入特征向量到n个簇中心的距离,按照距离排序后找到与输入特征向量距离最近的簇中心对应的倒排表作为最相似倒排表。

s222、基于输入标签信息在最相似倒排表中查找待新增的数据的待插入位置,并将待新增的数据存储到待插入位置。例如,可以按照标签升序的方式找到该待新增数据插入到倒排表的相应位置。在待插入位置将待新增数据的特征向量保存到特征容器以及将待新增数据的标签信息保存到标签容器。

作为本实施例提供的上述数据检索方法的一种优选的实施方式,上述倒排表的生成的方法包括:

s101、获取训练样本中包含特征向量以及标签信息的数据。

示例性地,训练样本中的数据需要有标签信息(id)和特征向量。该步骤中需要根据设定的倒排表的数量(即簇中心的数量)以及每个簇中心最多参与的数据的数量确定训练样本中的数据的数量。例如,簇中心的数量n=4096,每个簇中心最多参与的数据的数量为256,则参与训练的数据的总量不超过4096*256。当训练数据太多时,需要先进行采样。当训练可用的数据太少时,需要先增加训练可用的数据,以使生成的簇中心具有较好的代表性

s102、根据预设的簇中心的数量将训练样本中的所有数据的特征向量进行聚类。

示例性地,步骤s102具体的实现过程可以如下:

1)初始化

从训练样本中的数据中随机选取n个数据作为初始簇中心点,并且对数据进行归一化,然后每个维度取整。

2)迭代调整簇中心

每一轮迭代算法规则包括:

2.1数据分簇:对每个训练样本中的数据,遍历所有簇中心,计算当前数据到每个簇中心的距离,找到距离最近的那个簇中心,便可以认为当前数据属于该簇,并将该当前数据保存到最近簇中。

2.2更新簇中心:遍历上述生成的簇,将属于同一个簇的训练数据累加并求出平均特征向量,用此平均特征向量作为新的簇中心。

2.3大簇拆分:由于初始化的原因或者迭代过程中的其他原因,可能导致有的簇中的数据太多,有的簇中数据很少,为了避免生成的倒排表出现长度失衡而影响并发检索,可以将数据太多的大簇拆分成两个簇。

s103、将聚类后各簇中的数据以标签信息升序的方式排序后形成多个倒排表。

可以理解的是,将聚类后的同一簇中所有数据的特征向量存储在特征容器中,以及将同一簇中所有数据的标签信息存储在标签容器中,并且聚类后的同一簇中的所有数据按照标签信息升序的方式进行排序形成倒排表,如图3所示。其中,当聚类的过程中迭代收敛后,即形成n个倒排表且有n个簇中心作为各倒排表的入口。

作为本实施例提供的上述数据检索方法的一种优选的实施方式,可以理解的是,当需要删除一个特定的时空区间的数据时,例如需要删除某个时间段的某个摄像头拍摄的照片或者视频的情形下,该倒排表中的数据的删除方法包括:

s41、基于待删除的数据的起始标签和终止标签在所有的倒排表中进行二分查找。

s41、将倒排表中位于起始标签和终止标签区间中的待删除的数据的标签信息和特征向量全部移出。

其中,倒排表包括存储数据的特征向量的特征容器以及存储数据的标签信息的标签容器,标签信息具有时空属性。

可理解的是,由于本实施例提供的数据检索和删除方法所用到的倒排表包括特征容器和标签容器,也可以只是通过起始标签和终止标签区间进行数据检索,当待删除数据的标签信息位于起始标签和终止标签区间时,可以直接将检索结果中的数据删除。因而,本实施例提供的基于倒排表的数据检索和删除方法均能够支持具有时间/空间范围要求的大规模向量相似性检索,能够满足用户相应的检索需求,并使得检索过程更高效。

需要说明的是,尽管上文详细描述了本实施例方法的详细步骤,但是,在不偏离本实施例的基本原理的前提下,本领域技术人员可以对上述步骤进行组合、拆分及调换顺序,如此修改后的实施范式并没有改变本实施例的基本构思,因此也落入本实施例的保护范围之内。例如,虽然图3以及上述实施例的步骤s211至213中是先将输入特征向量与所有的倒排表的簇中心分别进行相似度检索,然后再依据输入标签信息的起始标签和终止标签在倒排表中分别进行数据查找。但是,也可以先依据输入标签信息的起始标签和终止标签在倒排表中分别进行数据查找,然后在查找结果的基础上将输入特征向量与所有的倒排表的簇中心分别进行相似度检索,其仍属于发明的保护范围之内。

第二方面

实施例还提供了一种基于倒排表的数据检索系统,包括:第一获取模块,用于获取数据检索所需的输入特征向量以及输入标签信息;检索模块,用于基于输入特征向量以及输入标签信息在所有的倒排表中进行数据检索;其中,倒排表存储有数据的特征向量以及标签信息,标签信息具有时空属性。

作为本实施例提供的上述数据检索系统的一种优选的实施方式,检索模块具体包括:第一相似度检索模块,用于将输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与输入特征向量相似的多个相似倒排表;第一查找模块,用于依据输入标签信息的起始标签和终止标签在多个相似倒排表中分别进行数据查找,以找到位于起始标签和终止标签区间内的标签信息对应的多个第一特征向量;向量相似性检索模块,用于将输入特征向量与多个第一特征向量分别进行向量相似性检索,以确定出与输入特征向量最相似的topk个第二特征向量所对应的目标数据。

作为本实施例提供的上述数据检索系统的一种优选的实施方式,向量相似性检索模块具体用于:将每个相似倒排表中的多个第一特征向量分别与输入特征向量进行扫描比对,并通过一个大小为topk的最大堆/最小堆根据对比的结果收集得到所有的第二特征向量,然后将所有的第二特征向量进行堆排序,并以堆排序的结果确定所有的第二特征向量对应的目标数据。

作为本实施例提供的上述数据检索系统的一种优选的实施方式,输入特征向量为待新增数据的特征向量,且输入标签信息为待新增数据的标签信息;检索模块具体还包括:第二相似度检索模块,用于将输入特征向量与所有的倒排表的簇中心分别进行相似度检索,得到与输入特征向量最相似的最相似倒排表;第二查找模块,用于基于输入标签信息在最相似倒排表中查找待新增的数据的待插入位置,并将待新增的数据存储到待插入位置。

作为本实施例提供的上述数据检索系统的一种优选的实施方式,还包括用于建立倒排表的训练模块;训练模块具体包括:第二获取模块,用于获取训练样本中包含特征向量以及标签信息的数据;聚类模块,用于根据预设的簇中心的数量将训练样本中的所有数据的特征向量进行聚类;排序模块,用于将聚类后各簇中的数据以标签信息升序的方式排序后形成多个倒排表。

需要说明的是,本实施例提供的基于倒排表的数据检索系统与前述第一方面中的基于倒排表的数据检索方法是相互对应的,故不再对本实施例中的系统进行赘述,关于该系统的说明请参见前述的第一方面中的内容。

还需说明的是,上述实施例提供的基于倒排表的数据检索系统,仅以上述各功能模块(如第一获取模块和检索模块等)的划分进行举例说明,在实际应用中,可以根据需要而将上述功能模块由不同的功能模块来完成,即将本发明实施例中的功能模块再分解或者组合,例如,上述实施例的功能模块可以合并为一个功能模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的功能模块名称,仅仅是为了进行区分,不视为对本实施例的不当限定。

第三方面

本领域的技术人员应当理解的是,在本实施例提供的一种计算机可读存储介质中,该存储介质存储有多条程序代码,该程序代码适于由处理器加载并运行以执行前述第一方面任一种实施方式中的数据检索方法。

其中,该存储介质中包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

第四方面

本实施例还提供了一种基于倒排表的数据检索的装置,该装置包括处理器和存储器,所述存储器中存储有多条程序代码,所述程序代码适于由所述处理器加载并运行以执行前述第一方面中任一实施方式中的数据检索方法。

第五方面

本实施例主要通过一个应用于终端设备的场景中,对本发明的基于倒排表的数据检索方法的实现做进一步说明。终端设备的硬件结构如图4所示。该终端设备可以包括:输入设备1100、第一处理器1101、输出设备1102、第一存储器1103和至少一个通信总线1104。通信总线1104用于实现元件之间的通信连接。第一存储器1103可能包含高速ram存储器,也可能还包括非易失性存储nvm,例如至少一个磁盘存储器,第一存储器1103中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。

可选的,上述第一处理器1101例如可以为中央处理器(centralprocessingunit,简称cpu)、应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,该第一处理器1101通过有线或无线连接耦合到上述输入设备1100和输出设备1102。

可选的,上述输入设备1100可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如usb接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;输出设备1102可以包括显示器、音响等输出设备。在本实施例中,该终端设备的处理器包括用于执行各设备中语音识别装置各模块的功能,具体功能和技术效果参照上述实施例即可,此处不再赘述。

图5为本申请的另一个实施例提供的终端设备的硬件结构示意图。图5是对图4在实现过程中的一个具体的实施例。如图5所示,本实施例的终端设备可以包括第二处理器1201以及第二存储器1202。

第二处理器1201执行第二存储器1202所存放的计算机程序代码,实现第一方面及如图1和图2中的基于倒排表的数据检索方法。第二存储器1202被配置为存储各种类型的数据以支持在终端设备的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令,例如消息、图片、视频等。第二存储器1202可能包含随机存取存储器(randomaccessmemory,简称ram),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

可选地,第二处理器1201设置在处理模块1200中。该终端设备还可以包括:通信模块1203,电源模块1204,多媒体模块1205,语音模块1206,输入/输出接口1207和/或传感器模块1208。终端设备具体所包含的组件等依据实际需求设定,本实施例对此不作限定。

处理模块1200通常控制终端设备的整体操作。处理模块1200可以包括一个或多个第二处理器1201来执行指令,以完成上述图1所示方法的全部或部分步骤。此外,处理模块1200可以包括一个或多个模块,便于处理模块1200和其他组件之间的交互。例如,处理模块1200可以包括多媒体模块,以方便多媒体模块1205和处理模块1200之间的交互。电源模块1204为终端设备的各种组件提供电力。电源模块1204可以包括电源管理系统,一个或多个电源,及其他与为终端设备生成、管理和分配电力相关联的组件。多媒体模块1205包括在终端设备和用户之间的提供一个输出接口的显示屏。在一些实施例中,显示屏可以包括液晶显示器(lcd)和触摸面板(tp)。如果显示屏包括触摸面板,显示屏可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。语音模块1206被配置为输出和/或输入语音信号。例如,语音模块1206包括一个麦克风(mic),当终端设备处于操作模式,如语音识别模式时,麦克风被配置为接收外部语音信号。所接收的语音信号可以被进一步存储在第二存储器1202或经由通信模块1203发送。在一些实施例中,语音模块1206还包括一个扬声器,用于输出语音信号。

输入/输出接口1207为处理模块1200和外围接口模块之间提供接口,上述外围接口模块可以是点击轮,按钮等。这些按钮可包括但不限于:音量按钮、启动按钮和锁定按钮。

传感器模块1208包括一个或多个传感器,用于为终端设备提供各个方面的状态评估。例如,传感器模块1208可以检测到终端设备的打开/关闭状态,组件的相对定位,用户与终端设备接触的存在或不存在。传感器模块1208可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在,包括检测用户与终端设备间的距离。在一些实施例中,该传感器模块1208还可以包括摄像头等。

通信模块1203被配置为便于终端设备和其他设备之间有线或无线方式的通信。终端设备可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个实施例中,该终端设备中可以包括sim卡插槽,该sim卡插槽用于插入sim卡,使得终端设备可以登录gprs网络,通过互联网与服务器建立通信。

由上可知,在图5实施例中所涉及的通信模块1203、语音模块1206以及输入/输出接口1207、传感器模块1208均可以作为图4实施例中的输入设备的实现方式。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的保护范围之内并且形成不同的实施例。例如,在本发明的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1