用于度量语音数据库覆盖性的无监督模型训练方法及装置与流程

文档序号:20918451发布日期:2020-05-29 13:50阅读:231来源:国知局
用于度量语音数据库覆盖性的无监督模型训练方法及装置与流程

本公开涉及语音信号处理领域,尤其涉及用于度量语音数据库覆盖性的无监督模型训练方法及装置、电子设备和计算机可读存储介质。



背景技术:

语音数据库的覆盖性是衡量语音数据库质量的一个重要指标,是指语音数据库针对评价因素的覆盖程度。例如:发音人的性别、语种、语音内容等因素。例如在训练的语音识别系统时,需要采集数量很大的说话人的语音用于训练,此时,选用的语音数据库覆盖性越好,就越可以包含更为广泛的语音空间,可以有效减低样本空间分布中影响。

传统获取语音数据库的覆盖性是依靠语音数据库设计阶段的专家经验,在制订采集计划时使语音数据库中的语音在各种评价因素上分布尽量全面。但是对于已经采集完成的数据库,只有在语音信号处理建模后才能根据识别率等指标得到间接反馈。而在训练语音数据评价模型的过程中,训练数据划分不全面、缺乏人工标注的样本数据导致很难构建出准确的评价模型。



技术实现要素:

为克服相关技术中存在的问题,本公开提供一种用于度量语音数据库覆盖性的无监督模型训练方法及装置、电子设备和计算机可读存储介质。

根据本公开实施例的第一方面,提供一种用于度量语音数据库覆盖性的无监督模型训练方法,方法包括:获取训练数据,训练数据为语音;确定语音数据库覆盖性的一个或多个评价因素;基于训练数据对应于评价因素是否可通过参数调整控制,划分评价因素为可调因素或不可调因素;确定划分后的每个评价因素对应的聚类算法;通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类;根据每个评价因素的多个子类,训练评价模型。

在一实施例中,确定划分后的每个评价因素对应的聚类算法,包括:若评价因素为不可调因素,则确定其对应的聚类算法为基于距离的聚类算法;若评价因素为可调因素,则确定其对应的聚类算法为自适应训练算法。

在一实施例中,通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类,包括:若评价因素为不可调因素,则提取训练数据的特征向量;根据特征向量,采用基于距离的聚类算法,将训练数据划分为多个子类。

在一实施例中,基于距离的聚类算法为k均值聚类算法。

在一实施例中,通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类,包括:若评价因素为可调因素,则提取训练数据的特征向量;通过特征向量,训练高斯混合模型,标注训练数据;根据标注的训练数据,将训练数据分为多个子类。

在一实施例中,通过特征向量,训练高斯混合模型,标注训练数据,包括:通过特征向量训练高斯混合模型;根据评价因素,确定控制参数,控制参数可调整控制训练数据;遍历控制参数的所有取值,对训练数据进行变换;获取变换后的训练数据的特征向量使高斯混合模型似然度最大时的参数值;根据参数值累计似然度;根据参数值变换训练数据,得到新的训练数据,重新训练直到达到停止条件;将每个训练数据对应的使高斯混合模型似然度最大时的参数值作为训练数据的标注值。

在一实施例中,停止条件包括:迭代次数达到预设阈值,或累计似然度与上次迭代中的累计似然度变化率小于预设阈值。

在一实施例中,根据每个评价因素的多个子类,训练评价模型,包括:将每个子类数据分别训练一个或多个评价模型,或将多个子类数据整体训练一个评价模型。

在一实施例中,语音数据库覆盖性的评价因素包括以下一个或多个:发音者的性别、发音者的年龄、发音者的口音、语速、音调、语种、采集设备、采集环境、发音因素或内容主题。

根据本公开实施例的第二方面,提供一种度量语音数据库覆盖性的方法,方法包括,利用如第一方面的用于度量语音数据库覆盖性的无监督模型训练方法,得到每个评价因素的评价模型,获取待评价的语音数据库,其中,语音数据库中包括至少一条语音;通过评价因素的评价模型对语音数据库中的每条语音进行检测,得到语音数据库与评价因素相对应的单因素信息熵;根据单因素信息熵,确定语音数据库的覆盖度。

根据本公开实施例的第三方面,提供一种用于度量语音数据库覆盖性的无监督模型训练装置,装置包括:数据获取单元,用于获取训练数据,训练数据为语音;评价因素确定单元,用于确定语音数据库覆盖性的一个或多个评价因素;划分单元,用于基于训练数据对应于评价因素是否可通过参数调整控制,划分评价因素为可调因素或不可调因素;算法确定单元,用于确定划分后的每个评价因素对应的聚类算法;分类单元,用于通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类;模型训练单元,用于根据每个评价因素的多个子类,训练评价模型。

在一实施例中,算法确定单元还用于:当评价因素为不可调因素时,确定其对应的聚类算法为基于距离的聚类算法;当评价因素为可调因素时,确定其对应的聚类算法为自适应训练算法。

在一实施例中,分类单元还用于:当评价因素为不可调因素时,提取训练数据的特征向量;根据特征向量,采用基于距离的聚类算法,将训练数据划分为多个子类。

在一实施例中,基于距离的聚类算法为k均值聚类算法。

在一实施例中,分类单元还用于:当评价因素为可调因素时,提取训练数据的特征向量;通过特征向量,训练高斯混合模型,标注训练数据;根据标注的训练数据,将训练数据分为多个子类。

在一实施例中,通过特征向量,训练高斯混合模型,标注训练数据,包括:通过特征向量训练高斯混合模型;根据评价因素,确定控制参数,控制参数可调整控制训练数据;遍历控制参数的所有取值,对训练数据进行变换;获取变换后的训练数据的特征向量使高斯混合模型似然度最大时的参数值;根据参数值累计似然度;根据参数值变换训练数据,得到新的训练数据,重新训练直到达到停止条件;将每个训练数据对应的使高斯混合模型似然度最大时的参数值作为训练数据的标注值。

在一实施例中,停止条件包括:迭代次数达到预设阈值,或累计似然度与上次迭代中的累计似然度变化率小于预设阈值。

在一实施例中,模型训练单元还用于:将每个子类数据分别训练一个或多个评价模型,或将多个子类数据整体训练一个评价模型。

在一实施例中,语音数据库覆盖性的评价因素包括以下一个或多个:发音者的性别、发音者的年龄、发音者的口音、语速、音调、语种、采集设备、采集环境、发音因素或内容主题。

根据本公开实施例的第四方面,提供一种度量语音数据库覆盖性的装置,装置包括,评价模型获取单元,用于利用如第一方面的用于度量语音数据库覆盖性的无监督模型训练方法,得到每个评价因素的评价模型,语音数据库获取单元,用于获取待评价的语音数据库,其中,语音数据库中包括至少一条语音;检测单元,用于通过评价因素的评价模型对语音数据库中的每条语音进行检测,得到语音数据库与评价因素相对应的单因素信息熵;评价单元,用于根据单因素信息熵,确定语音数据库的覆盖度。

根据本公开实施例的第五方面,提供一种电子设备,包括:存储器,用于存储指令;以及处理器,用于调用存储器存储的指令执行第一方面的用于度量语音数据库覆盖性的无监督模型训练方法。

根据本公开实施例的第六方面,提供一种计算机可读存储介质,存储有指令,指令被处理器执行时,执行第一方面的用于度量语音数据库覆盖性的无监督模型训练方法。

本公开的实施例提供的技术方案可以包括以下有益效果:本公开提出一种用于度量语音数据库覆盖性的无监督模型训练方法,首先可以根据用户需要设定不同的评价要素度量相应的数据库,例如在做口音识别分类时可根据用户需要设定口音、音调、语速等评价因素构建评价模型,使语音数据库评价模型在具体应用场景中更有针对性;其次,通过区分不同的评价因素,有助于后续处理中抽取对应的特征、选用合适的算法,进一步针对该评价因素构建出更加合适且准确的分类模型,有助于后续准确判断出语音数据库的覆盖性;第三,可以采用无监督数据,即没有标注的数据,进行模型训练,从而实现对语音数据库的覆盖性的定量评价,降低了数据标注所引入的成本。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种用于度量语音数据库覆盖性的无监督模型训练方法的流程示意图;

图2是根据一示例性实施例示出的另一种用于度量语音数据库覆盖性的无监督模型训练方法的流程示意图;

图3是根据一示例性实施例示出的一种度量语音数据库覆盖性的方法的流程示意图;

图4是根据一示例性实施例示出的一种用于度量语音数据库覆盖性的无监督模型训练装置的示意框图;

图5是根据一示例性实施例示出的一种装置的示意框图。

图6是根据一示例性实施例示出的一种电子装置的示意框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

目前常用的语音数据库覆盖性评价系统,依赖于专家标注数据,且训练数据的划分不全面,缺乏多样性。在一些相关技术中,依赖于监督数据,即含有标注的数据,需要根据标注将数据划分为若干子类,然后根据每个子类的标签训练模型。这些监督数据需要人工标注才能获得,往往需要耗费大量的人力、物力和时间。

本公开为解决上述问题,提供一种用于度量语音数据库覆盖性的无监督模型训练方法10,参见图1,方法包括步骤s11-步骤s15,以下详细说明:

步骤s11,获取训练数据,训练数据为语音。

其中,训练数据可以来自一个或多个语音数据库,其覆盖的语音范围广泛,具备多种分类的可能性,确保在模型训练中数据的多样性。

步骤s12,确定语音数据库覆盖性的一个或多个评价因素。

在本公开的一实施例中,语音数据库覆盖性的评价因素包括以下一个或多个:发音者的性别、发音者的年龄、发音者的口音、语速、音调、语种、发音因素或内容主题。用户在评价过程中可以根据语音数据库的使用需求,确定语音数据库需要涉及的评价因素,例如在做口音识别分类时可根据用户需要设定口音、音调、语速等评价因素构建评价模型。通过上述实施例的步骤,可以由用户自主设定评价因素,使语音数据库评价模型在具体应用场景中更有针对性,得到的评估结果也更加符合用户需求。

步骤s13,基于训练数据对应于评价因素是否可通过参数调整控制,划分评价因素为可调因素或不可调因素。

具体地,对于待评价的某可变因素,首先判断语音对应于该评价因素来说,是否可以进行调整,即存在某种变换方式,使其可由一种取值变换成另一种取值。若存在变换方式时,则认为该评价因素为可调因素,如评价因素为语速时,可以通过时域缩放使语速变快或变慢;再如音调,可以通过频域缩放使音调降低或升高;若不存在变换方式时,则认为该评价因素为不可调因素,不可调因素一般按目前的技术手段来说,尚不存在某种简单的变换方式,使其由一种取值变换成另一种取值,如口音、语种等。通过区分评价要素是否可以进行调整,有助于开发者进一步针对该评价要素选择适当的处理方式,针对不同的评价要素抽取不同的特征,制定出更符合该要素的处理算法。在后续构建整体评价模型时,区分出的要素可以使模型架构更加清晰,进一步提高评价模型的准确度。

步骤s14,确定划分后的每个评价因素对应的聚类算法。

在本公开的一实施例中,若评价因素为不可调因素,则确定其对应的聚类算法为基于距离的聚类算法;若评价因素为可调因素,则确定其对应的聚类算法为自适应训练算法。在语音对应的评价因素不存在变换方式时,该因素的类别较为清晰,例如发音者性别包含男女两类、语音所述语种类别相对固定等,在类别清晰、语音相关特征能够明显区分不同类别的情况下,选取基于距离的聚类算法更加直观便捷,易于实现且准确率高;而在语音对应的评价因素存在变换方式时,特征向量中不能很直观反映类别信息,只能通过被测量的特征参数来体现相关的评价因素,这种情况下选取自适应训练的算法可以有效设置评价因素相关的特征参数,更精准地针对所属评价要素进行分类。

步骤s15,通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类。

在本公开的一实施例中,通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类,包括:若评价因素为不可调因素,则提取训练数据的特征向量;根据特征向量,采用基于距离的聚类算法,将训练数据划分为多个子类。

具体地,若评价因素为不可调因素,提取训练数据的相关特征的向量表示。例如对于口音、语种、说话人等因素,可以提取i-vector向量、x-vector向量等;对于环境、设备、音素内容等因素,可以提取mfcc(梅尔频率倒谱系数)特征向量等。根据抽取到的特征,将数据分为多个子类。在抽取特征时,选取能够有效区分该评价因素下不同语音的特征向量有助于提高聚类的准确率。

在本公开的一实施例中,基于距离的聚类算法为k均值聚类算法。k均值算法易于实现,并且在计算聚类问题上非常高效且实用。

在本公开的一实施例中,通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类,还包括:若评价因素为可调因素,则提取训练数据的特征向量;通过特征向量,训练高斯混合模型,标注训练数据;根据标注的训练数据,将训练数据分为多个子类。由于高斯混合模型是概率模型,其假设所有样本是从具有未知参数的有限数量的高斯分布的混合生成的。作为高斯概率密度函数的一个线性组合可以逼近任何一种密度函数。而语音特征通常有着平滑的概率密度函数,因此有限数目的高斯函数可以对语音特征的密度函数形成平滑的逼近,针对可调因素能够很好地将语音有效的区分开。

在本公开的一实施例中,通过特征向量,训练高斯混合模型,标注训练数据,包括:通过特征向量训练高斯混合模型;根据评价因素,确定控制参数,控制参数可调整控制训练数据;遍历控制参数的所有取值,对训练数据进行变换;获取变换后的训练数据的特征向量使高斯混合模型似然度最大时的参数值;根据参数值累计似然度;根据参数值变换训练数据,得到新的训练数据,重新训练直到达到停止条件;将每个训练数据对应的使高斯混合模型似然度最大时的参数值作为训练数据的标注值。

在本公开的一实施例中,停止条件包括:迭代次数达到预设阈值,或累计似然度与上次迭代中的累计似然度变化率小于预设阈值。

具体地,可以采集所有数据的mfcc特征向量,训练一个gmm模型(gaussianmixedmodel,高斯混合模型);

令似然度累加器,然后对所有数据逐一进行如下操作:

对数据进行变换,变换控制参数为,得到:例如对语速变换,指时域缩放因子;对音调,指频域缩放因子;

值离散化,遍历所有取值,使得的mfcc特征对gmm模型的似然度最大化:

记录取得最大值时的取值

按取值累计似然度:

按取值累对数据进行变换,得到新的数据:

继续采集所有数据的mfcc特征向量,训练gmm模型进行迭代,直到达到停止条件,在实施例中,我们将停止条件设置为似然度累加器与上一次迭代变化值小于,或迭代次数达到8次;

根据记录的每个记录最大值时的取值,将训练数据分成m个子类。

对于可调因素下的语音分类,由于特征向量本身无法很好地体现出语音的可调整性,直接使用向量距离来度量的方法对于可调因素的聚类来说准确率不高。通过高斯混合模型的似然度来描述特征向量,在特征变换的过程中可以获得更多语音特征信息,可以对语音数据的分布具有更加精确有效的描述效果。同时,选取合适的停止条件有助于在保证算法精度的前提下提升算法运算速度。

步骤s16,根据每个评价因素的多个子类,训练评价模型。

在本公开的一实施例中,将每个子类数据分别训练一个或多个评价模型,或将多个子类数据整体训练一个评价模型。对于每个评价因素的多个子类,可以根据需要训练相应的评价模型,便于后续判断语音数据库中每条语音相对于评价因素的信息熵,从而进一步判断语音数据库的覆盖性。

本公开的一实施例的流程如图2所示,首先确定语音数据库覆盖性的评价因素;基于语音对应于评价因素是否存在变换方式,划分评价因素;若不存在变换方式,则直接提取特征向量,使用k均值聚类算法进行聚类,得到该评价因素下的多个子类,通过得到的子类构建该评价因素的模型;若存在变换方式,则提取mfcc向量,构建gmm模型,通过参数变换的方式确定似然度最大时的参数值,并对向量进行变换,输入gmm模型中继续迭代,通过似然度最大时的参数值标注数据,从而获得多个子类,通过得到的子类构建该评价因素的模型。上述实施例中,对于不同的评价要素,抽取了不同的特征向量、选取了对应的聚类算法,建立评价模型时更具有针对性;同时,算法全程采用无监督数据进行模型训练,降低了数据标注所引入的成本。

本公开还提供一种度量语音数据库覆盖性的方法20,如图3所示,度量语音数据库覆盖性的方法20包括步骤s21-步骤s24,详细说明如下:

步骤s21:利用前述任一实施例的用于度量语音数据库覆盖性的无监督模型训练方法10,得到每个评价因素的评价模型。

步骤s22:获取待评价的语音数据库,其中,语音数据库中包括至少一条语音。

步骤s23:通过评价因素的评价模型对语音数据库中的每条语音进行检测,得到语音数据库与评价因素相对应的单因素信息熵。

在本公开实施例中,根据确定语音数据库需要涉及的评价因素,将语音数据库中的各语音分别进行检测。评价模型可以对一种或多种评价因素进行检测。通过评价模型进行分类检测,确定语音数据库中的语音涉及各评价因素的单因素信息熵,得到语音数据库涉及各评价因素的可能性,便于确定语音数据库中是否涉及需要涉及的评价因素,以及存在的概率。各语音涉及的子类因素越多、越分散,得到的单因素信息熵的熵值越高,反之,各语音涉及的子类因素越集中,得到的单因素信息熵的熵值越低。

在一实施例中,基于评价因素,通过评价模型对每条语音进行分类检测,得到语音数据库中各语音与评价因素中多个子类因素相对应的子类条件概率;基于子类条件概率,得到语音数据库与评价因素相对应的单因素信息熵。

具体地,根据确定需要涉及的评价因素,通过评价模型将对将语音数据库中各条语音均进行分类检测,确定各语音对应需要涉及的各评价因素条件下的概率。根据检测,能够得到语音数据库中各条语音在当前评价因素下对应各子类因素发生的条件概率,便于明确每条语音在各评价因素中涉及各子类因素条件下的发生概率,进而将每条语音在各子类因素下的子类条件概率进行整合,得到语音数据库在该评价因素下的单因素信息熵。

在一实施例中,针对当前评价因素,通过将各条语音进行检测,能够得到各条语音在当前评价因素下对应各子类因素的子类条件概率,将其汇总进行平均,能够得到语音数据库在当前评价因素下对应各子类因素的子类平均条件概率,进而根据各子类因素下语音数据库的子类平均条件概率得到语音数据库在当前评价因素下的单因素信息熵。

在一实施场景中,用于表示语音数据库,k表示语音数据库中语音的条数,代表语音数据库中的每一条语音。代表当前评价因素下中的各子类因素,m为子类因素的个数。通过评价模型,采用如下公式获取每条语音在各子类因素下的子类条件概率:k表示语音数据库中语音的条数,m为子类因素的个数。进而采用下述公式进行整合,得到语音数据库在各子类因素下的子类平均条件概率:。从而根据下述公式得到语音数据库涉及当前评价因素的单因素信息熵:,log为自然对数。

步骤s24:根据单因素信息熵,确定语音数据库的覆盖度。

具体地,根据语音数据库在各评价因素下对应得到的各单因素信息熵,能够快速明确语音数据库中的各语音涉及需要涉及的分类因素个数以及熵值大小,对于各个评价因素的子类因素判断全部语音覆盖情况,进而评估语音数据库中的语音是否满足需求,从而确定语音数据库的质量是否合格,对于合格的语音数据库需要尽量全面且平均的覆盖各个评价因素中的各个子类因素,以保证基于该语音数据库进行模型训练或其他后续处理的结果。通过利用信息熵来判断语音数据库涉及的分类因素进而评估语音数据库的质量,有利于将不确定性因素进行量化,统一度量各语音涉及各分类因素的标准,使抽象的评判信息变为具体化,进而有助于直接且快速获取待评估的语音数据库的质量。

基于同一个发明构思,图4示出了一种用于度量语音数据库覆盖性的无监督模型训练装置100,包括:数据获取单元110,用于获取训练数据,训练数据为语音;评价因素确定单元120,用于确定语音数据库覆盖性的一个或多个评价因素;划分单元130,用于基于训练数据对应于评价因素是否可通过参数调整控制,划分评价因素为可调因素或不可调因素;算法确定单元140,用于确定划分后的每个评价因素对应的聚类算法;分类单元150,用于通过每个评价因素对应的聚类算法分别将训练数据分类,得到多个子类;模型训练装置160,用于根据每个评价因素的多个子类,训练评价模型。

在一实施例中,算法确定单元140还用于:当评价因素为不可调因素时,确定其对应的聚类算法为基于距离的聚类算法;当评价因素为可调因素时,确定其对应的聚类算法为自适应训练算法。

在一实施例中,分类单元150还用于:当评价因素为不可调因素时,提取训练数据的特征向量;根据特征向量,采用基于距离的聚类算法,将训练数据划分为多个子类。

在一实施例中,基于距离的聚类算法为k均值聚类算法。

在一实施例中,分类单元150还用于:当评价因素为可调因素时,提取训练数据的特征向量;通过特征向量,训练高斯混合模型,标注训练数据;根据标注的训练数据,将训练数据分为多个子类。

在一实施例中,通过特征向量,训练高斯混合模型,标注训练数据,包括:通过特征向量训练高斯混合模型;根据评价因素,确定控制参数,控制参数可调整控制训练数据;遍历控制参数的所有取值,对训练数据进行变换;获取变换后的训练数据的特征向量使高斯混合模型似然度最大时的参数值;根据参数值累计似然度;根据参数值变换训练数据,得到新的训练数据,重新训练直到达到停止条件;将每个训练数据对应的使高斯混合模型似然度最大时的参数值作为训练数据的标注值。

在一实施例中,停止条件包括:迭代次数达到预设阈值,或累计似然度与上次迭代中的累计似然度变化率小于预设阈值。

在一实施例中,模型训练单元160还用于:将每个子类数据分别训练一个或多个评价模型,或将多个子类数据整体训练一个评价模型。

在一实施例中,语音数据库覆盖性的评价因素包括以下一个或多个:发音者的性别、发音者的年龄、发音者的口音、发音者的语速、发音者的音调、发音因素或内容主题。

本公开还提供一种度量语音数据库覆盖性的装置,装置包括,评价模型获取单元,用于利用前述任一实施例的用于度量语音数据库覆盖性的无监督模型训练方法10,得到每个评价因素的评价模型,语音数据库获取单元,用于获取待评价的语音数据库,其中,语音数据库中包括至少一条语音;检测单元,用于通过评价因素的评价模型对语音数据库中的每条语音进行检测,得到语音数据库与评价因素相对应的单因素信息熵;评价单元,用于根据单因素信息熵,确定语音数据库的覆盖度。

图5是根据一示例性实施例示出的前述任一实施例装置的示意框图。例如,装置200可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图5,装置200可以包括以下一个或多个组件:处理组件202,存储器204,电源组件206,多媒体组件208,音频组件210,输入/输出(i/o)的接口212,传感器组件214,以及通信组件216。

处理组件202通常控制装置200的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件202可以包括一个或多个处理器220来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件202可以包括一个或多个模块,便于处理组件202和其他组件之间的交互。例如,处理组件202可以包括多媒体模块,以方便多媒体组件208和处理组件202之间的交互。

存储器204被配置为存储各种类型的数据以支持在装置200的操作。这些数据的示例包括用于在装置200上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器204可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件206为装置200的各种组件提供电力。电源组件206可以包括电源管理系统,一个或多个电源,及其他与为装置200生成、管理和分配电力相关联的组件。

多媒体组件208包括在所述装置200和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件208包括一个前置摄像头和/或后置摄像头。当设备200处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件210被配置为输出和/或输入音频信号。例如,音频组件210包括一个麦克风(mic),当装置200处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器204或经由通信组件216发送。在一些实施例中,音频组件210还包括一个扬声器,用于输出音频信号。

i/o接口212为处理组件202和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件214包括一个或多个传感器,用于为装置200提供各个方面的状态评估。例如,传感器组件214可以检测到装置200的打开/关闭状态,组件的相对定位,例如所述组件为装置200的显示器和小键盘,传感器组件214还可以检测装置200或装置200一个组件的位置改变,用户与装置200接触的存在或不存在,装置200方位或加速/减速和装置200的温度变化。传感器组件214可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件214还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件214还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件216被配置为便于装置200和其他设备之间有线或无线方式的通信。装置200可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件216还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置200可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器204,上述指令可由装置200的处理器220执行以完成上述方法。例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

图6是根据一示例性实施例示出的一种电子装置300的框图。例如,装置300可以被提供为一服务器。参照图6,装置300包括处理组件322,其进一步包括一个或多个处理器,以及由存储器342所代表的存储器资源,用于存储可由处理组件322的执行的指令,例如应用程序。存储器342中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件322被配置为执行指令,以执行上述方法。

装置300还可以包括一个电源组件326被配置为执行装置300的电源管理,一个有线或无线网络接口350被配置为将装置300连接到网络,和一个输入输出(i/o)接口358。装置300可以操作基于存储在存储器342的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1