用户验证方法、用户验证装置和程序的制作方法

文档序号：2833313阅读：185来源：国知局

专利名称：用户验证方法、用户验证装置和程序的制作方法
技术领域：
本公开涉及用户验证方法、用户验证装置和程序。
背景技术：
活体验证是利用关于用户的活体信息代替密码或者磁卡来验证用户的方法。作为活体验证的示例，众所周知第2008-165742号日本未决专利申请公开的静脉验证和指纹验证以及第2001-34754号日本未决专利申请公开的虹膜验证。最近几年，这种活体验证越来越广泛地用作用户验证方法，在该方法中，用户本人因为忘记或者丢失而未被验证或者第三方假装用户并因为信息泄漏或者被盗而非法验证的可能性低。·

发明内容
在诸如第2008-165742号日本未决专利申请和第2001-34754号日本未决专利申请公开的静脉验证、指纹验证以及虹膜验证之类的活体验证中，作为模板事先获取然后保存静脉图形或者指纹或者虹膜图形。这样，对于采集各个用户的身体形状作为数据，诸如在指纹采集中存在用户感到心理抵触的情况。此外，甚至诸如在用户与第三方之间的共谋中复制活体信息的可能性不为零。此夕卜，当事先获取的模板信息无论什么原因泄露时，安全性可能因为模板复制而显著降低。因此，本公开提出了一种能够更有效地实现活体验证的新颖的和改进的用户验证方法、用户验证装置以及程序。根据本公开实施例，提供了用户验证方法，包括向用户再现声音数据，利用用户的头部相关传递函数(HRTF)来虚拟地定位用户周围空间的第一位置上的该声音数据的声源；获取用户周围空间的第二位置，该第二位置由已经听到再现的声音数据的用户估计为声源位置；以及根据第一位置与第二位置之间的一致性来验证用户。根据本公开的另一实施例，提供了用户验证装置，包括再现单元，配置为向用户再现声音数据，其中利用用户的HRTF来虚拟地定位用户周围空间的第一位置上的该声音数据的声源；响应获取单元，配置为获取用户周围空间的第二位置，该第二位置由已经听到再现的声音数据的用户估计为声源位置；以及验证单元，配置为根据第一位置与第二位置之间的一致性来验证用户。根据本公开的另一实施例，提供了用于使得计算机执行如下功能的程序用于向用户再现声音数据的功能，其中利用用户的HRTF来虚拟地定位用户周围空间的第一位置上的该声音数据的声源；用于获取用户周围空间的第二位置的功能，该第二位置由已经听到再现的声音数据的用户估计为声源位置；以及用于根据第一位置与第二位置之间的一致性来验证用户的功能。根据本公开，由于不是各个用户的直接身体形状表示的HRTF用作模板，所以用户的心理抵触相对小。此外，由于利用HRTF估计声源位置是个别用户的能力，所以即使当模板的HRTF被复制或者泄露时，安全性仍不容易降低。根据上面描述的本公开的实施例，可以更有效地实现活体验证。

图I是示出立体空间内的声源的示意图；图2是示出立体空间内的HRTF的示意图；图3是示出虚拟声源的再现的示意图；图4是示出用于再现虚拟声源的再现装置的配置示例的示意图；图5是示出利用HRTF进行用户验证的示例的概念图；图6是示出利用HRTF进行用户验证的另一示例的概念图；图7是示出本公开第一实施例的用于用户验证的装置的配置的示意图；图8是示出根据本公开第一实施例的用户验证装置的功能配置的框图；图9是示出根据本公开第一实施例的用于输入用户ID和响应的装置的示例的示意图；图10是示出根据本公开第一实施例的响应按钮的水平方向排列的示意图；图11是示出根据本公开第一实施例的响应按钮的垂直方向排列的示意图；图12是示出根据本公开第一实施例的用户验证处理的步骤的流程图；图13是示出图12所示的处理的修改例的步骤的流程图；图14是示出根据本公开第二实施例的用于用户验证的装置的配置的示意图；图15是示出根据本公开第三实施例的用于用户验证的装置的配置的示意图；图16是示出根据本公开第三实施例的用户ID和响应的输入屏幕的示例的示意图；图17是示出根据本公开第四实施例的用于用户验证的装置的配置的示意图；以及图18是示出信息处理装置的硬件配置的框图。
具体实施例方式在此，将参考附图详细描述本公开的优选实施例。请注意，在该说明书和附图中，利用相同的附图标记表示功能和结构基本相同的结构单元，并且省略重复解释这些结构单
J Li ο此外，以下面的顺序进行描述I.采用HRTF的用户验证的基本概念2.本公开的实施例2-1.第一实施例(双耳再现的示例)2-2.第二实施例(过耳再现的示例)2-3.第三实施例(采用用于响应的终端装置的示例)2-4.第四实施例(验证终端装置的用户的示例)3.补充信息(采用HRTF的用户验证的基本概念)
在下面描述的本公开的实施例中，利用HRTF验证用户。首先，将参考图I至图6描述采用该HRTF的用户验证的基本概念。(HRTF)图I是示出立体空间内的声源的示意图。立体空间R是作为听者的用户U周围并且具有声源S的空间。下面，在用户U的位置是原点的极平面内，利用径向矢量r和偏角(declination angle) Θ和φ来表示声源S的位置。用户U的位置确切地是连接用户U的右耳和左耳的线段的中点。径向矢量r是从中点到声源S的位置的距离。此外，偏角Θ是由水平面上用户U的前向和声源S的方向形成的夹角。偏角φ是由包括用户U的位置的水平面与垂直面上的声源S的方向形成的夹角。图2是示出立体空间内的HRTF的示意图。在此，在到达用户U的耳鼓的声波(下面也称为听到声)中，从声源S辐射出的声波的特定频率分量(下面也称为始发声)因为在用户U的头部或者耳部的反射和折射而被加重或者衰减。由于始发声反射或者折射的处理在用户U的右耳和左耳处不同，所以听到声的频率分量是不同的。此外，由于距声源S的距离在用户U的右耳和左耳处不同，所以听到声的相位可能也不同。在这种情况下，从始发声到听到声的变化表示为作为HRTF的传递函数。具体地说，HRTF严重依赖用户U的头部形状、外耳形状、外耳道形状、皮肤的声阻抗等。S卩，HRTF是对于每个用户不同的函数。此外，HRTF还因为声源S在立体空间R内的位置而不同。在该图中，示出了来自声源S的声波变为并且分别到达左耳和右耳。如上所述，HRTF是每个用户特有的，或者根据声源S的位置而不同。因此，
HRTF_R可以表示为HRTF_L (υ,Γ,θ,φ)和HRTF_R (υ,Γ,θ,φ)，它们是取决于用户U、指示声源S·的位置的径向矢量r以及偏角Θ和φ的函数。作为用户U的感觉中枢的大脑将声源S的位置与HRTF之间的关系识别为经验规贝U。这使得用户利用变为HRTF_L(U，r，e,(p)和HRTF_R(υ,Γ,θ,φ)的听到声来识别声源S的位置(ι',θ,φ) HRTF表示频域内的始发声与听到声之间的传递函数。当该HRTF经历离散傅里叶逆变换(IDFT)时，获得头部相关脉冲响应(HRIR)。HRIR表示时域内的始发声与听到声之间的传递函数，并且在广义上包括在HRTF中。与HRTF类似，HRIR对于左耳和右耳的每一个是不同的，并且还可以表示为取决于用户U、径向矢量r以及偏角Θ和φ的HRIR_L(U，r,e，q>)和 HRIR_R (U,r,0,(p) 图3是示出虚拟声源的再现的示意图。立体空间V是识别为作为听者的用户U周围空间的虚拟空间。当所测量的HRIR_L (υ,Γ,θ,φ)和HRIR_R (υ,Γ,θ,φ)被卷积到始发声X时，始发声X以与从处于实际立体空间R的位置(Γ,θ,φ)的声源S辐射出的听到声相同的方式改变以到达用户U的耳鼓。因此，当卷积的声波从用户U的耳鼓附近辐射出时，用户感觉到声源位于虚拟立体空间V的位置(Γ,θ，φ)。这也可以被认为是一种声错觉。在这种情况下，到用户的左耳的输出信号\和到右耳的输出信号Yk表示为下面的等式I和2。此外，指示卷积运算。Y| =X* H Ri R—L( υ,Γ,θ,φ)…等式 I
YR=X*HRiR—Ε_(υ，Γ，θ,φ)…等式 2通过将脉冲信号或者时展脉冲(time stretched pulse) (TSP)信号等再现为实际声空间R内的声源S、利用佩戴于用户U的左耳和右耳上的麦克风拾取听到声以测量频域内的HRTF_L和HRTF_R、以及使得所测量的HRTF经历IDFT，来获得用户U的HRIR。此外，可以在时域内从所测量的脉冲响应信号直接获得HRIR。如上所述，由于HRIR取决于指示声源S的位置的径向矢量r以及偏角Θ和φ，所以优选地在声源S有可能位于的每个位置测量HRIR。例如，通过将到声源S的径向矢量r固定在诸如I米等的预定距离，同时每次1°地改变偏角Θ或φ，来对于偏角Θ和φ的所有组合考虑测量HRIR。尽管方位角的最小分辨率也取决于方向，但通过听而识别出的最小分辨率约为1°，并由此可以通过测量在其网目上偏角θ和φ每次1°变化的观察点的HRIR，再现在立体空间V内距用户U距离r的任意位置的虚拟声源。此外，例如，利用耳机、头戴耳机等从用户U的耳鼓附近辐射出声波。在这种情况下，通过应用考虑到耳机或者头戴耳机的佩戴位置的外耳道的传递特性的校正、耳机或者头戴耳机的扬声器驱动器的声学特性的校正等，可以使地用户U精确地察觉到声源的位置。此外，将利用下面描述的过耳(transaural)系统向着用户U的耳鼓附近辐射出声波。图4是示出用于再现虚拟声源的装置的配置示例的示意图。在装置10中，利用左和右有限脉冲响应(FIR)滤波器IIL和I IR，将输入原始数据(单耳道)与HRIR_L或者HRIR_R卷积。例如，始发声数据作为采用频率为44. IkHz而量化位数为16位的数字信号输入。在此，当HRIR系数的抽头长度是512个样本时，采用FIR滤波器IlL和IlR的卷积导致512个插头的积和运算处理。FIR滤波器可以作为诸如数字信号处理器(DSP)之类的运算硬件安装，也可以利用中央处理单元(CPU)作为软件信号处理安装。作为FIR滤波器IlL和IlR的卷积结果，获得对用户的左耳的输出信号\和对右耳的输出信号Υκ。这些信号由D/A转换器12L和12R转换为模拟信号、由放大器13L和13R放大、以及分别从扬声器14L和14R输出到作为听者的用户U。如下所述，扬声器14L和14R是具有向用户U的左耳和右耳输出各个语言的功能的扬声器，诸如包括在耳机或者头戴耳机内的或者包括在过耳系统内的扬声器。在此，FIR滤波器IIL和IlR由CPU 15控制。CPU 15响应于声源的输入位置而从存储在存储装置等内的HRIR系数表16获得HRIR系数。例如，HRIR系数与用户ID链接以识别用户U，并且对于指示声源S的位置的径向矢量r以及偏角Θ和φ的每种组合，将HRIR系数分别存储在HRIR_L和HRIR_R中。(利用HRTF的用户验证)如上所述，HRTF和HRIR是每个用户的函数。用户U根据经验学习位置(Γ,θ,φ )上的声源S辐射出的始发声如何依据用户本人的HRTF而转变为听到声。这种学习使得用户U能够从听到声识别声源S的位置。因此，例如，即使当另一用户U’的HRIR_L (U’,Γ,θ,φ)和HRIR_R(U’,Γ,θ,φ)卷积到
始发声X，然后在再现图3所示的虚拟立体空间V中的声源时从用户U的耳鼓的附近辐射出时，用户察觉不到位于虚拟立体空间V的位置(Γ,θ,φ)上的声源。这是因为，由于另一用户U’的HRTF引起的始发声X的变化与用户根据经验学习的用户U本人的HRTF的变化不同。这样，通常已知与定位虚拟声源的感知相关的个体差异是显著的。当始发声X由从不属于用户U的HRTF计算出的HRIR卷积，然后呈现给用户U时，不能准确地如上所述地察觉到声源的位置。特别是，非常难以将声源精确地定位在前面(前面定位)或者上面和下面(上面下面定位)的任意位置上。在这种情况下，已知声源被错误地察觉为定位在诸如用户U的头部内(在头部内的定位)或者在用户U的后面(后面定位)的位置上。另一方面，当用户U的HRIR_L (ΙΙ，Γ，θ,φ)和HRIR_R (υ，Γ，θ，φ)卷积到始发声X，然后呈现时，仅用户U可以精确地察觉到声源在位置(Γ,θ,φ )上。采用HRTF的用户验证的基本概念基于上面描述的发现。即，采用HRTF的用户验证是利用诸如用户U的HRIR之类的HRTF作为模板并准确地估计已经利用HRTF虚拟产生的声源的位置，来验证用户U。在该验证中，例如，仅当已经虚拟产生的声源的位置准确地估计为在预定微小误差范围内时，用户U验证为确实是用户本人。图5是示出利用HRTF的用户验证的示例的原理图。例如，位于用户U前面的位置(Γ,θ,φ )的声源St是通过将HRIR_L(U,Γ,θ,φ)和HRIR_R(U，r，0,(p)卷积到始发声X而虚拟产生的，然后呈现给听者。在这种情况下，当听者是用户U时，可以准确地察觉到声源St的位置。另一方面，当听者不是用户U时，难以准确地察觉到声源St的位置。例如，声源被错误地察觉为在听者的后面的声源ST。因此，当估计到用户U前面的声源St的位置时，可以精确地验证用户U。图6是示出利用HRTF的用户验证的另一示例的原理图。如上所述，当从不属于用户U本人的HRTF计算出的HRIR卷积到始发声X，然后呈现给用户U时，声源被错误地察觉为定位在诸如用户的头部内或者用户U的后面的位置上。错误位置分布的范围在用户U的上下方向非常窄。即，当从不属于用户本人的HRTF计算出的HRIR卷积到始发声X，然后呈现时，听者非常难以识别出声源的高度。例如，位于用户U前面的位置(Γ,θ,φ )的声源3:是通过将HRIR_L(U,r,0.(p)和HRIR_R(U，r，0.(p)卷积到始发声X且然后呈现给听者而虚拟再现的。在这种情况下，当听者是用户U时，可以精确地察觉声源St的位置。另一方面，当听者不是用户U时，难以精确地察觉声源St的位置。因此，在许多情况下，声源St被错误地察觉为与听者后面的听者位于相同高度。因此，当估计到声源St在与用户U具有不同高度的多个位置中的任意一个位置时，用户U可以被精确地验证。(2.本公开的实施例)接着，将描述利用上述基本概念验证用户的实施例的一些示例。(2-1.第一实施例(双耳再现的示例))首先，将参考图7至图12描述本公开的第一实施例。在本实施例中，利用用户U的HRTF再现的虚拟声源依据双耳(binaural)再现提供给听者。听者通过利用输入装置输入声源的估计位置来响应。当响应正确时，验证听者为用户。图7是示出本公开第一实施例的用于用户验证的装置的配置的示意图。在本实施例中，ID输入装置150、头戴耳机160以及响应输入装置170连接到用户验证装置100。ID输入装置150、头戴耳机160以及响应输入装置170安装在要验证用户U的地点，例如在其内处理秘密信息的房间的入口处。例如，用户U具有进入房间的权限，并且事先测量用户U的HRTF并登记在用户验证装置100内。当用户U输入他或者她自己的ID时，使用ID输入装置150。用户U的HRTF与用户ID相关联地登记在用户验证装置100中，并且利用ID输入装置150获取的用户ID来读取。头戴耳机160用于提供由用户验证装置100产生的语音，并且依据两耳再现向听者虚拟地再现声源。如上所述，通过对语音应用考虑头戴耳机160的佩戴位置或者扬声器驱动器的特性的校正，可以使用户U更精确地察觉声源的位置。当获取由听者估计的声源的位置作为响应时，使用响应输入装置170。如图所示，响应输入装置170具有9个按钮“I”至“9”。听者选择这些按钮中的任意一个，并且获取对应于所选按钮的位置作为响应。此外，下面描述响应输入装置170的按钮排列。在本实施例中，上面描述的装置配置用于确定是否可以正确地估计由听者虚拟再现的声源的位置。当听者可以正确估计声源的位置时，听者被验证为用户U，并且例如执行使得已经从用户验证装置100获取验证结果的外部装置释放位于该房间的入口处的锁的处理。这样，通过利用专用输入装置获取用户ID和响应，即使当用户U没有携带磁卡等时，仍可以减轻用户U的负担。图8是示出根据本公开第一实施例的用户验证装置的功能配置的框图。用户验证装置100包括ID获取单元101、HRTF获取单元103、虚拟声源位置设置单元107、生成单元109、解码电路113、再现单元115、响应获取单元117、验证单元119以及验证结果输出单元121。此外，用户验证装置100参考存储在存储装置等内的HRTF数据105和始发声数据111。ID获取单元101获取用户U的用户ID。例如，ID获取单元101是连接到ID输入装置150的接口，并且获取听者利用ID输入装置150输入的用户ID的信息。ID获取单元101将获取的关于用户ID的信息提供到HRTF获取单元103。HRTF获取单元103获取事先测量的用户U的HRTF。如上所述，HRTF取决于用户U和声源S的位置(Γ,θ,φ )。然后，HRTF获取单元103利用从ID获取单元101获取的用户ID和从虚拟声源位置设置单元107获取的虚拟声源位置来参考HRTF数据105，并且获取关于事先测量并存储的用户U的HRTF的信息。在这种情况下，所获取的HRTF例如是HRIR。HRTF获取单元103将获取的HRTF信息提供到生成单元109。虚拟声源位置设置单元107随机设置虚拟声源的位置(Γ,θ,φ )。虚拟声源位置设置单元107将虚拟立体空间V的任意位置设置为虚拟声源位置(下面称为第一位置)。在本实施例中，由于通过在9个选项中进行选择来响应虚拟声源位置，所以虚拟声源位置设置单元107将对应于相应9个选项的立体空间V的9个位置的任意一个设置为虚拟声源位置。此外，下面描述响应选项与虚拟声源位置之间的关系。虚拟声源位置设置单元107将关于设置的第一位置的信息提供到HRTF获取单元103和验证单元119。如上所述，HRTF获取单元103根据ID获取单元101获取的用户ID和虚拟声源位置设置单元107设置的第一位置从HRTF数据中获取HRTF。在此，虚拟声源位置设置单元107可以设置的第一位置是9个位置中的任意一个。因为该原因，事先为HRTF数据105中的用户U准备至少9个位置的HRTF。生成单元109产生利用HRTF虚拟地再现立体空间V的第一位置的声源的声音数据。生成单元109从HRTF获取单元103获取关于用户U的第一位置的HRTF的信息。在图4所示的装置10的情况下，例如，利用FIR滤波器实现生成单元109。生成单元109利用HRTF处理从解码电路113提供的始发声的数据，以产生虚拟声源的声音数据。生成单元109将生成的声音数据送到再现单元115。解码电路113解码始发声数据111。例如，始发声数据111是作为利用44. IkHz的抽样频率和16位的量化位数压缩的MP3的单声道声音数据。解码电路113将声音数据解码为PCM信号，并且将该PCM信号提供到生成单元109。再现单元115再现从生成单元109提供到听者即待验证用户U的声音数据。生成单元115例如是连接到头戴耳机160的接口，并且可以包括D/A转换器或者放大器。生成单元115将声音数据提供到头戴耳机160以呈献给听者。
作为响应，响应获取单元117获取已经利用头戴耳机160听到由再现单元115再现的声音数据的听者估计的立体空间V内的虚拟声源的位置(下面也称为第二位置)。响应获取单元117例如是连接到响应输入装置170的接口，并且获取关于由听者利用响应输入装置170输入的第二位置的信息。响应获取单元117将关于第二位置的获取信息提供到验证单元119。验证单元119根据第一位置与第二位置之间的一致性验证用户U。验证单元119从虚拟声源位置设置单元107获取关于第一位置的信息，而从响应获取单元117获取关于第二位置的信息。当第一位置与第二位置彼此一致时，验证单元119确定听者正确地察觉到虚拟声源位置，并且验证听者是用户U。如下所述，验证单元119可以通过多次重复确定来验证用户U。验证单元119将验证结果输出到验证结果输出单元121。验证结果输出单元121输出验证结果。验证结果输出单元121例如是连接到用户验证装置100外的装置的接口，并且可以将验证结果提供到外部装置。在本实施例中，外部装置是例如用于锁闭房间的入口的闭锁装置等。在该外部装置中，可以将来自用户验证装置100的验证结果和来自诸如利用密码、磁卡、活体验证等验证用户U的验证装置之类的另一验证装置的验证结果组合在一起以验证用户U。此外，验证结果输出单元121可以是用于向验证装置100内的其他部分输出验证结果的接口。此外，例如，HRTF获取单元103、虚拟声源位置设置单元107以及验证单元119由CPU、随机存取存储器(RAM)、只读存储器(ROM)等实现。图9是示出根据本公开第一实施例的用于输入用户ID和响应的装置的示例的示意图。在本实施例中，ID输入装置150和响应输入装置170安装在听者前面的墙壁等上。例如，ID输入装置150是利用数字小键盘和回车键输入用户ID的装置。响应输入装置170具有9个按钮，如上所述，并且通过按下任意按钮获取响应。在此，响应输入装置170具有当由面对响应输入装置170的听者观看时布置在中心的按钮“5”，和当听者观看时分别布置在按钮“5”周围的上部、下部、左部、右部、左上部、右上部、左下部和右下部的按钮“I”至“4”和“6”至“9”。指示相应9个按钮的位置可以是立体空间V中的预定位置组。如上所述，从位置组中选择第一位置和第二位置。
这样，当通过在预定位置组中选择第一位置和第二位置，在至少包括在预定位置组中的位置上测量用户U的HRTF时，关于HRTF的测量被有利地简化。此外，通过从选项中选择，可以获取估计虚拟声源位置的用户U的响应，并且对正确应答的响应输入和确定变得简化。此外，包括在位置组中的位置的数目并不局限于9个，并且可以是任意数目。图10是示出根据本公开第一实施例的响应按钮的水平方向排列的示意图。在该图中，示意性地示出了在听者的头部高度上位于听者附近的虚拟立体空间V的水平截面原理图。在本实施例中，响应输入装置170布置在距听者的前面距离r的位置。因此，响应输入装置170的按钮“5”对应于立体空间V的位置(r，O, O)的声源S5。此外，响应输入装置170的按钮“4”对应于立体空间V的位置(r，- Θ 1，O)的声源S4,以及按钮“6”对应于位置(r，Θ 1； O)的声源S6。在所示的示例中，声源S4与声源S5之间的距离和声源S5与声源S6之间的距离的任意一个是rXtan Θ 10在这种情况下，到响应输入装置170的按钮“4”和“6”的距离略大于距离r。然而，例如，当r约为I米而Q1约为10°时，到这些按钮的距离与距离r之差作为误差处于可忽略的范围内。当到响应输入装置170的按钮“4”和“6”的距离正好是r时，从听者到响应输入装置170的距离，即，到按钮“5”的距离可以是rXcos Q1，而声源S4与声源S5之间的距离以及声源S5与声源S6之间的距离可以是r X sin Θ 10图11是示出根据本公开第一实施例的响应按钮的垂直方向排列的示意图。在该图中，在听者的附近，在虚拟立体空间V内，示出了听者的前后方向上的垂直截面原理图。如上所述，在本实施例中，响应输入装置170布置在距听者距离r的前面位置，并且按钮“5”对应于立体空间V内的位置(r，O, O)的声源S5。此外，响应输入装置170的按钮“2”对应于立体空间V的位置位置(切职)的声源S2，而按钮“8”对应于位置(Γ,Ο,-φΟ的声源S8。在所示的示例中，声源S2与声源S5之间的距离以及声源S5与声源S8之间的距离的任意一个是r x taiwpi。在这种情况下，到响应输入装置170的按钮“2”和“8”的距离略大于距离r。然而，例如，当r约为I米而,约为10°时，到这些按钮的距离与距离r之差作为误差处于可忽略的范围内。当到响应输入装置170的按钮“2”和“8”的距离正好是r时，从听者到响应输入装置170的距离，即，到按钮“5”的距离可以是Γ X COSqh，而声源S2与声源S5之间的距离以及声源S5与声源S6之间的距离可以是r X Simp1。以与上面描述的声源S2、S4至56和S8相同的方式设置立体空间V内未不出的声源SpS3、S7和S9的位置以及响应输入装置170的相应按钮。即，声源S1对应于位置(Γ,-Θ^φι)的按钮“I”。声源S3对应于位置(Ij1,(P1)的按钮“3”。声源S7对应于位置(r,AlrCp1)的按钮“7”。声源S9对应于位置(r, θ^,)的按钮“9”。此外,在本实施例中，优选地在无回声(anechoic)空间内测量要事先测量的用户U的HRTF，以去除墙壁的反射的影响。然而，例如，当要验证用户U的地方(即，布置头戴耳机160和响应输入装置170的地方)是小房间等时，可以在考虑到房间的墙壁的反射或者吸收的环境下测量HRTF。图12是示出根据本公开第一实施例的用户验证处理的步骤的流程图。首先，用户验证装置100的ID获取单元101获取听者利用ID输入装置150输入的用户ID (步骤S101)。然后，虚拟声源位置设置单元107随机设置虚拟声源位置(步骤S103)。在此，虚拟声源位置设置单元107从上面描述的声源S1至S9的位置中选择虚拟声源位置。然后，HRTF获取单元103利用在步骤SlOl获取的用户ID获取在步骤S103设置的虚拟声源位置的用户U的HRIR函数(步骤S105)。如上所述，事先测量获取的HRIR函数，然后，将其存储为HRTF数据105 。然后，生成单元109将在步骤S105获取的HRIR函数卷积到始发声数据，以产生虚拟声源的声音数据(步骤S107)。然后，再现单元115利用头戴耳机160向听者再现声数据(步骤 S109)。然后，响应获取单元117利用响应输入装置170获取听者估计虚拟声源位置的响应(步骤S111)。在此，在步骤S109与步骤Slll之间考虑与听者的思想或者动作相关联的时间，设置预定备用时间。然后，验证单元119确定在在步骤Slll获取的响应指示的第二位置是否与作为在步骤S103设置的虚拟声源位置的第一位置匹配(步骤S113)。在此，当确定第二位置与第一位置不匹配时，验证单元119通过验证结果输出单元121输出结果“用户验证失败”(步骤S115)。另一方面，当在步骤S113确定第二位置与第一位置匹配时，验证单元119进一步确定在步骤S103至S109的虚拟声源的再现是否重复了预定次数(步骤S117)。在此，当确定虚拟声源的再现重复了预定次数时，验证单元119通过验证结果输出单元121输出结果“用户验证成功”(步骤S119)。另一方面，当在步骤S117确定虚拟声源的再现没有重复预定次数时，再一次从步骤S103执行虚拟声源的再现处理。在这种情况下，在步骤S103可以再次随机地设置虚拟声源位置。S卩，在本实施例中，通过改变虚拟声源位置(改变的位置可以是与随机选择的结果相同的先前位置)，将虚拟声源的再现和从听者获取响应重复预定次数。因此，可以降低另一用户被偶然地验证为用户U的可能性。图13是示出图12所示的处理的修改例的步骤的流程图。在所示的示例中，接着步骤SI 11,验证单元119确定获取的响应是正确应答还是错误应答，并且更新正确应答或者错误应答的计数(步骤S121)。该计数作为数值存储在RAM等中。然后，验证单元119执行步骤S117。在步骤S117，当确定虚拟声源的再现重复了预定次数时，验证单元119由正确应答和错误应答的计数计算该预定次数和听者的正确应答的数目，并且确定正确应答的数目或者正确应答比率是否大于或者等于阈值(步骤S123)。在此，当确定正确应答的数目或者正确应答比率大于或者等于阈值时，验证单元119通过验证结果输出单元121输出结果“用户验证成功”(步骤S119)。另一方面，当确定正确应答的数目或者正确应答比率不大于或者等于阈值时，验证单元119通过验证结果输出单元121输出结果“用户验证失败”(步骤S115)。在上面描述的修改例中，例如，即使在重复再现虚拟声源时发生一次错误应答时，当错误应答后面是正确应答时，验证也不立即失败，并且验证有成功的可能。因此，当用户U本人可能因为HRIR函数或者头戴耳机160不佳而输入了错误应答时，也可以防止用户本人不被验证。在此，当在步骤S121检测到错误应答时，验证单元119可以增加重复再现虚拟声源的次数。例如，在“当从第一次开始或者在错误应答输入后连续输入了 3次正确应答时，响应是正确应答”、“在虚拟声源的再现重复3次或者以上时，当正确应答比率是75%或者更高时验证成功，而当正确应答比率低于50%验证失败”等的条件下，验证单元119可以动态设置重复再现虚拟声源的次数。(2-2.第二实施例)接着，将参考图14描述本公开的第二实施例。本实施例与第一实施例的不同之处在于，利用用户U的HRTF再现的虚拟声源不是利用头戴耳机160双耳再现的，而是利用包括在过耳系统中的扬声器260过耳再现的。其他部件与第一实施例中的相同，因此，省略过多的详细描述。图14是示出根据本公开第二实施例的用于用户验证的装置的配置的示意图。·扬声器260具有包括在过耳系统中的一对右扬声器和左扬声器。此外，各种众所周知的配置等应用于对扬声器260应用的过耳系统的配置。与采用头戴耳机160的双耳再现的方式相同，扬声器260使得听者以耳朵分别听到对于左耳和右耳再现的语音。在本实施例中，虚拟声源被过耳再现，因此，不需要要验证的用户U佩戴头戴耳机160。因此，可以进一步简化验证用户的动作，并且可以进一步减少用户对活体验证的抵触。(2-3.第三实施例)接着，将参考图15和图16描述本公开的第三实施例。本实施例与第一实施例的不同之处在于，用户ID和由听者估计的对声源的响应不由ID输入装置150和响应输入装置170获取，而由听者执行的终端装置300获取。其他部件与第一实施例中的相同，因此，省略过多的详细描述。图15是示出根据本公开第三实施例的用于用户验证的装置的配置的示意图。终端装置300例如是诸如蜂窝式电话和平板型个人计算机(PC)之类的终端装置。终端装置300至少包括用于获取听者的操作的获取单元和用于与用户验证装置100通信的通信单元。听者利用终端装置300的输入单元输入用户ID和响应。终端装置300将关于获取的用户ID和响应的信息发送到用户验证装置100。在优选实施例中，用户验证装置100的ID获取单元101和响应获取单元117由从终端装置300接收关于获取的用户ID和响应的信息的接收装置实现。图16是示出根据本公开第三实施例的用户ID和响应的输入屏幕的示例的示意图。在本实施例中，终端装置300具有作为输入单元的触摸屏310。包括ID输入显示350和响应输入显示370的图形界面显示在触摸屏310中。例如，听者利用在屏键盘输入用户ID到ID输入显示350，并且按下按钮“0K”。终端装置300将用户ID信息发送到用户验证装置100，并且用户验证装置100通过头戴耳机160向听者呈现利用由用户ID指定的用户的HRTF产生的虚拟声源。听者通过在响应输入显示370中按下显示为输入候选的按钮“I”至“9”输入估计的位置作为虚拟声源位置。终端装置300将响应发送到用户验证装置100，然后，用户验证装置100根据设置的虚拟声源位置与响应的位置之间的一致性来验证听者为用户U。在所示的示例中，虚拟声源再现3次，并且当听者3次输入了正确应答时，验证听者为用户U。此外，例如，当终端装置300对用户专用时，用户验证装置100可以保存终端装置300的设备ID，作为用户验证装置100利用其识别用户U的信息，终端装置300可以将设备ID发送到用户验证装置100，由此可以省略输入用户ID。此外，用户验证装置100可以将虚拟声源的声音数据发送到终端装置300，并且可以通过连接到终端装置300的头戴耳机向听者呈现虚拟声源。在这种情况下，例如，难以在空间上使响应的按钮位置与上面参考图10和图11描述的虚拟声源位置匹配，由此，可以指令听者将终端装置300握在听者的前面用于响应。此夕卜，终端装置300的输入单元并不局限于触摸屏，而可以是显示器和操作按钮等的组合。在这种情况下，为了输入响应，可以使用布置在蜂窝式电话等中的数字小键盘。在本实施例中，待输入的用户ID和响应不是由专用输入装置获取，而是由终端装置300获取。因此，可以使用户验证装置的配置简单。·
此外，作为本实施例的修改例，虚拟声源可以与上面描述的第二实施例相同的方式由扬声器260过耳再现并向用户呈现。因此，可以简化验证的用户动作，仅利用与用户本人拥有的终端装置300的接触而进行验证，由此，可以进一步降低用户对活体验证的抵触。(2-4.第四实施例)接着，参考图17描述本实施例的第四实施例。本实施例与第一实施例的不同之处在于，终端装置400用作用户验证装置100、ID输入装置150以及响应输入装置170。其他部件与第一实施例中的相同，由此，省略过多的详细描述。图17是示出根据本公开第四实施例的用于用户验证的装置的配置的示意图。终端装置400例如是诸如蜂窝式电话的终端装置。上面描述的第三实施例的终端装置300通过与布置在预定地点的用户验证装置100通信来验证用户U，而本实施例的终端装置400利用终端装置400的处理完成验证用户U。例如，终端装置400验证用户以释放终端装置400的闭锁状态。因此，终端装置400并不局限于便携式终端装置，而且可以是诸如台式PC的固定终端装置。终端装置400具有与上面描述的第一实施例的用户验证装置100相同的功能配置。例如，ID验证单元101和响应获取单元117由诸如键盘和鼠标之类的输入装置实现。此外，ID获取单元101和响应获取单元117的功能可以通过使终端装置400具有与上面描述的第三实施例的终端装置300相同的触摸屏310并且显示ID输入显示350和响应输入显示370来实现。例如，当闭锁终端装置400的操作恢复时，用户U输入用户ID、收听头戴耳机160呈现的语音、以及以虚拟声源位置做出响应。当响应正确时，用户U被验证，并由此释放终端装置400的闭锁状态，从而可以进行操作。此外，例如，当终端装置400对用户U专用时，省略输入由终端装置400保存的用户ID。在这种情况下，由于关于终端装置400保存的HRTF的信息局限于用户U，所以终端装置400可以没有ID获取单元101的功能。在本实施例中，终端装置400利用HRTF验证用户U并且将验证结果用于自己。这样可以以简单有效的方式利用HRTF进行用户验证以用于各种装置的闭锁释放或者登录。此外，作为本实施例的修改例，以与第二实施例相同的方式，利用终端装置400的扬声器，过耳再现虚拟声源并向用户呈现。因此，用于验证的用户操作进一步简化。(3.补充信息)(硬件配置)将参考图18描述可以实现根据本公开的上述实施例的用户验证装置100和终端装置300和400的信息处理装置900的硬件配置。图18是示出信息处理装置的硬件配置的框图。信息处理装置900包括CPU 901、ROM 903和RAM 905。此外，信息处理装置900还可以包括主总线907、桥接器909、外部总线911、接口 913、输入装置915、输出装置917、存储装置919、驱动器921、连接端口 923以及通信装置925。CPU 901起运算处理单元和控制单元的作用，并且根据记录在ROM 903、RAM 905、存储装置919或者可拆卸记录介质927内的各种程序，来控制信息处理装置900内的全部操作或者其一部分。ROM 903存储CPU 901使用的程序、操作参数等。RAM 905临时存储CPU 901执行中使用的程序、在执行时适当改变的参数等。CPU 90KROM 903和RAM 905通过由诸如CPU总线的内部总线构成的主总线907互相连接在一起。此外，主总线907通过桥接器909连接到诸如PCI (外围部件互连/接口)的外部总线911。输入装置915是用户使用的装置，例如，诸如鼠标、键盘、触摸板、按钮、开关或者操纵杆。输入装置915例如可以是使用红外线或者其他无线电波的遥控装置，或者诸如对应于信息处理装置900的操作的便携式电话的外部连接装置929。输入装置915包括根据用户输入的信息产生输入信号的输入控制电路，并且将输入信号输出到CPU 901。用户通过操作输入装置915可以向信息处理装置900输入各种数据，或者指令信息处理装置900执行处理操作。输出装置917包括可以利用可见方法或者可听方法将获取的信息通知用户的装置。输出装置917例如可以是诸如IXD (液晶显示器)、rop (等离子显示面板)、有机EL (场致发光)显示器的显示器件；诸如扬声器或者头戴耳机的音频输出装置；或者打印机装置。输出装置917将通过信息处理装置900获得的结果以文本或者诸如图像的视频或者以诸如语音或者音频的声音的方式输出。存储装置919是用于存储数据、构成信息处理设备900的存储单元的示例的装置。存储装置919例如包括诸如HDD (硬盘驱动器)的磁存储装置、半导体存储装置、光存储装置或者磁光存储装置。该存储装置919例如包括CPU 901执行的程序或者各种数据或者从外部获取的各种数据。驱动器921是用于诸如磁盘、光盘、磁光盘或者半导体存储器之类的可拆卸记录介质927的读写器，并且并入在或者从外部附于信息处理装置900。驱动器921读取记录在安装的可拆卸记录介质927上的信息，并且将该信息输出到RAM 905。驱动器921还将信息与入安装的可拆卸记录介质927。连接端口 923是用于将装置直接连接到信息处理装置900的端口。连接端口 923例如可以是USB (通用串行总线)端口、IEEE1394端口或者SCSI (小型计算机系统接口)端口。此外，连接端口 923可以是RS-232端口、声光端子或者HDMI (高清晰度多媒体接口)端口。当外部连接装置929连接到连接端口 923时，信息处理装置900和外部连接装置929可以交换各种数据。
通信装置925例如是包括通信装置等的用于连接到通信网络931的通信接口。通信装置925例如可以是有线或者无线LAN (局域网)或者蓝牙(注册商标)或者WUSB (无线USB)的通信卡。作为选择地，通信装置925可以是用于光通信的路由器、用于ADSU非对称数字用户线路)的路由器或者用于各种通信的调制解调器。通信装置925通过因特网或利用诸如TCP/IP的预定协议向其他通信装置发送/从其他通信装置接收信号等。此外，连接到通信装置925的通信网络931是有线或者无线连接的网络，并且例如是因特网，家庭LAN、红外通信、无线电通信或者卫星通信。上面描述了信息处理装置900的典型硬件配置。对于每个部件的功能，可以利用通用元件或者专用硬件配置上述部件中的每个。可以根据实现时的技术水平适当改变这种配置。(其他实施例) 除了上面描述的实施例，可以以各种实施例实现本公开。例如，在上面描述的实施例中，用户验证装置与用户ID相关联地保存用户的HRTF、利用HRTF产生声音数据、向用户再现声音数据。然而，本公开的实施例并不局限于此。用户验证装置可以保存关于与用户ID相关联地设置为虚拟声源位置的各个位置而事先利用用户的HRTF产生的声音数据和位置信息作为声文件。在这种情况下，再现单元利用从事先创建并且根据用户ID和虚拟声源位置保存的声音文件中选择的声音文件再现声数据。因此，用户验证装置可以不包括语音数据生成单元。(效果总结)下面总结本公开的实施例可以获得的效果。此外，这些效果不一定同时获得，而是可以根据实施例的配置获得。由于用作用户验证的密钥的HRTF是由诸如头部或者耳部的形状、皮肤的声阻抗等的用户身体的多个特性，而非关于身体一部分的信息确定的函数，所以非常难以复制。因此，根据上面描述的实施例，可以以非常高的安全性提供用户验证。用户的感觉中枢可以凭经验学习利用HRTF再现的虚拟声源位置的正确估计。因为该原因，即使第三方因为泄露或者复制获取了用户的HRTF时，第三方仍非常难以正确地估计再现声源的位置。因此，在上面描述的实施例的用户验证中，可以防止安全性因为模板被泄露或者复制而降低。HRTF由每个用户的身体特性间接获取。因为该原因，与直接获取用户的身体特性的其他活体验证方法相比，在上面描述的实施例的用户验证中，用户的心理抵触小。此外，由于用户可以不接触与其他用户共同使用的装置，所以例如可以降低有洁癖的用户的心理抵触。可以利用产生一般语音的装置再现虚拟声源。此外，可以利用现有终端装置等输入来自用户的响应。因此，在上面描述的实施例的用户验证中，可以抑制验证装置的成本。(概述)参考附图详细描述了本公开的优选实施例。然而，本公开的技术范围并不局限于实施例。本技术领域内的技术人员应当明白，显然可以进行各种变更或者修改，并且它们被所附权利要求书提供的本公开的技术范围完全覆盖。此外，本技术还可以如下配置。
(I) 一种用户验证方法，包括向用户再现声音数据，其中，利用用户的头部相关传递函数(HRTF)来虚拟地定位用户周围空间的第一位置上的该声音数据的声源；获取用户周围空间的第二位置，该第二位置由听到再现的声音数据的用户估计为声源位置；以及根据第一位置与第二位置之间的一致性来验证用户。(2)根据(I)所述的用户验证方法，其中，该第一位置是用户周围空间内的预定位置组的任意位置。(3)根据(2)所述的用户验证方法，其中，该位置组包括具有不同高度的多个位置。(4)根据(2)或者(3)所述的用户验证方法，其中，该位置组包括在用户前面的位置。(5)根据(2)至(4)中的任意一项所述的用户验证方法，其中，该第二位置是由用户从位置组中选择的位置。(6)根据(5)所述的用户验证方法，其中，该第二位置是由用户利用显示位置组作为输入候选的图形用户界面从位置组中选择的位置。(7)根据(I)至(6)中的任意一项所述的用户验证方法，其中，重复执行再现和获取，并且当第一位置与第二位置之间的一致性数目大于或者等于阈值时验证用户。(8)根据(I)至(7)中的任意一项所述的用户验证方法，其中，该声音数据是双耳再现的。(9)根据(I)至(7)中的任意一项所述的用户验证方法，其中，该声音数据是过耳再现的。(10)根据(I)至(9)中的任意一项所述的用户验证方法，其中，在与用于再现声音数据的装置相同的地点布置由输入装置获取的第二位置。(11)根据(I)至(9 )中的任意一项所述的用户验证方法，其中，由对用户拥有的终端装置中的输入来获取第二位置。(12)根据(I)至(11)中的任意一项所述的用户验证方法，进一步包括产生声音数据。(13)—种用户验证装置，包括再现单元，配置为向用户再现声音数据，其中，利用用户的头部相关传递函数(HRTF)虚拟地定位用户周围空间上的第一位置的该声音数据的声源；响应获取单元，配置为获取用户周围空间的第二位置，该第二位置由听到再现的声音数据的用户估计为声源位置；以及验证单元，配置为根据第一位置与第二位置之间的一致性来验证用户。(14) 一种用于使计算机执行如下功能的程序用于向用户再现声音数据的功能，其中，利用用户的头部相关传递函数(HRTF)虚拟地定位用户周围空间的第一位置上的该声音数据的声源；用于获取在用户周围空间的第二位置的功能，该第二位置由听到再现的声音数据的用户估计为声源的位置；以及用于根据第一位置与第二位置之间的一致性来验证用户的功能。
本公开含有与于2011年8月2日向日本专利局提交的第JP2011-168897号日本优先权专利申请公开的主题有关的主题，在此通过引用包括该专利申请的全部内容。
权利要求
1.一种用户验证方法，包括向用户再现声音数据，其中，利用用户的头部相关传递函数(HRTF)虚拟地定位用户周围空间的第一位置上的所述声音数据的声源；获取在用户周围空间的第二位置，所述第二位置由已经听到再现的声音数据的用户估计为声源位置；以及根据所述第一位置与所述第二位置之间的一致性来验证用户。
2.根据权利要求I所述的用户验证方法，其中，所述第一位置是用户周围空间内的预定位置组的任意位置。
3.根据权利要求2所述的用户验证方法，其中，所述位置组包括具有不同高度的多个位置。
4.根据权利要求2所述的用户验证方法，其中，所述位置组包括在用户前面的位置。
5.根据权利要求2所述的用户验证方法，其中，所述第二位置是由用户从所述位置组中选择的位置。
6.根据权利要求5所述的用户验证方法，其中，所述第二位置是由用户利用显示所述位置组为输入候选的图形用户界面而从所述位置组中选择的位置。
7.根据权利要求I所述的用户验证方法，其中，重复执行再现和获取，并且当所述第一位置与所述第二位置之间的一致性数目大于或者等于阈值时验证用户。
8.根据权利要求I所述的用户验证方法，其中，所述声音数据是双耳再现的。
9.根据权利要求I所述的用户验证方法，其中，所述声音数据是过耳再现的。
10.根据权利要求I所述的用户验证方法，其中，所述第二位置由在与用于再现声音数据的装置相同的地点布置的输入装置获取。
11.根据权利要求I所述的用户验证方法，其中，所述第二位置由对用户拥有的终端装置中的输入而获取。
12.根据权利要求I所述的用户验证方法，进一步包括产生所述声音数据。
13.一种用户验证装置，包括再现单元，配置为向用户再现声音数据，其中，利用用户的HRTF虚拟地定位用户周围空间的第一位置上的所述声音数据的声源；响应获取单元，配置为获取用户周围空间的第二位置，所述第二位置由听到再现的声音数据的用户估计为声源位置；以及验证单元，配置为根据所述第一位置与所述第二位置之间的一致性来验证用户。
14.一种用于使计算机执行如下功能的程序用于向用户再现声音数据的功能，其中，利用用户的HRTF虚拟地定位用户周围空间的第一位置上的所述声音数据的声源；用于获取用户周围空间的第二位置的功能，所述第二位置由听到再现的声音数据的用户估计为声源位置；以及用于根据所述第一位置与所述第二位置之间的一致性来验证用户的功能。
全文摘要
提供了用户验证方法、用户验证装置和程序。该用户验证方法包括向用户再现声音数据，其中，利用用户的头部相关传递函数(HRTF)虚拟地定位用户周围空间的第一位置上的该声音数据的声源；获取用户周围空间的第二位置，该第二位置由听到再现的声音数据的用户估计为声源位置；以及根据第一位置与第二位置之间的一致性来验证用户。
文档编号G10L17/22GK102915734SQ20121027332
公开日2013年2月6日申请日期2012年8月2日优先权日2011年8月2日
发明者山下功诚申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：山下功诚
技术所有人：索尼公司
我是此专利的发明人

上一篇：用于对多声道音频信号进行缩混的方法和设备的制作方法
上一篇：按键排箫的制作方法