用户识别方法、用户识别装置、电子设备和电子系统的制作方法

文档序号：2822455阅读：98来源：国知局

专利名称：用户识别方法、用户识别装置、电子设备和电子系统的制作方法
技术领域：
本发明涉及一种用于当多个用户使用装置时识别用户的方法和装置，以及结合了该装置的电子设备和电子系统。
背景技术：
例如多名家庭成员的多个用户常常共享单个电子设备，并且逐个用户地切换该设备的设置和过程。以这种方式使用的电子设备的数量逐渐增加。
例如，用户在数字通用盘(DVD)播放机上输入一个关键词以自动记录对应该关键词的节目。多个用户能够设定他们自己的关键词。
对于这种识别每一用户的设备，用户在显示于遥控器或该设备主部件其中之一的菜单屏幕上输入用户自己的姓名和口令。
日本未审查专利申请公开号61-172239公开了一种设备的方法，其使用语音识别技术识别用户。当用户操作该设备时，该设备通过用户自己的语音识别该用户。
日本未审查专利申请公开号2003-228460公开了一种移动信息终端的触笔(stylus)。该触笔包括压电音响器。例如，该触笔是不出现的。用户以一种特定节奏拍手，而该触笔中的麦克风对该用户的掌声进行拾音。该压电音响器激活其中的声音。

发明内容
对于用以识别用户的设备，用户在设备的遥控器或该设备的主部件之一的菜单屏幕上输入用户自己的姓名和口令。这样的操作对于用户并不方便。
在一种通过用户自己的语音向设备输入用户自己的名字和口令的方法中，用户对该设备发出声音。大多数用户未必能很好地接受这样的操作。人类声音很容易被掩藏在环境声音中，而且很难正确确定人类声音。
如果大量用户使用该设备，可能需要例如安全检查的高级的独立认证。但是如果例如家庭成员的有限几个用户共享同一设备，则不需要这种高级的独立认证。
于是需要提供一种设备，该设备通过简单操作即可容易地和准确地识别用户。
根据本发明的一个实施例，一种识别用户的方法包括如下步骤在存储器中登记多个用户的拍手的拍击模型以及用于识别与各拍击模型关联的每一用户的用户标识，对拍击声音进行拾音以获得响应拍击声音的输入音频信号，处理所获得的输入音频信号以检测拍击模型，以及将所检测的拍击模型与所登记的拍击模型进行比较，以确定存储器中登记的任意拍击模型是否匹配于所检测的拍击模型，以及在存在一种已登记的可匹配所检测的拍击模型的拍击模型的情况下，通过在存储器中登记的与匹配拍击模型关联的用户标识来识别用户。
根据该用户识别方法，以对用户唯一的模型，用户能够允许该设备用简单的操作识别他本人，该简单的操作例如，鼓掌、敲击一个接近该设备的铃、或轻拍该设备外壳的边缘。
和人类声音不同，这种声音不容易掩藏在环境声音中。因此该设备容易地识别该声音模型并识别用户。
根据本发明的实施例，一个用户的简单操作就允许该设备容易地识别用户。

图1说明了根据本发明的一个实施例的用户识别装置和电子设备；图2说明了所登记的掌声模型的波形；图3说明了所登记的掌声模型的波形；图4A和4B说明了掌声模型；图5说明了每一用户的掌声模型；图6说明了掌声模型的登记过程；图7说明了在用户识别期间对掌声模型的检测；图8说明了用户识别过程；图9A-9C说明了响应于用户标识对装置设置的切换；图10说明了使用遥控器的第一种系统；图11说明了使用遥控器的第二种系统；图12说明了使用遥控器的第三种系统；图13说明了图10的遥控器；图14说明了图10的内容记录和重放设备；图15说明了由图13的遥控器所执行的用户识别过程；图16说明了一种使用个人计算机的应用程序识别用户的系统；以及图17A和17B说明了单次鼓掌声音的波形。
具体实施例方式
第一实施例图1说明了用户识别装置以及作为电子设备的包括用户识别装置的内容记录和重放设备10。
内容记录和重放设备10包括中央处理器(CPU)11。CPU11的总线12连接于存储了多种节目和数据的只读存储器(ROM)13和在其上扩展节目和数据的随机存储器(RAM)14。
硬盘15通过输入输出端口16连接于总线12。例如光盘(CD)或数字通用盘(DVD)的记录媒体17通过输入输出端口18连接于总线12。收发器天线22通过例如RF收发器电路的射频(RF)接口21连接于总线12。总线12连接于用于与因特网1连接的外部接口23。
硬盘15和记录媒体17存储用于重放的例如视频和音乐的内容。RF接口21和收发器天线21以无线方式接收来自外部的内容，以及向外部发送内容。外部接口23通过因特网1接收来自外部的内容，以及通过因特网1向外部发送内容。
由多种键组成的操作部件31通过接口32连接于总线12。例如液晶显示器(LCD)的显示器34通过接口33连接于总线12。扬声器38通过输入输出端口35、数模(D/A)切换器36和音频放大电路37连接于总线12。
显示器34在其屏幕上作为内容显示视频和图像，随后会讨论随不同用户而不同的设置屏幕。扬声器38输出作为内容的音乐和声音，以及输出音频通告。
麦克风41通过音频放大器42、模数(A/D)切换器43和输入输出端口44连接于总线12。非易失性存储器45连接于总线12。
用户生成的掌声声音由麦克风41进行拾音，由A/D切换器43将其从模拟信号切换为数字信号，并由总线12收集。如上所讨论的，非易失性存储器45事先登记每一用户掌声的掌声模型。
用户识别装置40包括掌声声音输入模块(掌声声音获取模块)、算术处理模块(算术控制器)和非易失性存储器45。掌声声音输入模块包括麦克风41、音频放大器42、A/D切换器43和输入输出端口44。算术处理模块包括CPU11、ROM13和RAM14。可以代替非易失性存储器45而在部分硬盘15中登记掌声模型。
由多个用户使用内容记录和重放设备10。每一用户记录并重放该用户自己的优选节目。
每一用户拍手以便在非易失性存储器45上事先登记对该用户唯一的掌声模型。
图2和图3说明了分别具有用户标识U1、U2、U3和U4的四个用户以及所登记的掌声模型的波形。
为登记掌声模型，用户多次拍手，该次数大于预定的N次。掌声模型随不同用户而变化。图2和图3的右手部分说明了近似于掌声模型的节奏图。
由CPU11、ROM13、RAM14组成的算术处理模块处理掌声声音的输入音频信号，以及作为掌声检测某个点，在此点上掌声声音的声压级别急剧地上升并且达到预定的阈值。算术处理模块从检测结果中检测掌声模型。
如图4A所示，检测当掌声声音的声音级别在从输入起始点t(0)开始的预定的时间D(输入)的期间内的时间t(i)(I＝1，2，3，...，n)达到阈值数值时的掌声声音作为掌声。对图4B中示出的公式(1)所表示的在时间顺序上彼此相邻的两次掌声之间的时间间隔d(i)进行检测。
当从检测到预定的N次或更多次掌声中的最后一次掌声开始经过了预定的时间D(结束)的静音期间时，对掌声的检测终止。检测N次或更多次掌声是因为很难通过少量几次掌声检测掌声模型。
如果从输入起始点t(0)开始的预定的时间D(开始)的期间内、或从输入起始点t(0)开始的预定的时间D(输入)的期间内没有声音被拾音，则触发输入错误。请求用户再次鼓掌或者恢复一种预定的状态，例如显示菜单屏幕。如果掌声持续甚至超过从输入起始点t(0)开始的预定的时间D(输入)的期间，则触发输入错误。
如果没有输入错误被触发，使用图4B的公式(2)计算用于对掌声进行拾音的总时长d(和)，即从时间t(1)到时间(n)的时段。如图4B的公式(3)所表示的，时间间隔d(i)除以时间总长度d(和)可得出标准化的时间间隔d’(i)。此处标准化的时间间隔d’(i)的i的范围为从2到n。
掌声的次数n、标准化的时间间隔d’(i)和总时长d(和)连同与掌声模型关联之用户的用户标识ID一起存储于非易失性存储器45上作为用户的掌声模型。
图5列出了响应于图2和3中示出的用户掌声波形的每一用户所登记的掌声模型，即，掌声的次数n、标准化的时间间隔d’(i)和总时长d(和)。
图6说明了由内容记录和重放设备10中的CPU11所执行的掌声模型登记过程50。在掌声模型登记过程50中，用户选择他自己作为将登记的用户。更准确地说，想要登记他自己的掌声模型的用户对所述操作部件31进行操作，以输入他自己的姓名。CPU11设定对应于输入用户姓名的用户ID。
在步骤52，CPU11显示一条消息，例如在显示器34上读入“拍手”。CPU11也从扬声器38输出音频通告“拍手”。以这种方式请求用户拍手。作为响应，用户拍手。
在步骤53，在检测到掌声后，CPU11确定持续了预定的时间D(结束)的静音时期是否已经结束。如果在从输入起始点t(0)开始的预定的时间D(开始)的期间内没有声音被拾音，则触发输入错误。图6说明了当生成了预定次数的掌声而没有输入错误被触发时的操作示例。
如果从检测到掌声开始经过了预定的静音期间D(结束)，CPU11从步骤53进行到步骤54。如前所述，CPU11通过处理输入音频信号检测掌声模型。处理过程进行到步骤55以确定用户是否接受登记。
在接受登记的过程中，CPU11控制显示器34以显示一条消息，例如读出“你对你的此次掌声满意吗？”，以及控制扬声器38输出一条音频通告，该通告陈述“你对你的此次掌声满意吗？”。可选地，使用乐器数字接口(MIDI)将检测到的掌声声音切换为鼓声，并接着将其从扬声器38输出用于用户确定。作为响应，用户使用操作部件31回复接受或拒绝。
在步骤56，CPU11确定用户是否接受登记。如果CPU11确定用户未接受登记，处理过程返回步骤52以请求用户再次拍手。
如果CPU11确定用户已接受登记，处理过程从步骤56进行到步骤57。CPU11将步骤54中所检测的掌声模型和用户姓名、以及与之关联的在图5中所示的设定用户ID存储于非易失性存储器45上。
在登记后，用户使内容记录和重放设备10识别该用户。例如，每一用户搜索在内容记录和重放设备10中的硬盘15上和记录媒体17之一种上记录的节目，并拍手以便用与掌声登记过程中的同样方式重放所搜索的节目。
包括CPU11、ROM13和RAM14的算术处理模块用登记过程中的同样方式处理作为拍手声音的输入音频信号。算术处理模块作为掌声检测某个点，在该点上拍手声音的声压级别急剧地上升且达到预定的阈值。算术处理模块从检测结果中检测掌声模型。
与之前参考图4A所述的，如图4A所示，当声音级别在从输入起始点t(0)开始的预定的时间D(输入)期间内的时间t(i)达到阈值数值时，检测拍手声音作为掌声。对由图7中所示公式(11)所表示的在时间顺序上彼此相邻的两次掌声之间的时间间隔e(i)进行检测。
用掌声模型登记中的类似方式，检测到预定的N次掌声。当在检测到最后一次掌声之后的静音期间比预定的时间(D)还长时，终止掌声检测。
用掌声模型登记中的类似方式，如果在从输入起始点t(0)开始的预定的时间D(开始)的期间内或者在从输入起始点t(0)开始的预定的时间D(输入)的期间内没有声音被拾音，则触发输入错误。请求用户再次拍手，或恢复预定的一种状态，例如显示菜单屏幕。如果掌声持续声音甚至超过从输入起始点t(0)开始的预定的时间D(输入)的期间，也会触发输入错误。
如果没有输入错误被触发，则使用图7的公式(12)计算用于对掌声进行拾音的总时长e(和)，即从时间t(1)到时间t(n)的时段。如图7的公式(13)所表示的，时间间隔e(i)除以总时长e(和)可得到标准化时间间隔e’(i)。此处标准化时间间隔e’(i)的i的范围为从2到n。
在用户识别过程中，以下列顺序执行下列步骤以识别每一用户。如图5所示，CPU11搜索作为已识别的用户候选者的用户，所述用户具有的预定的掌声次数匹配于在用户识别过程中从登记于非易失性存储器45中的掌声模型表格中所检测的掌声次数。如图5的表格中所列出的，如果在用户确定过程中所检测的掌声次数为“5”，用户ID为U2的“Takeshi”和用户ID为U3的“Mami”成为了用于识别的用户候选者。
对于在搜索中找到的每一用户候选者，计算图7的公式(14)所表示的错误成本。当检测到用户及其用户ID时，识别具有最小错误成本的错误。此处，图7的公式(14)中的w1和w2为预定的权重。
响应所检测的用户ID识别的用户，对内容记录和重放设备10的设置和过程进行切换。
图8说明了由内容记录和重放设备10中由CPU11所执行的用户识别过程60。在用户识别屏幕60中，通过在显示器34上显示的如图9A所示的提示用户拍手的屏幕，CPU11启动用户识别过程。在步骤61，CPU11确定是否检测到音频输入。如果CPU11确定已检测到音频输入，则处理过程进行到步骤62。CPU11处理输入音频信号以检测掌声模型。CPU11在步骤63中确定非易失性存储器45中是否登记了匹配于所检测掌声模型的任意掌声模型。
“匹配于所检测掌声模型的掌声模型”是指，在非易失性存储器45中登记的掌声模型中的一个掌声模型，该掌声模型具有的掌声次数与步骤62中所检测的掌声次数相等，并提供了最小的图7的公式(14)所表示的错误成本。
不可以在非易失性存储器45中登记上述内容中的“匹配于所检测掌声模型的掌声模型”。更准确地说，如果非易失性存储器45中登记的掌声模型在掌声次数上无一匹配在步骤62中所检测的掌声模型，则处理过程从步骤63进行到步骤64，以执行错误处理。接着将处理过程返回步骤61。
步骤64中的错误处理会提示用户再次拍手。
如果在非易失性存储器45中登记了上述内容中的“匹配于所检测掌声模型的掌声模型”，处理过程从步骤63进行到步骤65。CPU11调用与具有匹配于掌声模型的用户ID对应的用户设置。
例如，通过显示器34上显示的图9A的屏幕，“Takeshi”拍手并且该用户被识别为“Takeshi”。在这种情况下，显示如图9B所示的为“Takeshi”配置的屏幕。例如，通过显示器34上显示的图9A的屏幕，“Mami”拍手并且该用户被识别为“Mami”。在这种情况下，显示如图9C所示的为“Mami”配置的屏幕。
第二实施例如图1所示，提供给包括整个用户识别装置40的内容记录和重放设备10所有用户识别功能。能够将部分或全部的用户识别装置和用户识别功能转移到控制内容记录和重放设备的遥控器。
图10说明了这种内容记录和重放系统。该内容记录和重放系统包括内容记录和重放设备19和遥控器70。包括麦克风41的遥控器70构成了用户识别装置40。遥控器70执行掌声模型登记过程和用户识别过程，并将识别用户的用户ID发送到内容记录和重放设备19。
红外通信链路、无线局域网(LAN)和有线LAN中的一种被用于在遥控器70和内容记录和重放设备19之间的通信。
图11说明了另一种记录和重放系统。该内容记录和重放系统包括内容记录和重放设备19和遥控器70。包括麦克风41的遥控器70将响应于由用户生成并由麦克风41拾音的掌声声音的数字音频信号和模拟音频信号之一发送到内容记录和重放设备19。内容记录和重放设备19执行掌声模型登记过程和用户识别过程。
用与图10的系统中的相同方式，红外通信链路、无线局域网和有线LAN中的一种被用于在遥控器70和内容记录和重放设备19之间的通信。
图12说明了另一种内容记录和重放系统。如图10所示，包括用户识别装置40的遥控器70执行掌声模型登记过程和用户识别过程。通过LAN 101、接入点100和LAN 102将识别用户的用户ID发送到内容记录和重放设备19。LAN 101和102是无线LAN或有线LAN。
图13和14分别说明了使用红外通信链路的图10的系统中的遥控器70和内容记录和重放设备19。
图13的内容记录和重放设备19包括CPU71。CPU71的总线72连接于存储了多种节目和数据的ROM73和在其上扩展节目和数据的RAM74。
麦克风41通过音频放大器42、A/D切换器43和输入输出端口44连接于总线72。非易失性存储器45也连接于总线72。
用户识别设备40包括麦克风41、音频放大器42、A/D切换器43、输入输出端口44、非易失性存储器45、CPU71、ROM73和RAM74。
由多种键组成的操作部件81通过接口82连接于总线72。例如液晶显示器的显示器84通过接口83连接于总线72。扬声器88通过输入输出端口85、D/A切换器86和音频放大器87连接于总线72。
在显示器84上显示操作屏幕和设置屏幕。从扬声器88输出音频通告。
红外光发射部件93通过输入输出端口91和发射器电路92连接于总线72。
红外光发射部件93作为红外光信号发送如下所述的识别用户的用户ID以及多种遥控信号。
图14的内容记录和重放设备19与图1的内容记录和重放设备10不同之处在于内容记录和重放设备19没有麦克风41。取而代之的是内容记录和重放设备19包括了通过输入输出端口26和接收器电路27连接于总线12的红外光接收部件28。内容记录和重放设备19的其余部分与内容记录和重放设备10相同。
从图13的遥控器70中的红外光发射装置93发送出的红外信号被发送，并接着由红外光接收部件28所接收。所接收的红外信号接着作为遥控信号被传输到总线12。
图13的遥控器70的掌声模型登记过程与图1的内容记录和重放设备10的掌声模型相同。更准确地说，每一用户在对用户唯一的模型中事先拍手。接着在遥控器70的非易失性存储器45中存储掌声模型以及其关联的用户姓名及用户ID。
在图6的掌声模型登记过程50中，当遥控器70的显示器84显示消息并且当扬声器88输出音频通告和鼓声之一时，执行步骤52中的拍手请求和步骤55中的登记接受确认。
能够修改系统以便内容记录和重放设备19中的显示器34和扬声器38分别执行消息显示和音频输出，以响应来自遥控器70的命令而请求拍手和登记确认。
在掌声模型登记之后的用户识别过程与图1的内容记录和重放设备10的用户识别相同，除了从遥控器70向内容记录和重放设备19发送识别用户的用户ID。
图15说明了由遥控器70的CPU71执行的用户识别过程110。在用户识别过程110中，CPU71通过在显示器84上显示提示用户拍手的屏幕启动用户识别过程。在步骤111，CPU71确定是否检测到音频输入。如果CPU71确定已检测到音频输入，处理过程进行到步骤112。步骤113中CPU71确定非易失性存储器45中是否登记了匹配于所检测的掌声模型的掌声模型。
之前已讨论过“匹配于所检测掌声模型的掌声模型”的意义。不可以在非易失性存储器45中登记“匹配于所检测掌声模型的掌声模型”。更准确地说，如果非易失性存储器45中登记的掌声模型在掌声次数上无一匹配在步骤112中所检测的掌声模型，则处理过程从步骤113进行到步骤114，以执行错误处理。在执行错误处理后，接着将处理过程返回步骤111。
如果在非易失性存储器45中登记了“匹配于所检测掌声模型的掌声模型”，处理过程从步骤113进行到步骤115。CPU71调用与具有匹配掌声模型的用户ID对应的用户设置。接着通过收发器电路92和红外光发射装置93将用户ID发送到内容记录和重放设备19。
内容记录和重放设备19通过红外光接收部件28和接收器电路27接收用户ID并且调用与用户ID对应的用户设置。
能够修改系统，以便响应于来自遥控器70的命令通过内容记录和重放设备19中的显示器34和扬声器38之一执行提示用户拍手的请求。
第三实施例根据本发明的第三实施例，由个人计算机的应用程序而不是遥控器的硬件结构和软件结构来执行掌声模型登记过程和用户识别过程。
图16说明了这种系统。在这种系统中，个人计算机120通过LAN155连接于内容记录和重放设备19。LAN 155是无线LAN和有线LAN中的一种。
个人计算机120是一种广泛可得的个人计算机，除了该个人计算机120加载了用于掌声模型登记过程和用户识别过程的应用程序。
个人计算机120包括CPU121。CPU121的总线122连接于存储器123。硬盘125通过输入输出端口126连接于总线122。记录媒体127通过输入输出端口128连接于总线122。
由键盘和指点装置组成的操作部件131通过接口132连接于总线122。例如液晶显示器的显示器134通过接口133连接于总线122。扬声器138通过输入输出端口135、D/A切换器136和音频放大器137连接于总线122。麦克风141通过音频放大器142、A/D切换器143和输入输出端口144连接于总线122。
麦克风141、音频放大器142、A/D切换器143和输入输出端口144是通用的音频输入元件，而不是特别用于构成用户识别装置的元件，其用于执行掌声模型登记过程和用户识别过程。
用于与因特网1和LAN通信部件153连接的外部接口151连接于总线122。LAN通信部件153通过LAN 155连接于内容记录和重放设备19。可由外部接口151和LAN通信部件153共享单个接口。
内容记录和重放设备19连接于替代了图14中所示的输入输出端口26、接收器电路27和红外光接收部件28的LAN通信部件153。
在掌声模型登记和用户识别期间，执行掌声模型登记过程和用户识别过程的个人计算机120的应用程序存储于硬盘125中，并扩展于存储器123上。
个人计算机120的应用程序的掌声模型登记过程与图1的内容记录和重放设备10的掌声模型登记过程和图13的遥控器70的掌声模型登记过程的每一个相同。因此，个人计算机120的掌声模型登记过程如图6中的掌声模型登记过程50所示。
在登记过程期间，在存储器123上生成将每一用户的掌声模型与用户姓名和用户ID相关联的图5的表格，并接着存储于硬盘125上。
个人计算机120的应用程序的用户识别过程与图13的遥控器70的用户识别程序相同，并因此如图15的用户识别过程110所示。
在该系统中，将具有匹配掌声模型的用户ID从个人计算机120的LAN通信部件153发送到内容记录和重放设备19。内容记录和重放设备19调用与用户ID对应的用户设置。
其他实施例在以上引用的实施例中，用户连续拍手若干次。可选地，用户可以仅仅拍手一次。图17A和17B说明了单次拍手的掌声模型。
在单次掌声声音中，使用快速傅立叶变换(FFT)技术和小波变换技术中的一种在所登记的掌声模型和在用户识别期间检测的掌声模型之间执行模型匹配。
单次掌声模型在振幅上随不同模型而不同，并且在识别准确度上低于多次掌声模型。然而，单次掌声模型能够在短时间内识别用户。
用户能够轻敲靠近设备安放的铃和设备边缘中的一种来代替拍手。
识别用户的电子设备和将遥控器或个人计算机所识别的用户的用户ID发送到其的电子设备之一可以是记录和重放设备。可选地，电子设备可以是空调设备、机器人、照明设备、电视接收器和个人计算机中的一种。
例如，在空调设备中，空调状态可自动切换为预定的适合特定用户的设置。在机器人的例子中，机器人的移动可自动设定为预定的适合特定用户的设置。在照明设备中，照明状态可自动转变为预定的适合特定用户的设置。在电视接收器中，接收频道的音量级别可响应适合特定用户的频道和状态之一而自动切换。
本领域的技术人员应该理解，可以存在基于设计要求和其他目前因素的各种修改、组合、子组合和替换，只要它们均在所附的权利要求及其同等物的范围之内。
权利要求
1.一种识别用户的方法，包括以下步骤在存储器中登记多个用户的拍手的拍击模型以及用于识别与各拍击模型关联的每一用户的用户标识；对拍击声音进行拾音以获得响应于拍击声音的输入音频信号；处理所获得的输入音频信号以检测拍击模型；以及将所检测的拍击模型与所登记的拍击模型进行比较，以确定存储器中登记的任何拍击模型是否匹配于所检测的拍击模型，以及在存在一种已登记的匹配于所检测的拍击模型的拍击模型的情况下，通过在存储器中登记的与匹配拍击模型关联的用户标识来识别用户。
2.根据权利要求1的方法，其中拍击声音包括掌声声音。
3.根据权利要求1的方法，其中拍击声音包括在预定的时间段内具有高于预定声音级别之声音级别的多种拍击声音成分。
4.根据权利要求3的方法，其中拍击模型通过拍击声音成分的数目和在时间顺序上彼此相邻的拍击声音成分之间的时间间隔来表示。
5.用于识别用户的装置，包括在存储器中登记多个用户的拍手的拍击模型以及用于识别与各拍击模型关联的每一用户的用户标识的存储部件；对拍击声音进行拾音以获得响应于拍击声音的输入音频信号的声音拾音部件；处理所获得的输入音频信号以检测拍击模型；以及控制部件，用于将所检测的拍击模型与所登记的拍击模型进行比较，以确定存储器中登记的任何拍击模型是否匹配于所检测的拍击模型，以及在存在一种已登记的匹配于所检测的拍击模型的拍击模型的情况下，通过在存储器中登记的与匹配拍击模型关联的用户标识来识别用户。
6.根据权利要求5的装置，其中拍击声音包括掌声声音。
7.根据权利要求5的装置，其中拍击声音包括在预定的时间段内具有高于预定声音级别之声音级别的多种拍击声音成分。
8.根据权利要求7的装置，其中拍击模型通过拍击声音成分的数目和在时间顺序上彼此相邻的拍击声音成分之间的时间间隔来表示。
9.包括权利要求5的装置的电子设备，其中响应于控制部件所识别的用户对设备的设置和过程之一进行切换。
10.一种电子系统，包括包括权利要求5的装置的遥控器；及权利要求9的电子设备，其接收识别用户的且从遥控器发送来的用户标识。
11.一种使计算机识别用户的计算机程序，包括用于执行以下步骤的程序码在存储器中登记多个用户的拍手的拍击模型以及用于识别与各拍击模型关联的每一用户的用户标识；对拍击声音进行拾音以获得响应于拍击声音的输入音频信号；处理所获得的输入音频信号以检测拍击模型；以及将所检测的拍击模型与所登记的拍击模型进行比较，以确定存储器中登记的任何拍击模型是否匹配于所检测的拍击模型，以及在存在一种已登记的匹配于所检测的拍击模型的拍击模型的情况下，通过在存储器中登记的与匹配拍击模型关联的用户标识来识别用户。
12.一种用于识别用户的装置，包括在存储器中登记多个用户的拍手的拍击模型以及用于识别与各拍击模型关联的每一用户的用户标识的存储部件；对拍击声音进行拾音以获得响应于拍击声音的输入音频信号的声音拾音部件；处理所获得的输入音频信号以检测拍击模型的处理部件；以及控制部件，其将所检测的拍击模型与所登记的拍击模型进行比较，以确定存储器中登记的任何拍击模型是否匹配所检测的拍击模型，以及在存在一种已登记的匹配于所检测的拍击模型的拍击模型的情况下，通过在存储器中登记的与匹配拍击模型关联的用户标识来识别用户。
全文摘要
一种识别用户的方法，包括以下步骤在存储器中登记多个用户的拍手的拍击模型以及用于识别与各拍击模型关联的每一用户的用户标识，对拍击声音进行拾音以获得响应于拍击声音的输入音频信号，处理所获得的输入音频信号以检测拍击模型，以及将所检测的拍击模型与所登记的拍击模型进行比较，以确定存储器中登记的任意拍击模型是否匹配于所检测的拍击模型，以及在存在一种已登记的匹配于所检测的拍击模型的拍击模型的情况下，通过在存储器中登记的与匹配拍击模型关联的用户标识来识别用户。
文档编号G10L15/00GK1766877SQ20051009885
公开日2006年5月3日申请日期2005年9月9日优先权日2004年9月10日
发明者高井基行, 佐古曜一郎, 寺内俊郎申请人:索尼株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高井基行;佐古曜一郎;寺内俊郎
技术所有人：索尼株式会社
我是此专利的发明人