根据声音确定人紧张状态的方法和实现所述方法的装置的制作方法

文档序号：2837025阅读：303来源：国知局

专利名称：根据声音确定人紧张状态的方法和实现所述方法的装置的制作方法
技术领域：
本发明涉及分析人对语言测试的心理生理反应的方法和装置。本发明可以用于医学目的和司法实践中，并且还适用于作决定的日常活动。
背景技术：
各种用来参数化表露紧张的声音信号的方法和装置是众所周知的。公开号为 WO0062279
公开日为2000年10月19日的国际申请公开了一种确定人的下意识反应的装置和方法。该装置包括连接各种声源如电话、麦克风或者互联网的模数转换器，声音频谱分析仪，展现声音结果的演示仪如扩音器或者以图表、图形或某些图示形式展示视觉结果的显示器。该方法包括对模拟声音段进行数字化计算、分析已计算的数值、展示说话人模拟声音中的兴奋，并指示它们以便追踪所展示的兴奋。该已知方法的缺点在于不足以精确分析特定测试结果；不能保证对特定测试者的响应进行真实辨别；不能对正在回答问题的测试者的诚实性作出可靠性的结论，因而需要通过改变问题的形式来重复证实。
公开号为WO 952021
公开日为1995年7月27日的国际申请公开了一种控制人的情绪状态的方法和装置。该控制情绪状态的方法包括检测人的声振动、过滤所检测的振动并接收剩余信号、比较剩余信号以获得结果、归纳一致的前后剩余信号以便评估声振动、展示超过声振动的评估、确定说话者一些情绪状态的指示。该控制情绪状态的装置包括声音检测器；反向和反向滤波器；剩余信号之间关系的互相关器；最大程度地重叠前后信号以便评估声振动的积分器；以及处理和测量受测兴奋成分、积累、确定和分析人的情绪状态的处理器。上述方法的缺点是不能确定所使用数据和数据处理过程是否适中，作出的决定带有主观性，因为使用大量共享的统计方法来对受试者是否诚实作出决定，这增加了对受测者不诚实的有可能的无理指控的错误风险。
公开号为WO 99223
公开日为1999年5月6日的国际申请披露了对选作原型 (prototype)的人类语言的情感成分进行自动分类的装置和方法。该装置包含用于接收、记录和分析声音信号的单元，用于对声音信号频谱特性进行测量、计算和分类的单元，以及用于显示紧张状态结果的单元。该方法包括接收、记录和分析声音信号，以便在展示至少一个特征的特性时，建立其重要性和数值；测量、计算和分类位于至少两个计算窗口的计时中的声音信号频谱特征，其中所述窗口用来统计处理、不诚实声音 (insincerely sounded)的频谱扫描、分类及显示紧张状态结果。上述装置的缺点是，增加了对各种干扰的敏感性，不足以适当选择和处理分离频谱的初始参数，因而降低了所获结果的可靠性。

发明内容
本发明要解决的技术问题是，通过从声音的频谱特征中选择最有关的初始参数，以及通过使用最合适的模型处理这种初始参数，以便基于本发明的通用累加参数计算紧张值，来增加根据人的声音的频谱特征确定人的紧张状态结果的可靠性和准确性。
本发明提出一种根据声音确定一个人紧张状态的方法，包括如下步骤接收一定时间间隔的声音信号；计算所接收声音信号的频谱特征；根据所计算的频谱特征确定紧张状态的级别；以及显示所确定的紧张状态的结果。本发明的新特征是当计算频谱特征时，计算所接收的声音信号频谱的至少四个参数基频、频谱强度、频谱中值和频谱宽度；当确定紧张状态的级别时，为四个参数中的每一个计算无量纲归一化紧张参数，其中所述无量纲归一化紧张参数显示每个频谱参数的紧张状态，并且大小为0到1，紧张状态的级别被确定为所有被计算的归一化紧张参数的加权平均值。
为了计算频谱特征，最好使用重叠的多个声音信号窗口，其重叠部分至少为串口宽度的一半。
另外，为了计算，采用声音信号窗口计算的条件是在采用的声音信号窗口阵列中，无声的声音信号窗口不超过一个，和/或任意一对有声声音信号窗口中的基频的相对偏差不超过20%。
当计算每个归一化紧张参数时，先计算该归一化紧张参数的紧张因子Z，将其计算为参数算术平均值与参数当前值之间的相对偏差和参数局部平均值与参数当前值之间的相对偏差之和，然后将归一化紧张参数计算为1/ (l+ez)。
在这种情况下，最好把50 — 500赫兹的频率范围内频谱特征的最大值的基频作为基频的当前值。
最好把频谱强度计算为频谱特征平方的累加(integral)。最好把频谱的中值计算为频谱特征的加权平均值，其中频率被用作权重。最好把频谱宽度计算为频谱特征超出预置阈值的最大与最小频率差值，例如先预置阈值为2-8%，把该阈值下的频谱特征归为零。
在确定紧张状态级别的步骤中，最好将计算出的所有归一化紧张参数的加权平均值确定为其算术平均值。
可利用一定范围内的可见光波的光发射来显示已确定的紧张状态结果，其中所发射光波的波长取决于紧张状态的级别。
在这种情况下，显示所确定的紧张状态级别，使得所发射的光波的波长随着所确定的紧张状态级别值在其可能值范围内的增减而增减。例如，绿光用于显示紧张状态级别的最小值，黄光用于显示紧张状态级别的平均值，红光用于显示紧张状态级别的最大值。
所确定的紧张状态结果可通过振动显示，其中，振动频率取决于所确定的紧张状态级别的值。
在这种情况下，显示所确定的紧张状态级别，使得振动频率随着所确定的紧张状态级别值而在其可能值范围内的增加或减小，而增加或减少直至降至零。例如，振动频率可能值中的最小振动频率或不振动用来显示紧张状态的最小值，振动频率可能值中的平均振动频率用来显示紧张状态级别的平均值，振动频率用可能值中的最大振动频率来显
示紧张状态级别的最大值。
另外，本发明提出了一种根据声音确定人的紧张状态的装置，包括接收单元，用于接收一定时间间隔内的声音信号；处理单元，用于计算接收到的已转换为数字形式的声音信号频谱的频谱特征，并根据所计算的频谱特征确定紫张状态的,；显示单元，用于显示所确定的紧张状态的结果。本发明的新特征是，处理单元能够根据上述方法计算接收到的声音信号的频谱特征和确定紧张状态的级别。
显示单元可以是在可视光波范围内发光的发光装置，其中发光光波的波长取决于处
理单元所确定的紧张状态级别值。例如，当紧张状态级别具有其可能值中的最小值时，发光装置能够发绿光，当紧张状态级别具有其可能值中的平均值时，发光装置发黄光，当紧张状态级别具有其可能值中的最大值时，发光装置发红光。
显示单元可以是振动装置，其中，振动频率取决于处理单元所确定的紧张状态级别。例如，当紧张状态级别具有可能值中的最小值时，振动装置能够用其可能值中的直至零的最小振动频率振动，当紧张状态级别具有可能值中的平均值时，振动装置能够用其可能值中的平均振动频率振动，当紧张状态级别具有可能值中的最大值时，振动装置能够用可能值中的最大振动频率振动。
该装置的所有单元都可被组合到一个便携式装置中，或并入到一个计算机内或一个计算机化装置内，这些装置可从以下组中选择数字录音电话机；移动电话；数字录音摄像机；掌上电脑。

本发明通过实施例结合以下附图特征详细描述。
图l是本发明装置的示意框图2是本发明方法的基本步骤的方框简图3是本发明的一种实施方式的示意图。
具体实施例方式
图1显示了本发明装置的示意框图。
如图1所示，通过声音确定人的紧张状态的装置1包括接收单元2，用于接收一
定时间间隔的声音信号；处理单元3，用于计算所接收到的转换为数字形式的声音信号频谱的频谱特征，并根据所计算的频谱特征确定紧张状态级别；显示单元4，用于显示所确定的紧张状态的结果。
装置2-4都可用计算机或计算机化装置的软件-硬件来实现。
接收单元2用于按一定时间间隔接收数字形式或模拟形式的声音采样信号，模拟形式的声音采样信号随后被转换为数字形式，以便在处理单元3中进一步处理声音信号的数据。实时声音信号或存储在任意已知有形介质中的一定时间间隔内的声音信号片段可以用作声音采样信号。例如，由计算机声卡、数字录音电话和其它装置转换成数字形式的来自麦克风的声音信号可以用作实时声音信号，并且经由包括有线、无线的各种广播网(电视、无线电)和其它通信网络接收的声音信号也可以用作实时声音信号。为了存储声音信号片段，可以使用任意的磁或光信息介质和基于微处理器的数据存储装置。需要注意的是，可用数字形式或模拟形式将声音信号片段记录和存储到介质上，模拟形式的声音信号随后在接收单元2中被转换为数字形式。还应注意的是，记录和存储在介质上的声音信号片段可以是带有视频信号的音频信号，需要时，分离出该音频信号并将其转换成数字形式。任意软件-硬件装置，如声卡、USB端口、无线通信卡(无线的，红外线的，蓝牙的)、各种磁盘(FD,CD,DVD)盘驱动等可以用作接收单元2，它们能够把数字或模拟形式的声音信号送入计算机或计算化装置，其中模拟形式的信号随后被转换为数字形式。处理单元3用于计算由接收单元2接收并转换为数字形式的声音信号的频谱谱特征，并根据所计算的频谱特征确定紧张状态的级别。通过使用基于已知计算机或计算机化装置的任意软件-硬件工具的中央处理器以及装载有实现本发明方法的独立装置，可以实施处理单元3。
图2示出了由处理单元3处理的本发明方法的基本步骤310 — 380的方框简图，下面对其进行描述。
开始前，将所有在前接收和计算的声音信号的数据和频谱特征的参数复位(步骤 310)。首先，处理单元3接收来自接收单元2的数字形式的声音信号数据块(步骤320)。通过利用任意公知方法获取声音信号的频谱特征，来处理所收到的数据块(步骤330)
在长期研究过程中，本申请人发现频谱的以下四个初始参数(即从频谱直接计算得出的参数)是最有关的参数基音频率或基频(FTF)，频谱强度，频谱中值，频谱宽度。也就是说，这四个参数足以用来确定紧张状态的级别，所得结果的精确度超过95%，下面将进一步说明。
当执行步骤340时，依据已获得的频谱特征算出上述四个频谱参数。当根据在前记录和存储的声音采样信号的数据进行计算时，利用相互重叠一半宽度的窗口执行计算。这样，每个时间计数属于两个计算窗口。然而，当根据实时数据计算时，计算是通过最后的短时间间隔完成的。
假如声音信号的音量足以认为该信号是重要的，则将50-500赫兹范围内将具有最大频谱特征的频率作为FTF的当前值。但是，应当指出，当根据存储的采样信号计算时，当不存在一个以上的无声窗口与以前的和更早以前的(采样信号)时，采用一个窗口计算，而且，任意一对有声窗口的FTF的相对偏差不超过20%。当在实时模式计算时，可以忽略该项。
当计算频谱强度时，通常采用强度是频谱特征平方的累加这样一个被普遍接受的概念。
频谱中值这样计算成为相应频率的频谱特征值的乘积之和除以频谱特征值之和。考虑到频谱特征可以被存储为阵列，可以采用阵列索引代替频率，并且推导出的商随后可以变为积分索引，所以可以采用频率的相应值。换句话说，频谱中值是频谱特征的加权平均值，其中频率是权重。
为了计算频谱宽度，需要给出一些阈值，此阈值下的频谱特征被有条件地认为是零 (在这种情况下，基于统计，阈值取5%)。频谱特征超过该阈值的最大与最小频率之间的差值取作频谱宽度。
此外，当存储装置(RAM)具有基于某些在前数据块的用于频谱四个初始参数的先前计算数据时，更新该先前数据(步骤350)。
此外，当执行步骤360时，根据频谱四个初始参数的更新值，利用下式计算满足四个初始参数之每个的四个紧张因子
Z = (M-P)/M + (L —P)/L,
其中 M是相应初始参数的算术平均值
L是相应初始参数的局部平均值
p是相应初始参数的当前值
而且，局部平均值按以下方式计算
当只有一个数据时，假设I^P，因为仅有的一个数据无法比较。
如果有边界数据，则意味着初始参数仅仅有在前值以及仅仅有后续值，在实时模式计算时经常出现这种情况，当没有任何的后续值(这可以理解)时，按下式进行计算
L = (2'P + P0Ut)/3，
其中，P。ut是具有边界值的参数的相邻值(例如，在前值)。
如果有内部数据，则意味着初始参数的先前值和随后值两者都存在，此时按下式进
行计算
L = (P—+2.P + P+)/4, 其中， P-是参数的在前值 P+是参数的后续值
这样，执行步骤360后，得出四个无量纲(dimensionless)的紧张因子，用于在步骤370开始时，按下式计算四个无无量纲归一化紧张参数，以便用频谱的相关参数显示紧张状态
紧张值=1/(1+62).
得出的归一化紧张值通常在0到1之间，并且当紧张因子接近正无穷大值时，归一化紧张值接近零，或当紧张因子接近负无穷大值时，归一化紧张值趋于l。所以，归一化紧张因子随着紧张因子的增加而单调减小。原则上，四个归一化紧张值之每个都可以被使用，以便根据该无量纲参数的值辨别紧张状态的级别，然而，为了增加结果的准确性，当执行步骤370时，计算累加的无量纲参数紧张值z，这使得紧张和紧张状态级别更精确地显示为所得的四个归一化紧张参数的加权平均值。正如研究所证明的那样，在这种情况下算术平均值可作为加权平均值使用。
此外，当执行步骤380时，显示单元4输出处理单元3的计算结果的命令就形成了。这样做时，命令本身取决于计算的累加紧张值2;。此时，由于紧张值z在0到l之间，当紧张值Z约等于零时，就命令显示单元4显示不存在紧张，而当紧张值j;约等于1时，就命令显示单元4显示存在强烈紧张，当紧张值z是中间值时，就命令显示单元4显示与该紧张值i;成比例的紧张状态。
此外，处理单元3从接收单元2接收数字形式的声音信号数据块，若接收到，则对该数据块重复执行步骤320 — 380。
显示单元4用于显示处理单元3接收的紧张状态结果，它通过直接显示紧张值￡和通过显示对应于紧张值2:或紧张值^;的某些值区间的各种信号，来显示紧张状态的当前级别。在此，显示单元4可以是内置的任何能够把结果显示为图形、光或其它信息的外围装置。另一例子将说明显示各种信号的一些实施方式。
图3给出了本发明一个实施例的示意图，是一个利用声音的便携式紧张测试仪，它可作为一个小装饰品或一个挂件。
在该实施例中，便携式紧张检测器1包括基于微处理器实现的上述单元2-4，在此情况下，接收单元2包括麦克风5，显示单元包括三色光板和振动器7，三色光板具有红、黄、绿三个发光二极管6，发光二极管像交通信号灯排列，振动器7由压电元件实现，类似于普通移动电话中使用的用于振动呼叫或振动音调的振动器。单元2-4按照与上述方式相同的方式工作，并且具有可以结合使用或单独使用的显示所获得的结果的两个实施例。
在仅利用发光显示的实施例中，发光二极管6之一的发光依赖于由处理单元3按下述方式计算的紧张值S的当前值。当紧张值2=0,0-0，3时，绿色发光二极管发光，表示紧张状态(包括兴奋)不存在或很小，这证明由麦克风5获取的话语足够诚实。当总紧张值Z二0,3-0,7时，黄色发光二极管发光，表示紧张状态不存在或很小，这证明由麦克风 5获取的话语兴奋，也就是，话语的诚实性值得可疑。当紧张值s^0,7-l,0时，红色发光二极管发光，表示紧张状态值很大，这证明由麦克风5获取的话语的兴奋级别最大，也就是，该话语很可能不诚实。如此类似于交通信号灯的灯光信号，容易被使用者识别。
在利用振动显示的实施例中，当紧张值z小于O,l时振动器7不振动，当紧张值z二 0.1时，振动器7就以它的可能的频率之中的最小频率振动；振动频率随着紧张值j;的增加而成比例增加，当紧张值j;约为1或等于1时，振动频率达到最大。显而易见的是，从软件的角度看本发明提出的装置很简单，并可与公知的处理声音信号的计算机化装置结合，比如这些计算机化装置可以是数字录音电话机，移动电话，数字录音摄像机，掌上电脑。
给出的例子仅仅用来说明本发明的一些实施例，而不是用来限制权利要求表述的的法律保护范围，也就是说，本领域的专业人员很容易采用其它的步骤用于本发明的其它实施例。
权利要求
1.一种根据声音确定人的紧张状态的方法，包括如下步骤接收一定时间间隔内的声音信号；计算所接收声音的频谱特征；根据所计算的频谱特征确定紧张状态的级别；以及显示所确定的紧张状态的结果；其特征在于，当计算频谱特征时，计算所接收声音信号的频谱的至少四个参数基频，频谱强度，频谱中值，频谱宽度；当确定紧张状态的级别时，为所述四个参数之每个计算无量纲归一化紧张参数，其中所述无量纲标准化紧张参数显示频谱每个参数的紧张状态并在0至1之间，紧张状态的级别被确定为所有被计算的归一化进展参数的加权平均值。
2. 根据权利要求1所述的方法，其中，至少其一半窗口宽度重叠的声音信号窗口用于计算频谱特征。
3. 根据权利要求2所述的方法，其中，声音信号窗口用于计算的条件是在所采用的声音信号窗口阵列中，无声声音信号窗口不超过一个。
4. 根据权利要求2所述的方法，其中，声音信号窗口用于计算的条件是任意一对有声声音信号窗口中的基频的相对偏差不超过20% 。
5. 根据权利要求l的方法，其中，当计算每个归一化紧张参数时，先计算该归一化紧张参数的紧张因子Z，将其计算为该参数算术平均值与该参数当前值之间的相对偏差和该参数局部平均值与该参数当前值之间的相对偏差之和，然后将归一化紧张参数计算为1/(l+ez)。
6. 根据权利要求5所述的方法，其中，把50-500赫兹频率范围的频谱特征的最大值的基频作为基频的当前值。
7. 根据权利要求1所述的方法，其中，把频谱强度计算为频谱特征平方的累加(integral)。
8. 根据权利要求1所述的方法，其中，把频谱的中值计算为频谱特征的加权平均值，其中频率被用作权重。
9. 根据权利要求1所述的方法，其中，把频谱的宽度计算为频谱特征超过预置阈值的最大与最小频率的差值。
10. 根据权利要求9所述的方法，其中，当计算频谱宽度时，阈值被预置为2-8%，该阈值之下的频谱特征被认为是零。
11. 根据权利要求1的所述方法，其中，所有被计算的归一化紧张参数的加权平均值被确定为其算术平均值。1
12. 根据权利要求l-ll所述的方法，其中，用可见光波范围内的发光显示所确定的紧张状态的结果，其中发出的光波波长取决于紧张状态级别的值。
13. 根据权利要求12所述的方法，其中，显示所确定的紧张状态级别，使发射的光波波长随着所确定的紧张状态级别值在其可能值范围内的增减而增减。
14. 根据权利要求13所述的方法，其中，绿光用于显示紧张状态级别的最小值，黄光用于显示紧张状态级别的平均值，红光用于显示紧张状态级别的最大值
15. 根据权利要求1-11所述的方法，其中，所确定的紧张状态结果用振动显示，其中的振动频率取决于所确定的紧张状态的级别的值。
16. 根据权利要求15所述的方法，其中，显示已确定的紧张状态级别，使振动频率随着所确定的紧张状态级别值在其可能值范围内增加或降低而增加或降低直至降为零。
17. 根据权利要求16所述的方法，其中，使用振动频率的可能值中最小振动频率或不振动来显示紧张状态级别的最小值，用振动频率可能值中的平均振动频率来显示紧张状态级别的平均值，用振动频率可能值中的最大振动频率来显示紧张状态级别的最大值。
18. —种根据声音确定人紧张状态的装置，包括接收单元，用于接收一定时间间隔内的声音信号；处理单元，用于计算所接收的已转换为数字形式的声音信号的频谱特征，并根据所计算的频谱特征确定紧张状态的级别；显示单元，用于显示所确定的紧张状态的结果，其中处理单元能够计算所接收的声音信号的频谱的频谱特征，并用权利要求1-11之一的方法，根据所计算的频谱特征确定紧张状态的级别。
19. 根据权利要求18所述的装置，其中，显示单元是在可视光波范围内发光的发光装置，其中发射的光波的波长取决于处理单元所确定的紧张状态级别的值。
20. 根据权利要求19的装置，其中，当紧张状态级别具有其可能值中的最小值时，发光装置可能发绿光，当紧张状态级别具有其可能值中的平均值时，发光装置发黄光，当紧张状态级别具有其可能值中的最大值时，发光装置发红光。
21. 根据权利要求18的装置，其中，显示单元是振动装置，其中振动频率取决于处理单元所确定的紧张状态级别。
22. 根据权利要求21所述的装置，其中，当紧张状态级别具有可能值中的最小值时，振动装置能够用可能值中的直至零的最小振动频率振动，当紧张状态级别具有可能值中的平均值时，振动装置能够用其可能值中的平均振动频率振动，当紧张状态级别具有可能值中的最大值时，振动装置能够用其可能值中的最大振动频率振动。
23. 根据权利要求21所述的装置，其中，该装置的所有单元都被组合到单个便携式装置中。
24. 根据权利要求21的装置，其中，该装置的所有单元都被并入到计算机或计算机化装置内。
25.根据权利要求24的装置，其中，该计算机化装置可从以下组中选取数字录音电话机；蜂窝电话；数字录音摄像机；掌上电脑。
全文摘要
本发明涉及分析人对语言测试的心理生理反应的方法和装置。本发明的装置(1)用于实现本发明的确定紧张状态的方法，该装置包括用于接收诸如来自麦克风(5)的声音信号的接收单元；处理单元，用于根据基于频谱特征的一个无量纲参数确定紧张状态的级别，该频谱特征例如是频谱的基频、强度、中值和宽度；用于显示紧张状态的显示单元，例如包括发光装置(6)或振动产生装置(7)，其中光波的波长或振动频率取决于紧张状态的级别。
文档编号G10L17/00GK101517636SQ200680056026
公开日2009年8月26日申请日期2006年10月3日优先权日2006年10月3日
发明者安德烈·耶夫根尼耶维奇·纳兹德拉坚科申请人:安德烈·耶夫根尼耶维奇·纳兹德拉坚科

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安德烈.耶夫根尼耶维奇.纳兹德拉坚科
技术所有人：安德烈.耶夫根尼耶维奇.纳兹德拉坚科
我是此专利的发明人

上一篇：笔型语音计算机及其产生方法
上一篇：用于语音/音频发送器和接收器的方法和设备的制作方法