带有语音识别功能的设备以及语音识别方法_3

文档序号：9240122阅读：来源：国知局

的关键字不是用户的语音指示，不进行基于与该关键字对应的命令的工作。另一方面，在由第一语音识别部103识别的关键字没有由第二语音识别部104识别的的情况下，能够判断为由第一语音识别部103识别的关键字是来自用户的语音指示，因此，进行基于与该关键字对应的命令的工作。
[0088]也就是说，第二语音识别部104，在识别结果与预先规定的关键字相同的情况下，使开关106打开，从而禁止由命令控制部105向TV接收部100发行命令。据此，带有语音识别功能的设备1，在由第二语音识别部104进行语音识别的关键字与预先规定的关键字一致的情况下，不进行基于由该关键字指示的命令的工作。
[0089]而且，所述的“ 10频道”这关键字仅仅是一个例子，也可以是任何关键字，发行的命令，也可以不是向TV接收部100的命令。例如，也可以是向显示与TV接收部100接收的电视信号的图像信号对应的图像的图像显示部的命令。也就是说，也可以将“变明亮”、“变暗”等作为关键字，命令控制部105，按照这样的关键字发行用于控制图像显示部的命令。并且，也可以将“音量大”、“音量小”等作为关键字，按照这样的关键字发行用于控制扬声器101的命令。
[0090]而且，输入到第二语音识别部104的语音信号，并不需要是紧在从扬声器101发出之前的信号，也可以是由TV接收部100接收并再生的语音信号由扬声器101发出为止的任何阶段的语音信号。在该语音信号是模拟信号的情况下，当然，在输入到第二语音识别部104为止的某个阶段，由AD(Analog to Digital)变换器变换为数字信号。
[0091]如上所述，本实施例涉及的带有语音识别功能的设备1，具备:扬声器101，向空间发出语音；麦克风102，收集该空间的语音；第一语音识别部103，识别由所述麦克风102收集的语音；第二语音识别部104，识别从扬声器101发出的语音，命令控制部105，根据由所述第一语音识别部识别的语音，发行用于控制该带有语音识别功能的设备I的命令；以及第二语音识别部104以及开关106，利用从扬声器101将要发出的语音，禁止由命令控制部105发行命令。而且，命令控制部105相当于命令发行部，第二语音识别部104以及开关106相当于控制部。
[0092]据此，能够抑制因带有语音识别功能的设备I本身发出的语音而发生误动作。
[0093]具体而言，在作为由第二语音识别部104的语音识别结果的输出信息与特定的关键字不一致的情况下，向TV接收部100发行与该关键字有关的命令，在作为由第二语音识别部104的语音识别结果与特定的关键字一致的情况下，不发行与作为由第一语音识别部103的语音识别结果的输出信息有关的命令。换而言之，第二语音识别部104，识别从扬声器101将要发出的语音，判断识别的语音与预先规定的关键字是否相同，在相同的情况下使开关106打开，从而禁止由命令控制部105向TV接收部100发行命令。
[0094]据此，在从扬声器101将要发出的语音是预先规定的关键字的情况下，不发行用于控制带有语音识别功能的设备I本身的命令。因此，将与命令相对应的语音作为关键字，从而能够抑制带有语音识别功能的设备I本身对偶然发出的不符合用户的意图的语音进行语音识别来成为不意图的工作。也就是说，能够更可靠地抑制误动作。
[0095]而且，在本实施例中，在第二语音识别部104的语音识别结果与预先规定的关键字一致的情况下，第二语音识别部104使开关106打开，从而禁止由命令控制部105变换的命令的向TV接收部100的发行，但是，禁止向TV接收部100的命令的发行的方法，不仅限于此。例如，带有语音识别功能的设备I也可以，不具备开关106，在第二语音识别部104的语音识别结果与预先规定的关键字一致的情况下，停止命令控制部105的命令的生成，从而禁止向TV接收部100的命令的发行。
[0096](实施例2)
[0097]本实施例涉及的带有语音识别功能的设备，将作为从扬声器将要发出的语音的电信号的语音信号下采样为窄频带，利用被下采样的语音信号，将作为从扬声器发出的语音之中的由麦克风收集的语音的回音成分，从由麦克风收集的语音中消除。据此，以少的运算量，不会受到带有语音识别功能的设备本身发出的语音信号的阻碍，而能够进行语音识别。
[0098]以下，对于实施例2涉及的带有语音识别功能的设备，参照附图进行说明。
[0099]图3是示出实施例2涉及的带有语音识别功能的设备的结构的框图。在本实施例涉及的带有语音识别功能的设备2中，说明电视机装载语音识别功能的例子。
[0100]该图示出的带有语音识别功能的设备2，具备:TV接收部200，接收电视信号，生成语音信号；扬声器201，向空间发出宽频带的语音信号；麦克风202，收集该空间的语音信号；语音识别部203，识别由麦克风202收集的语音信号；回音消除器204，将作为从扬声器201发出的由麦克风202收集的语音的回音成分，从由麦克风202收集的语音中消除；下采样器205，将从扬声器201将要发出的语音信号下采样为窄频带的信号；以及命令控制部206，根据语音识别部203的输出信息，发行用于控制设备的命令。
[0101]而且，在该图中，TV接收部200、扬声器201、麦克风202、语音识别部203、命令控制部206，与图1的TV接收部100、扬声器101、麦克风102、第一语音识别部103、命令控制部105相同。
[0102]如此，本实施例涉及的带有语音识别功能的设备2，与实施例1涉及的带有语音识别功能的设备I相比，代替控制部，而具备:下采样器205，将作为从扬声器201将要发出的语音的电信号的语音信号下采样为窄频带的信号；以及回音消除器204，利用被下采样的语音信号，推定回音成分，将推定的回音成分从由麦克风202收集的语音中消除，所述回音成分是从扬声器201发出了的语音之中的由麦克风202收集的语音。并且，语音识别部203，识别由回音消除器消除了回音成分的语音，从而识别用户的语音。
[0103]接着，说明如上构成的带有语音识别功能的设备2的工作。
[0104]图4是示出带有语音识别功能的设备2的工作的流程图。
[0105]首先，TV接收部200，接收电视信号，从接收的电视信号生成语音信号(S201)。近几年，电视信号的语音的再生频带是24kHz左右的宽频带信号。如此生成的语音信号，由扬声器201向空间发出(S202)。也就是说，向空间发出的语音的频带是24kHz左右。
[0106]包含从扬声器201向空间发出的语音的该空间的语音由麦克风202收集(S203)。具体而言，麦克风202，例如，以采样频率8kHz采样并收集空间的语音。也就是说，从麦克风202向回音消除器204输出的语音信号的频带是8kHz。换而言之，由麦克风202收集的语音信号，被下采样为频带8kHz的信号。
[0107]而且，由扬声器201将要发出的宽频带的语音信号，进一步，输入到下采样器205，变换为窄频带信号。也就是说，下采样器205，对由扬声器201将要发出的语音信号进行下采样(S204)。具体而言，下采样器205，消除由扬声器201将要发出的语音信号之中的、对语音识别不需要的频带的信号，从而将由扬声器201将要发出的语音信号成为窄频带化。更具体而言，语音识别所需要的频带仅仅是SkHz频带，因此，例如，在由扬声器201将要发出的语音信号的频带是24kHz的情况下，下采样器205，将输入的语音信号的频带下采样为作为1/3的频带的8kHz，输出到回音消除器204。
[0108]在此，输入到下采样器205的语音信号，并不需要是紧在从扬声器201发出之前的信号，而是由TV接收部200接收并再生的语音信号由扬声器201发出为止的任何阶段的语音信号即可。在它是模拟信号的情况下，当然，在输入到下采样器205为止的某个阶段，由AD变换器变换为数字信号。
[0109]接着，由麦克风202收集的语音信号、和下采样器205的输出信号，输入到回音消除器204。在回音消除器204，将从扬声器201发出的由麦克风202收集的回音成分，从由麦克风202收集的语音信号中消除。也就是说，进行回音消除(S205)。具体而言，回音消除器204，利用由下采样器205下采样的语音信号，推定作为从扬声器201发出的语音之中的由麦克风202收集的语音的回音成分，将推定的回音成分从由麦克风202收集的语音中消除。也就是说，从由麦克风202输出的语音信号中消除回音成分的语音信号，向语音识别部203输出消除后的语音信号。
[0110]而且，用于回音消除器204的回音消除的方式，也可以是以往众所周知的任何方式的回音消除。
[0111]最后，回音消除器204的输出信号，输入到语音识别部203后被进行语音识别。命令控制部206，按照语音识别部203的输出信息，发行用于控制设备的命令。也就是说，语音识别部203，对被回音消除的语音信号进行语音识别(S206)，命令控制部206，按照作为由语音识别部203的语音识别结果的输出信息，向TV接收部200发行命令(S207)。
[0112]如此，在本实施例涉及的带有语音识别功能的设备2中，下采样器205，将作为从扬声器201将要发出的语音的电信号的语音信号下采样为窄频带。而且，回音消除器204，利用由下采样器205下采样的语音信号，将作为从扬声器201发出的语音之中的由麦克风202收集的语音的回音成分，从由麦克风202收集的语音中消除。
[0113]如此，本实施例涉及的带有语音识别功能的设备2利用回音消除器204，因此，能够期待如下所述的效果。
[0114]例如，将“10频道”这语音设为，用于发行用于将电视机的接收频道变换为10频道的命令的关键字。此时，在用户发声“10频道”来以语音指示频道的切换的同时，电视机本身以大的语音发出电视节目的语音的情况下，用户发出的“10频道”这语音、和电视节目的语音被混合后，由麦克风202收集。
[0115]假如，在此，在没有回音消除器204的情况下，在语音识别部203，输入该混合的语音信号。其结果为，阻碍语音识别部203准确地识别“10频道”这关键字。
[0116]对此，本实施例涉及的带有语音识别功能的设备2，具备回音消除器204，因此，能够将从扬声器201发出的由麦克风202收集的

完整全部详细技术资料下载

当前第3页1 2 3 4 5