声音识别装置以及声音识别方法与流程

文档序号：13674277阅读：来源：国知局

技术特征：
1.一种声音识别装置，具备：声音取得部，其取得第1声音信息；噪声除去处理部，其使用第1除去方式除去由所述声音取得部取得的所述第1声音信息所包含的噪声，将除去了所述噪声的声音信息作为第2声音信息而输出；声音识别部，其对由所述噪声除去处理部输出的所述第2声音信息进行声音识别，将声音识别结果作为第1声音识别结果信息而输出；通信部，其将由所述声音取得部取得的所述第1声音信息发送给服务器，从所述服务器接收声音识别结果作为第2声音识别结果信息，上述声音识别结果是在所述服务器中使用第2除去方式除去所述第1声音信息所包含的噪声、并对除去了所述噪声而得到的第3声音信息进行声音识别的结果，所述第2除去方式是从所述第1声音信息中除去比通过所述第1除去方式从所述第1声音信息中除去的噪声的量多的量的噪声的方式；以及调解部，其选择将由所述声音识别部输出的所述第1声音识别结果信息和由所述通信部接收到的所述第2声音识别结果信息中的哪一方输出。2.根据权利要求1所述的声音识别装置，所述声音识别部算出表示所述第1声音识别结果信息的合理性的第1似然度，将所算出的所述第1似然度输出给所述调解部，所述通信部接收由所述服务器算出的表示所述第2声音识别结果信息的合理性的第2似然度，将所接收到的所述第2似然度输出给所述调解部，所述调解部基于所述第1似然度和所述第2似然度的至少一方来选择将所述第1声音识别结果信息和所述第2声音识别结果信息中的哪一方输出。3.根据权利要求2所述的声音识别装置，所述调解部，在所述第1似然度比预定的第1阈值大的情况下输出所述第1声音识\t别结果信息，在所述第1似然度为所述第1阈值以下且所述第2似然度比预定的第2阈值大的情况下输出所述第2声音识别结果信息，在所述第1似然度为所述第1阈值以下且所述第2似然度为所述第2阈值以下的情况下既不输出所述第1声音识别结果信息也不输出所述第2声音识别结果信息。4.根据权利要求1所述的声音识别装置，还具备发声区间检测部，该发声区间检测部检测由所述声音取得部取得的所述第1声音信息中的用户发声的发声区间，在没有由所述发声区间检测部检测到所述发声区间的情况下，所述噪声除去处理部不除去所述第1声音信息所包含的噪声，并且不输出所述第2声音信息，所述通信部不将所述第1声音信息发送给服务器。5.根据权利要求4所述的声音识别装置，还具备发声持续时间测定部，该发声持续时间测定部在由所述发声区间检测部检测到所述发声区间的情况下测定在所述发声区间检测部中检测到的发声区间的持续时间即发声持续时间，在由所述发声区间检测部检测到所述发声区间的情况下，所述噪声除去处理部除去所述第1声音信息所包含的噪声，所述通信部将所述发声区间内的所述第1声音信息发送给所述服务器，所述调解部至少使用与所述发声持续时间的长度相关的信息来选择将由所述声音识别部输出的所述第1声音识别结果信息和由所述通信部接收到的所述第2声音识别结果信息中的哪一方输出。6.根据权利要求5所述的声音识别装置，在所述发声持续时间比预定的长度长的情况下，所述调解部使对表示所述第2声音识别结果信息的合理性的第2似然度乘上的加权比对表示所述第1声音识别结果信息的合理性的第1似然度乘上的加权大。7.根据权利要求1所述的声音识别装置，所述通信部从所述服务器接收所述第3声音信息，将所接收到的所述第3声音信息输出给所述声音识别部，所述声音识别部对由所述通信部接收到的所述第3声音信息进行声音识别，将声音识别结果作为第4声音识别结果信息而输出，所述通信部将由所述噪声除去处理部输出的所述第2声音信息发送给服务器，从所述服务器接收对所述第2声音信息进行了声音识别的声音识别结果作为第3声音识别结果信息，将所接收到的所述第3声音识别结果信息输出给所述调解部，所述调解部选择将由所述声音识别部输出的所述第1声音识别结果信息、由所述通信部接收到的所述第2声音识别结果信息、由所述通信部接收到的所述第3声音识别结果信息、和由所述声音识别部输出的所述第4声音识别结果信息中的哪一方输出。8.根据权利要求7所述的声音识别装置，所述声音识别部算出表示所述第1声音识别结果信息的合理性的第1似然度，将所算出的所述第1似然度输出给所述调解部，所述通信部接收由所述服务器算出的表示所述第2声音识别结果信息的合理性的第2似然度，将所接收到的所述第2似然度输出给所述调解部，所述通信部接收由所述服务器算出的表示所述第3声音识别结果信息的合理性的第3似然度，将所接收到的所述第3似然度输出给所述调解部，所述声音识别部算出表示所述第4声音识别结果信息的合理性的第4似然度，将所算出的所述第4似然度输出给所述调解部，所述调解部基于所述第1似然度、所述第2似然度、所述第3似然度和所述第4似然度中的至少一方来选择将所述第1声音识别结果信息、所述第2声音识别结果信息、所述第3声音识别结果信息和所述第4声音识别结果信息中的哪一方输出。9.根据权利要求7所述的声音识别装置，还具备发声区间检测部，该发声区间检测部检测由所述声音取得部取\t得的所述第1声音信息中的用户发声的发声区间，在没有由所述发声区间检测部检测到所述发声区间的情况下，所述噪声除去处理部不除去所述第1声音信息所包含的噪声，并且不输出所述第2声音信息，所述通信部不将所述第1声音信息发送给服务器。10.根据权利要求9所述的声音识别装置，还具备发声持续时间测定部，该发声持续时间测定部在由所述发声区间检测部检测到所述发声区间的情况下测定在所述发声区间检测部中检测到的发声区间的持续时间即发声持续时间，在由所述发声区间检测部检测到所述发声区间的情况下，所述噪声除去处理部除去所述第1声音信息所包含的噪声，所述通信部将所述发声区间内的所述第1声音信息发送给所述服务器，所述调解部至少使用与所述发声持续时间的长度相关的信息来选择将所述第1声音识别结果信息、所述第2声音识别结果信息、所述第3声音识别结果信息和所述第4声音识别结果信息中的哪一方输出。11.根据权利要求10所述的声音识别装置，在所述发声持续时间比预定的长度长的情况下，所述调解部使对表示所述第2声音识别结果信息的合理性的第2似然度以及表示所述第3声音识别结果信息的合理性的第3似然度乘上的加权比对表示所述第1声音识别结果信息的合理性的第1似然度以及表示所述第4声音识别结果信息的合理性的第4似然度乘上的加权大。12.根据权利要求11所述的声音识别装置，在所述发声持续时间比预定的长度长的情况下，所述调解部使对所述第2似然度乘上的加权比对所述第3似然度乘上的加权大。13.一种声音识别装置，具备：声音取得部，其取得第1声音信息；噪声除去处理部，其使用第1除去方式除去由所述声音取得部取得的\t所述第1声音信息所包含的噪声，将除去了所述噪声的声音信息作为第2声音信息而输出；通信部，其将由所述声音取得部取得的所述第1声音信息发送给服务器，从所述服务器接收在所述服务器中使用第2除去方式除去了所述第1声音信息所包含的噪声而得到的第3声音信息，所述第2除去方式是从所述第1声音信息中除去比通过所述第1除去方式从所述第1声音信息中除去的噪声的量多的量的噪声的方式；声音识别部，其对由所述噪声除去处理部输出的所述第2声音信息进行声音识别，将声音识别结果作为第1声音识别结果信息而输出，并且对由所述通信部接收到的所述第3声音信息进行声音识别，将声音识别结果作为第2声音识别结果信息而输出；以及调解部，其选择将由所述声音识别部输出的所述第1声音识别结果信息和所述第2声音识别结果信息中的哪一方输出。14.一种服务器中的声音识别方法，所述服务器具备通信部、噪声除去处理部、声音识别部以及调解部，并对由终端取得的声音信息进行声音识别，所述通信部接收由所述终端取得的第1声音信息，所述噪声除去处理部使用第1除去方式除去所接收到的所述第1声音信息所包含的噪声，将除去了所述噪声的声音信息作为第2声音信息而输出，所述声音识别部对所述第2声音信息进行声音识别，将声音识别结果作为第1声音识别结果信息而输出，所述通信部从所述终端接收声音识别结果作为第2声音识别结果信息，上述声音识别结果是在所述终端中使用第2除去方式除去所述第1声音信息所包含的噪声、并对除去了所述噪声而得到的第3声音信息进行声音识别的结果，所述第2除去方式是除去比通过所述第1除去方式从所述第1声音信息中除去的噪声的量少的量的噪声的方式，所述调解部选择将所述第1声音识别结果信息和所述第2声音识别结\t果信息中的哪一方输出。

完整全部详细技术资料下载

当前第2页1 2 3