基于声学的智能设备的文本输入识别方法

文档序号:10577240阅读:329来源:国知局
基于声学的智能设备的文本输入识别方法
【专利摘要】本发明涉及智能识别领域,其公开了一种基于声学的智能设备的文本输入识别方法,包括如下步骤:(S1)使用手指在文本输入区域输入文本字符,采集声波信号;(S2)对采集到的声波信号进行处理;(S3)对声波信号进行识别。提供了一种用户体验比较好、同时设备轻巧抗噪声强的一种声波信号识别的方法,进而提高了文本识别的效率。
【专利说明】
基于声学的智能设备的文本输入识别方法
技术领域
[0001]本发明涉及智能识别领域,尤其涉及一种基于声学的智能设备的文本输入识别方法。
【背景技术】
[0002]如今,随着计算机技术和可穿戴智能设备行业的快速发展,智能设备逐渐在人们的生活中普及,而且智能设备的功能越来越多,数据处理能力越来越强大,同时这些设备的体积却越来越小。智能设备的小型化带来诸多便利的同时,在需要文本字符输入进行交互时,传统的一些文本字符输入方法已不能够很好适应新的输入环境,寻找一种新的更佳的文本字符输入方法显得极为迫切。
[0003]经过近年来的发展,可穿戴设备的形态正在逐步完善。其中,交互形式一直是人们所关注的,尤其是文字输入体验。目前的解决方案主要集中在三个方面:第一是传统键盘型,又称为传统派,便是坚持在可传达设备中集成物理或虚拟QWERTY键盘,来实现输入体验,比如拥有物理键盘的智能手套、配备完整输入法的智能手表等,这种形式更容易上手,但缺点很明显,便是容易造成设备体积偏大,同时键盘使用体验依然不佳;第二种是文本预测型,主要采用QWERTY布局方式带来一种拥挤的感觉,推测学派在节省空间上很有优势,当你打出一个字的时候,系统根据输入习惯推荐相应的字词,这样就不需要把所有的字都打出来也不需要用到所有的键盘,比如很流行的涂鸦社交键盘Inkboard;表达情感的emo j i键盘,此外,在大部分的智能手机上都有这种打字推测系统,使得这种推测更加容易在可穿戴设备上应用,但是限于可穿戴设备的显示屏体积小,以上两种输入方式的用户体验不佳;第三种是语言识别方式,语音识别无疑是最具未来感的,也是目前很多智能手表配备的功能,虽然语音输入已经存在一些时间了,人们仍然喜欢键盘输入,其中的一个原因是,在涉及到私人交流的时候,语音输入会让人们有不舒服的感觉,而且由于语音识别技术对用户所处环境有一定的要求,抗噪音能力方面也有待加强。

【发明内容】

[0004]为了解决现有技术中的问题,本发明提供了一种基于声学的智能设备的文本输入识别方法,解决现有技术中设备体积庞大、用户体验不佳和抗噪音能力较差的问题。
[0005]本发明是通过以下技术方案实现的:设计、制造了一种基于声学的智能设备的文本输入识别方法,包括如下步骤:(SI)使用手指在文本输入区域输入文本字符,采集声波信号;(S2)对采集到的声波信号进行处理;(S3)对声波信号进行识别。
[0006]作为本发明的进一步改进:所述步骤(S3)中,提取声波信号的包络,并提取不同字符所具有的包络特征,对声波信号进行变换,对采集到信号进行频域特征进行分析,提取不同字符所具有的频率特征,并通过对以上特征的综合,对字符特征数据进行模型训练,用户按照语法规则输入时,通过对比现有的字符特征进行分类判断,从而识别出用户输入的字符。
[0007]作为本发明的进一步改进:所述步骤(SI)中,激活智能设备扬声器使其发出经过调制的特定频率的声波信号,使用手指在文本输入区域输入文本字符,激活扬声器的同时也激活麦克风采集声波信号;该声波信号为经过调制的具有一定频率的声波信号。
[0008]作为本发明的进一步改进:麦克风采集数据的频率是固定的,至少是扬声器所发出的声波信号的频率的两倍。
[0009]作为本发明的进一步改进:所述步骤(S2)中,首先对声波信号进行分帧,并对每个窗口数据进行处理;对采集到的声波信号进行降噪处理,并使用滤波器对声波信号进行带通滤波处理,去除噪声和杂波。
[0010]作为本发明的进一步改进:所述步骤(S3)进一步包括:对步骤(S2)中所得到的声波信号数据,提取声波信号的包络信息,并对包络进行平滑,然后找出包络的峰值点与波峰之间的距离,通过对上述信息的提取对声波信号数据时域方面进行分析。
[0011]作为本发明的进一步改进:所述步骤(S3)中,使用短时傅里叶变换函数对声波数据信号进行傅里叶变换,对音频声波信号频域进行分析。
[0012]作为本发明的进一步改进:所述步骤(S3)中,对提取的特征信息,进行机器学习,通过对特征进行SVM训练,进行建模。
[0013]作为本发明的进一步改进:提取的字符特征使用建立的匹配模型并结合语法规则进行匹配分类,识别出用户输入的字符和文本,同时进行学习,优化匹配模型。
[0014]本发明的有益效果是:提供了一种用户体验比较好、同时设备轻巧抗噪声强的一种声波信号识别的方法,进而提高了文本识别的效率。
[0015]【【附图说明】】
图1是本发明基于声学的智能设备的文本输入识别方法步骤示意图。
[0016]图2是本发明中一种基于声学的智能设备的文本输入识别系统的结构示意图。
[0017]【【具体实施方式】】
下面结合【附图说明】及【具体实施方式】对本发明进一步说明。
[0018]—种基于声学的智能设备的文本输入识别方法,包括如下步骤:(SI)使用手指在文本输入区域输入文本字符,采集声波信号;(S2)对采集到的声波信号进行处理;(S3)对声波信号进行识别。
[0019]所述步骤(S3)中,提取声波信号的包络,并提取不同字符所具有的包络特征,对声波信号进行变换,对采集到信号进行频域特征进行分析,提取不同字符所具有的频率特征,并通过对以上特征的综合,对字符特征数据进行模型训练,用户按照语法规则输入时,通过对比现有的字符特征进行分类判断,从而识别出用户输入的字符。
[0020]所述步骤(SI)中,激活智能设备扬声器使其发出经过调制的特定频率的声波信号,使用手指在文本输入区域输入文本字符,激活扬声器的同时也激活麦克风采集声波信号;该声波信号为经过调制的具有一定频率的声波信号。
[0021]麦克风采集数据的频率是固定的,至少是扬声器所发出的声波信号的频率的两倍。
[0022]所述步骤(S2)中,首先对声波信号进行分帧,并对每个窗口数据进行处理;对采集到的声波信号进行降噪处理,并使用滤波器对声波信号进行带通滤波处理,去除噪声和杂波。
[0023]所述步骤(S3)进一步包括:对步骤(S2)中所得到的声波信号数据,提取声波信号的包络信息,并对包络进行平滑,然后找出包络的峰值点与波峰之间的距离,通过对上述信息的提取对声波信号数据时域方面进行分析。
[0024]所述步骤(S3)中,使用短时傅里叶变换函数对声波数据信号进行傅里叶变换,对音频声波信号频域进行分析。
[0025]所述步骤(S3)中,对提取的特征信息,进行机器学习,通过对特征进行SVM训练,进行建模。
[0026]提取的字符特征使用建立的匹配模型并结合语法规则进行匹配分类,识别出用户输入的字符和文本,同时进行学习,优化匹配模型。
[0027]在一实施例中,如图2,提出了一种基于声学原理的智能设备文本字符输入系统,该方法通过利用智能设备普遍内置的商用级麦克风与扬声器,结合数据挖掘与机器学习算法,实现无需额外输入设备的文本输入系统,通过智能设备中的扬声器发出经过一定方式调制的声波信号,使用手指在文本输入区域输入字符与文本;与此同时,智能设备内置的麦克风以一定的采样频率采集被手指反射回的声波信号;通过对上述步骤采集到的音频信号进行处理,包括:降噪滤波,包络提取,信号切分,时频分析,特征提取,模型训练,利用机器学习训练出的分类模型,识别用户输入的字符与文本。
[0028]在一具体实施例中,如图1,一种基于声学的智能设备的文本输入识别方法通过以下步骤实现:
S1、激活智能设备扬声器使其发出经过调制的特定频率的声波信号,使用手指在文本输入区域输入文本字符,激活扬声器的同时也激活麦克风米集声波信号,扬声器所发出的声波信号,是经过调制的具有一定频率的声波信号;麦克风采集数据的频率是一定的,至少是扬声器所发出的声波信号的频率的两倍。
[0029]S2、对麦克风采集到的声波数据进行处理。首先对采集到的信号进行分帧,然后对信号进行降噪,并通过使用滤波器对信号进行滤波处理;S2还包括,S21、首先对步骤SI采集的声波信号进行分帧,从而可以对每个窗口数据进行处理;S22、对采集到的声波信号进行降噪处理,并使用巴特沃斯滤波器对声波信号进行带通滤波处理,去除噪声和杂波。
[0030]S3、提取声波信号的包络,并提取不同字符所具有的包络特征,对声波信号进行傅里叶变换,对采集到信号进行频域特征进行分析,提取不同字符所具有的频率特征,并通过对以上特征的综合,对字符特征数据进行模型训练,用户按照语法规则输入时,通过对比现有的字符特征进行分类判断,从而识别出用户输入的字符。
[0031]将S3进行细化为:
S31A:结合步骤S2中所得到的声波信号数据,提取声波信号的包络信息,并对包络进行平滑,然后找出包络的峰值点与波峰之间的距离,通过对上述信息的提取对声波信号数据时域方面进行分析;
S31B:由于使用手指输入文本字符时,手指的移动会产生多普勒效应,从而扬声器所采集到的声波信号的频率会受到影响,结合步骤S2中所得到的声波数据信号,使用短时傅里叶变换函数对声波数据信号进行傅里叶变换,对音频声波信号频域进行分析;
S31C:结合训练的匹配模型,使用语法规则来提高识别的准确率;
S32:结合步骤S31A和S31B中经过包络提取所得到的时域包络信息和经过傅里叶变换所得到的频域信息的分析,从而提取出特征;
S33:通过结合步骤S32中提取的特征信息,进行机器学习,通过对特征进行SVM训练,进行建模。
[0032]还包括步骤S4:通过步骤S3中提取的字符特征使用步骤S3中所建立的匹配模型并结合语法规则进行匹配分类,识别出用户输入的字符和文本,同时进行学习,优化匹配模型S31A:结合步骤S2中所得到的声波信号数据,提取声波信号的包络信息,并对包络进行平滑,然后找出包络的峰值点与波峰之间的距离,通过对上述信息的提取对声波信号数据时域方面进行分析。
[0033]以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
【主权项】
1.一种基于声学的智能设备的文本输入识别方法,其特征在于:包括如下步骤:(SI)使用手指在文本输入区域输入文本字符,采集声波信号;(S2)对采集到的声波信号进行处理;(S3)对声波信号进行识别。2.根据权利要求1所述的基于声学的智能设备的文本输入识别方法,其特征在于:所述步骤(S3)中,提取声波信号的包络,并提取不同字符所具有的包络特征,对声波信号进行变换,对采集到信号进行频域特征进行分析,提取不同字符所具有的频率特征,并通过对以上特征的综合,对字符特征数据进行模型训练,用户按照语法规则输入时,通过对比现有的字符特征进行分类判断,从而识别出用户输入的字符。3.根据权利要求1所述的基于声学的智能设备的文本输入识别方法,其特征在于:所述步骤(SI)中,激活智能设备扬声器使其发出经过调制的特定频率的声波信号,使用手指在文本输入区域输入文本字符,激活扬声器的同时也激活麦克风米集声波信号;该声波信号为经过调制的具有一定频率的声波信号。4.根据权利要求3所述的基于声学的智能设备的文本输入识别方法,其特征在于:麦克风采集数据的频率是固定的,至少是扬声器所发出的声波信号的频率的两倍。5.根据权利要求1所述的基于声学的智能设备的文本输入识别方法,其特征在于:所述步骤(S2)中,首先对声波信号进行分帧,并对每个窗口数据进行处理;对采集到的声波信号进行降噪处理,并使用滤波器对声波信号进行带通滤波处理,去除噪声和杂波。6.根据权利要求1所述的基于声学的智能设备的文本输入识别方法,其特征在于:所述步骤(S3)进一步包括:对步骤(S2)中所得到的声波信号数据,提取声波信号的包络信息,并对包络进行平滑,然后找出包络的峰值点与波峰之间的距离,通过对上述信息的提取对声波信号数据时域方面进行分析。7.根据权利要求1所述的基于声学的智能设备的文本输入识别方法,其特征在于:所述步骤(S3)中,使用短时傅里叶变换函数对声波数据信号进行傅里叶变换,对音频声波信号频域进行分析。8.根据权利要求1所述的基于声学的智能设备的文本输入识别方法,其特征在于:所述步骤(S3)中,对提取的特征信息,进行机器学习,通过对特征进行SVM训练,进行建模。9.根据权利要求8所述的基于声学的智能设备的文本输入识别方法,其特征在于:提取的字符特征使用建立的匹配模型并结合语法规则进行匹配分类,识别出用户输入的字符和文本,同时进行学习,优化匹配模型。
【文档编号】G06F3/023GK105938399SQ201510878499
【公开日】2016年9月14日
【申请日】2015年12月4日
【发明人】伍楷舜, 邹永攀, 刘巍峰
【申请人】深圳大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1