电梯的语音呼梯登记装置的制作方法

文档序号:8043520阅读:133来源:国知局
专利名称:电梯的语音呼梯登记装置的制作方法
技术领域
本发明涉及通过语音输入来登记电梯呼梯的电梯的语音呼梯登记装置。
背景技术
关于通过语音输入来登记电梯呼梯的语音呼梯登记装置,已经提出了具有使用不同的识别方法进行语音识别的多个语音识别处理部的装置。该语音呼梯登记装置综合多个语音识别处理部的识别结果进行评定,由此提高语音识别的准确度,根据语音识别的准确度变更将对利用者进行的响应。由此,能够给利用者带来舒适的利用环境(例如,参照专利文献I)。但是,在利用专利文献I记载的语音呼梯登记装置的情况下,利用相同方法对全部利用者进行语音识别。因此,不能识别与语音识别处理部所准备的任意一种识别方法均·不适合的语音。发出这种语音的利用者无论何时都不能通过语音输入来登记目的地呼梯等电梯的呼梯。并且,专利文献I记载的语音呼梯登记装置在同时不被多个语音识别处理部识别时不能登记电梯的呼梯。即,专利文献I记载的语音呼梯登记装置针对全部利用者致使确定电梯的呼梯登记的门槛一律提高,使得使用便利性较差。对此,还提出了使只能受理预先登记的利用者的语音的语音呼梯登记装置。根据该语音呼梯登记装置,能够降低语音的错误识别(例如,参照专利文献2)。另外,还提出了保存语音的分析结果,并根据保存结果来识别讲话人属性的装置。根据这些装置,能够提高讲话人属性的确定精度,进一步降低语音的错误识别(例如,参照专利文献3和4)。但是,在将专利文献2 4记载的装置应用于语音呼梯登记装置的情况下,需要将利用者限定为特定的讲话人。因此,专利文献2 4记载的装置的应用范围变窄。另一方面,电梯的语音呼梯登记装置需要识别不特定的多个利用者的语音。因此,很难将专利文献2 4记载的装置应用于语音呼梯登记装置。针对这些情况,提出了具有与用利用用途、环境噪声表示的环境属性和/或用讲话人的性别和/或年龄表示的本人属性对应的多个语音识别辞典(识别单词和声学模型)的装置。根据该装置,能够给出实际的环境属性和/或实际的本人属性来选择合适的语音识别辞典,不需限定讲话人,即可选择符合讲话人特征的声学模型(例如,参照专利文献5)。但是,在将专利文献5记载的装置应用于语音呼梯登记装置的情况下,存在每次利用时都必须给出实际的环境属性和/或实际的利用者属性的繁琐事项。针对此情况,提出了一种显示装置,其根据从设于电梯的摄像机装置输入的信息来判别成人男性、成人女性、儿童等利用者属性和人数,由此进行符合利用状况的信息显示。如果将该显示装置的判别方法应用于声学模型的选择,则能够不需限定利用者地容易选择有可能符合利用者的声学模型(例如,参照专利文献6)。在先技术文献专利文献专利文献I :日本专利第3082618号公报
专利文献2 :日本专利第2557939号公报专利文献3 :日本特开平10 - 240287号公报专利文献4 :日本特表2003 - 524805号公报专利文献5 :日本特开2002 - 229584号公报专利文献6 :日本特开2007 - 261722号公报

发明内容
发明要解决的问题但是,专利文献6记载的判别方法不一定总是很准确。因此,存在选择了不符合利用者特征的声学模型的问题。本发明正是为了解决上述问题而提出的,其目的在于,提供一种电梯的语音呼梯登记装置,能够不限定利用者,而利用简单的方法提高在通过语音输入来登记电梯呼梯时选择符合利用者特征的声学模型的可能性。用于解决问题的手段本发明的电梯的语音呼梯登记装置具有语音输入部,其取入输入到设置在电梯的轿厢或者层站的语音输入装置的输入语音;声学模型存储部,其存储有声学特性彼此不同的多个声学模型;利用者信息提取部,其提取与位于设有所述语音输入装置的轿厢或者层站的利用者的特征相关的利用者信息;电梯信息提取部,其提取包括设有所述语音输入装置的轿厢或者层站的位置在内的与所述电梯的状态相关的电梯信息;以及声学模型选择部,其根据所述利用者信息和所述电梯信息,从所述多个声学模型中选择在从所述输入语音中识别所述电梯的呼梯时使用的声学模型。发明效果根据本发明,能够不限定利用者,而利用简单的方法提高在通过语音输入来登记电梯呼梯时选择符合利用者特征的声学模型的可能性。


图I是本发明的实施方式I的电梯的语音呼梯登记装置和电梯控制部的结构图。图2是用于说明本发明的实施方式I的电梯的语音呼梯登记装置登记电梯呼梯时的动作的流程图。图3是用于说明本发明的实施方式I的电梯的语音呼梯登记装置选择声学模型时的动作的流程图。图4是本发明的实施方式2的电梯的语音呼梯登记装置和电梯控制部的结构图。图5是本发明的实施方式3的电梯的语音呼梯登记装置和电梯控制部的结构图。
具体实施例方式参照附图来说明用于实施本发明的方式。另外,在各个附图中对相同或者相当的部分标注相同的标号,并适当简化乃至省略其重复说明。实施方式I通常,电梯被设于楼宇等建筑物中。在该电梯的轿厢内或层站设有呼梯登记装置。利用者利用该呼梯登记装置登记电梯的呼梯。并且,电梯的轿厢响应于利用该呼梯登记装置登记的呼梯而升降。在此,作为呼梯登记装置的一种,提出了通过语音输入来登记电梯呼梯的语音呼梯登记装置。该语音呼梯登记装置识别利用者在轿厢内或层站发出的语音,而登记电梯的呼梯。如果利用该语音呼梯登记装置,则即使是双手被占住的利用者等也能够容易登记电梯的呼梯。在这种语音呼梯登记装置中,如果错误识别了利用者发出的语音,则导致不能登记利用者期望的电梯呼梯。因此,在本实施方式的语音呼梯登记装置中提高了语音的识别精度。下面,具体说明本实施方式的语音呼梯登记装置。图I是本发明的实施方式I的电梯的语音呼梯登记装置和电梯控制部的结构图。图I中的语音呼梯登记装置被设于电梯的轿厢内或者层站。该语音呼梯登记装置 具有语音输入部1、A/D转换部2、语音切取部3、声学分析部4、信息输入部5、利用者信息提取部6、楼宇信息存储部7、声学模型选择部8、识别辞典9、多个声学模型10以及语音识别部11。语音输入部I具有取入针对设置在电梯的轿厢内或者层站的传声器等语音输入装置(未图示)的输入语音的功能。A/D转换部2具有将语音输入部I取入的输入语音转换为数字数据的功能。语音切取部3具有检测从A/D转换部2传送来的数字数据的无声区间的功能。并且,语音切取部3具有根据无声区间信息,切取被夹在数字数据的无声区间之间的区间作为成为语音识别的对象的讲话区间的功能。声学分析部4具有通过傅立叶变换等运算处理,将语音切取部3切取出的讲话区间转换为在语音识别中使用的特征量数据的功倉泛。信息输入部5具有取得由传感器装置、秤装置、摄像机装置等通常设置在电梯上的设备检测到的与利用者的特征相关的信息的功能。利用者信息提取部6具有从输入到信息输入部5的信息中提取利用者的身材、乘入轿厢的乘梯速度等与利用者的特征相关的利用者信息的功能。楼宇信息存储部7具有存储楼宇信息的功能。该楼宇信息包括与在设有电梯的楼宇等建筑物的各个楼层居住的住户相关的信息等、与该建筑物的各个楼层的特征相关的建筑物信息。即,楼宇信息存储部7作为存储建筑物信息的建筑物信息存储部发挥作用。声学模型选择部8具有提取与楼宇信息相关联的、与利用者特征的倾向相关的利用者倾向信息的功能。该利用者倾向信息可以存储在声学模型选择部8中,也可以存储在楼宇信息存储部7等其它存储部中。并且,声学模型选择部8具有根据由利用者信息提取部6提取出的利用者信息、与楼宇信息相关联的利用者倾向信息等,估计利用者属性的功能。关于该利用者属性的类型,能够考虑传感器装置、秤装置、摄像机装置等对利用者特征的检测内容和检测精度而设定为各种类型。例如,有时以区分大人和儿童的方式来设定利用者属性。另外,有时还以十几岁、二十几岁等区分各个年龄段的方式来设定利用者属性。另外,有时还以男性或者女性等区分性别的方式来设定利用者属性。此外,有时还以按照年龄段、性别等的复合条件进行区分的方式来设定利用者属性。另外,能够对声学模型选择部8适当设定估计利用者属性时的利用者信息、楼宇信息等各种信息的权重。识别辞典9具有存储例如“I层”、“大堂楼层”等想要被语音识别出的单词的功能。多个声学模型10被存储在各个声学模型存储装置(未图示)中。这些声学模型10由整套的各个音素的特征量数据的声学数据构成。这些声学数据对应于年龄段、性别等由声学模型选择部8估计出的利用者属性,其声学特性彼此不同。并且,预先对这些声学模型10附加了表示对应于哪种利用者属性的模型的标志。语音识别部11具有从多个声学模型10中检测与声学模型选择部8估计出的利用者属性对应的标志的功能。并且,语音识别部11具有选择具有检测到的标志的声学模型10,作为具有与声学模型选择部8估计出的利用者属性最接近的特征的声学模型10。gp,实质上语音识别部11从多个声学模型10中提取由声学模型选择部8选择的声学模型10。另外,语音识别部11具有使用所选择的声学模型10,从输入到语音输入部I的输入语音中识别记载在识别辞典9中的单词的功能。另外,在图I中也示出了电梯控制部12。该电梯控制部12具有呼梯登记部13。呼梯登记部13具有预先将识别辞典9的单词和设有电梯的楼宇等的楼层关联存储的功能。例如,针对识别辞典9的“I层”,相对应地存储有如字面所示的“I层”。对于识别辞典9的 “大堂楼层”也对应地存储有“I层”。并且,呼梯登记部13在识别到与语音识别部11识别的单词相关联的楼层的情况下,将对应于该楼层的目的地呼梯登记为电梯的呼梯。并且,电梯控制部12还具有电梯信息管理部14。该电梯信息管理部14具有检测各种电梯状态并进行管理的功能。例如,电梯信息管理部14具有管理设有语音输入装置的轿厢或者层站的位置、轿厢的行进方向、开门关门状态等电梯信息的功能。尤其电梯信息管理部14可靠地检测每时每刻变化的轿厢的当前位置(当前楼层)并进行管理。在本实施方式中,声学模型选择部8还作为从电梯信息管理部14提取电梯信息的电梯信息提取部发挥作用。并且,声学模型选择部8提取与各种电梯信息相关联的、与利用者特征的倾向相关的利用者倾向信息。该利用者倾向信息是通过在一定期间中调查电梯的利用者而被掌握的。该利用者倾向信息可以存储在声学模型选择部8中,也可以存储在其它存储部中。该声学模型选择部8将从楼宇信息中提取出的利用者倾向信息识别为第I利用者倾向信息,将从电梯信息中提取出的利用者倾向信息识别为第2利用者倾向信息。并且,声学模型选择部8不仅考虑利用者信息、第I利用者倾向信息,而且也考虑第2利用者倾向信息来估计利用者属性。下面,使用图2和图3来说明本实施方式的电梯的语音呼梯登记装置登记电梯呼梯时的动作。图2是用于说明本发明的实施方式I的电梯的语音呼梯登记装置登记电梯的呼梯时的动作的流程图。图3是用于说明本发明的实施方式I的电梯的语音呼梯登记装置选择声学模型时的动作的流程图。首先,使用图2来说明登记电梯呼梯的步骤的概况。S卩,在步骤SI中,在轿厢内或者层站的语音输入装置被输入语音时,语音输入部I取入该语音,进入步骤S2。在步骤S2中,A/D转换部2将该语音转换为数字数据,进入步骤S3。在步骤S3中,语音切取部3切取并检测该数字数据的讲话区间,进入步骤S4。在步骤S4中,声学分析部4将该讲话区间转换为在语音识别中使用的特征量数据并进行声学分析,进入步骤S5。在步骤S5中,声学模型选择部8实质上选择声学模型10,进入步骤S6。
在步骤S6中,语音识别部11将由声学分析部4进行声学分析后的特征量数据、与声学模型选择部8选择的声学模型10的声学数据进行比较。由此,被取入语音输入部I的输入语音得以识别,进入步骤S7。在步骤S7中,语音识别部11将输入语音的识别结果输出给电梯控制部12的呼梯登记部13,进入步骤S8。在步骤S8中,呼梯登记部13判定是否成功识别出与该识别结果涉及到的单词相关联的楼层。在未识别到与该识别结果涉及到的单词相关联的楼层时动作结束。即,不登记目的地呼梯。与此相对,在识别到与该识别结果涉及到的单词相关联的楼层的情况下,进入步骤S9。在步骤S9中,呼梯登记部13登记与该楼层对应的目的地呼梯,动作结束。在此,在图3的步骤S5中,如上所述,不仅考虑利用者信息、第I利用者倾向信息,而且也考虑第2利用者倾向信息来选择在根据输入语音识别电梯的呼梯时使用的声学模型10。下面,使用图3具体说明本实施方式的声学模型10的选择步骤。
首先,在步骤Sll中,声学模型选择部8参照楼宇信息存储部7的楼宇信息,提取与楼宇信息相关联的第I利用者倾向信息。然后,进入步骤S12,声学模型选择部8参照电梯信息管理部14的电梯信息,提取与当前的电梯信息相关联的第2利用者倾向信息。然后,进入步骤S13,利用者信息提取部6提取利用者信息。然后,声学模型选择部8参照该利用者信息,进入步骤S14。在步骤S14中,声学模型选择部8不仅考虑利用者信息、第I利用者倾向信息,而且也考虑第2利用者倾向信息来估计利用者属性,进入步骤S15。在步骤S15中,声学模型选择部8实质上选择符合该利用者属性的声学模型10,动作结束。根据以上说明的实施方式1,不仅考虑利用者信息、楼宇信息,而且也考虑电梯信息来选择在识别电梯的呼梯时使用的声学模型10。因此,能够不限定利用者而利用简单的方法提高在通过语音输入来登记电梯的呼梯时选择符合利用者特征的声学模型10的可能性。通过这样选择声学模型10,能够提高针对利用者发出的语音的识别精度,并且不容易对除具有与利用者相同特性的讲话人之外的无用话语和从广播装置播放的语音进行反应。即,能够提高防止利用者发出的语音的错误识别和该错误识别导致的错误的呼梯登记。并且,利用者信息提取部6从通常设置在电梯的传感器装置、秤装置、摄像机装置等设备检测到的利用者特征中提取利用者信息。因此,能够利用简单的方法提高选择符合利用者特征的声学模型10的可能性,而且不需追加特殊的装置。另外,在实施方式I中,使用所选择的声学模型10仅进行I次语音识别来登记电梯的呼梯。但是,也可以设置识别似然度的阈值,输出所识别到的单词和似然度作为语音识别部11的识别结果,来判定是否登记电梯的呼梯。并且,在作为符合利用者特征的声学模型而选择的声学模型10的识别似然度较低的情况下,反复变更在语音识别中使用的声学模型10,直到识别似然度超过阈值。另外,在实施方式I中,输出使用根据利用者信息和楼宇信息和电梯信息而选择的声学模型10而得到的输入语音的识别结果,而登记电梯的呼梯。然而,也可以是,输出使用全部声学模型10得到的输入语音的识别结果中、使用根据利用者信息和楼宇信息和电梯信息而选择的声学模型10得到的输入语音的识别结果,来登记电梯的呼梯。实施方式2图4是本发明的实施方式2的电梯的语音呼梯登记装置和电梯控制部的结构图。另外,对与实施方式I相同或者相当的部分标注相同标号,并省略说明。实施方式2的语音呼梯登记装置是对实施方式I的语音呼梯登记装置追加了利用者信息存储部15的装置。该利用者信息存储部15具有每当利用者信息提取部6提取利用者信息时,将所提取的利用者信息与电梯信息关联存储,由此保存第2利用者倾向信息的、功能。S卩,在实施方式2中,利用者信息存储部15与电梯信息联动地学习第2利用者倾向信息。并且,其学习结果体现在声学模型10的选择中。具体地讲,声学模型选择部8被设定成为不仅考虑利用者信息、第I利用者倾向信息,而且也考虑在实际的电梯运行中自动保存的第2利用者倾向信息,来选择在识别电梯的呼梯时使用的声学模型10。并且,本实施方式的声学模型选择部8被设定成为随着第2利用者倾向信息的保存量的增加,而增大第2利用者倾向信息的权重,并且减小第I利用者倾向信息的权重。例如,声学模型选择部8被设定成为使第I利用者倾向信息的权重与第2利用者倾向信息的学习量成反比地减小。在这种结构的语音呼梯登记装置中,每当电梯信息变化时,语音识别部11将在识别电梯的呼梯时使用的声学模型10切换为由声学模型选择部8实质上选择的声学模型10。并且,语音识别部11使用每当电梯信息变化时被切换的声学模型10,识别语音输入部I取入的输入语音。根据以上说明的实施方式2,也考虑在实际的电梯运行中保存的与电梯信息对应的第2利用者倾向信息,来选择电梯在对应于各个电梯信息的状态时使用的声学模型10。因此,能够进一步提高选择符合利用者特征的声学模型10的可能性。在此,在利用者的倾向随着入住楼宇的住户等的变更而变化的情况下,如果不更新楼宇信息,则在住户等的变更初期选择符合利用者的声学模型10的可能性降低。但是,在实施方式2中,随着与各个电梯信息对应的第2利用者倾向信息的保存量的增加,第2利用者倾向信息的权重增大,并且与楼宇信息对应的第I利用者倾向信息的权重减小。因此,如果电梯继续运行而使得第2利用者倾向信息的保存量的增加,即使忘记了手动更新楼宇信息,也能够提高选择符合利用者的声学模型10的可能性。实施方式3图4是本发明的实施方式3的电梯的语音呼梯登记装置和电梯控制部的结构图。另外,对与实施方式I或者2相同或者相当的部分标注相同标号,并省略说明。在实施方式3的语音呼梯登记装置中,设置语音特征提取部16、语音特征存储部17、输入语音学习部18来取代实施方式I的信息输入部5、利用者信息提取部6、楼宇信息存储部7。语音特征提取部16具有从由声学分析部4进行转换后的特征量数据中提取语音特征的功能。该语音特征被区分为大人的语音、儿童的语音、女性的语音、男性的语音等。即,在实施方式3中,语音特征提取部16作为从利用者的输入语音的特征中提取利用者信息的利用者信息提取部发挥作用。
语音特征存储部17具有每当语音特征提取部16提取了语音特征时,将利用者的语音特征与电梯信息相关联地进行存储,而保存第2利用者倾向信息的功能。S卩,在实施方式3中,语音特征存储部17作为相当于实施方式2的利用者信息存储部的单元发挥作用。在输入语音学习部18中设定了不特定讲话人模型,作为电梯在对应于各个电梯信息的状态时使用的声学模型10的初始设定。并且,输入语音学习部18根据在语音特征存储部17中保存的第2利用者倾向信息,学习在各个电梯状态时具有哪种语音特征的利用者比较多。即,输入语音学习部18通过上述学习,使电梯在对应于各个电梯信息的状态时使用的声学模型10的设定逐渐变化。并且,实施方式3的声学模型选择部8被设定成为根据输入语音学习部18学习到的与各个电梯信息对应的第2利用者倾向信息,从多个声学模型10中选择在识别电梯的呼梯时使用的声学模型10。
在这种结构的语音呼梯登记装置中,每当电梯信息变化时,语音识别部11将在识别电梯的呼梯时使用的声学模型10切换为由声学模型选择部8实质上选择的声学模型10。并且,语音识别部11使用在每当电梯信息变化时切换的声学模型10来识别语音输入部I取入的输入语音。根据以上说明的实施方式3,即使与来自传感器装置、秤装置、摄像机装置的利用者信息和楼宇信息相关联的第I利用者倾向信息不被提取,也能够提高选择符合利用者特征的声学模型10的可能性。产业上的可利用性如上所述,根据本发明的电梯的语音呼梯登记装置,能够应用于不限定利用者而能够利用简单的方法提高在通过语音输入来登记电梯呼梯时选择符合利用者特征的声学模型的可能性的电梯。标号说明I语音输入部;2A/D转换部;3语音切取部;4声学分析部;5信息输入部;6利用者信息提取部;7楼宇信息存储部;8声学模型选择部;9识别辞典;10声学模型;11语音识别部;12电梯控制部;13呼梯登记部;14电梯信息管理部;15利用者信息存储部;16语音特征提取部;17语音特征存储部;18输入语音学习部。
权利要求
1.一种电梯的语音呼梯登记装置,其特征在于,该电梯的语音呼梯登记装置具有 语音输入部,其取入输入到设置在电梯的轿厢或者层站的语音输入装置的输入语音; 声学模型存储部,其存储有声学特性彼此不同的多个声学模型; 利用者信息提取部,其提取与位于设有所述语音输入装置的轿厢或者层站的利用者的特征相关的利用者信息; 电梯信息提取部,其提取包括设有所述语音输入装置的轿厢或者层站的位置在内的与所述电梯的状态相关的电梯信息;以及 声学模型选择部,其根据所述利用者信息和所述电梯信息,从所述多个声学模型中选择在从所述输入语音中识别所述电梯的呼梯时使用的声学模型。
2.根据权利要求I所述的电梯的语音呼梯登记装置,其特征在于,所述语音呼梯登记装置具有语音识别部,该语音识别部输出使用所述声学模型选择部选择出的声学模型得到 的所述输入语音的识别结果。
3.根据权利要求I所述的电梯的语音呼梯登记装置,其特征在于,所述语音呼梯登记装置具有语音识别部,该语音识别部输出使用所述多个声学模型得到的所述输入语音的识别结果中的、使用所述声学模型选择部选择出的声学模型得到的所述输入语音的识别结果O
4.根据权利要求I 3中任意一项所述的电梯的语音呼梯登记装置,其特征在于,所述利用者信息提取部从设置在所述电梯的传感器装置、秤装置、摄像机装置中的至少一个装置检测到的利用者的特征中,提取所述利用者信息。
5.根据权利要求I 4中任意一项所述的电梯的语音呼梯登记装置,其特征在于, 所述语音呼梯登记装置具有利用者信息存储部,每当所述利用者信息提取部提取利用者信息时,该利用者信息存储部将提取出的利用者信息与所述电梯信息关联起来而保存与利用者特征的倾向相关的利用者倾向信息, 所述声学模型选择部根据所述利用者倾向信息,选择在所述电梯处于与所述电梯信息对应的状态的情况下识别所述电梯的呼梯时使用的声学模型。
6.根据权利要求5所述的电梯的语音呼梯登记装置,其特征在于, 所述语音呼梯登记装置具有建筑物信息存储部,该建筑物信息存储部存储与设有所述电梯的建筑物的各个楼层的特征相关的建筑物信息, 所述声学模型选择部根据所述利用者倾向信息和所述建筑物信息,选择在识别所述电梯的呼梯时使用的声学模型。
7.根据权利要求6所述的电梯的语音呼梯登记装置,其特征在于,所述声学模型选择部在选择声学模型时,伴随着所述利用者倾向信息的保存量的增加,使所述利用者倾向信息的权重增大,并且使所述建筑物信息的权重减小。
8.根据权利要求5 7中任意一项所述的电梯的语音呼梯登记装置,其特征在于,所述利用者信息提取部从所述输入语音的特征中提取所述利用者信息。
全文摘要
提供一种电梯的语音呼梯登记装置,能够不限定利用者而利用简单的方法提高在通过语音输入来登记电梯的呼梯时选择符合利用者特征的声学模型的可能性。为此,该电梯的语音呼梯登记装置具有语音输入部,其取入输入到设置在电梯的轿厢或者层站的语音输入装置的输入语音;声学模型存储部,其存储了声学特性彼此不同的多个声学模型;利用者信息提取部,其提取与位于设有语音输入装置的轿厢或者层站的利用者的特征相关的利用者信息;电梯信息提取部,其提取包括设有语音输入装置的轿厢或者层站的位置在内的与电梯的状态相关的电梯信息;以及声学模型选择部,其根据利用者信息和电梯信息,从多个声学模型中选择在根据输入语音识别电梯的呼梯时使用的声学模型。
文档编号B66B3/00GK102762477SQ20108006270
公开日2012年10月31日 申请日期2010年3月12日 优先权日2010年3月12日
发明者永田绚子 申请人:三菱电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1