汽车乘员的对话模型的制作方法

文档序号：6508066阅读：223来源：国知局

汽车乘员的对话模型的制作方法
【专利摘要】本发明涉及汽车乘员的对话模型。一种用于在统计对话建模系统中生成和管理多对话模型的方法和装置，该系统能够基于所选的模型，学习并进行人机对话。根据特征向量选出对话模型，该特征向量描述了对话参与者和他们当前场景的特征。乘员无论为驾驶员还是乘客，机动车辆中的移动装置都能够根据车辆的位置和路线，以及该乘员的个性特征，向该机动车辆的乘员提供优化的对话服务。当通过远程对话服务器被网络化后，对话乘员的大池子可用于对话模型的自动建立，该对话模型适合于处理许多场景和参与者。
【专利说明】汽车乘员的对话模型
[0001]相关申请的交叉引用
[0002]本申请要求标题为“汽车乘员的对话模型”，申请日为2012年5月29日，系列号为61/652，569的美国临时专利申请的权益。该临时专利申请公开的内容被引用结合到本申请中，并根据37CFR1.78(a) (4)和(5) (i)的规定要求了其优先权。
【背景技术】
[0003]可以通过部署统计学对话建模，来提高由自动语音识别和语音生成促进的人机对话中的机器响应的质量。统计学对话建模利用包含“部分可观测马尔可夫决策过程”(POMDP)和贝叶斯网络的技术。有限状态机器“呼叫流”方法上的统计学方式的优势在于，通过从该对话系统与用户的样本交互中学习，以赋予该自动化系统对对话性能进行优化的能力。
[0004]图1是用于统计学语音对话建模的现有技术系统的概念性框图。步骤101接收音频输入，并将该输入送入到包括对话模型105的对话控制单元103中。对话控制单元103发送对话行为到语音生成单元109，以产生该对话的音频输出。对话日志111保存用于离线分析的对话。在一个独立的，典型的线下学习进程中，对话控制单元103也可发送数据日志到对话模块生成器107，来更新模型105或用另一个模型替换模型105。

【发明内容】

[0005]本发明的实施例提供了根据与汽车有关的因素，为不同群组的人类对话参与者设计对话模型的方法，其中该人类对话参与者为汽车的乘员。因而，人类对话参与者在本公开中有时被称为“乘员”。本发明的其它实施例提供了用于将参与者分组成为簇的方法，其中的每个簇都与一个对话模型相对应。根据本发明的实施例，对话是人类参与者与机器之间的双向交互，或是其任何交互部分。
[0006]与为所有对话参与者使用单一对话模型的现有技术系统相比，本发明的实施例为对话参与者群的不同分段使用了不同的对话模型。这方面增强了口头和多模型对话的性能；允许改变人机接口以区分特殊对话；通过提供更好的从语音识别错误的恢复，提高了鲁棒性；并且根据品牌来改变对话风格，从而支持汽车品牌。
[0007]根据簇设计对话模型
[0008]根据本发明的实施例，配置对话模型的设计者为对话的定制者确定一个或多个参数。从多个参数中导出特征向量，然后该设计者创造出与该特征向量的不同值相对应的对话模型集合。
[0009]利用参与的汽车乘员共有的特征，本发明的实施例优化了对话性能。在这些实施例中，这些特征与对话参与者有关，并且包括对话参与者的个人特征(如年龄范围，为驾驶员或乘客等)和参与者所处的情况的特征(如他们所乘坐的汽车，他们的位置等)。本发明的实施例使用特征的子集，这些特征包括但不限于:
[0010]汽车品牌；[0011]汽车型号；
[0012]汽车情况(如移动、静止、停车、行程开始、到达目的地)；
[0013]车载对话系统的类型；
[0014]汽车地理位置(如大城市，郊区，农村等);
[0015]路的类型(如城市，农村，高速等)；
[0016]星期几和请求的时间；
[0017]乘员的类型(驾驶员与乘客)；
[0018]乘员年龄。
[0019]在非限制性的例子中，设计者希望创造与驾驶员的年龄和汽车品牌相应的对话模型集合，其中驾驶员年龄的三个范围为年轻的，中年的和年长的，并且考虑四个不同的汽车品牌。
[0020]本例子中的特征向量的形式为{年龄，品牌}，设计者选择生成与簇编号O至6相应的7个对话模型，来覆盖由设计者详细说明的如下映射表的所有组合:
[0021]
【权利要求】
1.一种用于对设备进行操作，以便与环境中的人类对话参与者进行对话的方法，该方法包括: 获得与至少一个特征相关的参数，该至少一个特征选自包括对话参与者的特征和环境的特征的一组特征；从多个对话模型中选择具体的对话模型，使得该具体的对话模型与该参数相关；基于该具体的对话模型，该设备生成至少一个输出对话行为；以及该设备将该至少一个输出对话行为呈现给人类对话参与者。
2.如权利要求1所述的方法，进一步包括构造特征向量，其中该特征向量至少部分地从该参数中得出。
3.如权利要求2所述的方法，进一步包括确定人类对话参与者的簇。
4.如权利要求3所述的方法，进一步包括为给定簇选择对话模型。
5.如权利要求1所述的方法，进一步包括: 将多个人类对话参与者分组成为多个簇；以及为该多个簇中的每一个簇生成对话模型。
6.如权利要求5所述的方法，进一步包括在存储设备中记录对话。
7.如权利要求6所述的方法，进一步包括建立用于将多个参数转换为特征向量的特征映射。
8.一种用于选择选定的对话模型，并基于该选定的对话模型来生成和管理对话的系统，该系统包括: 语音生成单元；对话模型集合存储器；对话控制单元，用于发送对话行为到该语音生成单元；簇确定单元，用于确定与该对话相关联的簇ID ;以及对话模型选择单元，用于根据该簇ID，从该对话模型集合存储器中选择选定的对话模型，并发送该选定的对话模型到该对话控制单元；其中该对话控制单元基于该选定的对话模型，发送该对话行为到该语音生成单元。
9.一种用于建立对话模型的系统，该系统包括: 用于提供先前保存的对话的对话日志存储器；用于基于来自该对话日志存储器的先前保存的对话，生成该对话模型的对话模型生成器；以及生成用于从特征向量获得簇ID的簇映射的簇映射生成器。
10.一种用于生成对话模型的系统，该系统包括: 用于提供先前保存的对话的对话日志存储器；用于基于来自该对话日志存储器的先前保存的对话，生成该对话模型的对话模型生成器；以及生成用于从对话参数获得特征向量的特征映射的特征映射生成器。
【文档编号】G06F17/50GK103544337SQ201310361706
【公开日】2014年1月29日申请日期:2013年5月29日优先权日:2012年5月29日
【发明者】E·茨尔克尔-汉科克, O·尖霍尼申请人:通用汽车环球科技运作有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：E·茨尔克尔-汉科克;O·尖霍尼
技术所有人：通用汽车环球科技运作有限责任公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。