一种多轮语音交互导航方法及系统的制作方法

文档序号：9748582阅读：471来源：国知局

一种多轮语音交互导航方法及系统的制作方法
【技术领域】
[0001] 本发明涉及语音方法，特别涉及多轮语音交互导航方法及系统。
【背景技术】
[0002] 抬头显示器HUD(Head Up Display)，是普遍运用在航空器上的飞行辅助仪器。抬头的意思是指飞行员不需要低头就能够看到他需要的重要资讯。因为HUD的方便性以及能够提高飞行安全，民航机也纷纷跟进安装。HUD是利用光学反射的原理，将重要的飞行相关资讯投射在一片玻璃上面。这片玻璃位於座舱前端，高度大致与飞行员的眼睛成水平，投射的文字和影像调整在焦距无限远的距离上面，飞行员透过HUD往前方看的时候，不会妨碍到眼睛的运作，维持清晰的显示。
[0003] HUD的基本架构包含两个部分:资料处理单元与影像显示装置。资料处理单元是将飞机上各系统的资料整合处理之後，根据选择的模式转换成预先设定的符号，图形或者是以文字或者是数字的型态输出。有些产品将讯号处理与影像输出分成两个装置，不过大致上都是类似的工作方式。影像显示装置就是安装在座舱前方，位于飞行员与座舱罩之间的空间上。影像显示装置接收来自资料处理装置的资讯，投射在玻璃上面。显示装置并且附有控制面板，能够调解或者是改变输出的影像。
[0004] 新一代的HUD在影像显示方面的改良包括采用全像摄影(Holographic)显示方式，扩大显示影像的范围，尤其是增加水平上的视野角度，减少支架的厚度对於视野的限制与影响，增强不同光度与外在环境下的显示调整，强化影像的清晰度，与其他光学影像输出的配合，譬如说能够将红外线影像摄影机产生的飞机前方影像直接投射到HUD上，与其他的资料融合显示，配合夜视镜的使用以及采用彩色影像显示资料。在资料处理单元上的改良包括提高处理的速率和效率，HUD是将影像投射在座舱前方的固定装置上，当飞行员转动头部的时候，这些影像就会暂时离开他的视野范围。新一代的HUD更适合广泛地运用在汽车上。
[0005] 在人们的固有观念里，驾驶最应该注重的自然是安全，不过随着智能手机的普及，手机用户们无时无刻不依赖手机带来的便利和快捷。电话、短信、微信的实时沟通，多媒体的使用，地图导航工具等等这些，然而在"低头族"日益增多的今天，手机带给我们的便利却极大的影响了驾驶的安全性。多种形式的交通事故都是由于车主在驾驶过程中由于使用手机而造成的。汽车厂商们开始意识到中控屏幕的重要性，再加上车辆作为最大的终端设备，更让车上的这块"屏"成为了兵家必争之地。然而车载中控屏幕的存在确实让驾驶变得更为安全了，但在实际体验中，依然有车载中控屏幕上的各项弊端和不方便之处，依然会让驾驶员分心。
[0006] 目前，在主流的地图类APP中，进行语音交互式搜索的方式基本都是单轮的交互，即用户发出目的地查询的指令，如"导航去天安门"或"去附近的肯德基"等，设备接受指令后需要用户手动的去进行点击选择，甚至可能需要进行翻页操作。这种交互方式的缺点一是交互不连贯，需要用户进行语音、手动选择等多重动作;二是当在开车的环境下，司机很容易分心，造成安全隐患。

【发明内容】

[0007] 本发明要解决的技术问题是，基于多轮语音交互的对话式导航选择方法，该方法基于用户的语音输入，记录用户的各种状态，不断的引导用户，直到选择出正确的目的地。
[0008] 解决上述技术问题，本发明提供了一种多轮语音交互导航方法，包括：
[0009] 接收用户发送的语音信号；
[0010] 根据所述语音信号得到用户输入的Ρ0Ι地址；
[0011] 根据所述Ρ0Ι地址进行检索，得到检索结果；
[0012] 将所述检索结果进行反馈，等待用户下一次语音信号；
[0013] 根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完成导航。
[0014] 所述用户输入的Ρ0Ι地址包括：目的地名称、所属类别、目的地经度炜度、目的地附近商业信息，所述Ρ0Ι地址根据用户的同样意思的不同表述方式的自然语音信息进行语义解析后得到。
[0015] 所述检索结果根据所述Ρ0Ι地址进行聚类，
[0016] 根据所述Ρ0Ι地址中的目的地名称选择出中心位置目的地，
[0017] 将距离所述中心位置目的地的最大或者最小位置作为有效地址；
[0018] 对所述有效地址进行反馈输出。
[0019] 根据所述Ρ0Ι地址中的目的地经度炜度选择出中心位置目的地。
[0020] 所述反馈输出按照列表形式或者对所述Ρ0Ι点的自定义进行下一次语音选择。
[0021] 根据所述用户输入的Ρ0Ι地址中的目的地附近的商业信息进行聚类，
[0022] 获取所述目的地附近商业信息，根据所述附近商业信息的热点或者HUD中的行车记录进行匹配抽样出核心点；
[0023] 所述核心点和其邻居点通过聚类形成簇，在所述簇中如果出现多个点都是核心点，则以这些核心点为中心的簇要合并；
[0024]合并后对所述核心点和其邻居点进行聚类。
[0025] 所述检索结果根据所述Ρ0Ι地址进行k-means聚类、k-modes聚类、CURE聚类、k-medoids 聚类、DBSCAN 聚类、STING 聚类。
[0026]所述语音信号按照多轮进行交互，所述语音信号由至少一个用户发出，并储存至云端服务器。
[0027]通过所述语音信号记录用户的操作习惯，并根据所述操作习惯进行建立操作学习模型后反馈检索结果；
[0028]通过反馈的检索结果，分轮次引导用户选择出定位出目的地；
[0029]通过调用地图服务进行Ρ0Ι地址的检索。
[0030]本发明还提出了一种多轮语音交互导航系统，包括：
[0031]语音识别模块，用以接收用户发送的语音信号；
[0032]查询模块，用以根据所述语音信号得到用户输入的Ρ0Ι地址；
[0033]显示输出模块，用以根据所述Ρ0Ι地址进行检索，得到检索结果；
[0034]语音交互模块，用以将所述检索结果进行反馈，等待用户下一次语音信号;根据所述下一次语音信号，在所述反馈的结果中选择定位出目地，完成导航。
[0035] 本发明的有益效果：
[0036] 1)由于本发明中的多轮语音交互导航方法，接收用户发送的语音信号;根据所述语音信号得到用户输入的Ρ0Ι地址;根据所述Ρ0Ι地址进行检索，得到检索结果;将所述检索结果进行反馈，等待用户下一次语音信号;根据所述下一次语音信号，在所述反馈的结果中选择定位出目的地，完成导航。通过上述步骤，能够实现全语音交互过程，无需用户手动操作。
[0037] 2)所述Ρ0Ι地址根据用户的同样意思的不同表述方式的自然语音信息进行语义解析后得到。并且采用上述基于中心位置的聚类算法，减少用户选择的余地，使操作方法更加智能。
[0038] 3)通过用户输入的Ρ0Ι地址，包括，目的地名称、所属类别、目的地经度炜度、目的地附近商业信息，能够更多维的目的地选择方案，更佳的用户体验。
【附图说明】
[0039]图1是本发明一实施例中一种基于HUD的多轮语音交互导航方法的操作流程示意图。
[0040] 图2是图1中的根据所述Ρ0Ι地址进行检索并得到检索结果的具体实现方法示意图。
[0041] 图3是图2中的另一实施方式示意图。
[0042] 图4是图2中进一步改进的实施方式示意图。
[0043]图5是根据图1中Ρ0Ι地址类型进行检索的【具体实施方式】示意图。
[0044] 图6是图1中一种优选的实施方式示意图。
[0045] 图7是图1中另一种优选的实施方式示意图。
[0046]图8是本发明一实施例中一种基于HUD的多轮语音交互导航系统的结构关系示意图。
[0047]图9是图1中用户输入P01地址的所包括类型示意图。
[0048] 图10是图1中对检索结果进一步进行聚类算法的示意图

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋明凯;陈涛;沈峥嵘;王艳龙;
技术所有人：北京乐驾科技有限公司;
我是此专利的发明人

上一篇：一种基于三轴加速计的计步方法及装置的制造方法
上一篇：智能油料提示装置及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。