本发明涉及语音识别及人工智能技术领域,尤其涉及一种智能语音导游方法、装置、设备及存储介质。
背景技术:
近年来,随着人工智能技术的发展及普及,地图已经成为人们自助导游决策的最重要的参考依据之一。
目前,自助导游导航技术可以通过定位系统实现自助导游,自主的对使用者进行导游服务,使自助旅游者可以享受专业性的导游服务。其中,对于地图出游用户来说,语音对话导游功能需求将会越来越密切,但是由于每个人的发音特点不一样,很多国家的语言不一样,各个地区的语言具有差异等,而现有的导游产品功能单一,存在导游与用户需求不适配的现象,从而导致导览效率低且用户体验较差的问题。因此,为用户提供一种个性化的语音导览服务是十分必要的。
技术实现要素:
本发明实施例提供一种智能语音导游方法、装置、设备及存储介质,丰富了地图用户导游过程中选择的语种信息,满足了更多用户的需求,同时丰富了语音交流的趣味性,从而提升了用户地图内语音导览的效率。
第一方面,本发明实施例提供了一种智能语音导游方法,该方法包括:
从预设的多种导览语言类型中选择当前语言类型;
依据当前地理位置信息和当前用户的游览兴趣特征生成当前游览路线信息;
依据所述当前游览路线信息,采用所述当前语言类型与当前用户进行语音导览会话。
第二方面,本发明实施例还提供了一种智能语音导游装置,该装置包括:
语言类型选择模块,用于从预设的多种导览语言类型中选择当前语言类型;
路线信息生成模块,用于依据当前地理位置信息和当前用户的游览兴趣特征生成当前游览路线信息;
语音会话模块,用于依据所述当前游览路线信息,采用所述当前语言类型与当前用户进行语音导览会话。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任意所述的智能语音导游方法。
第四方面,本发明实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意所述的智能语音导游方法。
本发明实施例提供的智能语音导游方法、装置、设备及存储介质,通过提供多种导览语言类型供用户选择当前语言类型,依据用户当前地理位置信息和游览兴趣特征确定当前游览路线信息,并依据当前游览路线信息,采用用户选择的当前语言类型与用户进行语音导览会话。避免了导游产品功能单一,存在导游与用户需求不适配的现象,丰富了地图用户导游过程中选择的语种信息,满足了更多用户的需求,同时丰富了语音交流的趣味性,从而提升了用户地图内语音导览的效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例一中提供的一种智能语音导游方法的流程图;
图2是本发明实施例二中提供的一种智能语音导游方法的流程图;
图3是本发明实施例三中提供的一种智能语音导游装置的结构框图;
图4是本发明实施例四中提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1为本发明实施例一提供的一种智能语音导游方法的流程图,本实施例适用于用户在某地旅游时,如何提升用户基于地图进行语音导游效率的情况。该方法可以由本发明实施例提供的智能语音导游装置来执行,该装置可采用软件和/或硬件的方式实现,如集成于地图软件上或配置于智能终端上,也可以是一个独立的智能设备或应用程序。参见图1,该方法具体包括:
s110,从预设的多种导览语言类型中选择当前语言类型。
其中,导览语言类型是指智能语音导游装置中所含有的,能够为用户提供语音导览的语言类型;语言类型包括不同的语种类型或者同一语种下不同的方言类型。如:英文、韩文、中文、中文-东北话及中文-天津话等。当前语言类型可以是导览语言类型中的任意一个。
示例性的,智能语音导游装置中设置有检测模块,用于检测用户输入的各种信息或手势,且智能语音导游装置为每个用户配置特有的账户信息及对应的存储库。因此,每个用户都可以通过登录自己的账户采用语音、键入或者点击等方式从预设的多种导览语言类型中选择自己所擅长或熟悉的语言类型作为当前语言类型。如用户首次利用智能语音导游装置进行语音对话时,通过触摸点击的方式选择一种自己所擅长的语言类型,检测模块检测到用户输入的信息后,通过后台数据分析,采用该种语言类型为用户介绍景点的知识和/或与用户进行语音交流。
可选的,还可以将用户当前所在地的语言类型作为当前语言类型,与用户进行交流。
示例性的,从预设的多种导览语言类型中选择当前语言类型之前,还可以包括:采用个性化语音识别模型识别用户的语音指令,其中个性化语音识别模型是预先依据历史语音导览会话预先训练得到的。
其中,语音指令是指用户发出的用于询问或指示智能语音导游装置介绍某个景点知识时所产生的指令;历史语音导览会话是指记录智能语音导游装置为用户介绍景点的多种知识以及与用户进行语音交流的会话历史;个性化语音识别模型是基于人工智能和语言识别技术所建立的模型,如可通过训练神经网络模型得到。具体的,通过在与用户的对话过程中的不断累积,以及智能技术检测和分析,基于语音识别技术神经网络模型能够识别出用户语言,并能够通过不断学习和应用用户语言,实现了可根据用户的语言类型自动转换和匹配,做到了顺畅交流。
因此,当用户使用自己所熟悉的语言类型与智能语音导游装置进行语音交流时,可采用个性化语音识别模型通过分析,准确识别出用户所用的语言类型后,将该语言类型作为当前语言类型为用户介绍景点的知识和/或与用户进行交流。
s120,依据当前地理位置信息和当前用户的游览兴趣特征生成当前游览路线信息。
其中,当前地理位置信息是指用户当前所在地的经纬度信息,可通过gps(globalpositioningsystem,全球定位系统)单元或雷达等设备进行获取。当前用户的旅游兴趣特征是指当前用户旅游时所关注的兴趣点。示例性的,当前用户的游览兴趣特征是依据当前用户的历史游览路线确定的,当前用户的游览兴趣特征可以包括当前用户关注的景点类型、美食或购物等中的至少一个。其中,历史游览路线是指智能语音导游装置存储的当前用户先前旅游时的游览路线。
当前导游路线信息是指智能语音导游装置依据用户当前所在地的地理位置信息以及该用户的游览兴趣特征,为用户提供的导游路线信息,可以包括当前位置景点信息、景点分布、住宿信息、餐饮娱乐信息以及购物信息等。
具体的,智能语音导游装置根据当前用户的账户信息获取到当前用户的历史游览路线,根据当前用户的历史游览路线分析得到用户的游览兴趣特征;依据gps确定当前用户所在地,结合用户的游览兴趣特征,为用户推荐一条游览当前所在地的路线。
示例性的,为了提供用户满意度较高的当前游览路线,还可以是:依据当前地理位置信息、当前用户的游览兴趣特征及当前用户的性别、年龄等生成当前游览路线信息。
s130,依据当前游览路线信息,采用当前语言类型与当前用户进行语音导览会话。
其中,导览会话是指智能语音导游装置以广播的形式为用户介绍景点知识和/或以交互的形式与用户进行语音交流。
具体的,当确定了当前游览路线信息后,智能语音导游装置就会采用当前语言类型为当前用户介绍游览路线上包含的各种景点信息,以及接收当前用户的语音指令与当前用户进行语音交流,如用户想要智能导游装置采用另外一种语言类型为其介绍景点知识时,可通过向其发送语音指令来实现。此外,用户还可以在交流的过程通过键入或点击等方式自动转换语言类型。还可以是,用户采用另外的一种语言与智能语音导游装置进行交流,即交流的过程中检测到用户更换了语言类型,则可通过个性化语音识别模型识别出用户语言,并自动转换到与用户所使用的语言类型相匹配的语言类型上,实现了在满足用户需求同时,能够丰富语音交流的趣味性,从而提升了用户地图内语音导览的效率。
可选的,采用当前语言类型与当前用户进行语音导览会话,包括:获取当前用户输入的语音信息;将当前用户输入的语音信息与预设的导游功能进行匹配,并采用当前语音类型将匹配到的导游功能反馈给当前用户。若将当前用户输入的语音信息与预设的导游功能进行匹配之后,还包括:若当前用户输入的语音信息与各导游功能均匹配失败,则获取当前用户手动输入的信息;将当前用户手动输入的信息与预设的导游功能进行匹配,并采用当前语音类型将匹配到的导游功能反馈给当前用户。也就是说,在为用户提供智能语音导游过程中,用户可以通过语音方式进行信息输入,进而将用户输入的语音信息与预设的导游功能进行匹配,在语音输入无法匹配的情况下,手动输入可以作为替换语音输入作为辅助手段。
另外,若依据用户输入的信息从预设的多种导览语言类型中选择当前语言类型,可以是将与用户输入的语音信息匹配成功的导览语言类型作为当前语言类型;若用户输入的语音信息与各导览语言类型均不匹配,则使用手动输入替代语音输入,并将与用户手动输入的信息匹配的导览语言类型作为当前语言类型。
本发明实施例提供的智能语音导游方法,通过提供多种导览语言类型供用户选择当前语言类型,依据用户当前地理位置信息和游览兴趣特征确定当前游览路线信息,并依据当前游览路线信息,采用用户选择的当前语言类型与用户进行语音导览会话。避免了导游产品功能单一,存在导游与用户需求不适配的现象,丰富了地图用户导游过程中选择的语种信息,满足了更多用户的需求,同时丰富了语音交流的趣味性,从而提升了用户地图内语音导览的效率。
实施例二
图2为本发明实施例二提供的一种智能语音导游方法流程图,该智能语音导游方法以本发明实施例一为基础,进一步的对从预设的多种导览语言类型中选择当前语言类型进行解释说明。具体的,参见图2该方法可以包括:
s210,依据当前地理位置信息、当前用户的历史语音导览会话和当前用户的属性信息中的至少一项,从预设的多种导览语言类型中选择当前语言类型。
其中,用户的属性信息可以包括用户的籍贯、家乡方言、精通的语言、性别及年龄等。
示例性的,确定当前语言类型的方法可以有如下几种:
(1)依据当前地理位置信息确定当前所属地的语言类型,从预设的多种导览语言类型中将当前所属地的语言类型作为当前语言类型,并在交流中过程中根据用户的语言习惯,自动转换到和用户所使用的语言类型相匹配的语言类型上,以提升用户地图内语音导览效率。
(2)依据当前用户的历史语音导览会话从预设的多种导览语言类型中选择当前语言类型可以包括:分析当前用户的历史语音导览会话中当前用户惯用的语言类型,作为当前语言类型。其中惯用语言类型可以是当前用户的方言,也可以是用户的历史语音导览会话中使用最多的语言。
(3)依据当前地理位置信息及当前用户的历史语音导览会话,从预设的多种导览语言类型中选择当前语言类型。具体的,可依据当前地理位置信息确定当前所属地的语言类型,结合用户的历史语音导览会话,从当前所属地的语言类型中选择用户所擅长的语言类型作为当前语言类型。如,用户当前在日本,导览语言类型中有日文、英文、日文-麦兜及日文-樱木花道等,而从用户的历史语音导览会话中分析得出该用户擅长英文和日文-樱木花道,此时,为了使用户能更好的体验当地的风俗习惯,可将日文-樱木花道作为当前语言类型。
示例性的,在确定了当前语言类型之后还可以包括:依据用户的需求,通过个性化语音识别模型的分析,自动转换语言类型作为当前语言类型,以实现在满足更多用户需求的同时,丰富语音交流的趣味性,从而提升用户地图内语音导览效率。
s220,依据当前地理位置信息和当前用户的游览兴趣特征生成当前游览路线信息。
s230,依据当前游览路线信息,采用当前语言类型与当前用户进行语音导览会话。
本发明实施例提供的智能语音导游方法,通过综合考虑当前地理位置信息、当前用户的历史语音导览会话和当前用户的属性信息中的至少一项,从预设的多种导览语言类型中确定当前语言类型,依据用户当前地理位置信息和游览兴趣特征确定当前游览路线信息,并依据当前游览路线信息,采用用户选择的当前语言类型与用户进行语音导览会话。避免了导游产品功能单一,存在导游与用户需求不适配的现象,丰富了地图用户导游过程中选择的语种信息,满足了更多用户的需求,同时丰富了语音交流的趣味性,从而提升了用户地图内语音导览的效率。
实施例三
图3为本发明实施例三提供的一种智能语音导游装置的结构框图,该装置可执行本发明任意实施例所提供的智能语音导游方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置可以包括:
语言类型选择模块310,用于从预设的多种导览语言类型中选择当前语言类型;
路线信息生成模块320,用于依据当前地理位置信息和当前用户的游览兴趣特征生成当前游览路线信息;
语音会话模块330,用于依据当前游览路线信息,采用当前语言类型与当前用户进行语音导览会话。
本发明实施例提供的智能语音导游装置,通过提供多种导览语言类型供用户选择当前语言类型,依据用户当前地理位置信息和游览兴趣特征确定当前游览路线信息,并依据当前游览路线信息,采用用户选择的当前语言类型与用户进行语音导览会话。避免了导游产品功能单一,存在导游与用户需求不适配的现象,丰富了地图用户导游过程中选择的语种信息,满足了更多用户的需求,同时丰富了语音交流的趣味性,从而提升了用户地图内语音导览的效率。
示例性的,语言类型选择模块310具体可以用于:依据当前地理位置信息、当前用户的历史语音导览会话和当前用户的属性信息中的至少一项,从预设的多种导览语言类型中选择当前语言类型。
示例性的,语言类型选择模块310还具体可以用于:分析当前用户的历史语音导览会话中当前用户惯用的语言类型,作为当前语言类型。
可选的,当前用户的游览兴趣特征是依据当前用户的历史游览路线确定的,当前用户的游览兴趣特征包括当前用户关注的景点类型。
可选的,上述装置还可以包括:语音指令识别模块,具体用于:
用于在从预设的多种导览语言类型中选择当前语言类型之前,采用个性化语音识别模型识别用户的语音指令,其中个性化语音识别模型是预先依据历史语音导览会话预先训练得到的。
实施例四
图4为本发明实施例四提供的一种设备的结构示意图。4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,该设备12以通用计算设备的形式表现。该设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网
(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的智能语音导游方法。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现上述实施例中任意的智能语音导游方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
上述实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间的相同或相似的部分互相参见即可。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。