确定对车辆内用户查询的结果的方法、装置和存储介质与流程

文档序号:24397104发布日期:2021-03-26 21:51阅读:120来源:国知局
确定对车辆内用户查询的结果的方法、装置和存储介质与流程

1.本公开的实施例涉及信息处理领域,并且更具体地,涉及确定对车辆内用户查询的结果的方法、装置和存储介质。


背景技术:

2.随着计算机技术的发展,在车辆内识别用户输入并作出响应的方式也变得越来越多样。目前市场上的人车交互的方式大多需要用户与车辆进行多轮上下文交互以确定用户的需求,这通常需要耗费较长的时间并且最终往往不会精准地得出用户感兴趣的点,同时增加了网络侧的负担。并且目前的人车交互方案单纯利用车辆所在地的地理位置进行信息推荐,其无法找出用户的真正需求。因此,如何在人车交互中找出用户感兴趣的点成为当前的关注热点。


技术实现要素:

3.本公开提出了一种用于确定对车辆内用户查询的查询结果的方案,能够在不影响车辆安全行驶的情况下,快速和精准地在人车交互中找出用户感兴趣的点。
4.在本公开的第一方面,提供了一种确定对车辆内用户查询的查询结果的方法,所述方法包括:在车辆处,接收用户输入;响应于确应所述用户输入与所述车辆所处物理环境中的对象的查询相关联,利用所述车辆的至少一个相机获取所述车辆所处物理环境的图像;基于所述图像和所述查询,确定针对所述对象的查询结果;以及向所述用户提供所确定的所述查询结果。
5.在本公开的第二方面,提出了一种电子装置,包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该电子设备执行动作,该动作包括:在车辆处,接收用户输入;响应于确定所述用户输入与所述车辆所处物理环境中的对象的查询相关联,利用所述车辆的至少一个相机获取所述车辆所处物理环境的图像;基于所述图像和所述查询,确定针对所述对象的查询结果;以及向所述用户提供所确定的所述查询结果。
6.在本公开的第三方面,提供了一种计算机存储介质。该计算机存储介质具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行根据第一方面的方法。
7.提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
8.通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常
代表相同部件。
9.图1图示了能够在其中实施本公开的实施例的环境100的示意图;
10.图2图示了根据本公开的实施例的用于确定对车辆内用户查询的查询结果的方法200的流程图;
11.图3图示了根据本公开的实施例的用于利用车辆的相机获取车辆所处物理环境的图像的方法300的流程图;以及
12.图4图示了可以用来实施本公开的实施例的示例设备400的示意性框图。
具体实施方式
13.下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
14.在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
15.如以上提及的,期望快速和精准地在人车交互中找出用户感兴趣的点。目前,在人车交互中车辆单纯利用车辆所在地的地理位置进行推荐,其在得出用户感兴趣的点的智能化和精准性上仍有上升的空间。
16.根据本公开的实施例,提供了一种确定对车辆内用户查询的查询结果的方法,所述方法包括:在车辆处,接收用户输入;响应于确应所述用户输入与所述车辆所处物理环境中的对象的查询相关联,利用所述车辆的至少一个相机获取所述车辆所处物理环境的图像;基于所述图像和所述查询,确定针对所述对象的查询结果;以及向所述用户提供所确定的所述查询结果。通过该方法,由用户主动发起对驾驶过程中周围环境中所感兴趣的对象的查询,然后由车辆上的图像设备进行信息收集与处理,能够在不影响车辆安全行驶的情况下,精准并且快速地在人车交互中找出用户感兴趣的点,进而提升用户体验,并且在处理图像信息时仅需要处理与用户查询相关的部分,节省了网络侧的负担,对处理设备要求更低,节省了成本。
17.以下参考附图来说明本公开的基本原理和若干示例实现。
18.图1图示了可以在其中实施本公开的多个实现的环境100的框图。应当理解,图1所示出的环境100仅仅是示例性的,而不应当构成对本公开所描述的实现的功能和范围的任何限制。
19.如图1所示,环境100包括行驶在道路中的车辆110、用户120和用户设备150。用户120可以是车辆110中的驾驶员或者特定乘客。
20.在图1的示例中,车辆110例如是可以承载人和/或物并且通过发动机等动力系统移动的任何类型的车辆,包括但不限于轿车、卡车、巴士、电动车、摩托车、房车、火车等等。在一些实施例中,环境100中的一个或多个车辆110可以是具有一定自动驾驶能力的车辆,
这样的车辆也被称为无人驾驶车辆。在一些实施例中,车辆110也可以是不具有自动驾驶能力的车辆。
21.车辆110可以通信地耦合到计算设备140。虽然被示出为单独的实体,但计算设备140可以被嵌入在车辆110中。计算设备140也可以车辆110外部的实体,并且可以经由无线网络与车辆110通信。计算设备140可以被实现为一个或多个计算设备,其至少包含处理器、存储器以及其他通常存在于通用计算机中的组件,以便实现计算、存储、通信、控制等功能。
22.车辆110包括多个传感器以接收用户输入。传感器例如可以包括接收用户120的语音输入的声学传感器,接收用户120的手势输入的图像传感器,或者是接收用户120的按压的压力传感器。
23.车辆110包括至少一个相机130,其被配置为在获取拍摄指令时获取车辆所处物理环境的图像。例如,在图1的示例中,相机130可以获取车辆110所处环境的图像或视频(例如,路边的建筑和广告牌)。虽然图示中相机130置于车辆110的车顶,但这仅仅是示例性的,还可以置于车辆130的任何合适位置处的一个或多个拍摄装置。
24.在一些实施例中,计算设备140可以获取相机130所捕获的图像,并且对图像进行识别以确定其中的信息。例如,在图1的示例中,计算设备140可以基于相机130所获取的路边展示牌的图片来识别其上的文本信息。
25.以下结合图2至图3来进一步描述详细的过程。图2图示了根据本公开的实施例的用于确定对车辆内用户查询的查询结果的方法200的流程图。方法200可以由图1中的计算设备140来实施。为便于描述,将参照图1来描述方法200。
26.在框210处,计算设备140在车辆110处,接收用户输入。在一个示例中,用户输入可以是语音输入,该输入例如是用户对周围所感兴趣的对象的查询,例如“刚才右边那家餐厅/游乐园是什么名字?评价如何?”、“左边广告牌上的衣服款式是哪个品牌?”、“右边那个摄影展是什么时候在哪里开展?”等。请注意,用户输入还可以是用户120的手势输入或者按压按钮的输入,以下通过语音输入作为示例进行描述,但这并非旨在限制本公开的范围。
27.在框220处,计算设备140确定所述用户输入与所述车辆110所处物理环境中的对象的查询相关联。在一个实施例中,计算设备140将在210接收的用户120的语音输入转换为文本信息,并且通过人工智能和计算语言学的方法对文本信息进行语义分析以确定其中的关键字。计算设备140可以将经转换的文本信息利用深度学习技术深入理解文字背后的含义,基于最新深度学习技术和神经网络,提取海量文本数据的潜在特征,结合经典的n-gram特征和概率模型,使用表示学习优化特征提取进行词性识别,确定其中的专有名词、重要的词、同近义词、句法结构等。具体地,例如,计算设备140可以通过语义分析将“左边广告牌上的衣服款式是哪个品牌”中的主语名词“广告牌”、“衣服”等确定为关键字。从而确定其是针对车辆所在环境周围的对象的查询。对于视频中的图片信息,计算设备140可以进行将所获取视频帧传输到图像信号处理装置进行处理。
28.在一个实施例中,用户可以通过触摸车辆中的显示屏上所显示的常用对象种类图标(例如“食品”图标)来作为输入,此时计算设备确定“食品”为关键字,在这种情况下直接确定为是用户针对车辆所在环境周围的对象的查询。
29.在一个实施例中,用户可以设置常用手势作为输入。
30.在框230处,计算设备140利用所述车辆110的至少一个相机获取所述车辆所处物
理环境的图像。在计算设备140确定在210接收的用户输入与所述车辆110所处物理环境中的对象的查询相关联的情况下,计算设备140打开车辆110上的相机对车辆110所在的周围环境进行取景。在一个示例中,计算设备140将凭借相机130在从接收用户输入内5秒内所获取的视频帧传输到图像处理器以进行后续处理。
31.下面将接合图3进一步描述计算设备140利用所述车辆110的至少一个相机获取所述车辆所处物理环境的图像的过程。
32.在框310处,计算设备140确定车辆110的速度。
33.在框320处,计算设备基于速度,确定与所述至少一个相机130相关联的拍摄范围。
34.在框330处,计算设备在所确定的所述拍摄范围内获取所述车辆110所处物理环境的图像。
35.在一个实施例中,计算设备140还可以根据车辆速度动态地调整相机130的拍摄范围以完整地获取周围环境的图像。计算设备140首先获取车辆110的速度,然后基于车辆110当前的速度以及预设的算法规则计算拍摄范围,最后使相机130在该拍摄范围内获取车辆110所处物理环境的图像信息。
36.可以理解的是,当计算设备140接收到车辆110的速度增加时,其会相应地增加相机130的拍摄范围以获得车辆110所处物理环境的完整图像信息。在一个示例中,可以通过调整相机130的录入焦距和拍摄时间等的参数来实现拍摄范围的增加。当然这不是限制性的,还可以通过增加相机的数目等方式来获取完整、清晰的图像。
37.在一个备选实施例中,计算设备140可以响应于从用户120接收到输入时开启相机130,以便在驾驶过程中全程获取图像,或者仅获取与用户120设置的感兴趣的对象相关联的图像。这可以在用户120经常经过的路线中更容易地发现用户120所感兴趣的点。
38.继续回到图2进行描述,在框240处,计算设备140基于所述图像和所述查询,确定针对所述对象的查询结果。计算设备根据在210接收的用户输入中的与对象相关的关键字,通过图像识别在图像中获取与该关键字相关联的信息,并且将该信息确定为查询结果。
39.在一个实施例中,例如用户120通过语音输入“左边广告牌上的衣服款式是哪个品牌?”,计算设备140首先确定对象为“广告牌”、“衣服”和“品牌”,计算设备140然后通过图像识别技术识别出相机130所获取的图像中的广告牌、然后对每个广告牌中的图形和文字等不同信息进行识别以找出与“衣服”相关联的信息,最后计算设备可以与一个或多个服务器通信以获取衣服的品牌、其评价、以及在哪里可以获取该衣服的信息。应当理解,可以采用本领域公知的网络技术(例如,蜂窝网络(例如第五代(5g)网络、长期演进(lte)网络、第三代(3g)网络、码分多址(cdma)网络等)、公共陆地移动网络(plmn)、局域网(lan)、广域网(wan)、城域网(man)、电话网络(例如公共交换电话网(pstn))、专用网络、自组织网络、内联网、因特网、基于光纤的网络等、和/或这些或其他类型的网络的组合)以建立车辆110、计算设备140服务器之间的连接,在此不再详叙。
40.在另一实施例中,计算设备140还可以确定用户120在车辆中看到的周围环境的其他信息、例如餐厅的名字、评价和预订信息,展览的时间、内容信息等。
41.在框250处,计算设备140向所述用户120提供所确定的查询结果。例如,当用户120还在车辆110中时,计算设备140可以利用扬声器、显示屏等用户接口向用户120实时地以文本、图像、音频以及视频的形式反馈在240中确定的查询结果。在用户120对该查询结果由其
他查询时,计算设备140指示车辆110与用户120进行进一步交互。若用户无进一步查询,则计算设备140将所确定的查询结果保存到本地存储器,和/或将结果发送到通信地耦合到车辆110的用户设备150以供用户以后查看。
42.在一个实施例中,计算设备140在利用车辆110中的用户接口或经由用户设备150向所述用户120提供所确定的查询结果之后,还可以向用户120提供可能操作列表,该可能操作列表指示用户针对查询结果中的对象所做出的一个或多个历史操作。例如,计算设备140在将一家餐厅的信息作为查询结果呈现给用户120后,会依据用户120对餐厅类型的对象做出过预定的操作而主动询问用户120是否要对该餐厅进行预定。类似的示例还包括对感兴趣的视频或图片的转发,收藏用户120所感兴趣的地点、将所感兴趣的活动加入日程等。上述过程可以由计算设备在用户驾驶或乘车过程中同步实时地进行。
43.在一个实施例中,计算设备140可以响应于车辆110已经抵达预定目的地已到达或者所述用户设备150距离车辆110预定距离之内来向用户设备150发送所确定的查询结果,以便经由所述用户设备150处的应用向用户显示所确定的所述查询结果。这可以不再用户驾驶时打扰用户并且方便用户在方便的时间随时查询所感兴趣的点。
44.通过本公开的实施例,可以通过用户对与所看到的对象相关联的主动输入,精准快速地确定用户所感兴趣的点。并且进一步减少了用户与车辆间繁琐的多轮次交互,减轻了计算设备侧图像处理的负担。还使得驾车交互体验变得丰富、可以捕捉更多有意义的精彩瞬间。将车内驾车的数据所得,更好的同步扩展到车外。
45.图4图示了可以用来实施本公开内容的实施例的示例设备400的示意性框图。例如,如图1所示的示例环境100中的计算设备140可以由设备400来实施。如图所示,设备400包括中央处理单元(cpu)401,其可以根据存储在只读存储器(rom)402中的计算机程序指令或者从存储单元308加载到随机访问存储器(ram)403中的计算机程序指令,来执行各种适当的动作和处理。在ram 403中,还可存储设备400操作所需的各种程序和数据。cpu 401、rom 402以及ram 403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。
46.设备400中的多个部件连接至i/o接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
47.上文所描述的各个过程和处理,例如方法200和300,可由处理单元401执行。例如,在一些实施例中,方法200和300可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由rom 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序被加载到ram 403并由cpu 401执行时,可以执行上文描述的方法200和300中的一个或多个动作。
48.本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
49.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存
储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
50.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
51.用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
52.这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
53.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
54.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
55.附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程
序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
56.以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1