人机交互及内容搜索方法、装置、设备以及存储介质与流程

文档序号：19879671发布日期：2020-02-08 06:51阅读：158来源：国知局

本公开涉及人机交互领域，特别是涉及一种人机交互及内容搜索方法、装置、设备以及存储介质。

背景技术：

人机交互技术(human-computerinteractiontechniques)是指通过计算机输入、输出设备，实现人与计算机对话的技术。在将人机交互技术应用于具体的业务场景中时，通常需要与用户进行多轮次对话，才能确定用户的具体意图，以为用户提供相应的服务。

以用户通过语音进行视频资源搜索这一交互场景为例，由于视频种类繁多，通常需要与用户进行多轮次会话，才能确定用户期望观看的视频类别。而传统的语音交互方案，是预先设定多轮交互流程，限定用户在每一轮的意图输入，从上至下，经过逐轮的意图逻辑判断，最终确定用户的观看意图。

这种方案的劣势在于，在每一轮都有既定的语法限制，用户只能在既定的意图范围内表达意图，如果用户意图超过了既定的语法限制，则无法给予正确的判断和反馈，需要作为错误处理，导致交互体验不够自然流畅。并且，整个流程是自上而下的不可逆的线性逻辑，无法回溯。

因此，需要一种对用户更加友善的交互方案。

技术实现要素：

本公开的一个目的在于提供一种对用户更加友善的人机交互方案。

根据本公开的第一个方面，提供了一种人机交互方法，包括：识别当前轮次用户输入的指令中的意图信息所属的意图类别；基于当前轮次的意图类别，对上一轮次的类别组合进行更新，以得到当前轮次的类别组合；以及基于当前轮次的类别组合，确定当前轮次向用户反馈的内容。

可选地，人机交互方法还包括：向用户发送内容。

可选地，对上一轮次的类别组合进行更新的步骤包括：将当前轮次的意图类别与上一轮次的类别组合中之前轮次的意图类别进行叠加。

可选地，将当前轮次的意图类别与上一轮次的类别组合中之前轮次的意图类别进行叠加的步骤包括：判断当前轮次的意图类别与之前轮次的意图类别是否互斥；并且删除上一轮次的类别组合中与当前轮次的意图类别互斥的意图类别。

可选地，人机交互方法还包括：在内容为空的情况下，按照时间先后顺序删除当前轮次的类别组合中排名靠前的预定数量的意图类别。

可选地，内容包括：与当前轮次的类别组合相匹配的推荐信息；和/或与当前轮次的类别组合中的意图类别不同的类别标签。

可选地，人机交互方法还包括：在当前轮次用户输入的指令中的意图信息所属的意图类别为空的情况下，提取指令中的意图信息的关键词；以及基于关键词以及上一轮次的类别组合，确定当前轮次向用户反馈的内容。

可选地，人机交互方法还包括：预先划分多个具有预定优先级的意图级别，每个意图级别包括一个或多个意图类别，确定当前轮次向用户反馈的内容的步骤包括：按照优先级顺序，将当前轮次的类别组合未覆盖的意图级别下的意图类别，确定为当前轮次向用户反馈的内容。

可选地，指令为语音指令，该方法用于确定用户的语音搜索意图。

根据本公开的第二个方面，还提供了一种基于对话实现的内容搜索方法，包括：响应于用户当前对话轮次的内容搜索指令，识别所述内容搜索指令中的内容搜索意图信息所属的意图类别；基于当前对话轮次的意图类别，对上一对话轮次的类别组合进行更新，以得到当前对话轮次的类别组合；以及基于当前对话轮次的类别组合，执行搜索以确定当前对话轮次向用户反馈的内容。

根据本公开的第三个方面，还提供了一种人机交互装置，包括：类别识别模块，用于识别当前轮次用户输入的指令中的意图信息所属的意图类别；组合更新模块，用于基于当前轮次的意图类别，对上一轮次的类别组合进行更新，以得到当前轮次的类别组合；以及内容确定模块，用于基于当前轮次的类别组合，确定当前轮次向用户反馈的内容。

可选地，人机交互装置还包括：发送模块，用于向用户发送内容。

可选地，组合更新模块将当前轮次的意图类别与上一轮次的类别组合中之前轮次的意图类别进行叠加，以得到当前轮次的类别组合。

可选地，组合更新模块包括：判断模块，用于判断当前轮次的意图类别与之前轮次的意图类别是否互斥；和第一删除模块，用于删除上一轮次的类别组合中与当前轮次的意图类别互斥的意图类别。

可选地，人机交互装置还包括：第二删除模块，用于在内容为空的情况下，按照时间先后顺序删除当前轮次的类别组合中排名靠前的预定数量的意图类别。

可选地，内容包括：与当前轮次的类别组合相匹配的推荐信息；和/或与当前轮次的类别组合中的意图类别不同的类别标签。

可选地，人机交互装置还包括：关键词提取模块，用于在当前轮次用户输入的指令中的意图信息所属的意图类别为空的情况下，提取指令中的意图信息的关键词，内容确定模块基于关键词以及上一轮次的类别组合，确定当前轮次向用户反馈的内容。

可选地，人机交互装置还包括：划分模块，用于预先划分多个具有预定优先级的意图级别，每个意图级别包括一个或多个意图类别，内容确定模块按照优先级顺序，将当前轮次的类别组合未覆盖的意图级别下的意图类别，确定为当前轮次向用户反馈的内容。

可选地，指令为语音指令，该装置用于确定用户的语音搜索意图。

根据本公开的第四个方面，还提供了一种基于对话实现的内容搜索装置，包括：类别识别模块，用于响应于用户当前对话轮次的内容搜索指令，识别所述内容搜索指令中的内容搜索意图信息所属的意图类别；组合更新模块，用于基于当前对话轮次的意图类别，对上一对话轮次的类别组合进行更新，以得到当前对话轮次的类别组合；以及内容确定模块，用于基于当前对话轮次的类别组合，执行搜索以确定当前对话轮次向用户反馈的内容。

根据本公开的第五个方面，还提供了一种计算设备，包括：处理器；以及存储器，其上存储有可执行代码，当可执行代码被处理器执行时，使处理器执行如本公开第一个方面述及的人机交互方法。

根据本公开的第六个方面，还提供了一种非暂时性机器可读存储介质，其上存储有可执行代码，当可执行代码被电子设备的处理器执行时，使处理器执行如本公开第一个方面述及的人机交互方法。

本公开通过将重点转移到对于用户真实意图的剖析、归类，可以达到多轮交互不限轮数的重复筛选，并且对于每一轮来说，其筛选逻辑都是相同的。采用本公开的人机交互及内容搜索方案，用户意图不会被既定语法所限制，也不会被对话轮数所限制。

附图说明

通过结合附图对本公开示例性实施方式进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施方式中，相同的参考标号通常代表相同部件。

图1是示出了根据本公开一实施例的人机交互方法的示意性流程图。

图2是示出了根据本公开一实施例的人机交互装置的结构的示意性方框图。

图3示出了由客户端和服务端协作执行本公开的人机交互方案的示意图。

图4示出了向用户反馈的界面的示意图。

图5示出了根据本公开一实施例的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本公开的人机交互方案特别适用于需要与用户进行多轮对话的交互场景。例如，可以是视频、音乐、资讯等资源搜索场景，也可以是票务预订、网上点餐等业务场景。其中，对话(也即会话)是指计算机与用户之间进行的交互过程。一轮完整的对话包括从用户输入到机器针对用户输入做出反馈的过程。多轮对话是指整个交互过程，需要通过不止一轮对话获取用户输入，以最终给出符合用户需求的反馈结果。

如背景技术部分所述，针对这种需要多轮对话实现的交互场景，现有的方案是由系统预先设定多轮会话的交互流程，在每一轮都有既定的语法限制，用户只能在既定的范围内表达意图，如果用户表达的意图超过了既定的语法限制，则无法给予正确的判断和反馈，需要作为错误处理，导致交互体验不够自然流畅。

为了使得交互过程中用户意图不会被既定语法限制，本公开提出，可以以用户的真实意图表达为线索，来设定交互流程。具体地，可以对每轮对话中用户的意图进行识别并归类，所得到的意图类别可以作为一个维度下的筛选条件。并且，每轮对话中可以保留之前轮次的意图类别，由此可以得到一个筛选条件组合(也即意图类别组合)。在多轮对话过程中，可以不断更新筛选条件组合，以逐渐缩小筛选范围，最终得到满足用户需求的筛选结果。

进一步地，由于本公开是以用户的真实意图表达为线索，设定交互流程。因此，每轮对话中向用户反馈的内容可以仅起提示作用，用于提示用户表达与反馈的内容相关的意图，并不对用户的意图进行限定。也就是说，用户在表达意图时可以不受为其反馈的内容的限制，可以在反馈的内容所表征的范围外表达意图。例如，在识别出用户的意图为“我想看电视”的情况，可以向用户反馈“你想看哪个演员主演的电视”这一提示内容，根据提示内容，用户可以做出“我想看何冰主演的电视”、“我想看范明主演的电视”等在提示内容的范围内的意图表达，也可以不受提示内容的限制，而根据自身喜好做出真实的意图表达，如可以做出“我想看喜剧类型的电视”等在提示内容的范围之外的意图表达。

由此，本公开通过将重点转移到对于用户真实意图的剖析、归类，可以达到多轮交互不限轮数的重复筛选，并且对于每一轮来说，其筛选逻辑都是相同的。采用本公开的人机交互方案，用户意图不会被既定语法所限制，也不会被对话轮数所限制。

下面就本公开的人机交互方案做进一步说明。

图1是示出了根据本公开一实施例的人机交互方法的示意性流程图。

参见图1，在步骤s110，识别当前轮次用户输入的指令中的意图信息所属的意图类别。

用户输入的指令可以是用户发出的语音数据，也可以是用户通过键盘、触摸屏等输入设备输入的文本信息。

意图是指用户在交互过程中期望达到的预期目标。此处述及的意图信息是指当前轮次下用户输入的指令中期望达到的预期目标。其中，意图信息可以是肯定意图，也可以是否定意图。例如，在用户发出的语音指令为“我想看电影”时，意图信息为“看电影”，属于肯定意图。在用户发出的语音指令为“我不想看喜剧电影”时，意图信息为“不看喜剧电影”，属于否定意图。

意图类别是对意图信息进行归类得到的类别信息，也即类别标签。例如，在意图信息为“看电影”时，对应的意图类别可以是“电影”这一类别标签。其中，意图类别可以视为当前轮次用户输入的指令所表征的筛选条件。

如上文所述，意图信息可以是肯定意图，也可以是否定意图。因此，此处述及的意图类别可以是肯定式意图类别，也可以是否定式意图类别。肯定式意图类别可以视为正筛选条件，否定式意图类别可以视为负筛选条件。正筛选条件为需要满足的条件，负筛选条件为需要排除的条件。

可以首先对用户输入的指令中的意图信息进行识别，然后对识别出的意图信息进行归类，以得到意图类别。例如，在用户输入的指令为文本信息的情况下，可以通过语义识别技术确定指令中的意图信息，如可以通过nlu(naturallanguageunderstanding，自然语言理解技术)识别文本信息中的意图信息。在用户输入的指令为语音的情况下，可以首先将语音转换为文本，如可以利用asr(automaticspeechrecognition，自动语音识别技术)将语音转换为文本，然后通过语义识别技术确定文本中的意图信息。对意图信息进行归类也可以利用语义识别技术实现，此处不再赘述。

作为本公开的一个示例，可以根据人机交互的具体应用场景，预先划分多个不同的意图类别，以便于识别指令中的意图信息所属的意图类别。例如，可以划分多个意图级别，每个意图级别可以包括一个或多个意图类别。其中，多个意图级别可以视为多级筛选条件，这多个意图级别之间可以具有预定优先级。每个意图类别可以视为一个维度的筛选条件。

以应用于视频资源搜索这一交互场景为例，可以划分如下多个具有预定优先级的意图级别。第一意图级别：可以包括电影、电视剧、综艺、动画片等表示视频类别的意图类别；第二意图级别：可以包括古装、偶像、喜剧、科幻等表示视频类型的意图类别；第三意图级别：可以包括美国、韩国、日本等表示国家/地区的意图类别，也可以包括tvb、cctv、bbc、迪士尼等表示出品单位的意图类别，还可以包括新片、具体时间、老片等表示上映时间的意图类别，演员、导演、声优、角色名、体育明星等与人名有关的意图类别。

在步骤s120，基于当前轮次的意图类别，对上一轮次的类别组合进行更新，以得到当前轮次的类别组合。

每个轮次下的类别组合是基于之前轮次的意图类别得到的，如可以是之前轮次的意图类别的叠加结果。而每个轮次的意图类别可以视为一个维度的筛选条件，因此每个轮次下的类别组合可以视为该轮次下的筛选条件组合。

可以将当前轮次的意图类别与上一轮次的类别组合中之前轮次的意图类别进行叠加，以得到当前轮次的类别组合。在叠加过程中，可以判断当前轮次的意图类别与之前轮次的意图类别是否互斥，并且可以删除上一轮次的类别组合中与当前轮次的意图类别互斥的意图类别。由此，在多轮交互过程中，用户可以自然流畅地转换意图。

在步骤s130，基于当前轮次的类别组合，确定当前轮次向用户反馈的内容。

由于当前轮次的类别组合可以视为当前状态下用户的条件筛选组合。因此，可以基于当前轮次的类别组合，确定当前轮次向用户反馈的内容。其中，可以将与当前轮次的类别组合中的意图类别不同的类别标签作为反馈内容，也可以将与当前轮次的类别组合相匹配的推荐信息作为反馈内容。也就是说，向用户反馈的内容可以包括与当前轮次的类别组合中的意图类别不同的类别标签，也可以包括与当前轮次的类别组合相匹配的推荐信息。

例如，如上文所述，可以预先划分多个具有预定优先级的意图级别，每个意图级别包括一个或多个意图类别。因此，优选地，可以按照优先级顺序，将当前轮次的类别组合未覆盖的意图级别下的意图类别，作为当前轮次向用户反馈的内容，以提示用户表达相关意图，从而缩小筛选范围。

再例如，也可以将满足当前轮次的类别组合的推荐信息(如热门信息)作为反馈结果反馈给用户，以快速将结果信息反馈给用户，提高用户的交互体验。

在基于当前轮次的类别组合，确定当前轮次向用户反馈的内容为空的情况下，可以对当前轮次下的类别组合中的意图类别进行删减。删减原则可以设置为，按照时间先后顺序删除当前轮次的类别组合中排名靠前的预定数量的意图类别。然后基于删减后的类别组合，确定当前轮次向用户反馈的内容。如果内容仍为空，可以返回错误，也可以按照时间先后顺序继续删除排名靠前的意图类别。

作为本公开的一个示例，在当前轮次用户输入的指令中的意图信息没有对应的意图类别，即意图信息所属的意图类别为空的情况下，可以提取指令中的意图信息的关键词，然后基于关键词以及上一轮次的类别组合，确定当前轮次向用户反馈的内容。

综上，在确定了当前轮次向用户反馈的内容后，就可以向用户发送该内容。其中，所发送的内容仅用于提示用户，并不会对用户的意图表达进行限定。也就是说，用户在表达意图时可以不受为其反馈的内容的限制，可以在反馈的内容所表征的范围外表达意图。

至此，结合图1就本公开的人机交互方法的实现流程做了详细说明。

本公开的人机交互方法可以应用于搜索场景，例如视频、音乐、资讯等内容搜索场景。在将本公开的人机交互方法应用于搜索场景时，本公开可以实现为一种基于对话实现的内容搜索方法。

具体地，响应于用户当前对话轮次的内容搜索指令(可以是语音指令，也可以是输入的文本指令)，可以识别内容搜索指令中的内容搜索意图信息所属的意图类别。关于意图类别的含义及其识别过程可以参见上文结合图1的描述，此处不再赘述。

基于当前对话轮次识别的意图类别，可以对上一对话轮次的类别组合进行更新，以得到当前对话轮次的类别组合。关于类别组合的含义以及更新机制可以参见上文结合图1的描述，此处不再赘述。

基于当前对话轮次的类别组合，可以执行搜索以确定当前对话轮次向用户反馈的内容。通过执行搜索，可以查找与当前对话轮次的类别组合相匹配的内容，并将其反馈给用户。并且，向用户反馈的内容还可以同时包括当前轮次的类别组合中的意图类别不同的类别标签，以提示用户针对未涉及的类别标签表达其搜索意图。

另外，本公开的人机交互方法还可以实现为一种人机交互装置。

图2是示出了根据本公开一实施例的人机交互装置的结构的示意性方框图。其中，人机交互装置的功能模块可以由实现本发明原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是，图2所描述的功能模块可以组合起来或者划分成子模块，从而实现上述发明的原理。因此，本文的描述可以支持对本文描述的功能模块的任何可能的组合、或者划分、或者更进一步的限定。

下面就人机交互装置可以具有的功能模块以及各功能模块可以执行的操作做简要说明，对于其中涉及的细节部分可以参见上文结合图1的描述，这里不再赘述。

参见图2，人机交互装置200可以包括类别识别模块210、组合更新模块220以及内容确定模块230。

类别识别模块210用于识别当前轮次用户输入的指令中的意图信息所属的意图类别。其中，此处述及的指令可以是语音指令，该装置可以用于确定用户的语音搜索意图。

组合更新模块220用于基于当前轮次的意图类别，对上一轮次的类别组合进行更新，以得到当前轮次的类别组合。其中，组合更新模块220可以将当前轮次的意图类别与上一轮次的类别组合中之前轮次的意图类别进行叠加，以得到当前轮次的类别组合。

作为本公开的一个示例，如图2所示，组合更新模块220可以可选地包括图中虚线框所示的判断模块221和第一删除模块223。判断模块221用于判断当前轮次的意图类别与之前轮次的意图类别是否互斥。第一删除模块223用于删除上一轮次的类别组合中与当前轮次的意图类别互斥的意图类别。

内容确定模块230用于基于当前轮次的类别组合，确定当前轮次向用户反馈的内容。所确定的内容可以包括：与当前轮次的类别组合相匹配的推荐信息；和/或与当前轮次的类别组合中的意图类别不同的类别标签。

如图2所示，人机交互装置200还可以包括发送模块240。在内容确定模块230确定了当前轮次向用户反馈的内容后，可以由发送模块240向用户发送该内容。

如图2所示，人机交互装置200还可以包括第二删除模块250，用于在内容为空的情况下，按照时间先后顺序删除当前轮次的类别组合中排名靠前的预定数量的意图类别。

作为本公开的一个示例，如图2所示，组合更新模块220可以可选地包括图中虚线框所示的关键词提取模块260。关键词提取模块260用于在当前轮次用户输入的指令中的意图信息所属的意图类别为空的情况下，提取所述指令中的意图信息的关键词。所述内容确定模块230基于关键词以及上一轮次的类别组合，确定当前轮次向用户反馈的内容。

作为本公开的一个示例，如图2所示，组合更新模块220可以可选地包括图中虚线框所示的划分模块270，用于预先划分多个具有预定优先级的意图级别，每个意图级别包括一个或多个意图类别。所述内容确定模块230可以按照优先级顺序，将所述当前轮次的类别组合未覆盖的意图级别下的意图类别，确定为当前轮次向用户反馈的内容。

本公开的人机交互装置200还可以配置为一种基于对话实现的内容搜索装置。例如，类别识别模块210可以响应于用户当前对话轮次的内容搜索指令，识别内容搜索指令中的内容搜索意图信息所属的意图类别。组合更新模块220可以基于当前对话轮次的意图类别，对上一对话轮次的类别组合进行更新，以得到当前对话轮次的类别组合。内容确定模块230可以基于当前对话轮次的类别组合，执行搜索以确定当前对话轮次向用户反馈的内容。

应用例

图3示出了由客户端和服务端协作执行本公开的人机交互方案的示意图。以应用于视频资源搜索这一交互场景为例，客户端可以是智能电视(tv)，服务端可以是与智能电视网络连接的服务器。用户可以通过语音与智能电视交互，智能电视可以通过与用户进行交互，向用户反馈满足用户搜索需求的视频资源。

第一轮交互过程如下。

响应于用户发出的语音指令，客户端可以基于语音自动识别技术(automaticspeechrecognition，简称asr)识别用户发出的语音指令，将其转换为文本信息(可以称为“asr数据”)。然后客户端可以将得到的数据发送给服务端。

服务端可以对接收到的数据进行解析，如可以利用自然语言理解技术(naturallanguageunderstanding，简称nlu)对客户端上传的数据进行语义解析，以识别其中的意图信息，并可以对识别出的意图信息进行归类。

例如，服务端可以预先多个意图类别，并将分类信息存储在数据文件(可以是xml/js/jsgf等格式的文件)中。服务端在识别出意图信息后，可以将意图信息与数据文件中划分的意图类别进行比较，确定意图信息所属的意图类别。

服务端在识别出意图类别后，可以判断应向用户反馈的界面，反馈的界面可以包含根据意图猜测推荐的标签以及搜索影视结果。例如，可以是图4所示的包含多个标签以及影视搜索结果的界面。

具体地，服务端可以从交互至今未涉及的意图类别中选取一个或多个意图类别作为反馈给用户的标签发送给客户端。并且，服务端还可以同时从视频库中搜索满足识别出的意图类别的视频数据，将该视频数据发送给客户端。客户端根据服务端发送的标签和/或视频数据后，可以生成相应的界面，反馈给用户。

至此，第一轮交互过程完毕，第二轮交互过程如下。

以客户端在第一轮交互过程中反馈的内容是标签+推荐视频为例，用户可以点击推荐视频进行观看，此时交互流程暂停或结束。另外，用户也可以针对反馈的类别标签进行意图表达，例如在反馈的类别标签是“演员”的情况下，用户可以说出想看的演员名字。当然，用户并不必须在所提示的类别标签范围内做出意图表达，换言之，用户可以根据自己的意愿，自由地表达意图。

响应于用户在第二轮交互过程中发出的语音指令，可以继续由客户端将语音数据转换为本文信息，然后将其上传给服务端。由服务端进行语义解析，识别出当前轮次的意图类别。这一过程与第一轮交互过程类似，此处不再赘述。

不同的是，服务端在识别出意图类别后，可以将上一轮识别出的意图类别与本轮次识别的意图类别进行组合，以得到意图类别组合，也即筛选条件组合。服务端可以根据筛选条件组合，确定本轮次向用户反馈的内容。然后将内容发送给客户端，由客户端推送给用户。

由此，在多轮交互过程中，可以基于当前轮次识别的意图类别，对之前轮次的意图类别组合进行更新，以逐渐缩小筛选范围，最终得到满足用户需求的筛选结果。并且，在交互过程中，不会对用户意图进行限定。

利用本公开实现的一个多轮次交互过程实例如下。

可以预先划分多级筛选条件。作为示例，可以分为如下多级筛选条件。

一级筛选条件：类别(电影、电视剧、综艺、动画片等...)

二级筛选条件：类型(古装、偶像、喜剧、科幻等...)

三级筛选条件：国家/地区(美国、韩国、日本等...)、出品单位(tvb、cctv、bbc、迪士尼等...)、质量(获奖、评分、经典)、上映时间(新片、具体时间、老片)、人名(演员、导演、声优、角色名、体育明星等...)等等。

第一轮次

user(用户)：我想看电影

tv(客户端)：请选择(推荐电影二级维度标签+热门电影)

第二轮次

user(用户)：喜剧的

tv(客户端)：请选择(推荐喜剧电影三级维度标签+热门喜剧电影)

第三轮次

user：悬疑的

tv：请选择(推荐悬疑电影三级维度标签+热门悬疑电影)

第四轮次

user：刘德华的

tv：请选择(推荐刘德华悬疑电影三级维度标签+刘德华热门悬疑电影)

第五轮次

user：彭于晏的

tv：请选择(推荐彭于晏悬疑电影三级维度标签+彭于晏热门悬疑电影)

可见，本公开是以对用户的意图进行识别得到的意图类别为线索设定的，没有为用户预设流程逻辑，在交互过程中，用户的意图不会受到限制，并且用户的意图可以随时切换。

本公开是将重点从多轮流程的预设禁锢中释放出来，而将设计重点转移到对于用户真实意图的剖析。经过对于用户意图的归类，达到多轮交互不限轮数的重复筛选，而对于每一轮来说，其筛选逻辑都是相同的。采用这种方法，用户意图不会被既定语法所限制，也不会被对话轮数所限制，更可以自然流畅的转换意图，并能达成逻辑的回溯。

在将本公开的方案应用于影片的语音交互式搜索时，可以根据用户对话中的标签进行模糊匹配，并推测用户意图向用户推荐相关标签。通过采用标签叠加，互斥删减的原则，可以不限轮数的重复筛选。并且无需预设语法限制，用户可不限意图的任意切换各种级别的标签。

图5示出了根据本发明一实施例可用于实现上述人机交互或内容搜索方法的数据处理的计算设备的结构示意图。

参见图5，计算设备500包括存储器510和处理器520。

处理器520可以是一个多核的处理器，也可以包含多个处理器。在一些实施例中，处理器520可以包含一个通用的主处理器以及一个或多个特殊的协处理器，例如图形处理器(gpu)、数字信号处理器(dsp)等等。在一些实施例中，处理器420可以使用定制的电路实现，例如特定用途集成电路(asic，applicationspecificintegratedcircuit)或者现场可编程逻辑门阵列(fpga，fieldprogrammablegatearrays)。

存储器510可以包括各种类型的存储单元，例如系统内存、只读存储器(rom)，和永久存储装置。其中，rom可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外，存储器510可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片(dram，sram，sdram，闪存，可编程只读存储器)，磁盘和/或光盘也可以采用。在一些实施方式中，存储器410可以包括可读和/或写的可移除的存储设备，例如激光唱片(cd)、只读数字多功能光盘(例如dvd-rom，双层dvd-rom)、只读蓝光光盘、超密度光盘、闪存卡(例如sd卡、minsd卡、micro-sd卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器510上存储有可执行代码，当可执行代码被处理器520执行时，可以使处理器520执行上文述及的人机交互方法或内容搜索方法。

上文中已经参考附图详细描述了根据本公开的人机交互及内容搜索方法、装置以及计算设备。

此外，根据本发明的方法还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。

或者，本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质)，其上存储有可执行代码(或计算机程序、或计算机指令代码)，当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时，使所述处理器执行根据本发明的上述方法的各个步骤。

本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许侃;姚维;马骥;陈康增
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种N-甲基吡咯烷酮的回收方法与流程
上一篇：一种氟叠氮取代的四元杂环化合物的制备和应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。