基于语音信息的物体检索方法及其装置、电子设备与流程

文档序号：33713919发布日期：2023-04-01 03:02阅读：来源：国知局

技术特征：
1.一种基于语音信息的物体检索方法，其特征在于，包括：接收输入的语音信息，并将所述语音信息转化为文字信息；基于预设检测模型，处理所述文字信息，得到特征信息；将所述特征信息与预设打标信息集进行匹配，得到匹配结果，其中，所述预设打标信息集包括：多个打标信息，所述打标信息用于确定物体的位置；在所述匹配结果指示存在目标打标信息的情况下，基于所述目标打标信息，确定待检索物体的目标位置。2.根据权利要求1所述的物体检索方法，其特征在于，在接收输入的语音信息之前，还包括：为待检索场景部署多个拍摄设备，其中，所述拍摄设备用于拍摄所述待检索场景，得到场景图片；分割所述场景图片，得到多张物体图片。3.根据权利要求2所述的物体检索方法，其特征在于，在分割所述场景图片，得到多张物体图片之后，还包括：依据预设维度信息，为每张所述物体图片中的物体进行打标，得到与每个所述物体对应的所述打标信息，其中，所述预设维度信息至少包括：颜色、位置、形状、属性；基于所有所述打标信息，生成所述预设打标信息集。4.根据权利要求1所述的物体检索方法，其特征在于，基于预设检测模型，处理所述文字信息，得到特征信息的步骤，包括：基于所述预设检测模型中的预设编码器对所述文字信息进行编码，得到一组词向量，其中，每个所述词向量对应有一个预设网络；基于所述预设网络，处理所述词向量，得到特征向量；采用预设领域门聚合所有所述特征向量，得到所述特征信息。5.根据权利要求1所述的物体检索方法，其特征在于，在将所述特征信息与预设打标信息集进行匹配，得到匹配结果之后，还包括：在所述匹配结果指示存在多个打标信息的情况下，接收交互语音信息；分析所述交互语音信息，得到所述目标打标信息。6.根据权利要求1所述的物体检索方法，其特征在于，在基于所述目标打标信息，确定待检索物体的目标位置之后，还包括：基于所述目标位置，控制智能机器人导航到与所述目标位置对应的目标区域；控制所述智能机器人对所述目标区域执行预设操作。7.根据权利要求6所述的物体检索方法，其特征在于，还包括：所述智能机器人预先安装有预设语音处理系统以及预设检测系统，其中，所述预设语音处理系统用于处理接收到的语音信息，得到文字信息，所述预设检测系统通过所述预设检测模型处理所述文字信息，得到所述目标区域。8.一种基于语音信息的物体检索装置，其特征在于，包括：接收单元，用于接收输入的语音信息，并将所述语音信息转化为文字信息；处理单元，用于基于预设检测模型，处理所述文字信息，得到特征信息；匹配单元，用于将所述特征信息与预设打标信息集进行匹配，得到匹配结果，其中，所
述预设打标信息集包括：多个打标信息，所述打标信息用于确定物体的位置；确定单元，用于在所述匹配结果指示存在目标打标信息的情况下，基于所述目标打标信息，确定待检索物体的目标位置。9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的基于语音信息的物体检索方法。10.一种电子设备，其特征在于，包括一个或多个处理器和存储器，所述存储器用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至7中任意一项所述的基于语音信息的物体检索方法。

技术总结
本发明公开了一种基于语音信息的物体检索方法及其装置、电子设备，其中，该物体检索方法包括：接收输入的语音信息，并将语音信息转化为文字信息，基于预设检测模型，处理文字信息，得到特征信息，将特征信息与预设打标信息集进行匹配，得到匹配结果，在匹配结果指示存在目标打标信息的情况下，基于目标打标信息，确定待检索物体的目标位置。本发明解决了相关技术中智能机器人无法对物体的位置进行精准检索的技术问题。检索的技术问题。检索的技术问题。

技术研发人员：刘丹乔雨周震峰张晓宇杨富雄李建峰
受保护的技术使用者：珠海格力电器股份有限公司
技术研发日：2022.11.23
技术公布日：2023/3/31

完整全部详细技术资料下载

当前第2页1 2