三维立体内容显示方法、装置、设备及存储介质与流程

文档序号：18642804发布日期：2019-09-11 23:44阅读：157来源：国知局

本发明涉及视频显示技术领域，尤其涉及一种三维立体内容显示方法、装置、设备及存储介质。

背景技术：

随着互联网技术的发展，用户在观看视频文件的过程中根据视频内容获取知识的场景越来越多，而且通过视频内容进行知识扩展和多维度的信息展示将是非常重要的。但是，目前并没有在播放视频文件的过程中为用户主动推送视频帧中物体的相关信息的技术，特别是没有主动获取并推送三维立体内容的技术。因此，现有的视频播放技术无法为用户提供较为丰富的搜索推荐体验。

技术实现要素：

本发明实施例提供一种三维立体内容显示方法及装置，以至少解决现有技术中的以上技术问题。

第一方面，本发明实施例提供了一种三维立体内容显示方法，包括：

在播放视频文件的过程中，获取第一视频帧的视频帧数据；所述第一视频帧为正在显示或预定时间长度后即将显示的视频帧；

采用物体预测模型对所述视频帧数据进行预测；根据预测结果识别所述第一视频帧中的物体，确定所述第一视频帧中的物体的标识信息；

采用所述物体的标识信息，判断所述第一视频帧中的物体是否存在关联的三维立体内容；

在存在所述关联的三维立体内容的情况下，在所述第一视频帧中的物体的预设位置显示第一提示标记。

在一种实施方式中，所述采用物体预测模型对所述视频帧数据进行预测之后，还包括：根据预测结果识别所述第一视频帧中的物体的坐标信息；

所述在所述第一视频帧中的物体的预设位置显示第一提示标记，包括：在所述第一视频帧中的物体的坐标信息确定的位置显示第一提示标记。

在一种实施方式中，还包括：

接收显示所述关联的三维立体内容的第一指令；

根据所述第一指令，获取并显示所述关联的三维立体内容。

在一种实施方式中，所述采用物体预测模型对所述视频帧数据进行预测，包括：

获取所述视频文件的主题类别，确定所述主题类别对应的物体预测模型；

采用所述主题类别对应的物体预测模型对所述视频帧数据进行预测。

在一种实施方式中，所述第一指令为针对所述第一提示标记的点击事件；

所述根据所述第一指令，获取并显示所述关联的三维立体内容，包括：从所述第一提示标记所对应物体的关联内容存储地址读取所述关联的三维立体内容；暂停播放所述视频文件，在暂停后的视频画面上生成浮层，将所述关联的三维立体内容在所述浮层上显示。

在一种实施方式中，所述将所述关联的三维立体内容在所述浮层上显示之后，还包括：

接收变换显示所述关联的三维立体内容的第二指令，根据所述第二指令在所述浮层上对所述关联的三维立体内容进行变换显示；所述变换显示包括旋转、放大及缩小中的至少一项；

和/或，接收停止显示所述关联的三维立体内容的第三指令，关闭所述关联的三维立体内容及所述浮层，继续播放所述视频文件。

第二方面，本发明实施例提出一种物体预测模型的训练方法，所述物体预测模型用于识别图片中的物体，所述方法包括：

获取图片数据，并获取所述图片中的物体的实际标识信息及实际坐标信息；

将所述图片数据输入所述物体预测模型；

将所述物体预测模型输出的预测标识信息与所述实际标识信息进行比较，并将所述物体预测模型输出的预测坐标信息与所述实际坐标信息进行比较，根据所述比较结果调整所述物体预测模型的参数。

第三方面，本发明实施例提出一种三维立体内容显示装置，包括：

视频播放模块，用于在播放视频文件的过程中将第一视频帧的视频帧数据发送至预测模块；所述第一视频帧为正在显示或预定时间长度后即将显示的视频帧；

所述预测模块，用于从模型服务模块获取物体预测模型，采用所述物体预测模型对所述视频帧数据进行预测；根据预测结果识别所述第一视频帧中的物体，确定所述第一视频帧中的物体的标识信息；将所述标识信息发送至关联内容检索模块；

所述模型服务模块，用于为所述预测模块提供物体预测模型；

所述关联内容检索模块，用于采用所述标识信息检索所述第一视频帧中的物体关联的三维立体内容，并在所述第一视频帧中的物体存在关联的三维立体内容的情况下，将检索结果发送至标记显示模块；

所述标记显示模块，用于在存在关联的三维立体内容的情况下，在所述第一视频帧中的物体的预设位置显示第一提示标记。在一种实施方式中，所述装置还包括关联内容显示模块；

所述标记显示模块，还用于接收显示所述关联的三维立体内容的第一指令，并将所述第一指令发送至所述关联内容显示模块；

所述关联内容显示模块，用于根据所述第一指令，获取所述第一视频帧中的物体关联的三维立体内容；显示所述第一视频帧中的物体关联的三维立体内容。

在一种实施方式中，所述预测模块用于，获取所述视频文件的主题类别，将所述主题类别发送至所述模型服务模块，接收所述模型服务模块反馈的所述主题类别对应的物体预测模型；

所述模型服务模块包括：

模型训练子模块，用于训练不同主题类别对应的物体预测模型，将所述不同主题类别对应的物体预测模型发送至模型提供子模块；

所述模型提供子模块，用于接收并保存所述不同主题类别对应的物体预测模型；接收来自所述预测模块的视频文件的主题类别，识别所述主题类别对应的物体预测模型，并将识别出的物体预测模型返回所述预测模块。

在一种实施方式中，所述预测模块还用于，确定所述第一视频帧中的物体的坐标信息，将所述坐标信息发送至关联内容检索模块；

所述关联内容检索模块还用于，在所述第一视频帧中的物体存在关联的三维立体内容的情况下，将所述坐标信息及关联内容存储地址发送至所述标记显示模块；

所述标记显示模块，用于在所述坐标信息确定的位置显示第一提示标记。

在一种实施方式中，所述第一指令为针对所述第一提示标记的点击事件；

所述标记显示模块还用于，将所述第一提示标记所对应物体的关联内容存储地址发送至所述关联内容显示模块；

所述关联内容显示模块，用于从所述关联内容存储地址读取所述第一视频帧中的物体关联的三维立体内容；暂停播放所述视频文件，在暂停后的视频画面上生成浮层，将所述关联的三维立体内容在所述浮层上显示。

在一种实施方式中，所述关联内容显示模块还用于：

或者，接收停止显示所述关联的三维立体内容的第三指令，关闭所述关联的三维立体内容及所述浮层，继续播放所述视频文件。

第四方面，本发明实施例提出一种物体预测模型的训练装置，所述物体预测模型用于识别图片中的物体，所述装置包括：

数据获取模块，用于获取图片数据，并获取所述图片中的物体的实际标识信息及实际坐标信息；

输入模块，用于将所述图片数据输入所述物体预测模型；

参数调整模块，用于将所述物体预测模型输出的预测标识信息与所述实际标识信息进行比较，并将所述物体预测模型输出的预测坐标信息与所述实际坐标信息进行比较，根据所述比较结果调整所述物体预测模型的参数。

第五方面，本发明实施例提供了一种三维立体内容显示设备，所述设备的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，所述三维立体内容显示设备的结构中包括处理器和存储器，所述存储器用于存储支持所述设备执行上述三维立体内容显示方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口，用于与其他设备或通信网络通信。

第六方面，本发明实施例提供了一种物体预测模型的训练设备，所述设备的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，所述物体预测模型的训练设备的结构中包括处理器和存储器，所述存储器用于存储支持所述设备执行上述物体预测模型的训练方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口，用于与其他设备或通信网络通信。

第七方面，本发明实施例提供了一种计算机可读存储介质，用于存储三维立体内容显示设备或物体预测模型的训练设备所用的计算机软件指令，其包括用于执行上述三维立体内容显示方法或物体预测模型的训练方法所涉及的程序。

上述技术方案中的一个技术方案具有如下优点或有益效果：

本发明实施例能够在播放视频文件的过程中，主动识别视频帧中物体的关联的三维立体内容，并提示用户，从而为用户提供较为丰富的搜索推荐体验。

上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本发明公开的一些实施方式，而不应将其视为是对本发明范围的限制。

图1为本发明实施例的一种三维立体内容显示方法实现流程图一；

图2为本发明实施例的一种三维立体内容显示方法实现流程图二；

图3a为本发明实施例的一种三维立体内容显示方法中，第一提示标记的显示示意图；

图3b为本发明实施例的一种三维立体内容显示方法中，三维立体内容的显示示意图；

图3c为本发明实施例的一种三维立体内容显示方法中，三维立体内容的旋转显示示意图；

图4为本发明实施例的一种三维内容显示方法中，步骤s12中对视频数据帧进行预测的实现方式示意图；

图5为本发明实施例的一种物体预测模型的训练方法实现流程图；

图6为本发明实施例的一种三维立体内容显示装置结构示意图一；

图7为本发明实施例的一种三维立体内容显示装置结构示意图二；

图8为本发明实施例的一种三维立体内容显示装置的结构及各模块之间的信息传输示意图；

图9为本发明实施例的一种物体预测模型的训练装置结构示意图；

图10为本发明实施例的三维立体内容显示设备或物体预测模型的训练设备结构示意图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。

本发明实施例主要提供了三维立体内容显示方法和装置，下面分别通过以下实施例进行技术方案的展开描述。

图1为本发明实施例的一种三维立体内容显示方法实现流程图一，包括：

s11：在播放视频文件的过程中，获取第一视频帧的视频帧数据；所述第一视频帧为正在显示或预定时间长度后即将显示的视频帧；

s12：采用物体预测模型对所述视频帧数据进行预测；根据预测结果识别所述第一视频帧中的物体，确定所述第一视频帧中的物体的标识信息；

s13：采用所述物体的标识信息，判断所述第一视频帧中的物体是否存在关联的三维立体内容；

s14：在存在所述关联的三维立体内容的情况下，在所述第一视频帧中的物体的预设位置显示第一提示标记。

如果上述步骤s11中的第一视频帧为预定时间长度后即将显示的视频帧，那么，在存在关联的三维立体内容的情况下，步骤s14在显示该第一视频帧的时刻同时显示该第一提示标记。例如，如果当前时刻为t0，预定时间长度为t，采用步骤s11判断出(t0+t)时刻的视频帧f中的一个物体存在关联的三维立体内容。那么，将在(t0+t)时刻显示第一提示标记，(t0+t)时刻也就是前述视频帧f正在被显示的时刻。这样保证了物体与第一提示标记能够同步被显示。

例如，对于视频帧中的一个建筑，该建筑关联的三维立体内容可以为该建筑的3d模型。

在一种可能的实施方式中，所述的第一提示标记可以为表示存在3d内容的标记。第一提示标记可以采用icon图标格式。本发明实施例可以在上述第一视频帧中的物体上悬浮显示该第一提示标记，以表示存在该物体关联的三维立体内容。

图2为本发明实施例的一种三维立体内容显示方法实现流程图二，包括：

s11：在播放视频文件的过程中，获取第一视频帧的视频帧数据；所述第一视频帧为正在显示或预定时间长度后即将显示的视频帧；

s12：采用物体预测模型对所述视频帧数据进行预测；根据预测结果识别所述第一视频帧中的物体，确定所述第一视频帧中的物体的标识信息；

s12：采用所述物体的标识信息，判断所述第一视频帧中的物体是否存在关联的三维立体内容；

s14：在存在所述关联的三维立体内容的情况下，在所述第一视频帧中的物体的预设位置显示第一提示标记；

s25：接收显示所述关联的三维立体内容的第一指令；

s26：根据所述第一指令，获取并显示所述关联的三维立体内容。

图3a为本发明实施例的一种三维立体内容显示方法中，第一提示标记的显示示意图。在图3a中显示的图片为上述第一视频帧，经过判断，确定该图片正中位置的建筑存在关联的三维立体内容。在该建筑的右上角悬浮显示一个圆形标记，圆圈内有“3d”字样，该图标即为上述第一提示标记，用于提示用户该建筑存在关联的三维立体内容。用户点击该第一提示标记，即可以暂停显示视频文件，获取并显示该建筑关联的三维立体内容。

图3b为本发明实施例的一种三维立体内容显示方法中，三维立体内容的显示示意图。本发明实施例在视频画面之上生成浮层，将三维立体内容渲染在浮层上。用户可以点击或通过触摸屏，对三维立体内容进行旋转、放大、缩小等交互操作，以了解三维立体视觉物体知识。

图3c为本发明实施例的一种三维立体内容显示方法中，三维立体内容的旋转显示示意图。如图3c所示，用户对三维立体内容进行了一定角度的旋转，以便更清晰地从不同角度了解对应的建筑。在图3b和图3c中，显示画面的右上角均存在“关闭”字样的标记，用户可以随时点击该标记，从而关闭三维立体内容。关闭之后，将继续播放视频文件。

图4为本发明实施例的一种三维内容显示方法中，步骤s12中对视频数据帧进行预测的实现方式示意图，包括：

s121：获取所述视频文件的主题类别，确定所述主题类别对应的物体预测模型；

s122：采用所述主题类别对应的物体预测模型对所述视频帧数据进行预测。

在一种可能的实施方式中，上述步骤s12中采用物体预测模型对所述视频帧数据进行预测之后，还可以进一步根据预测结果识别所述第一视频帧中的物体的坐标信息。该坐标信息是指物体在第一视频帧中的坐标信息，并非该物体真实物理位置的坐标信息。

相应地，上述步骤s14可以在该坐标信息确定的位置显示第一提示标记。

在一种可能的实施方式中，所述第一指令为针对所述第一提示标记的点击事件；

上述步骤s26具体可以包括：从所述第一提示标记所对应物体的关联内容存储地址读取所述关联的三维立体内容；暂停播放所述视频文件，在暂停后的视频画面上生成浮层，将所述关联的三维立体内容在所述浮层上显示。

如图2所示，上述步骤s26之后，可以进一步包括步骤s27及步骤s28。或者，上述步骤s26之后，可以进一步包括步骤s28。

s27：接收变换显示所述关联的三维立体内容的第二指令，根据所述第二指令在所述浮层上对所述关联的三维立体内容进行变换显示；所述变换显示包括旋转、放大及缩小中的至少一项。其中，上述第二指令可以为用户通过点击或触摸屏幕对三维立体内容进行的交互操作。

s28：接收停止显示所述关联的三维立体内容的第三指令，关闭所述关联的三维立体内容及所述浮层，继续播放所述视频文件。其中，上述第三指令可以为用户对“关闭”标记的点击事件。

本发明实施例还提出一种物体预测模型的训练方法，所述物体预测模型用于识别图片中的物体。图5为本发明实施例的一种物体预测模型的训练方法实现流程图，包括：

s51：获取图片数据，并获取所述图片中的物体的实际标识信息及实际坐标信息；

s52：将所述图片数据输入所述物体预测模型；

s53：将所述物体预测模型输出的预测标识信息与所述实际标识信息进行比较，并将所述物体预测模型输出的预测坐标信息与所述实际坐标信息进行比较，根据所述比较结果调整所述物体预测模型的参数。

其中，上述图片可以为视频帧，上述图片数据可以为视频帧数据。

本发明实施例还提出一种三维立体内容显示装置。参见图6，图6为本发明实施例的一种三维立体内容显示装置结构示意图一，包括：

视频播放模块610，用于在播放视频文件的过程中将第一视频帧的视频帧数据发送至预测模块620；所述第一视频帧为正在显示或预定时间长度后即将显示的视频帧；

预测模块620，用于从模型服务模块630获取物体预测模型，采用所述物体预测模型对所述视频帧数据进行预测；根据预测结果识别所述第一视频帧中的物体，确定所述第一视频帧中的物体的标识信息；将所述标识信息发送至关联内容检索模块640；

模型服务模块630，用于为所述预测模块提供物体预测模型；

关联内容检索模块640，用于采用所述标识信息检索所述第一视频帧中的物体关联的三维立体内容，并在所述第一视频帧中的物体存在关联的三维立体内容的情况下，将检索结果发送至标记显示模块650；

标记显示模块650，用于在存在关联的三维立体内容的情况下，在所述第一视频帧中的物体的预设位置显示第一提示标记。

在一种可能的实施方式中，上述装置还包括关联内容显示模块。图7为本发明实施例的一种三维立体内容显示装置结构示意图二。如图7所示，本发明实施例的三维立体内容显示装置包括：

视频播放模块610、预测模块620、模型服务模块630、关联内容检索模块640、标记显示模块650和关联内容显示模块760。

在一种可能的实施方式中，标记显示模块650，还用于接收显示所述关联的三维立体内容的第一指令，并将所述第一指令发送至所述关联内容显示模块760；

关联内容显示模块760，用于根据所述第一指令，获取所述第一视频帧中的物体关联的三维立体内容；显示所述第一视频帧中的物体关联的三维立体内容。

在一种可能的实施方式中，预测模块620具体用于，获取所述视频文件的主题类别，将所述主题类别发送至所述模型服务模块630，接收所述模型服务模块630反馈的所述主题类别对应的物体预测模型。其中，视频文件的主题类别可以由人为设定，或者通过视频文件的名称、内容介绍等信息获取。

所述模型服务模块630包括：

模型训练子模块631，用于训练不同主题类别对应的物体预测模型，将所述不同主题类别对应的物体预测模型发送至模型提供子模块632；

所述模型提供子模块632，用于接收并保存所述不同主题类别对应的物体预测模型；接收来自所述预测模块620的视频文件的主题类别，识别所述主题类别对应的物体预测模型，并将识别出的物体预测模型返回所述预测模块620。

例如，上述不同的主题类别可以包括：高校类别、旅游景点类别等类型。模型训练子模块631可以离线训练针对不同主题类别的物体预测模型。例如，获取多个高校建筑的不同角度的图片，人工标注图片中建筑物的标识信息及在图片中的坐标信息。其中，上述标识信息可以指序列号。采用这些图片作为训练样本，用以训练对应高校类别的物体预测模型。前述图片可以为从视频文件中提取的视频帧。

最终训练完成的物体预测模型的输入内容为视频帧，输出内容为视频帧中的物体的序列号及坐标信息。本发明实施例还可以设置预测分类字典，预测分类字典中包括物体的序列号与物体的名称的对应关系。如采用如下的形式：

1——清华大学正门；

2——清华大学图书馆；

……

训练完成的物体预测模型可以保存在模型提供子模块632的数据库中。一个物体预测模型的数据可以包括：

1)描述json文件。用于描述物体预测模型的层数、每层的功能等模型框架信息。

2)多个神经网络层的参数数据二进制文件(bin文件)。用于描述物体预测模型每层的具体参数。

3)预测分类字典。包括物体的序列号与物体的名称的对应关系。

在一种可能的实施方式中，预测模块620还用于，确定所述第一视频帧中的物体的坐标信息，将所述坐标信息发送至关联内容检索模块640；

所述关联内容检索模块640还用于，在所述第一视频帧中的物体存在关联的三维立体内容的情况下，将所述坐标信息及关联内容存储地址发送至所述标记显示模块650；

所述标记显示模块650，具体用于在所述坐标信息确定的位置显示第一提示标记。

在一种可能的实施方式中，所述第一指令为针对所述第一提示标记的点击事件；

所述标记显示模块650还用于，将所述第一提示标记所对应物体的关联内容存储地址发送至所述关联内容显示模块760；

所述关联内容显示模块760，用于从所述关联内容存储地址读取所述第一视频帧中的物体关联的三维立体内容；暂停播放所述视频文件，在暂停后的视频画面上生成浮层，将所述关联的三维立体内容在所述浮层上显示。

在一种可能的实施方式中，所述关联内容显示模块760还用于：

或者，接收停止显示所述关联的三维立体内容的第三指令，关闭所述关联的三维立体内容及所述浮层，继续播放所述视频文件。

以下参照图8所示的三维立体内容显示装置的结构及各模块之间的信息传输，介绍该装置显示关联的三维立体内容的具体实现方式。包括：

s81：视频播放模块610在播放视频文件的过程中，将视频帧的视频帧数据发送至预测模块620及标记显示模块650。

s82：预测模块620获取视频文件的主题类别，将主题类别发送至模型提供子模块632。

s83：模型提供子模块632根据该视频文件的主题类别，识别对应的物体预测模型，并将识别出的物体预测模型返回预测模块620。其中，物体预测模型的数据可以包括：描述json文件、多个神经网络层的参数数据bin文件、以及预测分类字典。

s84：预测模块620可以进行在线web端预测。具体地，本发明实施例的可以运行根据深度学习开发框架fluid开发的web端深度学习框架，获取所需的物体预测模型。运行该物体预测模型，确定视频帧中物体的名称及物体在视频帧中的坐标信息。将前述确定的结果发送至关联内容检索模块640。前述发送内容的数据格式可以{name：‘’，location：{x：‘’，y：‘’}}。

具体实现方式为：web端的深度学习开发框架通过web图形程序库(webgl，webgraphicslibrary)协议调用图形处理器(gpu，graphicsprocessingunit)开启并行计算能力，请求所需的物体预测模型。在gpu的片元着色器(fragmentshader)环节采用获取的预测模型进行运算。gpu的输入数据为视频帧数据及预测模型的多个神经网络层的参数数据bin文件，输出结果为预测模型输出的序列号以及物体的坐标。之后，根据该序列号查找预测分类字典文件，得到物体名称。

s85：关联内容检索模块640根据收到的物体名称，查找该物体名称对应的关联内容存储地址，前述关联内容存储地址具体可以为3d资源在线地址。如果能够检索到3d资源在线地址，则将该3d资源在线地址、以及之前接收到物体的名称及物体在视频帧中的坐标信息发送至标记显示模块650。如果检索不到，则可以直接将接收到的物体的名称及物体在视频帧中的坐标信息转发至标记显示模块650，或者不发送任何信息。

s86：标记显示模块650具体可以为3d标记生成器。3d标记生成器根据接收的内容实时创建、更新或销毁3d标记。如果3d标记生成器接收的信息中包含3d资源在线地址，表明上述物体存在关联的3d内容。这种情况下，3d标记生成器创建3d标记，并根据接收到的坐标信息将该3d标记显示在上述视频帧中的指定位置。

s87：当用户点击3d标记时，标记显示模块650将该点击事件以及上述3d资源在线地址发送至关联内容显示模块760。

s88：关联内容显示模块760具体可以为3d内容渲染器。在接收到上述点击事件时，3d内容渲染器指示视频播放模块610暂停播放视频文件。并且从3d资源在线地址获取3d内容，在暂停后的视频画面之上生成浮层，将3d内容渲染到浮层上。之后，关联内容显示模块760接收对3d内容的变换显示指令，并根据变换显示指令对3d内容进行旋转、放大、缩小等。关联内容显示模块760还可以接收停止显示3d内容的指令，根据该指令关闭3d内容，并指示视频播放模块610继续播放视频文件。

至此，本发明实施例提出的三维立体内容显示装置完成了对视频文件的关联3d内容的一次显示过程。

上述三维立体内容显示方法可以采用三维立体内容显示装置实现。该方法中的详细实现方式可以参照装置中各模块的功能以及各模块之间信息的交互形式，在此不再赘述。

综上可见，本发明实施例提出的三维立体内容显示方法和装置，能够在视频文件播放的过程中，主动识别第一视频帧中的物体是否存在关联的三维立体内容，并在存在的情况下对用户做出提示。进一步地，当收到用户显示该关联的三维立体内容的指示时，显示该三维立体内容。

本发明实施例还提出一种物体预测模型的训练装置，所述物体预测模型用于识别图片中的物体，如图9为该装置结构示意图，包括：

数据获取模块910，用于获取图片数据，并获取所述图片中的物体的实际标识信息及实际坐标信息；

输入模块920，用于将所述图片数据输入所述物体预测模型；

参数调整模块930，用于将所述物体预测模型输出的预测标识信息与所述实际标识信息进行比较，并将所述物体预测模型输出的预测坐标信息与所述实际坐标信息进行比较，根据所述比较结果调整所述物体预测模型的参数。

本发明实施例还提出一种三维立体内容显示设备、以及一种物体预测模型的训练设备，如图10为本发明实施例的三维立体内容显示设备或物体预测模型的训练设备结构示意图，包括：

存储器11和处理器12，存储器11存储有可在处理器12上运行的计算机程序。所述处理器12执行所述计算机程序时实现上述实施例中的三维立体内容显示方法或物体预测模型的训练方法。所述存储器11和处理器12的数量可以为一个或多个。

所述设备还可以包括：

通信接口13，用于与外界设备进行通信，进行数据交换传输。

存储器11可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

如果存储器11、处理器12和通信接口13独立实现，则存储器11、处理器12和通信接口13可以通过总线相互连接并完成相互之间的通信。所述总线可以是工业标准体系结构(isa，industrystandardarchitecture)总线，外部设备互连(pci，peripheralcomponentinterconnect)总线或扩展工业标准体系结构(eisa，extendedindustrystandardarchitecture)等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器11、处理器12和通信接口13集成在一块芯片上，则存储器11、处理器12和通信接口13可以通过内部接口完成相互间的通信。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器，磁盘或光盘等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨茗名;王群;张苗
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：8位取代-3,4,7,8-四氢-2H-氧代辛-2-酮八元环的合成方法与流程
上一篇：一种视频分类方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。