一种多媒体数据采集方法与流程

文档序号：22324470发布日期：2020-09-25 17:52阅读：178来源：国知局

本发明属于信息管理技术领域，具体涉及一种多媒体数据采集方法。

背景技术：

随着计算机的飞速发展，数据采集技术已在通信、智能和网络仪器、测绘、探测、工业控制等领域广泛应用在生产过程中，要求较高的测量控制数据的技术很多，不仅如此，有很多其他的数据采集技术要求也是相当高，其中，多媒体数据采集技术就包含在这类采集技术中。目前，常规的多媒体数据采集采集面很窄且数据采集并不精准，这就导致最终得到的数据出现很大的误导性。

技术实现要素：

本发明所要解决的技术问题便是针对上述现有技术的不足，提供一种多媒体数据采集方法，通过对多媒体数据的采集、信息提取和信息处理，以获得更准确的信息。

本发明所采用的技术方案是：一种多媒体数据采集方法，包括以下步骤：

步骤10、获取多媒体数据并存储；

步骤20、对获取的多媒体数据进行预处理；

步骤30、对获取的多媒体数据进行错位纠正；

步骤40、基于多媒体处理技术，检测并识别多媒体数据中的信息；

步骤50、对采集到的多媒体数据信息进行校验；

步骤60、形成多媒体数据包，储存并显示。

其中一个实施例中，所述的步骤20，具体如下：

对获取的文字信息进行去重和语义理解；

对获取的图片信息进行角度矫正、视角矫正和去除色彩干扰；

去除音频或视频中的杂音以及视频中的色彩干扰。

其中一个实施例中，所述的角度矫正和视角矫正时，设立中轴线，将图片中的信息以中轴线为标准进行旋转，保证图片中的信息与中轴线平齐。

其中一个实施例中，所述的步骤30，具体如下：

将获取的文字信息中错位或遗漏的部分根据文字间隙和语义关系将文字纠正或补充到正确位置；

将获取的图片信息中有遮挡或色彩脱落的部分根据整体色彩和整体图片涵义进行去除或补充；

将获取的音频信息中各种音频根据音效调整至合适的对应位置；

将获取的视频信息中各种音频、图像和文字根据音效和视效调整至对应位置。

其中一个实施例中，所述的步骤40，具体如下：

提取文字信息中的文字，整理并显示；

提取图形信息中的图像和文字，整理并显示；

将音频信息中的语言信息转换为文字，整理并显示，将音频信息中的环境声音经语言信息过滤后，截取后整理并显示；

提取视频信息中的图像和文字，整理并显示，将视频信息中的的语言信息转换为文字，整理并显示，将视频信息中的环境声音经语言信息过滤后，截取后整理并显示。

其中一个实施例中，将音频信息和视频信息中的的语言信息转换为文字时，音频中无法识别的语言信息根据语义进行补充，并将补充的内容进行特别标注。

其中一个实施例中，整理的多媒体信息以整理时间和设定的编号命名并储存。

其中一个实施例中，所述的步骤50，具体如下：

关联大数据，通过语义、整体色彩、整体图片色彩、音效和视效对采集到的多媒体数据信息进行比对，并将比对结果进行显示。

其中一个实施例中，还包括多媒体数据包查询步骤，具体如下：

选择时间段，输入整理时间、设定的编号命名或关键字，调取该多媒体数据包并显示。

其中一个实施例中，可对调取的多媒体数据包进行二次编辑，保持原有的多媒体数据包并将编辑后的多媒体数据包进行储存。

本发明的有益效果在于：

1、通过预处理、错位纠正、识别信息、校验、形成多媒体数据包和储存的方式，使得数据采集的方式更为合理，并且一定程度上保证数据采集的准确性；

2、本方法可调取已经采集到的多媒体数据包，对多媒体数据包有一定的追溯性。

具体实施方式

下面将结合具体实施例对本发明作进一步详细说明。

一种多媒体数据采集方法，包括以下步骤：

步骤10、获取多媒体数据并存储；

步骤20、对获取的多媒体数据进行预处理；

步骤30、对获取的多媒体数据进行错位纠正；

步骤40、基于多媒体处理技术，检测并识别多媒体数据中的信息；

步骤50、对采集到的多媒体数据信息进行校验；

步骤60、形成多媒体数据包，储存并显示。

本实施例中，所述的步骤20，具体如下：

对获取的文字信息进行去重和语义理解；

对获取的图片信息进行角度矫正、视角矫正和去除色彩干扰；

去除音频或视频中的杂音以及视频中的色彩干扰。

本实施例中，所述的角度矫正和视角矫正时，设立中轴线，将图片中的信息以中轴线为标准进行旋转，保证图片中的信息与中轴线平齐。

本实施例中，所述的步骤30，具体如下：

将获取的文字信息中错位或遗漏的部分根据文字间隙和语义关系将文字纠正或补充到正确位置；

将获取的图片信息中有遮挡或色彩脱落的部分根据整体色彩和整体图片涵义进行去除或补充；

将获取的音频信息中各种音频根据音效调整至合适的对应位置；

将获取的视频信息中各种音频、图像和文字根据音效和视效调整至对应位置。

本实施例中，所述的步骤40，具体如下：

提取文字信息中的文字，整理并显示；

提取图形信息中的图像和文字，整理并显示；

将音频信息中的语言信息转换为文字，整理并显示，将音频信息中的环境声音经语言信息过滤后，截取后整理并显示；

本实施例中，将音频信息和视频信息中的的语言信息转换为文字时，音频中无法识别的语言信息根据语义进行补充，并将补充的内容进行特别标注。

本实施例中，整理的多媒体信息以整理时间和设定的编号命名并储存。

本实施例中，所述的步骤50，具体如下：

关联大数据，通过语义、整体色彩、整体图片色彩、音效和视效对采集到的多媒体数据信息进行比对，并将比对结果进行显示。

本实施例中，还包括多媒体数据包查询步骤，具体如下：

选择时间段，输入整理时间、设定的编号命名或关键字，调取该多媒体数据包并显示。

本实施例中，可对调取的多媒体数据包进行二次编辑，保持原有的多媒体数据包并将编辑后的多媒体数据包进行储存。

本发明通过预处理、错位纠正、识别信息、校验、形成多媒体数据包和储存的方式，使得数据采集的方式更为合理，并且一定程度上保证数据采集的准确性；本方法可调取已经采集到的多媒体数据包，对多媒体数据包有一定的追溯性。

以上所述实施例仅表达了本发明的具体实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹畋;曾炜
技术所有人：南京晓庄学院
我是此专利的发明人

上一篇：一种纸面石膏板及其制备方法与流程
上一篇：一种多功能小鼠低氧实验装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。