多媒体数据处理平台及多媒体读物、系统和方法

文档序号：7893146阅读：183来源：国知局

专利名称：多媒体数据处理平台及多媒体读物、系统和方法
技术领域：
本发明涉及移动通讯技术领域，特别是指一种多媒体数据处理平台及多媒体读物、系统和方法。
背景技术：
随着移动通讯技术的发展和电子技术的发展，多媒体读物已经成为儿童、青少年非常喜爱的休闲娱乐工具。其中，多媒体数据可以包括音频、视频等流媒体文件，也可以包括PDF格式、WORD格式的文本文件。当然也可以是上述这些格式融合在一起形成的文件，例如播放一段视频时同时显示一段文本，或播放一段音频时同时显示一段文本。传统的多媒体读物一般来说具有插图、文字，还兼具文档、音频、视频播放功能，因此完全可以替代普通的故事书、漫画书，给儿童、青少年以更好的视听体验。但是现有的专门的多媒体读物都是以精美的书籍配以内置的MP3或其他语音、视频播放器以节约成本，因此只能整段的播放预先录制好的多媒体文件。如果停止后再次播放就只能从头开始，这样导致儿童、青少年使用非常不方便。

发明内容
针对现有的多媒体读物对于多媒体数据处理时存在的缺陷导致使用者使用不方便的问题，本发明实施例的目的是提出一种多媒体数据处理平台及多媒体读物、系统和方法。为了达到上述目的，本发明的实施例提供了一种多媒体数据处理平台，包括数据通讯模块，所述数据通讯模块用于提供网络接口以使多媒体读物通过网络接入所述多媒体数据处理平台；数据处理模块，连接所述数据通讯模块以接收所述数据通讯模块接收到的所述多媒体读物发送的语音请求，并对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。本发明实施例还提出了一种多媒体数据处理平台的数据处理方法，包括步骤I、接收所述多媒体网络发送的接入请求；步骤2、对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。本发明实施例还提出了一种多媒体读物，包括第二数据通讯模块，所述第二数据通讯模块通过网络连接多媒体数据处理平台；第二数据处理模块，连接所述第二数据通讯模块以向所述多媒体数据处理平台发送语音请求。本发明实施例还提出了一种多媒体数据处理系统，包括如前所述的多媒体数据处理平台，以及如前所述的多媒体读物。本发明的有益效果是本发明实施例提出了一种多媒体数据处理平台和数据处理方法，可以通过网络连接多媒体读物以接收用户的语音请求，以实现进行存储观看的进度、添加批注或意见等功能，方便使用。本发明提出的多媒体读物可以通过网络向多媒体数据处理平台发送语音请求，实现进行存储观看的进度、添加批注或意见等功能，方便使用。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图I为本发明实施例的多媒体数据处理平台的结构示意图；图2为图I中数据处理模块的结构示意图；图3为本发明实施例的多媒体数据处理平台的数据处理方法的流程示意图；图4为本发明实施例的多媒体读物的结构示意图。
具体实施例方式下面将结合本发明的附图，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。实施例I本发明实施例提出了一种多媒体数据处理系统，包括多媒体数据处理平台和多媒体读物。以下将对多媒体数据处理平台和多媒体读物以及多媒体数据处理平台的数据处理方法分别进行说明。实施例2本发明第二实施例提出了一种多媒体数据处理平台，其结构如图I所示的，包括数据通讯模块1，所述数据通讯模块用于提供网络接口以使多媒体读物通过网络接入所述多媒体数据处理平台；数据处理模块2，连接所述数据通讯模块以接收所述数据通讯模块接收到的所述多媒体读物发送的语音请求，并对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。其中，该数据处理模块可以采用非特定人语音识别服务器。当然，本领域内技术人员可以理解采用普通的语音识别服务器也可以。为了方便用户登录和用户注册，本发明实施例的多媒体数据处理平台还包括用户注册模块3，所述用户注册模块连接所述数据处理模块，用于根据用户通过所述多媒体读取发送的唯一标识对用户进行注册；用户登陆模块4，所述用户登陆模块连接所述数据处理模块，用于根据用户的注册信息对用户进行认证。举例来说，可以采用用户的手机号为注册账号。当然，也可以是其他的唯一标识来进行注册，例如邮箱、用户自定义的用户名等。
进一步的，用户通过多媒体读物连入多媒体数据处理平台后，既可以播放本地的多媒体文件，也可以播放存储在多媒体数据处理平台上的多媒体文件，还可以将本地的多媒体文件上传到多媒体数据处理平台上进行播放和/或共享。即多媒体数据处理平台还包括数据存储模块5，用于存储多媒体文件。其中，为了提高用户的使用体验并降低多媒体读物的成本，多媒体数据处理平台对用户通过多媒体读物发来的语音请求可以进行多种处理。即所述数据处理模块2的结构如图3所示的,包括
语音识别单元21，用于对所述数据通讯模块接收到的所述多媒体读物发送的用户语音进行识别，以生成相应的控制命令；数据播放单元22，用于根据所述控制命令播放所述多媒体文件；断点续播单元23，用于记录所述多媒体数据文件的播放进程，并根据用户的控制命令从停止处继续播放。这样，可以通过多媒体数据处理平台实现对用户控制命令的语音识别，以增强用户的使用体验感。同时，每个多媒体读物无需单独设置语音识别功能，以降低成本。同时，由多媒体数据处理平台来记录播放进程，也可以实现断点续播功能，还无需对多媒体读物进行改变，降低了成本。更进一步的，所述数据处理模块2还包括同步播放单元24，用于根据所述多媒体文件的标识，将相互关联的多个文档、音频、视频同步进行播放。这样，在用户通过多媒体读物读取音频文件时，可以将对应的文档文件同步播出，例如歌词、故事等。或是在播放文档文件时，选择适当的音乐同步播出。当然，实现断点续播的方式可以有多种，本发明实施例中示例性的给出一种实现的具体方式，即所述数据处理模块2还包括时间标签单元25，用于根据语音识别单元的控制命令，对所述多媒体文件添加用于标识所述多媒体文件播放进程的时间标签。例如，使用者在播放音频时，可以通过多媒体读物向多媒体数据处理平台发送语音请求请在此处暂停。此时多媒体读物将该语音请求直接发送到多媒体数据处理平台，多媒体数据处理平台的语音识别单元21对该语音请求进行识别以转换成文字，然后由时间标签单元25在当前位置插入一个时间标签，并对正在播放的音频文件暂停。此时，针对音频存储在多媒体读物端和多媒体读物向多媒体数据处理平台端的操作方式略有不同，本领域内技术人员可以理解，当音频存储在多媒体读物端时，多媒体数据处理平台可以发送一个命令要求多媒体读物上报当前的播放时间点，并生成时间标签。如果音频存储在多媒体数据处理平台，可以直接在音频的当前位置插入一个时间标签。当用户再次发送语音请求要求继续播放时，多媒体数据处理平台通过断点续播单元23进行断点续播。在进行断点续播时，同样的，对于针对音频存储在多媒体读物端和多媒体读物向多媒体数据处理平台端的操作方式也会略有不同。本领域内技术人员可以理解，如果音频文件存储在多媒体读物端，则多媒体数据处理平台可以通过网络将时间标签下发到多媒体读物，以使多媒体读物进行断点续播。如果音频文件就存储在多媒体数据处理平台端，则可以直接读取该用户对应的时间标签进行断点续播。当然这只是通过音频文件为例进行说明。其他多媒体文件，可以采用相同或类似的技术，在此不一一赘述。当然上述的断点续播、同步播出等功能都只是举例说明的应用，本领域内技术人员可以理解，通过本发明实施例的系统、多媒体数据处理平台，还能有多种其他应用，而这些应用也应在本发明的保护范围内为使本领域内技术人员可以理解，在此再通过其他功能进行进一步说明。为了实现更多的功能以方便使用者，本发明实施例还可以提供多种其他应用，例如进行语音批注。即，所述数据处理模块2还包括意见标签单元26，用于根据语音识别单元的控制命令，对所述多媒体文件添加用于批注或修订的意见标签。该意见标签单元可以为用户通过多媒体读物发送来的一段语音请求，例如“请在此处添加意见这一段写的很好”。这样多媒体数据处理平台的语音识别单元21对该语音请求进行识别以转换成文字，并识别出该段语音请求是要求添加意见，然后就会将该段意见发送给意见标签单元26。此时，意见标签单元26在该多媒体数据的当前位置插入一个意见标签。由于多媒体文件可能包括音频、视频等流媒体文件，也可以包括PDF格式、WORD格式的文本文件，因此处理方式略有不同。即该意见标签单元26包括流媒体意见批注子单元，用于判断当前播放的流媒体是否具有对应的文档；如果有则将所述控制命令发送给文本意见批注子单元；如果没有则将所述控制命令中包含的意见语音添加到所述流媒体文件中；文本意见批注子单元，用于将所述控制命令中包含的意见语音转换为文字后添加到所述文本文件中。实施例3本发明第三实施例提出了一种多媒体数据处理平台的，其流程如图2所示的，包括步骤I、接收所述多媒体网络发送的接入请求；步骤2、对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。在本申请中，采用步骤I、步骤2等方式对每一步骤进行标识。但该方式只是为了便于标识以使说明更清晰，而非对于执行时间顺序的限定。本领域内技术人员可以理解，在可行的方式下，本申请的方法可以采用任何时间顺序来分别执行各个步骤，本申请并不对此作出限定。其中，该步骤2可以采用非特定人语音识别服务器。当然，本领域内技术人员可以理解采用普通的语音识别服务器也可以。为了方便用户登录和用户注册，本发明实施例的方法还包括步骤a、接收用户通过所述多媒体读取发送的唯一标识对用户进行注册；步骤b、接收用户的登陆请求，以根据用户的注册信息对用户进行认证。举例来说，可以采用用户的手机号为注册账号。当然，也可以是其他的唯一标识来进行注册，例如邮箱、用户自定义的用户名等。
进一步的，用户通过多媒体读物连入多媒体数据处理平台后，既可以播放本地的多媒体文件，也可以播放存储在多媒体数据处理平台上的多媒体文件，还可以将本地的多媒体文件上传到多媒体数据处理平台上进行播放和/或共享。即该方法还包括步骤C、接收用户上传的多媒体文件并进行存储。其中，为了提高用户的使用体验并降低多媒体读物的成本，多媒体数据处理平台对用户通过多媒体读物发来的语音请求可以进行多种处理。即所述步骤2包括步骤21、对接收到的所述多媒体读物发送的用户语音进行识别，以生成相应的控制命令；步骤22、根据所述控制命令播放所述多媒体文件；步骤23、记录所述多媒体数据文件的播放进程，并根据用户的控制命令从停止处继续播放。这样，可以通过多媒体数据处理平台实现对用户控制命令的语音识别，以增强用户的使用体验感。同时，每个多媒体读物无需单独设置语音识别功能，以降低成本。同时，由多媒体数据处理平台来记录播放进程，也可以实现断点续播功能，还无需对多媒体读物进行改变，降低了成本。更进一步的，所述步骤2还包括步骤2a、根据所述多媒体文件的标识，将相互关联的多个文档、音频、视频同步进行播放。这样，在用户通过多媒体读物读取音频文件时，可以将对应的文档文件同步播出，例如歌词、故事等。或是在播放文档文件时，选择适当的音乐同步播出。当然，实现断点续播的方式可以有多种，本发明实施例中示例性的给出一种实现的具体方式，即所述步骤2还包括步骤2b、根据控制命令，对所述多媒体文件添加用于标识所述多媒体文件播放进程的时间标签。例如，使用者在播放音频时，可以通过多媒体读物向多媒体数据处理平台发送语音请求请在此处暂停。此时多媒体读物将该语音请求直接发送到多媒体数据处理平台，多媒体数据处理平台对该语音请求进行识别以转换成文字，然后由步骤2b在当前位置插入一个时间标签，并对正在播放的音频文件暂停。此时，针对音频存储在多媒体读物端和多媒体读物向多媒体数据处理平台端的操作方式略有不同，本领域内技术人员可以理解，当音频存储在多媒体读物端时，多媒体数据处理平台可以发送一个命令要求多媒体读物上报当前的播放时间点，并生成时间标签。如果音频存储在多媒体数据处理平台，可以直接在音频的当前位置插入一个时间标签。当用户再次发送语音请求要求继续播放时，多媒体数据处理平台进行断点续播。在进行断点续播时，同样的，对于针对音频存储在多媒体读物端和多媒体读物向多媒体数据处理平台端的操作方式也会略有不同。本领域内技术人员可以理解，如果音频文件存储在多媒体读物端，则多媒体数据处理平台可以通过网络将时间标签下发到多媒体读物，以使多媒体读物进行断点续播。如果音频文件就存储在多媒体数据处理平台端，则可以直接读取该用户对应的时间标签进行断点续播。当然这只是通过音频文件为例进行说明。其他多媒体文件，可以采用相同或类似的技术，在此不一一赘述。当然上述的断点续播、同步播出等功能都只是举例说明的应用，本领域内技术人员可以理解，通过本发明实施例的系统、多媒体数据处理平台，还能有多种其他应用，而这些应用也应在本发明的保护范围内。
为使本领域内技术人员可以理解，在此再通过其他功能进行进一步说明。为了实现更多的功能以方便使用者，本发明实施例还可以提供多种其他应用，例如进行语音批注。即，所述步骤2还包括步骤2c、根据识别出的控制命令，对所述多媒体文件添加用于批注或修订的意见标签。该控制命令可以为用户通过多媒体读物发送来的一段语音请求，例如“请在此处
添加意见这一段写的很好”，或是“这一段写错了，应该是......”。这样多媒体数据处理
平台对该语音请求进行识别以转换成文字，并识别出该段语音请求是要求添加意见，然后就会通过步骤2c在该多媒体数据的当前位置插入一个意见标签。由于多媒体文件可能包括音频、视频等流媒体文件，也可以包括PDF格式、WORD格式的文本文件，因此处理方式略有不同。即所述步骤2c包括步骤2cl、判断当前播放的流媒体是否具有对应的文档；如果没有则将所述控制命令中包含的意见语音添加到所述流媒体文件中，步骤结束；如果有则将所述控制命令中包含的意见语音添加到所述流媒体文件中，并跳转到步骤2c2 ；步骤2c2、将所述控制命令中包含的意见语音转换为文字后添加到所述文本文件中。实施例4进一步的，本发明第四实施例提出了一种多媒体读物，其结构如图3所示的，包括第二数据通讯模块101，所述第二数据通讯模块通过网络连接多媒体数据处理平台；第二数据处理模块102，连接所述第二数据通讯模块以向所述多媒体数据处理平台发送语音请求。以上所述，仅为本发明的具体实施方式
，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种多媒体数据处理平台，其特征在于，包括数据通讯模块，所述数据通讯模块用于提供网络接口以使多媒体读物通过网络接入所述多媒体数据处理平台；数据处理模块，连接所述数据通讯模块以接收所述数据通讯模块接收到的所述多媒体读物发送的语音请求，并对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。
2.根据权利要求I所述的多媒体数据处理平台，其特征在于，所述多媒体数据处理平台还包括用户注册模块，所述用户注册模块连接所述数据处理模块，用于根据用户通过所述多媒体读取发送的唯一标识对用户进行注册；用户登陆模决，所述用户登陆模块连接所述数据处理模块，用于根据用户的注册信息对用户进行认证。
3.根据权利要求I所述的多媒体数据处理平台，其特征在于，所述多媒体数据处理平台还包括数据存储模块，用于存储多媒体文件。
4.根据权利要求1-3任一项所述的多媒体数据处理平台，其特征在于，所述数据处理模块包括语音识别单元，用于对所述数据通讯模块接收到的所述多媒体读物发送的用户语音进行识别，以生成相应的控制命令；数据播放单元，用于根据所述控制命令播放所述多媒体文件；断点续播单元，用于记录所述多媒体数据文件的播放进程，并根据用户的控制命令从停止处继续播放。
5.根据权利要求4所述的多媒体数据处理平台，其特征在于，所述数据处理模块还包括同步播放单元，用于根据所述多媒体文件的标识，将相互关联的多个文档、音频、视频同步进行播放。
6.根据权利要求4所述的多媒体数据处理平台，其特征在于，所述数据处理模块还包括时间标签单元，用于根据语音识别单元的控制命令，对所述多媒体文件添加用于标识所述多媒体文件播放进程的时间标签。
7.根据权利要求4所述的多媒体数据处理平台，其特征在于，所述数据处理模块还包括意见标签单元，用于根据语音识别单元的控制命令，对所述多媒体文件添加用于批注或修订的意见标签。
8.根据权利要求7所述的多媒体数据处理平台，其特征在于，所述意见标签单元包括流媒体意见批注子单元，用于判断当前播放的流媒体是否具有对应的文档；如果有则将所述控制命令发送给文本意见批注子单元；如果没有则将所述控制命令中包含的意见语音添加到所述流媒体文件中；文本意见批注子单元，用于将所述控制命令中包含的意见语音转换为文字后添加到所述文本文件中。
9.一种多媒体数据处理平台的数据处理方法，其特征在于，包括步骤I、接收所述多媒体网络发送的接入请求；步骤2、对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。
10.根据权利要求9所述的多媒体数据处理平台的数据处理方法，其特征在于，所述方法还包括步骤a、接收用户通过所述多媒体读取发送的唯一标识对用户进行注册；步骤b、接收用户的登陆请求，以根据用户的注册信息对用户进行认证。
11.根据权利要求9所述的多媒体数据处理平台的数据处理方法，其特征在于，所述方法还包括步骤C、接收用户上传的多媒体文件并进行存储。
12.根据权利要求9-11任一项所述的多媒体数据处理平台的数据处理方法，其特征在于，所述步骤2包括步骤21、对接收到的所述多媒体读物发送的用户语音进行识别，以生成相应的控制命令；步骤22、根据所述控制命令播放所述多媒体文件；步骤23、记录所述多媒体数据文件的播放进程，并根据用户的控制命令从停止处继续播放。
13.根据权利要求12所述的多媒体数据处理平台的数据处理方法，其特征在于，所述步骤2还包括步骤2a、根据所述多媒体文件的标识，将相互关联的多个文档、音频、视频同步进行播放。
14.根据权利要求12所述的多媒体数据处理平台的数据处理方法，其特征在于，所述步骤2还包括步骤2b、根据控制命令，对所述多媒体文件添加用于标识所述多媒体文件播放进程的时间标签。
15.根据权利要求12所述的多媒体数据处理平台的数据处理方法，其特征在于，所述步骤2还包括步骤2c、根据识别出的控制命令，对所述多媒体文件添加用于批注或修订的意见标签。
16.根据权利要求15所述的多媒体数据处理平台的数据处理方法，其特征在于，所述步骤2c包括步骤2cl、判断当前播放的流媒体是否具有对应的文档；如果没有则将所述控制命令中包含的意见语音添加到所述流媒体文件中，步骤结束；如果有则将所述控制命令中包含的意见语音添加到所述流媒体文件中，并跳转到步骤2c2 ；步骤2c2、将所述控制命令中包含的意见语音转换为文字后添加到所述文本文件中。
17.一种多媒体读物，其特征在于，包括第二数据通讯模块，所述第二数据通讯模块通过网络连接多媒体数据处理平台；第二数据处理模块，连接所述第二数据通讯模块以向所述多媒体数据处理平台发送语音请求。
18.一种多媒体数据处理系统，其特征在于，包括如权利要求1-8任一项所述的多媒体数据处理平台，以及如权利要求17所述的多媒体读物。
全文摘要
本发明提供了一种多媒体数据处理平台及多媒体读物、系统和方法，所述系统包括多媒体数据处理平台和多媒体读物，所述多媒体数据处理平台包括数据通讯模块，所述数据通讯模块用于提供网络接口以使多媒体读物通过网络接入所述多媒体数据处理平台；数据处理模块，连接所述数据通讯模块以接收所述数据通讯模块接收到的所述多媒体读物发送的语音请求，并对所述语音请求进行语音识别以转换成控制命令，并根据所述控制命令对多媒体数据进行处理。发明实施例可以通过网络连接多媒体读物以接收用户的语音请求，以实现进行存储观看的进度、添加批注或意见等功能，方便使用。
文档编号H04N21/266GK102625164SQ201210100038
公开日2012年8月1日申请日期2012年4月6日优先权日2012年4月6日
发明者刘湘洲, 王钢, 邵颖申请人:上海车音网络科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邵颖;王钢;刘湘洲
技术所有人：上海车音网络科技有限公司
我是此专利的发明人

上一篇：一种分频段确定加筋板壳结构机械导纳的方法
上一篇：一种对数字电视节目传输流进行签名的方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。