一种语音文字化的云笔记实现方法及装置制造方法

文档序号：2825957阅读：470来源：国知局

一种语音文字化的云笔记实现方法及装置制造方法
【专利摘要】本发明公开了一种语音文字化的云笔记实现方法及装置，其中，所述装置包括：交互模块、语音文字化处理模块以及语音文字化云笔记生成模块，所述方法包括：云端接收终端发来的语音音频段的数据；所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；所述云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。这种方法及装置将语音转换为文字化信息，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。
【专利说明】
【技术领域】
[0001] 本发明涉及通信领域，具体涉及一种语音文字化的云笔记实现方法及装置。一种语音文字化的云笔记实现方法及装置

【背景技术】
[0002] 随着移动终端的日益普及，围绕移动终端的语音场景层出不穷，包括通话等沟通类场景、会议场景、课堂场景、访谈场景、直播场景等等。语音当之无愧的成为最为普通的、覆盖面非常大的用户场景，包含了大量"用户数据"，真可谓"数据金矿"！挖掘语音数据的黄金价值的关键在于：要改变语音数据单独存在的现状，要让语音数据融于文字化的数据流中，才能让其价值不断的提升。
[0003] 现有技术下，互联网上为移动终端提供的云笔记类应用渐趋热门，主要有印象笔记、有道云笔记等，就目前业务形式来看，"语音内容上传互联网"还只是简单的将终端的语音文件直接上传到云端，仍然以语音格式的文件存在，相当于终端侧录音文件的云上传。对于语音格式文件，只能通过播放器播放，无法与互联网的数据流、内容流融通，使得移动语音资源的信息化拓展空间受限。

【发明内容】

[0004] 本发明需要解决的技术问题是提供一种语音文字化的云笔记实现方法及装置，将语音转换为文字化信息，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。
[0005] 为了解决上述技术问题，本发明提供了一种语音文字化的云笔记实现方法，包括：
[0006] 云端接收终端发来的语音音频段的数据；
[0007] 所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；
[0008] 所述云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。
[0009] 进一步地，所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，包括：
[0010] 所述云端识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度。
[0011] 进一步地，所述云端对所述格式化的处理结果再进行文档逻辑化处理，包括：
[0012] 所述云端根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，然后，将所述格式化的处理结果生成云笔记文档。
[0013] 进一步地，所述云端接收终端发来的语音音频段的数据之前，还包括：
[0014] 所述云端接收所述终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；
[0015] 所述云端根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为该云笔记文档的头信息。
[0016] 进一步地，所述方法还包括：
[0017] 所述云端将所述整体的云笔记文档保存在用户账号下云端个人数据中心的云笔记中的语音笔记子目录中。
[0018] 为了解决上述技术问题，本发明还提供了一种语音文字化的云笔记实现装置，包括：
[0019] 交互模块，用于接收终端发来的语音音频段的数据；
[0020] 语音文字化处理模块，用于对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理，并将经文档逻辑化处理后的内容发送至语音文字化云笔记生成模块；
[0021] 语音文字化云笔记生成模块，用于接收并保存所述语音文字化处理模块发来的经文档逻辑化处理后的内容，并在接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。
[0022] 进一步地，所述语音文字化处理模块还包括：
[0023] 语音文字转换模块，用于识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，并将所述格式化的处理结果发送至文档逻辑化处理模块；所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度；
[0024] 文档逻辑化处理模块，用于接收所述语音文字转换模块发送来的格式化的处理结果，并根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，然后，将所述格式化的处理结果生成云笔记文档。
[0025] 进一步地，所述交互模块，还用于接收所述终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；
[0026] 所述语音文字化云笔记生成模块，还用于根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为该云笔记文档的头信息。
[0027] 进一步地，所述语音文字化云笔记生成模块，还用于将所述整体的云笔记文档保存在用户账号下云端个人数据中心的云笔记中的语音笔记子目录中。
[0028] 与现有技术相比，本发明提供的一种语音文字化的云笔记实现方法及装置，利用云端高效的云计算处理能力支撑下的语音文字化处理过程，将语音转换为文字化信息，形成云笔记，进入云服务的个人数据中心，从而与云服务系统融通，后续还可以进一步拓展各种云服务，例如，同步、共享等，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。

【专利附图】
【专利附图】

【附图说明】
[0029] 图1是实施例中语音文字化的云笔记实现装置的结构图；
[0030] 图2是实施例中语音文字化的云笔记实现方法流程图；
[0031] 图3是一个应用示例中移动终端的结构图；
[0032] 图4是一个应用示例中语音文字化的云笔记实现装置的结构图；
[0033] 图5是一个应用示例中语音文字化的云笔记实现方法流程图。

【具体实施方式】
[0034] 为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。
[0035] 实施例：
[0036] 如图1所示，本实施例提供了一种语音文字化的云笔记实现装置，包括：
[0037] 交互模块，用于接收终端发来的语音音频段的数据；
[0038] 语音文字化处理模块，用于对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理，并将经文档逻辑化处理后的内容发送至语音文字化云笔记生成模块；
[0039] 其中，所述语音文字化处理模块还包括：
[0040] 语音文字转换模块，用于识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，并将所述格式化的处理结果发送至文档逻辑化处理模块；所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度；
[0041] 文档逻辑化处理模块，用于接收所述语音文字转换模块发送来的格式化的处理结果，并根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，然后，将所述格式化的处理结果生成云笔记文档。
[0042] 语音文字化云笔记生成模块，用于接收并保存所述语音文字化处理模块发来的经文档逻辑化处理后的内容，并在所述交互模块接收语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的笔记文档。
[0043] 所述交互模块，还用于接收所述终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；
[0044] 所述语音文字化云笔记生成模块，还用于根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为该云笔记文档的头信息。
[0045] 所述语音文字化云笔记生成模块，还用于将所述整体的云笔记文档保存在用户账号下云端个人数据中心的云笔记中的语音笔记子目录中。
[0046] 如图2所示，本实施例提供了一种语音文字化的云笔记实现方法，包括以下步骤：
[0047] S101 :云端接收终端发来的语音音频段的数据；
[0048] S102:云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；
[0049] 其中，所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，包括：
[0050] 所述云端识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间计数长度。
[0051] 其中，所述云端对所述格式化的处理结果再进行文档逻辑化处理，包括：
[0052] 所述云端根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，然后，将所述格式化的处理结果生成云笔记文档。
[0053] S103:云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。
[0054] 在步骤S101之前还包括：所述云端接收所述终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；
[0055] 步骤S103进一步包括：所述云端根据所有经文档逻辑化处理后的内容生成整体的笔记文档时，将保存的本次云笔记的头信息作为该笔记文档的头信息。
[0056] 在步骤S103之后还包括以下步骤：
[0057] 所述云端将所述整体的笔记文档保存在用户账号下云端个人数据中心的"云笔记"中的"语音笔记"子目录中。
[0058] 在一个应用示例中，以移动终端为例，当然也不排除其他如PC等可以与云端进行交互，并且能够采集音频数据上传云端的终端。移动终端通过循环采集，将循环采集的音频数据分批上传至云端，可以减轻终端处理负荷、优化业务过程，且移动终端具有便携性好，采集语音实时性强的优点，使得"语音云笔记"的业务体验真正达到用户级要求。因此，下面以移动终端为例，进一步对本实施例做详细说明。
[0059] 如图3所示，该移动终端至少包括：语音文字化云笔记功能设置模块、语音采集模块、语音缓存模块和数据交互模块。
[0060] 所述语音文字化云笔记功能设置模块，是终端上为语音文字化云笔记功能的运行提供的设置模块。该模块提供"启动"/ "停止"语音文字化云笔记的功能键。用户点击"启动"键后进入登录云端的登录界面，完成登录后进入"启动"配置界面，该界面为本次云笔记任务填写包括但不限于以下信息项：云笔记标题、角色说明以及场景说明，作为本次语音文字化云笔记的头信息。
[0061] 所述语音采集模块，用于在终端平台上采集语音。该模块在语音文字化云笔记功能开启状态下一直处在工作状态，并循环向语音缓存模块存入语音数据。
[0062] 所述语音缓存模块，用于缓存从语音采集模块采集到的语音数据。
[0063] 所述数据交互模块，用于终端与云端之间的消息交互，将本次云笔记的头信息发送至云端，以及将语音缓存模块的缓冲区语音数据依次提取并向云端发送。
[0064] 在本应用示例中，如图4所示，所述语音文字化的云笔记实现装置包括：
[0065] 数据交互模块、语音文字转换模块、文档逻辑化处理模块、数据缓存模块和语音文字化云笔记生成模块，其中：
[0066] 所述数据交互模块，用于云端与移动终端之间的消息交互，接收移动终端发送的本次云笔记的头信息并保存,发送确认信息给所述终端；并接收来自移动终端的数据交互模块发送过来的语音音频段的数据，并循环传递到语音文字转换模块，以及接收来自移动终端结束本次云笔记消息，并传递给语音文字化云笔记生成模块；
[0067] 所述语音文字转换模块，用于将数据交互模块传递来的语音数据进行语音文字转换及空白段处理，即识别当前采集的音频段中的可识别文字部分以及各空白段的时间段长度，并生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后、文字中间分布的一个或多个空白段的时间段长度，该时间段长度单位为秒。语音文字转换模块将格式化的处理结果输出给文档逻辑化处理模块；
[0068] 所述文档逻辑化处理模块，用于接收所述语音文字转换模块发送来的格式化的处理结果，并根据系统设定的所述空白段的时间段长度与文档逻辑符号的对应逻辑规则，将语音文字转换模块输出的格式化的处理结果进行文档逻辑化处理：对于空白段，根据其时间段长度分级转换为相应的文档逻辑符号，这里文档逻辑符号包括：冒号、逗号、顿号、双引号、句号，以及换行符、段落符等，这样文档逻辑化处理模块就可以根据空白段的时间段长短生成有文档逻辑符号有段落的云笔记文档了。所述文档逻辑化处理模块将逻辑化处理的当前结果存入数据缓存模块；
[0069] 所述数据缓存模块，用于缓存来自文档逻辑化处理模块循环输出的文档数据；
[0070] 所述语音文字化云笔记生成模块，用于在收到数据交互模块发来的结束本次云笔记消息后，将数据缓存模块中的文档数据构建成整体的文字化云笔记，并通过文档头信息生成本次云笔记的笔记文档，格式为txt ;并将整体的文字化云笔记文档保存在用户账号下云端个人数据中心的〃云笔记〃中的〃语音笔记〃子目录中。
[0071] 在本应用示例中，以学生听讲座的语音场景为例，采用上述应用示例中的移动终端和语音文字化的云笔记实现装置，如图5所示，语音文字化的云笔记实现方法，包括以下步骤：
[0072] S201 :用户点击移动终端语音文字化云笔记功能设置模块中的"启动"键；
[0073] S202 :用户进入登录云端的登录界面，用户完成登录后进入"启动"配置界面；
[0074] S203 :用户完成语音文字化云笔记〃启动〃配置中的信息项（包括：云笔记标题：讲座-2013. 03. 20、角色说明：学生、场景说明：听讲座）的信息配置，作为本次云笔记的头信息，然后，通过系统提交给移动终端的数据交互模块；
[0075] S204:移动终端的数据交互模块把为本次语音文字化云笔记配置的头信息发送给云端的数据交互模块；
[0076] S205:云端的数据交互模块接收到本次语音文字化云笔记的头信息后，给移动终端发送确认消息；
[0077] S206:移动终端的数据交互模块接收到云端确认消息后，提示用户本次云笔记在用户"确认"后可开始工作；
[0078] S207 :用户"确认"后，移动终端的语音采集模块开始循环采集语音数据；
[0079] S208:移动终端的语音采集模块在采集语音的每个循环中，将采集到的语音数据存入移动终端的语音缓存模块；
[0080] S209 :移动终端的数据交互模块从移动终端的语音缓存模块中提取当前缓存语音数据向云端的数据交互模块发送；
[0081] S210:云端的数据交互模块接收到当前语音数据段后传递给云端的语音文字转换模块；
[0082] S211 :云端的语音文字转换模块对当前的语音段数据进行语音文字转换及空白段处理，并生成格式化的处理结果，将该处理结果输出给云端的文档逻辑化处理模块；
[0083] S212:云端的文档逻辑化处理模块根据系统设定的逻辑规则，将语音文字转换模块输出的格式化的处理结果进行文档逻辑化处理，并将处理结果存入云端的数据缓存模块；
[0084] S213:用户在终端侧关闭语音文字化云笔记功能，移动终端的数据交互模块向云端的数据交互模块发送语音文字化云笔记结束消息；
[0085] S214:当云端的数据交互模块接收到该结束消息后，调用语音文字化云笔记生成模块；语音文字化云笔记生成模块从云端的数据缓存模块中获取到所有经文档逻辑化处理后的所有内容块后生成整体的笔记内容，并通过文档头信息生成本次云笔记的笔记文档，格式为txt ;并将本次云笔记完整的语音文字化笔记文档保存在用户账号下云端个人数据中心的〃云笔记〃中的〃语音笔记〃子目录中。
[0086] 从上述实施例可以看出，相对于现有技术，上述实施例中提供的语音文字化的云笔记实现方法及装置，通过移动终端作为语音信息入口，利用移动终端循环采集分批上传音频数据，以及其便携性以及随时可以采集音频数据的优点，采用移动终端的缓冲技术将现场语音数据依次发送到云端，利用云端高效的云计算处理能力支撑下的语音文字化处理过程，将语音数据转换为文字化信息，形成云笔记，进入云服务的个人数据中心，从而与云服务系统融通，后续还可以进一步拓展各种云服务，例如，同步、共享等，把语音真正融入到通用的信息流中，真正实现互联网的语音信息化。
[0087] 本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
[〇〇88] 以上所述仅为本发明的优选实施例而已，并非用于限定本发明的保护范围。根据本发明的
【发明内容】
，还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【权利要求】
1. 一种语音文字化的云笔记实现方法，包括：云端接收终端发来的语音音频段的数据；所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理；所述云端接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。
2. 如权利要求1所述的方法，其特征在于：所述云端对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，包括：所述云端识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度。
3. 如权利要求2所述的方法，其特征在于：所述云端对所述格式化的处理结果再进行文档逻辑化处理，包括：所述云端根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，然后，将所述格式化的处理结果生成云笔记文档。
4. 如权利要求1所述的方法，其特征在于：所述云端接收终端发来的语音音频段的数据之前，还包括：所述云端接收所述终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；所述云端根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为该云笔记文档的头信息。
5. 如权利要求4所述的方法，其特征在于：所述方法还包括：所述云端将所述整体的云笔记文档保存在用户账号下云端个人数据中心的云笔记中的语音笔记子目录中。
6. -种语音文字化的云笔记实现装置，包括：交互模块，用于接收终端发来的语音音频段的数据；语音文字化处理模块，用于对所述语音音频段进行语音到文字的转换并生成格式化的处理结果，对所述格式化的处理结果再进行文档逻辑化处理，并将经文档逻辑化处理后的内容发送至语音文字化云笔记生成模块；语音文字化云笔记生成模块，用于接收并保存所述语音文字化处理模块发来的经文档逻辑化处理后的内容，并在接收所述语音音频段的数据结束后，根据所有经文档逻辑化处理后的内容生成整体的云笔记文档。
7. 如权利要求6所述的装置，其特征在于：所述语音文字化处理模块还包括：语音文字转换模块，用于识别所述语音音频段中的可识别文字部分以及各空白段的时间段长度，生成格式化的处理结果，并将所述格式化的处理结果发送至文档逻辑化处理模块；所述处理结果的格式为：文字部分以及在文字前后或文字中间分布的一个或多个空白段的时间段长度；文档逻辑化处理模块，用于接收所述语音文字转换模块发送来的格式化的处理结果，并根据所述空白段的时间段长度与文档逻辑符号的对应关系，将所述空白段转换为相应的文档逻辑符号，然后，将所述格式化的处理结果生成云笔记文档。
8. 如权利要求6所述的装置，其特征在于：所述交互模块，还用于接收所述终端发送的本次云笔记的头信息并保存，发送确认信息给所述终端；所述语音文字化云笔记生成模块，还用于根据所有经文档逻辑化处理后的内容生成整体的云笔记文档时，将保存的本次云笔记的头信息作为该云笔记文档的头信息。
9. 如权利要求8所述的装置，其特征在于：所述语音文字化云笔记生成模块，还用于将所述整体的云笔记文档保存在用户账号下云端个人数据中心的云笔记中的语音笔记子目录中。
【文档编号】G10L15/34GK104064188SQ201310094909
【公开日】2014年9月24日申请日期:2013年3月22日优先权日:2013年3月22日
【发明者】陈斌申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈斌
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种用于轨道列车的分层复合轻质声学材料的制作方法
上一篇：一种线性预测语音编码的信息隐藏方法与提取方法