语音内容记录方法与装置与流程

文档序号:16383023发布日期:2018-12-22 09:39阅读:192来源:国知局
语音内容记录方法与装置与流程

本发明涉及语音通信领域,具体而言,涉及一种语音内容记录方法与装置。

背景技术

随着互联网通信技术的不断成熟,网络语音通话、视频通话、电话会议等等语音通话交流越来越频繁,在语音通话过程中可能需要将语音内容记录下来,比如在一次电话会议后需要将会议的纪要整理出来,如果会议内容过多,且没有做好相关笔记,很容易将会议的内容遗漏,再者即使做好了书面笔记,会后也需要将其转化为电子文本。这样既需要记录又要防止遗漏且最后还要转化为电子文本的操作比较耗时且易出错,如何即简单又快捷无误的将语音内容记录成电子文本成为人们一种急切的渴望。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种能够简单、快捷且准备的记录语音内容的语音内容记录方法与装置。

第一方面,本发明实施例提供了一种语音内容记录方法,所述语音内容记录方法包括:

在第一用户终端与另外的一个或多个第二用户终端进行语音交互时,启动安装于第一用户终端的目标应用程序;

控制所述目标应用程序识别语音交互的过程中的语音内容,并将所述语音内容转化为预设定国家的文字语言;

控制所述目标应用程序将所述转化为预设定国家的文字语言的文字内容传输至存储器存储。

第二方面,本发明实施例还提供了一种语音内容记录装置,所述语音内容记录装置包括:

启动单元,用于在第一用户终端与另外的一个或多个第二用户终端进行语音交互时,启动安装于第一用户终端的目标应用程序;

控制单元,用于控制所述目标应用程序识别语音交互的过程中的语音内容,并将所述语音内容转化为预设定国家的文字语言;

所述控制单元还用于控制所述目标应用程序将所述转化为预设定国家的文字语言的文字内容传输至存储器存储。

与现有技术相比,本发明提供的语音内容记录方法与装置,通过在第一用户终端与另外的一个或多个第二用户终端进行语音交互时,启动安装于第一用户终端的目标应用程序;控制所述目标应用程序识别语音交互的过程中的语音内容,并将所述语音内容转化为预设定国家的文字语言;从而实现了高效率并且准确的记录语音内容的效果。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的第一用户终端与多个第二用户终端的交互示意图;

图2为本发明实施例提供的第一用户终端的功能模块框图;

图3为本发明实施例提供的语音内容记录方法的流程图;

图4为本发明实施例提供的语音内容记录装置的功能模块框图。

图标:100-第一用户终端;200-第二用户终端;300-网络;400-语音内容记录装置;102-存储器;104-存储控制器;106-处理器;108-外设接口;110-射频模块;112-音频模块;114-触控屏幕;401-启动单元;402-控制单元;403-修改或编辑单元。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明较佳实施例所提供的语音内容记录方法与装置可应用于如图1所示的应用环境中。如图1所示,第一用户终端100、一个或多个第二用户终端200位于无线网络或有线网络300中(图1中包括两个第二用户终端200),通过该无线网络或有线网络300,第一用户终端100与一个或多个第二用户终端200进行数据交互。在本发明实施例中,第一用户终端100与第二用户终端200能够进行语音交互,第一用户终端100中安装有能够将语音内容翻译成文字内容的目标应用程序(application,app)。

在本发明实施例中,第一用户终端100可以为移动终端设备,例如可以是但不限于是智能手机、平板电脑、电子书阅读器、膝上型便携计算机、车载电脑、穿戴式移动终端。

图2示出了一种可应用于本发明实施例中的第一用户终端100的结构框图。如图2所示,第一用户终端100包括语音内容记录装置400、存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、音频模块112、触控屏幕114等。这些组件通过一条或多条通讯总线/信号线116相互通讯。语音内容记录装置400包括至少一个可以软件或固件(firmware)的形式存储于存储器102中或固化在第一用户终端100的操作系统(operatingsystem,os)中的软件功能模块。

存储器102可用于存储软件程序以及模块,如本发明实施例中的语音内容记录装置及方法所对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本发明实施例提供的语音内容记录方法。

存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。

外设接口108将各种输入/输出装置耦合至处理器106以及存储器102。在一些实施例中,外设接口108、处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。

射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。

音频模块112向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

触控屏幕114在第一用户终端100与用户之间同时提供一个输出及输入界面。在本实施例中,触控屏幕114支持单点和多点触控操作,例如,该触控屏幕114可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是触控屏幕114能感应到来自该触控屏11上一个或多个位置处同时产生的触控操作,并将该感应到的多点触控操作交由处理器106进行处理。

可以理解,图2所示的结构仅为示意,第一用户终端100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。

本发明实施例提出的语音内容记录方法与装置可适用于android操作系统、ios操作系统、windowsphone操作系统等平台。

请参阅图3,本发明实施例提供了一种语音内容记录方法,该语音内容记录方法包括:

步骤s301:在第一用户终端100与另外的一个或多个第二用户终端200进行语音交互的过程中,启动安装于第一用户终端100的目标应用程序。

其中,目标应用程序是指能够将语音内容翻译成文字内容的应用程序,例如,可以将语音内容翻译成汉字文字内容、英文文字内容、日文文字内容等等,在此不做限定。

具体地,启动安装于第一用户终端100的目标应用程序的方式可以包括但不限于以下两种:

第一种:在检测到启动键生成的预设启动指令时,启动安装于所述第一用户终端100的目标应用程序。

具体地,通过预先设置启动键的方式触发和启动目标应用程序。进一步地,启动键通过响应用户预设操作生成预设启动指令,例如,在第一用户终端100正在进行语音交互时,启动键响应到用户双击动作时,生成预设启动指令,或者启动键在响应到用户长按动作时,生成预设启动指令。进一步地,启动键可以在再次响应到用户输入的与启动目标应用程序相同的操作,例如双击动作或长按动作时,关闭处于运行状态的目标应用程序。

第二种:在第一用户终端100与另外的一个或多个第二用户终端200进行语音交互时,自动触发并启动目标应用程序。例如,在监测到第一用户终端100与另外的一个或多个第二用户终端200建立语音通信连接后,即自动启动安装于第一用户终端100的目标应用程序。此种方式,在响应到第一应用程序与另外的一个或多个第二用户终端200断开语音通信连接后,目标应用程序自动关闭。

本实施例中,第一用户终端100与一个或多个第二用户终端200可以通过多方电话会议系统进行语音会议,也可以通过微信、qq、钉钉等可以用于进行多方在线语音会议的聊天应用程序进行语音交互,在此不做限定。上述的语音交互的场景可以为语音会议场景或者语音通话场景。

步骤s302:控制目标应用程序识别语音交互的过程中的语音内容,并将语音内容转化为预设定国家的文字语言。

其中,用户可以预先设置好需要转化的国家的文字语言,例如,汉语、英语、日语、德语等等,在此不做限制。

步骤s303:控制目标应用程序将转化为预设定国家的文字语言的文字内容传输至显示屏显示。

在启动第一应用程序进行语音交互之前,可以预先在目标应用程序进行参数设置,例如,转化为哪国语言文字、通话的过程中是否启动实时显示已经转化的文字等功能,当设置实时显示已经转化的文字等功能后,即可执行步骤s303,从而用户可以在显示屏上实时观察到被转化的文字内容。

步骤s304:在响应到用户输入的文字修改指令或编辑指令后对转化为预设定国家的文字语言的文字内容进行修改或编辑。

当用户在显示屏观察到由于方言、发音不标准等造成的文字转化差异或错误或遗漏,可以输入文字修改指令或编辑指令进行文本修正。

步骤s305:控制目标应用程序将转化为预设定国家的文字语言的文字内容传输至存储器存储。

若用户对文本修改,则保存的是修改过后的文本。

请参阅图4,本发明实施例还提供了一种语音内容记录装置400,本发明实施例所提供的语音内容记录装置400,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。语音内容记录装置包括启动单元401、控制单元402以及修改或编辑单元403。

其中,启动单元401用于在第一用户终端100与另外的一个或多个第二用户终端200进行语音交互的过程中,启动安装于第一用户终端100的目标应用程序。

本实施例中,启动单元401启动安装于第一用户终端100的目标应用程序包括但不限于以下的两种方式:

第一种:启动单元401具体用于在检测到启动键生成的预设启动指令时,启动安装于所述第一用户终端100的目标应用程序。其中,可以在启动键响应到用户双击动作时,生成预设启动指令。

第二种:启动单元401具体用于在第一用户终端100与另外的一个或多个第二用户终端200进行语音交互时,自动触发并启动目标应用程序。

控制单元402用于控制目标应用程序识别语音交互的过程中的语音内容,并将语音内容转化为预设定国家的文字语言。

控制单元402还用于控制目标应用程序将转化为预设定国家的文字语言的文字内容传输至显示屏显示。

语音内容记录装置400还包括:修改或编辑单元403,用于在响应到用户输入的文字修改指令或编辑指令后对转化为预设定国家的文字语言的文字内容进行修改或编辑。

控制单元402还用于控制目标应用程序将转化为预设定国家的文字语言的文字内容传输至存储器存储。

综上,本发明提供的语音内容记录方法与装置,通过在第一用户终端与另外的一个或多个第二用户终端进行语音交互时,启动安装于第一用户终端的目标应用程序;控制目标应用程序识别语音交互的过程中的语音内容,并将语音内容转化为预设定国家的文字语言;从而实现了高效率并且准确的记录语音会议的内容。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1