语音便签的编辑方法、装置及移动终端与流程

文档序号:33453346发布日期:2023-03-15 01:32阅读:43来源:国知局
语音便签的编辑方法、装置及移动终端与流程

1.本技术涉及音频处理技术领域,尤其涉及一种语音便签的编辑方法、装置及移动终端。


背景技术:

2.目前为了获得更高效的记录方式,移动终端通过集成语音识别技术,向用户提供语音便签功能,用户使用语音便签功能,实时录制用户语音,将语音转换为文字。现有语音便签已成为帮助人们处理日常事务的重要辅助工具。


技术实现要素:

3.本技术实施例提供了一种语音便签的编辑方法、装置及移动终端。
4.第一方面,本技术实施例提供了一种语音便签的编辑方法,包括:
5.在语音录制过程中,侦测语音的停顿特征;
6.根据停顿特征确定语音转换文字的排版方式。
7.第二方面,本技术实施例提供了一种语音便签的编辑装置,包括:
8.侦测模块,用于在语音录制过程中,侦测语音的停顿特征;
9.确定模块,用于根据停顿特征确定语音转换文字的排版方式。
10.第三方面,本技术实施例提供了一种移动终端,包括存储器以及处理器,所述存储器用于存储计算机程序,所述计算机程序在所述处理器运行时执行第一方面提供的语音便签的编辑方法。
11.第四方面,本技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序在处理器上运行时执行第一方面提供的语音便签的编辑方法。
12.上述本技术提供的语音便签的编辑方法、装置及移动终端,在语音录制过程中,侦测语音的停顿特征;根据所述停顿特征确定语音转换文字的排版方式。这样,通过语音录制过程中的停顿特征确定语音转换文字的排版方式,能够实现自动确定语音转换文字的排版方式,对语音转换文字进行相应排版编辑,提高语音转换文字的排版效果,提高文字阅读性。
附图说明
13.为了更清楚地说明本技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对本技术保护范围的限定。在各个附图中,类似的构成部分采用类似的编号。
14.图1示出了本技术实施例提供的移动终端的一结构示意图;
15.图2示出了本技术实施例提供的语音便签的编辑方法的流程示意图;
16.图3示出了本技术实施例提供的语音便签显示界面的一示意图;
17.图4示出了本技术实施例提供的语音便签的编辑方法的步骤s102的一流程示意
图;
18.图5示出了本技术实施例提供的语音便签的编辑方法的另一流程示意图;
19.图6示出了本技术实施例提供的语音便签的编辑方法的步骤s102的另一流程示意图;
20.图7示出了本技术实施例提供的语音便签显示界面的另一示意图;
21.图8示出了本技术实施例提供的语音便签的编辑装置的一结构示意图。
具体实施方式
22.下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。
23.通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
24.在下文中,可在本技术的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
25.此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
26.除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本技术的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本技术的各种实施例中被清楚地限定。
27.目前,在现有移动终端提供的语音便签功能中,将语音转换文字形成一篇没有进行任何编辑的文本段落,导致文字阅读性比较差。
28.针对上述问题,本技术实施例提供一种语音便签的编辑方法、装置及移动终端,以期优化语音便签功能,方便阅读语音便签的文字内容。下面结合附图进行说明。
29.请参阅图1,图1是本技术实施例提供的移动终端的一结构示意图。如图1所示,本实施例提供的移动终端100包括:
30.射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本技术实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载移动终端、可穿戴设备、以及计步器等。
31.应理解的是,本技术实施例中,射频单元101可用于收发信息或通话过程中,信号
的接收和发送,具体的,将来自基站的下行数据接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信系统与网络和其他设备通信。
32.移动终端通过网络模块102为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
33.音频输出单元103可以将射频单元101或网络模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103包括扬声器、蜂鸣器以及受话器等。
34.输入单元104用于接收音频或视频信号。输入单元104可以包括图形处理器(graphics processing unit,gpu)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获移动终端(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以视频播放在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或网络模块102进行发送。麦克风1042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。
35.移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器105还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
36.显示单元106用于视频播放由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶视频播放器(liquid crystal display,lcd)、有机发光二极管(organic light-emitting diode,oled)等形式来配置显示面板1061。
37.用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)。触控面板1071可包括触摸检测移动终端和触摸控制器两个部分。其中,触摸检测移动终端检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测移动终端上接收触摸信息,并将它转换成触点坐标,再送给处理器110,接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如
音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
38.进一步的,触控面板1071可覆盖在显示面板1061上,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
39.接口单元108为外部移动终端与移动终端100连接的接口。例如,外部移动终端可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的移动终端的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元108可以用于接收来自外部移动终端的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部移动终端之间传输数据。
40.存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
41.处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
42.移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
43.另外,移动终端100包括一些未示出的功能模块,在此不再赘述。
44.实施例1
45.请参阅图2,图2是本技术实施例提供的语音便签的编辑方法的流程示意图。本技术实施例中的执行主体可以为移动终端100,也可以为移动终端100的处理器110或移动终端100中的操作系统,本实施例以执行主体为移动终端100为例进行说明。如图2所示,本语音便签的编辑方法包括以下操作。
46.步骤s201,在语音录制过程中,侦测语音的停顿特征。
47.在本实施例中,语音便签的编辑方法可以应用于移动终端,移动终端录制语音时,由于用户说话停顿,会存在无声音的停顿时段,可以实时侦测停顿开始时刻、停顿结束时刻,根据停顿开始时刻、停顿结束时刻计算停顿时长,停顿特征可以包括停顿时长。
48.步骤s202,根据所述停顿特征确定语音转换文字的排版方式。
49.可以理解的是,基于用户说话一般习惯可知,在用户说了一句完整的话语后,会停
顿较短时间,开始说下一句。在用户说了大段语句后,会停顿较长时间,开始说下一段。
50.在本实施例中,将录制的语音转换的对应文字称为语音转换文字。在考虑人体说话的基本习惯的基础上,基于用户语音的停顿特征,确定语音转换文字的排版方式。现有技术中,语音转换为文字后,还是需要根据需求手动编辑、整理文本,排版效果差。而本实施例中,能够实现自动确定语音转换文字的排版方式,对语音转换文字进行相应排版编辑,提高语音转换文字的排版效果,提高的可读性。
51.在本实施例中,所述停顿特征包括停顿时长,不同停顿时长对应不同排版方式。
52.补充说明的是,排版方式可以包括换行排版方式及空行排版方式。此外,排版方式还可以包括按照不同颜色设置的排版方式。此外,排版方式还可以包括按照不同字体尺寸设置的排版方式。
53.请参阅图3,在语音录制过程中,在第一语音便签显示界面300将语音转换文字按照排版方式实时显示。需要说明的是,用户的语音可以汉语、英语,也可以是其他形式的语音,在此不做限制。在录制过程中,当前录制语音的语音转换文字的颜色可以与其他语音转换文字的颜色不同,例如,在图3中,当前录制语音的语音转换文字“timeline of steos”颜色为灰色,其他语音转换文字的颜色为黑色,在其他实施方式中,还可以是其他不同彩色,在此不做限制。
54.在图3中,语音转换文字为英语语音。在语音“accomplish”和“you”之间有第一次语音停顿,在语音“personas”和“step2”之间有第二次语音停顿。获取第一次语音停顿的第一停顿特征,根据所述第一停顿特征确定语音转换文字的换行排版方式,将“you”及其之后的语音转换文字换行显示。获取第二次语音停顿的第二停顿特征,根据所述第二停顿特征确定语音转换文字的空行排版方式,将“step2”及其之后的语音转换文字空行显示。
55.除上述对语音转换文字的换行显示及空行显示之外,对于图3的语音转换文字内容而言,还可以根据所述第一停顿特征确定语音转换文字的第一字体颜色排版方式,将“you”及其之后的语音转换文字设置成第一字体颜色。获取第二次语音停顿的第二停顿特征,根据所述第二停顿特征确定语音转换文字的第二字体颜色排版方式,将“step2”及其之后的语音转换文字设置成第二字体颜色,第一字体颜色及第二字体颜色不同,例如,第一字体颜色为红色,第二字体颜色为绿色。
56.除上述对语音转换文字设置第一字体颜色及第二字体颜色之外,对于图3的语音转换文字内容而言,还可以根据所述第一停顿特征确定语音转换文字的第一字体尺寸排版方式,将“you”及其之后的语音转换文字设置成第一字体尺寸。获取第二次语音停顿的第二停顿特征,根据所述第二停顿特征确定语音转换文字的第二字体尺寸排版方式,将“step2”及其之后的语音转换文字设置成第二字体尺寸,第一字体尺寸及第二字体尺寸不同,例如,第一字体尺寸为10号字体,第二字体尺寸为14号字体。
57.这样,在显示语音转换文字时,能够实现自动确定语音转换文字的排版方式,对语音转换文字按照确定的排版方式进行显示,提高语音转换文字的排版效果,便于用户阅读,提高文字可读性。
58.请参阅图4,在本实施例中的步骤s202包括:
59.步骤s2021,在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,确定停顿后的语音转换文字为换行排版方式;
60.步骤s2022,在所述停顿时长大于等于第二预设时间阈值时,确定停顿后的语音转换文字为空行排版方式。
61.在本实施例中,第一预设时间阈值及第二预设时间阈值可以根据大量用户语音样本数据的分析得到。例如,对大量用户语音样本数据进行分析,获取用户相邻语句之间的停顿时长范围,相邻语段之间的停顿时长范围,根据用户相邻语句之间的停顿时长范围及相邻语段之间的停顿时长范围确定第一预设时间阈值及第二预设时间阈值。
62.在一种可能的实施方式中,第一预设时间阈值及第二预设时间阈值可以为系统默认数据,还可以为用户自定义设置的数据,在此不做限制。
63.举例来说,第一预设时间阈值可以为5秒,第二预设时间阈值为3秒。请再次参阅图2,在语音“accomplish”和“you”之间停顿时长为3秒,将“you”及其之后的语音转换文字换行显示。在语音“personas”和“step2”之间语音停顿时长5秒,将“step2”及其之后的语音转换文字空行显示。
64.本实施例中步骤s101中的侦测语音的停顿特征,包括:
65.在对录制的语音进行语音识别的过程中,确定相邻两段语音转换文字之间的时间间隔;
66.将所述时间间隔确定为所述停顿时长。
67.在本实施例中,移动终端100对录制的语音进行语音识别,得到语音转换文字,可以是移动终端100自身设置语音识别模块,通过语音识别模块对录制的语音进行识别,也可以是移动终端100将录制语音实时发送给云服务器,云服务器对语音进行识别,将得到的语音文本发送给移动终端100。移动终端100对获取到一段语音对应的语音转换文字的时间进行记录,根据记录的时间确定相邻两段语音转换文字之间的时间间隔。例如,相邻两段语音转换文字之间的时间间隔可以为4秒。
68.这样,可以根据相邻两段语音转换文字之间的时间间隔确定相应的两段语音之间的停顿时长,确保停顿时长的准确度。
69.本实施例中,所述方法还包括:
70.将所述语音转换文字按照所述排版方式实时显示。
71.结合图3举例来说,若对于图3的语音转换文字内容而言,根据第一停顿特征确定语音转换文字的红色字体排版方式,将“you”及其之后的语音转换文字设置成红色字体。根据第二停顿特征确定语音转换文字的绿色字体排版方式,将“step2”及其之后的语音转换文字设置成绿色字体,以根据相应的字体颜色实时显示语音转换文字。
72.本实施例中,所述将所述语音转换文字按照所述排版方式实时显示,包括:
73.在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,生成换行符,确定所述换行符对应的换行区域,在所述相邻两段语音转换文字的前一段语音转换文字之后依次显示所述换行区域、及所述相邻两段语音转换文字的后一段语音转换文字;
74.在所述停顿时长大于等于第二预设时间阈值时,生成空行符,确定所述空行符对应的空行区域,在所述相邻两段语音转换文字的前一段语音转换文字之后依次显示所述空行区域、及所述相邻两段语音转换文字的后一段语音转换文字。
75.在本实施例中,移动终端100对获取到一段语音对应的语音转换文字的时间进行记录,并对获取到相邻下一段语音对应的语音转换文字的时间进行记录。举例来说,第一预
设时间阈值可以为5秒,第二预设时间阈值为3秒。
76.请再次参阅图3,在相邻两段语音转换文字的时间间隔大于等于第一预设时间阈值小于第二预设时间阈值时,即在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,移动终端100生成换行符,向显示单元106发送换行符,确定换行符对应的换行区域301,控制在前一段语音转换文字之后显示换行区域301,并在换行区域301之后显示后一段语音转换文字。换行区域301可以将前一段语音转换文字与下一段语音转换文字进行有效区分,另起一段显示语音转换文字。
77.在相邻两段语音转换文字的时间间隔大于等于第二预设时间阈值时,即在所述停顿时长大于等于第二预设时间阈值时,移动终端100向显示单元106发送空行符,确定空行符对应的空行区域302,控制在在所述相邻两段语音转换文字的前一段语音转换文字之后显示空行区域302,并在空行区域302之后显示后一段语音转换文字。
78.下面结合图5,对本实施例提供的对语音转换文字进行换行显示及空行显示的流程进行说明。
79.步骤s501,语音识别。
80.该步骤中,移动终端100可以对录制的语音进行语音识别,得到语音对应的语音转换文字,语音转换文字又可以称为识别数据。移动终端100也可以将语音发送给服务器,服务器对语音进行识别,服务器将识别得到的识别数据发送给移动终端100。
81.步骤s502,识别数据返回。
82.在步骤s502中,移动终端100将得到的识别数据返回给语音便签应用程序,语音便签应用程序可以将此时收到的识别数据显示在相应的显示界面上,并执行后续的处理流程。
83.步骤s502,计时。
84.在步骤s502中,移动终端100的语音便签应用程序从接收到识别数据的时刻启动计时,直到接收到下一识别数据停止计时。
85.步骤s503,判断超过3秒是否有下一识别数据返回。
86.在步骤s503中,若超过3秒有下一识别数据返回,则执行步骤s408。若超过3秒没有下一识别数据返回,则执行步骤s505。
87.步骤s505,发送第一换行符。
88.在步骤s505中,语音便签应用程序将第一换行符发送给移动终端100的显示单元106,根据第一换行符确定第一换行区域。
89.步骤s506,判断超过5秒是否有下一识别数据返回。
90.在步骤s506中,若超过5秒有下一识别数据返回,则执行步骤s508。若超过5秒没有下一识别数据返回,则执行步骤s507。
91.步骤s507,发送第二换行符。
92.在步骤s507中,语音便签应用程序将第二换行符发送给移动终端的屏幕,语音便签应用程序根据第二换行符确定第二换行区域。
93.步骤s507,上屏显示。
94.在本实施例中,移动终端包括显示屏,在步骤s503中,超过3秒时有下一识别数据返回时,显示下一识别数据。在步骤s505发送第一换行符后,确定第一换行区域,在已显示
的识别数据之后显示第一换行区域。在步骤s506中,超过5秒时有下一识别数据返回时,显示下一识别数据。在步骤s507发送第二换行符后,确定第二换行区域,在已显示的识别数据及第一换行区域之后显示第二换行区域。
95.在该具体举例中,步骤s503中的3秒是本实施例中的第一预设时间阈值的具体举例说明,步骤s505中的5秒对应本实施例中的第二预设时间阈值的具体举例说明,也可以是其他数值,在此不做限定。
96.本实施例中前述的空行符可以包括第一换行符及第二换行符。通过两个换行符组成空行符,达到空行的作用。
97.这样,在显示语音转换文字时,能够实现自动确定语音转换文字的换行排版方式、空行排版方式,语音转换文字按照换行排版方式或空行排版方式进行显示,提高语音转换文字的排版效果,便于用户阅读,提高文字可读性。
98.在本实施例中,所述停顿特征包括停顿前语音与停顿后语音是否语义关联,参阅图6,步骤s202,所述根据所述停顿特征确定语音转换文字的排版方式,包括:
99.步骤s2023,在停顿前语音和停顿后语音的语义关联时,确定停顿后的语音转换文字为不换行、不空格的排版方式,或者,将语义关联的停顿前语音与停顿端后语音关联构成完整语句,确定所述完整语句转换的文字为换行或空格排版方式;
100.步骤s2024,在停顿前语音和停顿后语音的语义不关联时,确定停顿后的语音转换文字为换行或空行排版方式。
101.在一些情况下,用户有可能由于在说话过程中进行思考,出现语音停顿,导致一个完整的语句被打断,停顿前语音与停顿后语音在语义上具有关联性。将停顿前语音与停顿后语音是否语义关联作为停顿特征,可以对用户停顿的意图进行真实判断,减少误排版操作。
102.在本实施例中,可以采用语音分析技术对停顿前语音和停顿后语音的语义关联性进行判断,停顿前语音和停顿后语音的语义关联,说明用户在思考、或者被其他事情打断语音,停顿前语音和停顿后语音可以构成完整语句。停顿前语音和停顿后语音的语义不关联,说明此时的语音停顿是用户的正常停顿,停顿前语音和停顿后语音是单独的语句。
103.在本实施例中,在停顿前语音和停顿后语音的语义关联时,有两种处理方式可以采用。第一种处理方式:确定停顿后的语音转换文字为不换行、不空格的排版方式,直接在停顿前的语音转换文字后面,显示停顿后的语音转换文字,避免误排版操作。第二种方式:将语义关联的停顿前语音与停顿端后语音关联构成完整语句,确定所述完整语句转换的文字为换行或空格排版方式,这样,可以将停顿前语音和停顿后语音合并在一起得到完整语句,将完整语句转换的文字换行或空格排版方式,即起到对语音转换文字的编辑效果,还可以保证语义完整度。
104.在本实施例中,在停顿前语音和停顿后语音的语义不关联时,说明此时语音停顿为用户的正常停顿,停顿前语音和停顿后语音是单独的语句,确定停顿后的语音转换文字为换行或空行排版方式,自动对语音转换文字的排版方式进行确定,对语音转换文字进行相应排版编辑,提高语音转换文字的排版效果。
105.在本实施例中,语音便签的编辑方法还包括:
106.在录制结束后,将已录制语音对应的播放条及其语音转换文字进行关联显示。
107.在本实施例中,移动终端的语音便签应用程序中,可以录制多个语音,采用语音识别技术,对各语音转换得到相应文字。将语音的播放条及其对应的文字关联显示,可以为提高语音及其转换的文字的关联性。
108.在本实施例中,语音便签的编辑方法还包括:
109.对所述已录制语音的下一相邻已录制语音对应的播放条及其语音转换文字进行关联显示,其中,播放条及其关联的语音转换文字之间相距第一预设间隔;所述已录制语音对应的语音转换文字与所述下一相邻已录制语音的播放条相距第二预设间隔,且所述第二预设间隔大于所述第一预设间隔。
110.这样,下一相邻已录制语音对应的播放条与所述下一相邻已录制语音转换的文字关联显示时,有效进行区分显示,提高语音的播放条及其对应转换的文字的关联性,用户回听语音时,可以快速便捷地查看对应文字。
111.需要说明的是,在录制过程中,会出现分开多次录制的情况,录制多个语音,加强语音和对应文本之间的关联性,在回听录音时可以有更多的针对性。
112.在本实施例中,第一预设间隔、第二预设间隔可以是系统默认设置的,也可以是根据移动终端的显示屏的尺寸计算得到,在此不做限制。例如,第一预设间隔系统默认设置为5毫米、第二预设间隔系统默认设置为10毫米。
113.请参阅图7,第二录制界面700包括第一播放条7011及其关联的第一语音转换文字7012、第二播放条7021及其关联的第二语音转换文字7022。第一播放条7011及第一语音转换文字7012相距第一预设间隔,第二播放条7021及第一语音转换文字7022相距第一预设间隔,第一语音转换文字7012与第二播放条7021相距第二预设间隔,第二预设间隔大于第一预设间隔。
114.可以理解的是,在图7中,第一播放条7011的下方关联显示第一语音转换文字7012,第二播放条7021的下方关联显示第二语音转换文字7022,第一语音转换文字7012的下方显示第二播放条7021,此种显示方式可以有其他替代显示方式的。例如,第一语音转换文字7012的下方关联显示第一播放条7011,第二语音转换文字7022的下方关联显示第二播放条7021,第一播放条7011下方显示第二语音转换文字7022,此时,第一播放条7011与第二语音转换文字7022相距第二预设间隔。
115.这样,可以在录制界面对各语音的播放条及其转换的文字有区分地关联显示,加强语音的播放条及其转换的文字之间的关联性,用户在回听音频文件时可以有更多的针对性,提高回停语音便签的效率。
116.本实施例提供的语音便签的编辑方法,在语音录制过程中,侦测语音的停顿特征;根据所述停顿特征确定语音转换文字的排版方式。本实施例提供的语音便签的编辑方法,通过语音录制过程中的停顿特征确定语音转换文字的排版方式,能够实现自动确定语音转换文字的排版方式,对语音转换文字进行相应排版编辑,提高语音转换文字的排版效果,提高文字阅读性。
117.实施例2
118.此外,本公开实施例提供了一种语音便签的编辑装置,该语音便签的编辑装置应用于图1所述的移动终端100。具体的,该语音便签的编辑装置用于执行实施例1中的语音便签的编辑方法中移动终端所述执行的步骤。
119.本技术实施例提供的语音便签的编辑装置可以包括相应步骤对应的模块。
120.本技术实施例可以根据实施例1提供语音便签的编辑方法对语音便签的编辑装置进行功能模块划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中,上述集成的模块即可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
121.本技术实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
122.在采用对应各个功能划分各个功能模块的情况下,图8示出本实施例的语音便签的编辑装置的一种可能的结构示意图。如图8所示,语音便签的编辑装置800应用于移动终端100,所述装置包括:
123.侦测模块801,用于在语音录制过程中,侦测语音的停顿特征;
124.确定模块802,用于根据所述停顿特征确定语音转换文字的排版方式。
125.在本实施例中,所述停顿特征包括停顿时长,不同停顿时长对应不同排版方式。
126.在本实施例中,所述确定模块802,还用于在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,确定停顿后的语音转换文字为换行排版方式;
127.在所述停顿时长大于等于第二预设时间阈值时,确定停顿后的语音转换文字为空行排版方式。
128.在本实施例中,所述侦测模块801,还用于在对录制的语音进行语音识别的过程中,确定相邻两段语音转换文字之间的时间间隔;
129.将所述时间间隔确定为所述停顿时长。
130.在本实施例中,语音便签的编辑装置800还包括:
131.第一显示模块,用于将所述语音转换文字按照所述排版方式实时显示。
132.在本实施例中,所述第一显示模块,还用于在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,生成换行符,确定所述换行符对应的换行区域,在所述相邻两段语音转换文字的前一段语音转换文字之后依次显示所述换行区域、及所述相邻两段语音转换文字的后一段语音转换文字;
133.在所述停顿时长大于等于第二预设时间阈值时,生成空行符,确定所述空行符对应的空行区域,在所述相邻两段语音转换文字的前一段语音转换文字之后依次显示所述空行区域、及所述相邻两段语音转换文字的后一段语音转换文字。
134.在本实施例中,所述停顿特征包括停顿前语音与停顿后语音是否语义
135.关联,所述确定模块802,还用于在停顿前语音和停顿后语音的语义关联时,确定停顿后的语音转换文字为不换行、不空格的排版方式,或者,将语义关联的停顿前语音与停顿端后语音关联构成完整语句,确定所述完整语句转换的文字为换行或空格排版方式;
136.在停顿前语音和停顿后语音的语义不关联时,确定停顿后的语音转换文字为换行或空行排版方式。
137.在本实施例中,语音便签的编辑装置800还包括:
138.第二显示模块,还用于在录制结束后,将已录制语音对应的播放条及其语音转换文字进行关联显示。
139.在本实施例中,所述第二显示模块,还用于对所述已录制语音的下一相邻已录制
语音对应的播放条及其语音转换文字进行关联显示,其中,播放条及其关联的语音转换文字之间相距第一预设间隔;所述已录制语音对应的语音转换文字与所述下一相邻已录制语音的播放条相距第二预设间隔,且所述第二预设间隔大于所述第一预设间隔。
140.本实施例提供的语音便签的编辑装置800可以实现实施例1提供的语音便签的编辑方法,为避免重复,在此不再赘述。
141.本实施例提供的语音便签的编辑装置,在语音录制过程中,侦测语音的停顿特征;根据所述停顿特征确定语音转换文字的排版方式。本实施例提供的语音便签的编辑方法,通过语音录制过程中的停顿特征确定语音转换文字的排版方式,能够实现自动确定语音转换文字的排版方式,对语音转换文字进行相应排版编辑,提高语音转换文字的排版效果,提高文字阅读性。
142.实施例3
143.本公开实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如下步骤:
144.在语音录制过程中,侦测语音的停顿特征;
145.根据所述停顿特征确定语音转换文字的排版方式。
146.在本实施例中,所述停顿特征包括停顿时长,不同停顿时长对应不同排版方式。
147.在本实施例中,所述计算机程序被处理器执行时还实现如下步骤:
148.在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,确定停顿后的语音转换文字为换行排版方式;
149.在所述停顿时长大于等于第二预设时间阈值时,确定停顿后的语音转换文字为空行排版方式。
150.在本实施例中,所述侦测语音的停顿特征,包括:
151.在对录制的语音进行语音识别的过程中,确定相邻两段语音转换文字之间的时间间隔;
152.将所述时间间隔确定为所述停顿时长。
153.在本实施例中,所述计算机程序被处理器执行时还实现如下步骤:
154.将所述语音转换文字按照所述排版方式实时显示。
155.在本实施例中,所述将所述语音转换文字按照所述排版方式实时显示,包括:
156.在所述停顿时长大于等于第一预设时间阈值小于第二预设时间阈值时,生成换行符,确定所述换行符对应的换行区域,在所述相邻两段语音转换文字的前一段语音转换文字之后依次显示所述换行区域、及所述相邻两段语音转换文字的后一段语音转换文字;
157.在所述停顿时长大于等于第二预设时间阈值时,生成空行符,确定所述空行符对应的空行区域,在所述相邻两段语音转换文字的前一段语音转换文字之后依次显示所述空行区域、及所述相邻两段语音转换文字的后一段语音转换文字。
158.在本实施例中,所述停顿特征包括停顿前语音与停顿后语音是否语义关联,所述计算机程序被处理器执行时还实现如下步骤:
159.在停顿前语音和停顿后语音的语义关联时,确定停顿后的语音转换文字为不换行、不空格的排版方式,或者,将语义关联的停顿前语音与停顿端后语音关联构成完整语句,确定所述完整语句转换的文字为换行或空格排版方式;
160.在停顿前语音和停顿后语音的语义不关联时,确定停顿后的语音转换文字为换行或空行排版方式。
161.在本实施例中,所述计算机程序被处理器执行时还实现如下步骤:
162.在录制结束后,将已录制语音对应的播放条及其语音转换文字进行关联显示。
163.在本实施例中,所述计算机程序被处理器执行时还实现如下步骤:对所述已录制语音的下一相邻已录制语音对应的播放条及其语音转换文字进行关联显示,其中,播放条及其关联的语音转换文字之间相距第一预设间隔;所述已录制语音对应的语音转换文字与所述下一相邻已录制语音的播放条相距第二预设间隔,且所述第二预设间隔大于所述第一预设间隔。
164.在本实施例中,计算机可读存储介质可以为只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
165.本实施例提供的计算机可读存储介质可以实现实施例1提供的语音便签的编辑方法,为避免重复,在此不再赘述。
166.实施例4
167.本公开实施例还提供一种计算机程序产品,当该计算机程序产品中的程序代码由移动终端的处理器执行时,使得移动终端能够执行实施例1提供的语音便签的编辑方法。
168.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。
169.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
170.上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1