基于语音转换的交互方法及终端设备与流程

文档序号:16670172发布日期:2019-01-18 23:31阅读:196来源:国知局
基于语音转换的交互方法及终端设备与流程

本发明属于数据处理技术领域,尤其涉及基于语音转换的交互方法、终端设备以及计算机可读存储介质。



背景技术:

随着科学技术的发展,智能终端已逐渐普及到千家万户,成为人们日常生活中的必需品。用户在使用智能终端时,通常需要通过智能终端上的应用程序来获取特定的信息,比如通过读书相关的应用程序来获取文学信息,通过购物相关的应用程序来获取商品信息。

但是,在现有技术中,智能终端大多不具备数字按键,并且应用程序界面上的信息一般以可视化的形式提供给用户。对一些障碍者如不识字者、老人和盲人等来说,难以通过肉眼获取应用程序界面的信息,导致难以使用应用程序。综上,现有技术中,应用程序界面的信息无法有效地展现给障碍者,与障碍者的交互效率低。



技术实现要素:

有鉴于此,本发明实施例提供了基于语音转换的交互方法、终端设备以及计算机可读存储介质,以解决现有技术中应用程序界面的信息无法展现给障碍者,交互效率低的问题。

本发明实施例的第一方面提供了一种基于语音转换的交互方法,包括:

若终端设备的当前界面触发了触摸事件,获取与所述触摸事件相关度最大的信息区块,所述信息区块为所述当前界面中通过预设的超文本标记语言html划分标签对划分出的区块;

提取与所述触摸事件相关度最大的信息区块中的区块文本,并将所述区块文本按照预设格式转换为待播放文本,所述区块文本包括所述信息区块中显示于所述当前界面上的可视文本;

调用音频转换接口,以生成与所述待播放文本对应的音频文件;

从所述音频转换接口获取并播放所述音频文件。

本发明实施例的第二方面提供了一种终端设备,所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:

若终端设备的当前界面触发了触摸事件,获取与所述触摸事件相关度最大的信息区块,所述信息区块为所述当前界面中通过预设的超文本标记语言html划分标签对划分出的区块;

提取与所述触摸事件相关度最大的信息区块中的区块文本,并将所述区块文本按照预设格式转换为待播放文本,所述区块文本包括所述信息区块中显示于所述当前界面上的可视文本;

调用音频转换接口,以生成与所述待播放文本对应的音频文件;

从所述音频转换接口获取并播放所述音频文件。

本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:

若终端设备的当前界面触发了触摸事件,获取与所述触摸事件相关度最大的信息区块,所述信息区块为所述当前界面中通过预设的超文本标记语言html划分标签对划分出的区块;

提取与所述触摸事件相关度最大的信息区块中的区块文本,并将所述区块文本按照预设格式转换为待播放文本,所述区块文本包括所述信息区块中显示于所述当前界面上的可视文本;

调用音频转换接口,以生成与所述待播放文本对应的音频文件;

从所述音频转换接口获取并播放所述音频文件。

本发明实施例与现有技术相比存在的有益效果是:

本发明实施例在当前界面触发了触摸事件时,获取与触摸事件相关度最大的信息区块,并提取该信息区块中的文本作为区块文本,将区块文本按照预设格式转换为更易于理解的待播放文本,最后播放与待播放文本对应的音频文件,本发明实施例实现了将用户触摸的当前界面的内容转换为音频进行播放,基于语音转换技术提升了当前界面的交互效果以及对障碍人群的适用性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的基于语音转换的交互方法的实现流程图;

图2是本发明实施例二提供的基于语音转换的交互方法的实现流程图;

图3是本发明实施例三提供的基于语音转换的交互方法的实现流程图;

图4是本发明实施例四提供的基于语音转换的交互方法的实现流程图;

图5是本发明实施例五提供的基于语音转换的交互方法的实现流程图;

图6是本发明实施例六提供的一种预设格式的示意图;

图7是本发明实施例七提供的终端设备的结构框图;

图8是本发明实施例八提供的终端设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

图1示出了本发明实施例提供的基于语音转换的交互方法的实现流程,详述如下:

在s101中,若终端设备的当前界面触发了触摸事件,获取与所述触摸事件相关度最大的信息区块,所述信息区块为所述当前界面中通过预设的超文本标记语言html划分标签对划分出的区块。

当前界面是指终端设备上应用程序的运行界面,在用户使用应用程序的过程中,会对当前界面进行触摸操作,并且触摸的位置一般对应有用户欲获取的信息。在本发明实施例中,对当前界面进行检测,若终端设备的当前界面触发了触摸事件,则获取当前界面上与触摸事件相关度最大的信息区块。值得说明的是,当前界面为通过超文本标记语言(hypertextmarkuplanguage,html)5编写的界面,信息区块是当前界面的组成元素,是当前界面中通过预设的html划分标签对划分出的区块,为了便于进行阐述,以html划分标签对为<div>标签和</div>标签进行说明,但应获知的是,这并不构成对本发明实施例的限定,也即利用其它html标签对划分的信息区块也可应用在本实施例中。html标签是html中的基本单位,html标签的种类包括包括单html标签和html标签对,比如用于在应用界面添加图像的<img>标签为单html标签,在使用时单独使用,用于在应用界面添加超链接的<a>标签和</a>标签为html标签对,必须配对使用,<a>标签作为该html标签对的起始,</a>标签作为该html标签对的结束。在当前界面触发了触摸事件后,从当前界面的所有信息区块中确定与触摸事件相关度最大的信息区块,其中,由于触摸事件对应的触摸操作通常是一个区域,而并不仅限于一个点,故可获取触摸事件对应的触摸坐标集,并根据触摸坐标集来查找与触摸事件相关度最大的信息区块,具体内容在后文进行阐述。

可选地,通过执行touch事件检测当前界面的触摸事件,并获取与触摸事件对应的触摸坐标集。在本发明实施例中,可在应用程序中设置touch事件,在touch事件的执行过程中,检测当前界面上是否有触摸事件。并且,还可在touch事件内部预先设置区块确定机制,区块确定机制为当检测到触摸事件时,确定与触摸事件对应的触摸坐标集,并根据触摸坐标集确定与触摸事件相关度最大的信息区块,本发明实施例通过设置touch事件提升了触摸事件检测的准确性和及时性。

可选地,在touch事件内设置时间阈值,在touch事件的运行过程中,若检测到触摸时间达到时间阈值,则触发触摸事件。为了防止因误按当前界面导致触摸事件触发错误,本发明实施例在应用程序的touch事件内预设时间阈值,比如2秒。在touch事件的运行过程中,若检测到在当前界面的触摸时间未达到2秒时,则不触发触摸事件;若检测到触摸时间大于或等于2秒,则触发触摸事件,进一步提升了触发触摸事件的准确性。

在s102中,提取与所述触摸事件相关度最大的信息区块中的区块文本,并将所述区块文本按照预设格式转换为待播放文本,所述区块文本包括所述信息区块中显示于所述当前界面上的可视文本。

在确定出与触摸事件相关度最大的信息区块后,提取该信息区块内的区块文本,其中,区块文本为该信息区块中显示于当前界面的可视文本(即可视文本对外界是可视的)。具体地,对与触摸事件相关度最大的信息区块内的html标签进行识别,提取单html标签后的以及html标签对之间的可视文本。举例来说,与触摸事件相关度最大的信息区块的代码为:

<div>

<imgsrc=“xxx.jpg”>郁金香

<ahref="http://www.xxx.com.cn">网站指引</a>

</div>

在上述代码中,<img>标签为单html标签,提取到的该单html标签后的可视文本为“郁金香”,<a>和</a>为html标签对,提取到的该html标签对之间的可视文本为“网站指引”,故该信息区块的区块文本包括两个可视文本。在获取到区块文本后,如果区块文本仅包含一个可视文本,则可直接将该区块文本作为待播放文本,但由上所述,在实际应用场景中,区块文本很可能包括多个可视文本,如果简单地将区块文本直接作为待播放文本,则无法获知多个可视文本在信息区块内的顺序,交互效果差。故在本发明实施例中,将区块文本按照预设格式转换为待播放文本,其中,根据区块文本中多个可视文本的获取顺序,对每个可视文本都添加一个位置编号,预设格式可如图6所示,主要包括位置编号,另外图6中的n为大于零的整数。举例来说,与触摸事件相关度最大的信息区块的代码为:

<div>

<h1>郁金香</h1>

<h2>玫瑰</h2>

<h3>决明子</h3>

</div>

则按照代码顺序,获取的多个可视文本依次为“郁金香”、“玫瑰”和“决明子”,根据预设格式对包含多个可视文本的区块文本进行转换后,得到的待播放文本为“第一行:郁金香;第二行:玫瑰;第三行:决明子”,值得一提的是,在对多个可视文本添加上位置编号后,将添加完成的多个可视文本组合为单句文本,该单句文本即为待播放文本,便于后续进行播放。当然,预设格式并不限于图6所示,比如预设格式中的位置编号可以为一、二、三……等。此外,在根据预设格式对区块文本进行转换的过程中,根据区块文本中可视文本的数量自适应地调整位置编号的数量。

在s103中,调用音频转换接口,以生成与所述待播放文本对应的音频文件。

在本发明实施例中,在终端设备的应用程序中预先写入音频转换接口,该音频转换接口为第三方的文字转语音(texttospeech,tts)服务的应用程序编程接口。在得到待播放文本后,调用音频转换接口,并将待播放文本输入至音频转换接口对应的第三方的tts服务,使该tts服务生成与待播放文件对应的音频文件。

在s104中,从所述音频转换接口获取并播放所述音频文件。

在本发明实施例中,实时检测音频转换接口,并获取音频转换接口返回的音频文件。在获取到音频文件后,需要播放音频文件,其中,播放方式可以是在应用程序中预先设置用于播放的html标签对,并在接收到音频文件后,将音频文件的名称添加至该html标签对中,用于播放的html标签对可以为<embed></embed>标签对、<object></object>标签对、<audio></audio>标签对以及<a></a>标签对等。若用于播放的html标签对为<embed></embed>标签对或<audio></audio>标签对,则对应的用于播放音频文件的属性为src,添加完成的html标签对如<embedsrc="audio.mp3"></embed>;若用于播放的html标签对为<object></object>标签对,则对应的用于播放音频文件的属性为data,添加完成的html标签对如<objectdata="audio.mp3"></object>;若用于播放的html标签对为<a></a>标签对,则对应的用于播放音频文件的属性为herf,将音频文件的名称添加至该html标签对后,音频文件的名称实质上是作为一个超链接,比如<aherf="audio.mp3">示例</a>,在点击当前界面上的“示例”后,即可播放音频文件。在上述例子中,“audio.mp3”仅为音频文件的名称的示例。当然,在本发明实施例中,还可应用更多的播放方式。值得一提的是,本发明实施例中的属性为html属性,专门用于为html元素提供附件信息,如超链接。

通过图1所示实施例可知,在本发明实施例中,若终端设备的当前界面触发了触摸事件,获取与触摸事件相关度最大的信息区块,提取该信息区块中的区块文本,区块文本包括该信息区块中显示于当前界面上的可视文本,并将区块文本按照预设格式转换为待播放文本,为了使待播放文本能够被播放,调用音频转换接口,生成与待播放文本对应的音频文件,最后从音频转换接口获取并播放音频文件,提升了应用程序界面与用户之间的交互效果,并且通过语音播放提升了应用程序界面对障碍者的适用性。

图2所示,是在本发明实施例一的基础上,并在当前界面上与触摸事件相关的信息区块包括第一信息区块和第二信息区块的基础上,对获取与触摸事件相关度最大的信息区块的过程进行细化后得到的一种实现方法。本发明实施例提供了基于语音转换的交互方法的实现流程图,如图所示,该基于语音转换的交互方法可以包括以下步骤:

在s201中,获取所述触摸事件对应的触摸坐标集。

通常来说,当终端设备的当前界面的触摸事件触发时,触摸并不仅限于一个点,故在本发明实施例中,通过执行应用程序中的touch事件获取当前界面上与触摸事件对应的触摸坐标集。触摸坐标集中包括多个触摸坐标,多个触摸坐标可以为多个横坐标、多个纵坐标或多个横坐标与多个纵坐标的组合。获取到的触摸坐标的种类可以根据实际应用场景进行设定,如果是多个横坐标,则多个横坐标构成了触摸事件相对于终端设备的当前屏幕左边缘的横向坐标范围;如果是多个纵坐标,则构成了触摸事件相对于终端设备的当前屏幕上边缘的纵向坐标范围。

在s202中,获取所述第一信息区块对应的第一坐标集,并获取所述第二信息区块对应的第二坐标集。

在实际应用场景中,一个当前界面可能由多个信息区块组成,并且考虑到当前界面设计的美观性,不同信息区块之间的距离通常较近,即存在左右相隔和上下相隔两种情况,导致了在触摸事件触发后,触摸事件对应的触摸坐标集中的触摸坐标可能一部分落入第一信息区块,一部分落入第二信息区块,难以判别与触摸事件相关度最大的信息区块的情况。在本发明实施例中,获取第一信息区块对应的区块坐标集,作为第一坐标集,并获取第二信息区块对应的区块坐标集,作为第二坐标集。具体地,分别检测第一信息区块和第二信息区块内是否存在用于存放坐标的属性,如果存在,则从第一信息区块中该属性所属的html标签内该属性指示的位置(通常为该属性名称的冒号后)获取第一坐标集,从第二信息区块中该属性所属的html标签内该属性指示的位置获取第二坐标集。此外,在实际应用中,用于坐标的属性所指示的可能并不是坐标,而是比例系数(该比例系数的设置是为了使当前界面对不同尺寸的屏幕进行进行自适应),故在该情况下,获取第一信息区块或第二信息区块的比例系数后,获取终端设备的屏幕尺寸,根据屏幕尺寸和比例系数得到第一信息区块的第一坐标集或第二信息区块的第二坐标集。其中,根据比例系数得到的第一坐标集和第二坐标集可为具体的坐标数值,也可为坐标的数值范围,根据预设的比例系数的种类决定。

在s203中,根据所述触摸坐标集和所述第一坐标集计算所述触摸事件位于所述第一信息区块的第一触摸面积,并根据所述触摸坐标集和所述第二坐标集计算所述触摸事件位于所述第二信息区块的第二触摸面积。

在得到第一坐标集和第二坐标集后,将第一坐标集对应的坐标范围在触摸坐标集对应的坐标范围中的占比作为第一触摸面积,并将第二坐标集对应的坐标范围在触摸坐标集对应的坐标范围中的占比作为第二触摸面积。为了便于说明,假设触摸坐标集仅包括多个横坐标,分别为2px、4px,6px,则对应的坐标范围为2px至6px,第一坐标集仅包括一个横向的坐标范围,为4px至7px,则可计算出第一触摸面积为(6px-4px)/(6px-2px)=50%,上述的px为html语言中的长度单位。

在s204中,若所述第一触摸面积大于或等于所述第二触摸面积,则将所述第一信息区块输出为与所述触摸事件相关度最大的信息区块;若所述第二触摸面积大于所述第一触摸面积,则将所述第二信息区块输出为与所述触摸事件相关度最大的信息区块。

在本发明实施例中,可将第一触摸面积和第二触摸面积分别作为第一信息区块与触摸事件的相关度和第二信息区块与触摸事件的相关度,若第一触摸面积大于或等于第二触摸面积,则将第一信息区块输出为与触摸事件相关度最大的信息区块;若第二触摸面积大于第一触摸面积,则将第二信息区块输出为与触摸事件相关度最大的信息区块。

通过图2所示实施例可知,在本发明实施例中,在与触摸事件相关的信息区块包括第一信息区块和第二信息区块的基础上,根据触摸事件对应的触摸坐标集和第一信息区块对应的第一坐标集计算出第一触摸面积,根据触摸坐标集和第二信息区块对应的第二坐标集计算出第二触摸面积,若第一触摸面积大于或等于第二触摸面积,则将第一信息区块输出为与触摸事件相关度最大的信息区块;若第二触摸面积大于第一触摸面积,则将第二信息区块输出为与触摸事件相关度最大的信息区块,提升了对与触摸事件相关度最大的信息区块进行确定的准确性。

图3所示,是在本发明实施例一的基础上,对判断是否执行获取与触摸事件相关度最大的信息区块的操作的过程进行细化后得到的一种实现方法。本发明实施例提供了基于语音转换的交互方法的实现流程图,如图所示,该基于语音转换的交互方法可以包括以下步骤:

在s301中,获取与所述触摸事件对应的触摸坐标集,并确定与所述触摸坐标集相关的信息区块。

在本发明实施例中,首先获取与触摸事件对应的触摸坐标集,同样地,可通过执行应用程序中预设的touch事件进行获取。并且,获取当前界面上所有信息区块对应的区块坐标集,并确定与触摸坐标集存在重合的区块坐标集,重合是指触摸坐标集与区块坐标集存在相同的坐标或者存在部分相同的坐标范围。在查找出与触摸坐标集存在重合的区块坐标集后,确定该区块坐标集对应的信息区块,作为与触摸坐标集相关的信息区块。

在s302中,若与所述触摸坐标集相关的信息区块的个数大于预设阈值,则输出重新触摸的提示;若与所述触摸坐标集相关的信息区块的个数小于或等于预设阈值,则执行所述获取与所述触摸事件相关度最大的信息区块的操作。

根据与触摸坐标集相关的信息区块的个数进行判断,如果该个数大于预设阈值,证明触摸事件同时发生在当前界面的多个位置,很大可能是由误触产生,则不执行后续的提取区块文本及转换音频等操作,而是直接输出重新触摸的提示;如果该个数小于或等于预设阈值,则认定触摸事件为正常,执行后续的获取与触摸事件相关度最大的信息区块的操作。

通过图3所示实施例可知,在本发明实施例中,获取与触摸事件对应的触摸坐标集,并确定与触摸坐标集相关的信息区块,若相关的信息区块的个数大于预设阈值,则输出重新触摸的提示;若相关的信息区块的个数小于或等于预设阈值,则执行获取与触摸事件相关度最大的信息区块的操作,本发明实施例实则是对是否误触进行检测,防止了资源浪费。

图4所示,是在本发明实施例一的基础上,对提取与触摸事件相关度最大的信息区块中的区块文本,并将区块文本按照预设格式转换为待播放文本的过程进行细化后得到的一种实现方法。本发明实施例提供了基于语音转换的交互方法的实现流程图,如图4所示,该基于语音转换的交互方法可以包括以下步骤:

在s401中,确定与所述触摸事件相关度最大的信息区块中的所述可视文本,识别所述可视文本所在的html标签,并判断所述html标签内是否存在不可视属性,所述不可视属性指示所述html标签内存在不可视文本。

在本发明实施例中,在查找出与触摸事件相关度最大的信息区块中的可视文本后,确定可视文本所在的html标签,并判断在html标签的内部是否存在不可视属性,该不可视属性是预先自定义的,用于指示html标签内存在不可视文本的属性。为了便于说明,假设不可视的属性的名称为invi。

在s402中,若所述html标签内存在所述不可视属性,则获取所述html标签内的所述不可视文本,基于所述可视文本和所述不可视文本生成所述区块文本,并将所述区块文本按照所述预设格式转换为所述待播放文本。

如果html标签内部存在不可视属性,则获取html标签内部不可视属性所指示的不可视文本。举例来说,与所述触摸事件相关度最大的信息区块的代码如下:

<div>

<imgsrc=“xxx.jpg”invi=“一种花朵”>郁金香

<ahref=“http://www.xxx.com.cn”invi=“再次点击可进入介绍网站”>网站指引</a>

<imgsrc=“xxx2.jpg”>决明子

</div>

获取的该信息区块中的可视文本包括“郁金香”、“网站指引”和“决明子”,但是只有“郁金香”和“网站指引”的可视文本对应的html标签,即<img>标签和<a></a>标签对内存在不可视属性invi,则只获取<img>标签内invi属性所指示的不可视文本“一种花朵”以及<a></a>标签对内invi属性所指示的不可视文本“再次点击可进入介绍网站”。对于可视文本“决明子”所在的html标签,由于该html标签对内并不存在不可视属性,则并不在该html标签对内执行获取不可视文本的操作。

在获取到不可视文本后,基于不可视文本和可视文本生成区块文本(其中将同一个html标签对应的不可视文本和可视文本归为一组),并按照预设格式将区块文本转换为待播放文本。若是在上述例子的基础上按照如图6所示的预设格式进行转换,则转换出的待播放文本为“第一行:郁金香,一种花朵;第二行,网站指引,再次点击可进入介绍网站;第三行:决明子”。值得一提的是,在将同一个html标签对应的不可视文本和可视文本作为一组添加至区块文本时,可根据实际应用场景调整该组内不可视文本和可视文本的顺序,比如可以为“郁金香,一种花朵”或者“一种花朵,郁金香”。

通过图4所示实施例可知,在本发明实施例中,确定与触摸事件相关度最大的信息区块中的可视文本,识别可视文本所在的html标签,并判断该html标签内是否存在不可视属性,若该html标签内存在不可视属性,则获取该html标签内不可视属性所指示的不可视文本,基于可视文本和不可视文本生成区块文本,并将区块文本按照预设格式转换为待播放文本,本发明实施例通过获取不可视文本,并基于不可视文本和可视文本生成区块文本,便于用户更多地获知信息区块的内容,进一步提升了交互效果。

图5所示,是在本发明实施例一的基础上,对获取与触摸事件相关度最大的信息区块之后判断是否执行音频转换的过程进行细化后得到的一种实现方法。本发明实施例提供了基于语音转换的交互方法的实现流程图,如图5所示,该基于语音转换的交互方法可以包括以下步骤:

在s501中,识别与所述触摸事件相关度最大的信息区块中的音频转换属性,所述音频转换属性用于指示与所述信息区块是否支持音频转换。

在确定与触摸事件相关度最大的信息区块后,识别该信息区块中html标签内的音频转换属性,该音频转换属性同样也为自定义的属性,用于指示该信息区块是否支持音频转换。根据实际应用场景,可预先制定只识别信息区块内html划分标签对内的音频转换属性或者识别信息区块内所有html标签内的音频转换属性,针对前一种方式,识别到的html划分标签对内的音频转换属性的对象是整个信息区块,针对后一种方式,识别到的某个html标签(除了html划分标签对)内的音频转换属性的对象是该html标签,即只针对该html标签的内容进行音频转换。

在s502中,若所述音频转换属性指示所述信息区块不支持音频转换,则停止执行后续操作,并输出重新触摸的提示。

为了便于说明,假设音频转换属性的名称为trans,并且假设如果音频转换属性后的内容为true,则该信息区块不支持音频转换;如果音频转换属性后的内容为false,则该信息区块支持音频转换。举例来说,与触摸事件相关度最大的信息区块的代码为:

<divtrans=“true”>

<imgsrc=“xxx.jpg”invi=“一种花朵”>郁金香

<ahref=“http://www.xxx.com.cn”invi=“再次点击可进入介绍网站”>网站指引</a>

<imgsrc=“xxx2.jpg”>决明子

</div>

则该信息区块内的音频转换属性指示信息区块支持音频转换,则继续执行提取与触摸事件相关度最大的信息区块中的区块文本及后续的操作。相反,如果音频转换属性指示信息区块不支持音频转换,则停止执行后续操作,并输出重新触摸的提示。

通过图5所示实施例可知,在本发明实施例中,识别与触摸事件相关度最大的信息区块中的音频转换属性,若音频转换属性指示信息区块不支持音频转换,则停止执行后续操作,并输出重新触摸的提示,本发明实施例通过识别音频转换属性并在信息区块不支持音频转换的情况下提示重新触摸,使得在编写当前界面时可自由决定将哪些信息区块作为可以进行音频转换的信息区块,降低了开发难度,并且提升了对当前界面使用者的用户体验。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

图7示出了本发明实施例提供的终端设备的结构框图,该终端设备包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1与图1所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。

参见图7,所述终端设备包括:

获取单元71,用于若终端设备的当前界面触发了触摸事件,获取与所述触摸事件相关度最大的信息区块,所述信息区块为所述当前界面中通过预设的超文本标记语言html划分标签对划分出的区块;

转换单元72,用于提取与所述触摸事件相关度最大的信息区块中的区块文本,并将所述区块文本按照预设格式转换为待播放文本,所述区块文本包括所述信息区块中显示于所述当前界面上的可视文本;

调用单元73,用于调用音频转换接口,以生成与所述待播放文本对应的音频文件;

播放单元74,用于从所述音频转换接口获取并播放所述音频文件。

可选地,所述当前界面上与所述触摸事件相关的信息区块包括第一信息区块和第二信息区块,所述获取单元71,包括:

坐标集获取单元,用于获取所述触摸事件对应的触摸坐标集;

区块坐标集获取单元,用于获取所述第一信息区块对应的第一坐标集,并获取所述第二信息区块对应的第二坐标集;

计算单元,用于根据所述触摸坐标集和所述第一坐标集计算所述触摸事件位于所述第一信息区块的第一触摸面积,并根据所述触摸坐标集和所述第二坐标集计算所述触摸事件位于所述第二信息区块的第二触摸面积;

输出单元,用于若所述第一触摸面积大于或等于所述第二触摸面积,则将所述第一信息区块输出为与所述触摸事件相关度最大的信息区块;若所述第二触摸面积大于所述第一触摸面积,则将所述第二信息区块输出为与所述触摸事件相关度最大的信息区块。

可选地,所述获取单元71,还包括:

确定单元,用于获取与所述触摸事件对应的触摸坐标集,并确定与所述触摸坐标集相关的信息区块;

判断单元,用于若与所述触摸坐标集相关的信息区块的个数大于预设阈值,则输出重新触摸的提示;若与所述触摸坐标集相关的信息区块的个数小于或等于预设阈值,则执行所述获取与所述触摸事件相关度最大的信息区块的操作。

可选地,所述转换单元72,包括:

识别单元,用于确定与所述触摸事件相关度最大的信息区块中的所述可视文本,识别所述可视文本所在的html标签,并判断所述html标签内是否存在不可视属性,所述不可视属性指示所述html标签内存在不可视文本;

转换子单元,用于若所述html标签内存在所述不可视属性,则获取所述html标签内的所述不可视文本,基于所述可视文本和所述不可视文本生成所述区块文本,并将所述区块文本按照所述预设格式转换为所述待播放文本。

可选地,所述获取单元71,还包括:

属性识别单元,用于识别与所述触摸事件相关度最大的信息区块中的音频转换属性,所述音频转换属性用于指示与所述信息区块是否支持音频转换;

停止执行单元,用于若所述音频转换属性指示所述信息区块不支持音频转换,则停止执行后续操作,并输出重新触摸的提示。

因此,本发明实施例提供的终端设备通过将当前界面上与触摸事件相关的内容转换为音频进行播放,提升了当前界面的交互效果。

图8是本发明实施例提供的终端设备的示意图。如图8所示,该实施例的终端设备8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82,例如基于语音转换的交互程序。所述处理器80执行所述计算机程序82时实现上述各个基于语音转换的交互方法实施例中的步骤,例如图1所示的步骤s101至s104。或者,所述处理器80执行所述计算机程序82时实现上述各终端设备实施例中各单元的功能,例如图7所示单元71至74的功能。

示例性的,所述计算机程序82可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器81中,并由所述处理器80执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述终端设备8中的执行过程。例如,所述计算机程序82可以被分割成获取单元、转换单元、调用单元和播放单元,各单元具体功能如下:

获取单元,用于若终端设备的当前界面触发了触摸事件,获取与所述触摸事件相关度最大的信息区块,所述信息区块为所述当前界面中通过预设的超文本标记语言html划分标签对划分出的区块;

转换单元,用于提取与所述触摸事件相关度最大的信息区块中的区块文本,并将所述区块文本按照预设格式转换为待播放文本,所述区块文本包括所述信息区块中显示于所述当前界面上的可视文本;

调用单元,用于调用音频转换接口,以生成与所述待播放文本对应的音频文件;

播放单元,用于从所述音频转换接口获取并播放所述音频文件。

所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的示例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器80可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81可以是所述终端设备8的内部存储单元,例如终端设备6的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将所述终端设备的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1