调整音频单元的方法和装置与流程

文档序号：15848788发布日期：2018-11-07 09:30阅读：268来源：国知局

本发明涉及网络技术领域，特别涉及一种调整音频单元的方法和装置。

背景技术

网页视频播放器具有易分享、无需额外安装视频软件等优点，因此越来越受欢迎。网页视频播放器可以具备观看视频和直播的功能。

当用户通过网页视频播放器观看视频直播时，由于网络不稳定等原因，可能导致传输的视频单元或音频单元丢失的现象。当发生视频单元或音频单元丢失事件时，由于缺失了部分视频单元或音频单元，导致原本相对应的视频单元和音频单元变得不对应，导致出现视频单元与音频单元不同步的问题。

技术实现要素：

为了解决现有技术的问题，本发明实施例提供了一种调整音频单元的方法和装置。所述技术方案如下：

第一方面，提供了一种调整音频单元的方法，所述方法包括：

确定连续接收的目标直播视频的第一音频单元和第二音频单元之间是否丢失音频单元，其中，所述第一音频单元是在接收所述第二音频单元之前接收的音频单元；

如果所述第一音频单元与所述第二音频单元之间丢失音频单元，则确定所述第一音频单元的播放结束时间点；

在所述第一音频单元和所述第二音频单元之间添加静音音频单元，其中，所述静音音频单元的播放起始时间点为所述第一音频单元的播放结束时间点，所述静音音频单元不包含采样数据。

可选地，所述确定连续接收的所述目标直播视频的第一音频单元和第二音频单元之间是否丢失音频单元，包括：

计算连续接收的所述目标直播视频的第一音频单元与第二音频单元之间的播放起始时间点的差值；

如果所述差值大于所述第一音频单元的播放持续时长，则确定所述第一音频单元与所述第二音频单元之间丢失音频单元。

可选地，所述确定所述第一音频单元的播放结束时间点，包括：

计算所述第一音频单元的播放起始时间点与所述播放持续时长相加后得到的时间点，将所述时间点确定为所述第一音频单元的播放结束时间点。

可选地，所述方法还包括：

当到达所述静音音频单元的播放起始时间点时，开始播放所述静音音频单元；

当到达所述第二音频单元的播放起始时间点时，结束播放所述静音音频单元，并开始播放所述第二音频单元。

可选地，所述方法还包括：

获取连续接收的所述目标直播视频的第一视频单元和第二视频单元的播放起始时间点，其中，所述第一视频单元是在接收第二视频单元之前接收的视频单元；

确定所述第二视频单元的播放起始时间点与所述第一视频单元的播放起始时间点之间的间隔时长；

将所述第一视频单元的播放持续时长调整为所述间隔时长。

第二方面，提供了一种调整音频单元的装置，所述装置包括：

确定模块，用于确定连续接收的目标直播视频的第一音频单元和第二音频单元之间是否丢失音频单元，其中，所述第一音频单元是在接收所述第二音频单元之前接收的音频单元；

确定模块，还用于如果所述第一音频单元与所述第二音频单元之间丢失音频单元，则确定所述第一音频单元的播放结束时间点；

添加模块，用于在所述第一音频单元和所述第二音频单元之间添加静音音频单元，其中，所述静音音频单元的播放起始时间点为所述第一音频单元的播放结束时间点，所述静音音频单元不包含采样数据。

可选地，所述确定模块，用于：

计算连续接收的所述目标直播视频的第一音频单元与第二音频单元之间的播放起始时间点的差值；

如果所述差值大于所述第一音频单元的播放持续时长，则确定所述第一音频单元与所述第二音频单元之间丢失音频单元。

可选地，所述确定模块，用于：

计算所述第一音频单元的播放起始时间点与所述播放持续时长相加后得到的时间点，将所述时间点确定为所述第一音频单元的播放结束时间点。

可选地，所述装置还包括：

播放模块，用于当到达所述静音音频单元的播放起始时间点时，开始播放所述静音音频单元；

播放模块，还用于当到达所述第二音频单元的播放起始时间点时，结束播放所述静音音频单元，并开始播放所述第二音频单元。

可选地，所述装置还包括：

获取模块，用于获取连续接收的所述目标直播视频的第一视频单元和第二视频单元的播放起始时间点，其中，所述第一视频单元是在接收第二视频单元之前接收的视频单元；

确定模块，还用于确定所述第二视频单元的播放起始时间点与所述第一视频单元的播放起始时间点之间的间隔时长；

调整模块，用于将所述第一视频单元的播放持续时长调整为所述间隔时长。

第三方面，提供了一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述第一方面所述的调整音频单元的方法。

第四方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述第一方面所述的调整音频单元的方法。

本发明实施例提供的技术方案带来的有益效果至少包括：

本发明实施例中，当确定连续接收的目标直播视频的两个音频单元之间丢失音频单元时，通过添加一个不包含采样数据的静音音频单元，代替丢失的音频单元，使第一音频单元和第二音频单元都能按照各自的播放起始时间点连续播放，避免了由于丢失音频单元而导致视频单元和音频单元变得不对应的问题，解决了有可能出现的视频单元与音频单元不同步的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种调整音频单元的方法的流程图；

图2是本发明实施例提供的一种调整音频单元的结构图；

图3是本发明实施例提供的一种调整音频单元的装置的结构示意图；

图4是本发明实施例提供的一种调整音频单元的装置的结构示意图；

图5是本发明实施例提供的一种调整音频单元的装置的结构示意图；

图6是本发明实施例提供的一种终端结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种调整音频单元的方法，该方法可以由终端实现。其中，该终端是安装有浏览器、且可以通过浏览器进行网络数据传输的终端。

终端可以包括处理器、存储器、屏幕等部件。处理器，可以为cpu(centralprocessingunit，中央处理单元)等，可以用于确定两个音频单元之间是否丢失音频单元、确定音频单元的播放结束时间点、添加静音音频单元等处理。存储器，可以为ram(randomaccessmemory，随机存取存储器)，flash(闪存)等，可以用于存储接收到的数据、处理过程所需的数据、处理过程中生成的数据等，如第一音频单元、第二音频单元、第一音频单元的播放起始时间点、第二音频单元的播放起始时间点、音频单元的播放持续时长、静音音频单元等。屏幕可以用于显示直播视频以及用户界面等。终端还可以包括收发器、图像检测部件、音频输出部件和音频输入部件等。收发器，可以用于与其它设备进行数据传输，例如，接收服务器发送的音频单元和视频单元，可以包括天线、匹配电路、调制解调器等。图像检测部件可以是摄像头等。音频输出部件可以是音箱、耳机等。音频输入部件可以是麦克风等。

如图1所示，该方法的处理流程可以包括如下的步骤：

在步骤101中，确定连续接收的目标直播视频的第一音频单元和第二音频单元之间是否丢失音频单元。

其中，第一音频单元是在接收第二音频单元之前接收的音频单元。音频单元是webhtml5浏览器可以识别并播放的音频容器格式，如fmp4等。

一个可能的实施例中，html5是指万维网(即web)的核心语言、标准通用标记语言下的一个应用超文本标记语言(即html)经过第五次重大修改后确定的应用超文本标记语言，由于具备设备兼容性、支持多设备跨平台等优点，成为目前网络开发的重点研究对象。基于html5的网页直播播放器由于无需额外安装直播应用程序的优点，很受用户的欢迎。

针对于音频来说，当用户想要通过终端(可称为观看终端)上的网页观看直播时，用户打开网页上的直播界面，进入相应的直播房间，用户使用的终端向服务器发送直播视频获取请求，该直播视频获取请求中携带有直播房间标识。服务器接收到终端发送的直播视频获取请求时，根据直播视频获取请求中的直播房间标识，确定该终端请求的直播视频对应的终端(可称为直播终端)的设备标识。然后，当直播终端对应的播主进行直播时，直播终端将通过音频输入部件采集到的音频单元上传到服务器。服务器接收到音频单元后，分别确定每个音频单元的播放持续时长，由于格式相同，各个音频单元的播放持续时长相同。

然后，服务器根据观看终端的直播视频获取请求，对音频单元确定播放起始时间点。需要说明的是，音频单元的播放起始时间点可以不是实际的时间点，而是根据音频单元的播放顺序重新确定的播放时间点，比如，观看终端向服务器第一次发送直播视频获取请求时，也就是服务器向观看终端发送第1个音频单元之前，服务器将第1个音频单元的播放起始时间点确定为00:00:00.000，假设每个音频单元的播放持续时长为46ms，则服务器将第2个音频单元的播放起始时间点确定为00:00:00.046，将第3个音频单元的播放起始时间点确定为00:00:00.138，以此类推。

观看终端接收到服务器发送的音频单元以及音频单元的播放起始时间点和播放持续时长时，将音频单元添加到音频缓冲队列中。如果在音频缓冲队列中，有音频单元(可称为第一音频单元)排在新添加的音频单元(可称为第二音频单元)前边，则根据第一音频单元的播放起始时间点、第二音频单元的播放起始时间点以及音频单元的播放持续时长，检测第一音频单元与第二音频单元之间是否丢失音频单元。

可选地，上述检测第一音频单元与第二音频单元之间是否丢失音频单元的方法可以如下：计算连续接收的目标直播视频的第一音频单元与第二音频单元之间的播放起始时间点的差值；如果差值大于第一音频单元的播放持续时长，则确定第一音频单元与第二音频单元之间丢失音频单元。

一个可能的实施例中，观看终端计算第一音频单元与第二音频单元之间的播放起始时间点的差值，将得到的差值与音频单元的播放持续时长进行比较，如果得到的差值大于音频单元的播放持续时长，说明按照第一音频单元的播放起始时间点播放第一音频单元后，在按照第二音频单元的播放起始时间点播放第二音频单元之前，会出现一段没有音频单元的空档，这说明第一音频单元与第二音频单元之间丢失了至少一个音频单元。举例来说，假设第一音频单元的播放起始时间点为00:00:00.046，第二音频单元的播放起始时间点为00:00:00.184，每个音频单元的播放持续时长为46ms，则在检测第一音频单元与第二音频单元之间是否丢失音频单元时，计算00:00:00.184与00:00:00.046之间的差值，得到差值为138ms，将138ms与音频单元的播放持续时长46ms进行比较，得到的比较结果为差值大于音频单元的播放持续时长，说明当第一音频单元播放结束后，00:00:00.092-00:00:00.184之间没有音频单元可以播放，进而可以确定，第一音频单元与第二音频单元之间丢失了至少一个音频单元。

如果得到的差值等于音频单元的播放持续时长，说明按照第一音频单元的播放起始时间点播放第一音频单元后，紧接着可以按照第二音频单元的播放起始时间点播放第二音频单元，中间没有空档，因此可以确定第一音频单元与第二音频单元之间没有丢失音频单元。

如果得到的差值小于音频单元的播放持续时长，按正常来说是不会出现这种情况的，如果出现了，说明第一音频单元的播放起始时间点或第二音频单元的播放起始时间点出现错误，可以根据第一音频单元的前一个音频单元的播放起始时间点以及播放持续时间，确定是第一音频单元的播放起始时间点出现错误还是第二音频单元的播放起始时间点出现错误。确定后，可以对错误的音频单元的播放起始时间点进行更正，或将出现错误的音频单元舍弃，该处理方式可以由技术人员进行设定，本发明在此不做限定。

在步骤102中，如果第一音频单元与第二音频单元之间丢失音频单元，则确定第一音频单元的播放结束时间点。

一个可能的实施例中，通过上述步骤确定第一音频单元与第二音频单元之间丢失音频单元后，根据第一音频单元的播放起始时间点以及音频单元的播放持续时长，确定第一音频单元的播放结束时间点。

可选地，上述确定第一音频单元的播放结束时间点的方法可以如下：计算第一音频单元的播放起始时间点与播放持续时长相加后得到的时间点，将时间点确定为第一音频单元的播放结束时间点。

一个可能的实施例中，观看终端计算第一音频单元的播放起始时间点与播放持续时长的加和，得到一个时间点，该时间点为第一音频单元自播放起始时间点开始播放后，持续了播放持续时长后停止的时间点，即为第一音频单元的播放结束时间点。

在步骤103中，在第一音频单元和第二音频单元之间添加静音音频单元。

其中，静音音频单元的播放起始时间点为第一音频单元的播放结束时间点，静音音频单元不包含采样数据。

一个可能的实施例中，通过上述步骤确定第一音频单元的播放结束时间点后，观看终端生成一个静音音频单元，将静音音频单元放置在音频缓冲队列中第一音频单元与第二音频单元中间的位置。

需要说明的是，上述音频单元可以是fmp4(fragmentedmp4，碎片式动态图像专家组)格式的音频单元。fmp4文件是由box为基本单元构成的，这些box既可以包括data(即为数据)，也可以包括metadata(即为元数据，用于描述数据的属性信息)。fmp4文件中有一种非常重要的box，为moofbox(moviefragmentbox，一种描述音频单元的属性信息的数据单元)，其结构如图2所示，每个音频单元都存有一个该类型的box。moofbox存放的是音频单元的metadata信息，用于描述每个音频单元的属性信息。moofbox中子单元包括trafbox(trackfragmentbox，一种存放采样集合的配置信息的数据单元)，trafbox用于存放采样集合的配置信息，包括播放起始时间点以及播放持续时长等信息。trafbox中包括tfhdbox(trackfragmentheaderbox，一种描述采样集合类型的数据单元)以及tfdtbox(trackfragmentdecodetimebox，一种描述采样集合中首个采样数据的播放起始时间点的数据单元)。

tfhdbox中有一个duration字段，该字段可以表示该音频单元中是否有采样数据。静音音频单元的duration字段被设置为空，即表示静音音频字段中没有采样数据，则播放该静音音频单元时是没有声音的，起到了静音的作用。tfdtbox中包含一个basemediadecodetime字段，用于设置采样数据的播放起始时间点，静音音频单元中的basemediadecodetime字段被设置为上述第一音频单元的播放结束时间点，即第一音频单元播放后开始播放静音音频单元。这样，第一音频单元与第二音频单元之间丢失的音频单元用静音音频单元填充，就可以使第一音频单元与第二音频单元正常播放。

可选地，添加静音音频单元后，播放音频单元的处理过程可以如下：当到达静音音频单元的播放起始时间点时，开始播放静音音频单元；当到达第二音频单元的播放起始时间点时，结束播放静音音频单元，并开始播放第二音频单元。

一个可能的实施例中，在第一音频单元与第二音频单元之间添加静音音频单元之后，当达到第一音频单元的播放起始时间点时，从音频缓存队列中加载第一音频单元进行播放，直到播放持续时长后，第一音频单元停止播放。观看终端读取到静音音频单元的duration字段为空，且basemediadecodetime为第一音频单元的播放结束时间点，即静音音频单元的播放起始时间点为第一音频单元的播放结束时间点，这样，当第一音频单元停止播放时，观看终端读取并播放静音音频单元，直到到达第二音频单元的播放起始时间点时，播放第二音频单元，静音音频单元自动停止播放。

这样就解决了由于第一音频单元与第二音频单元之间丢失音频单元，而导致第二音频单元不能按照播放起始时间点正常播放的问题，进而，可以避免视频单元和音频单元不对应的问题，使用户观看直播的体验更好。

可选地，上述方案用于解决由于音频单元丢失而导致视频单元与音频单元不对应的问题，除此之外，还可以通过调整视频单元的播放持续时长的方案，来解决由于视频单元丢失而导致视频单元与音频单元不对应的问题，相应的处理步骤可以如下：获取连续接收的目标直播视频的第一视频单元和第二视频单元的播放起始时间点，其中，第一视频单元是在接收第二视频单元之前接收的视频单元；确定第二视频单元的播放起始时间点与第一视频单元的播放起始时间点之间的间隔时长；将第一视频单元的播放持续时长调整为间隔时长。

一个可能的实施例中，针对于视频来说，当用户想要通过观看终端上的网页观看直播时，用户打开网页上的直播界面，进入相应的直播房间，用户使用的终端向服务器发送直播视频获取请求，该直播视频获取请求中携带有直播房间标识。服务器接收到终端发送的直播视频获取请求时，根据直播视频获取请求中的直播房间标识，确定该终端请求的直播视频对应的直播终端的设备标识。然后，当直播终端对应的播主进行直播时，直播终端将通过图像检测部件采集到的视频单元上传到服务器。服务器接收到视频单元后，分别确定每个视频单元的播放持续时长，由于格式相同，各个视频单元的播放持续时长相同。

然后，服务器根据观看终端的直播视频获取请求，对视频单元确定播放起始时间点。需要说明的是，视频单元的播放起始时间点可以不是实际的时间点，而是根据视频单元的播放顺序重新确定的播放时间点，比如，观看终端向服务器第一次发送直播视频获取请求时，也就是服务器向观看终端发送第1个视频单元之前，服务器将第1个视频单元的播放起始时间点确定为00:00:00.000，假设每个视频单元的播放持续时长为60ms，则服务器将第2个视频单元的播放起始时间点确定为00:00:00.060，将第3个视频单元的播放起始时间点确定为00:00:00.120，以此类推。

需要说明的是，上述直播终端向服务器发送音频单元以及视频单元的过程中，可以是音频单元与视频单元交替发送，也可以是音频单元与视频单元同时发送，具体发送方式取决于服务器的承载能力以及当前的网络状态，本发明对此不做限制。同理，服务器向观看终端发送音频单元以及视频单元的过程中，可以是音频单元与视频单元交替发送，也可以是音频单元与视频单元同时发送。

观看终端接收到服务器发送的视频单元以及视频单元的播放起始时间点和播放持续时长时，将视频单元添加到视频缓冲队列中。如果在视频缓冲队列中，有视频单元(可称为第一视频单元)排在新添加的视频单元(可称为第二视频单元)前边，则确定第一视频单元的播放起始时间点以及第二视频单元的播放起始时间点，并计算两个播放起始时间点的差值，即为第二视频单元的播放起始时间点与第一视频单元的播放起始时间点之间的间隔时长。

然后将第一视频单元的播放持续时长调整为计算得到的间隔时长。举例来说，观看终端接收到服务器发送的第二视频单元后，将第二视频单元添加到视频缓存队列中，当观看终端检测到排在第二视频单元前边的第一视频单元时，观看终端获取第一视频单元的播放起始时间点为00:00:00.060，以及第二视频单元的播放起始时间点为00:00:00.180，则计算两个播放起始时间点的差值为120ms，则将第一视频单元的播放持续时长调整为120ms。如果后续新接收到一个视频单元，则根据新接收到的视频单元，调整第二视频单元的播放持续时长。

通过这样的方式，无需判断两个视频单元之间是否丢失视频单元，都可以使视频缓存队列中的视频单元按照各自的播放起始时间点连续播放，解决了由于丢失视频单元导致视频单元与音频单元不对应的问题，使用户观看直播的体验更好。

基于相同的技术构思，本发明实施例还提供了一种调整音频单元的装置，该装置可以为上述实施例中的观看终端，如图3所示，该装置包括：确定模块310和添加模块320。

该确定模块310，被配置为确定连续接收的目标直播视频的第一音频单元和第二音频单元之间是否丢失音频单元，其中，所述第一音频单元是在接收所述第二音频单元之前接收的音频单元；

该确定模块310，还被配置为如果所述第一音频单元与所述第二音频单元之间丢失音频单元，则确定所述第一音频单元的播放结束时间点；

该添加模块320，被配置为在所述第一音频单元和所述第二音频单元之间添加静音音频单元，其中，所述静音音频单元的播放起始时间点为所述第一音频单元的播放结束时间点，所述静音音频单元不包含采样数据。

可选地，所述确定模块310，被配置为：

计算连续接收的所述目标直播视频的第一音频单元与第二音频单元之间的播放起始时间点的差值；

如果所述差值大于所述第一音频单元的播放持续时长，则确定所述第一音频单元与所述第二音频单元之间丢失音频单元。

可选地，所述确定模块310，被配置为：

计算所述第一音频单元的播放起始时间点与所述播放持续时长相加后得到的时间点，将所述时间点确定为所述第一音频单元的播放结束时间点。

可选地，如图4所示，所述装置还包括：

播放模块330，被配置为当到达所述静音音频单元的播放起始时间点时，开始播放所述静音音频单元；

播放模块330，还被配置为当到达所述第二音频单元的播放起始时间点时，结束播放所述静音音频单元，并开始播放所述第二音频单元。

可选地，如图5所示，所述装置还包括：

获取模块340，被配置为获取连续接收的所述目标直播视频的第一视频单元和第二视频单元的播放起始时间点，其中，所述第一视频单元是在接收第二视频单元之前接收的视频单元；

确定模块310，还被配置为确定所述第二视频单元的播放起始时间点与所述第一视频单元的播放起始时间点之间的间隔时长；

调整模块350，被配置为将所述第一视频单元的播放持续时长调整为所述间隔时长。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

需要说明的是：上述实施例提供的调整音频单元的装置在调整音频单元时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的调整音频单元的装置与调整音频单元的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图6是本发明实施例提供的一种终端的结构框图。该终端600可以是便携式移动终端，比如：智能手机、平板电脑。终端600还可能被称为用户设备、便携式终端等其他名称。

通常，终端600包括有：处理器601和存储器602。

处理器601可以包括一个或多个处理核心，比如4核心处理器、6核心处理器等。处理器601可以采用dsp(digitalsignalprocessing，数字信号处理)、fpga(field－programmablegatearray，现场可编程门阵列)、pla(programmablelogicarray，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(centralprocessingunit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器601可以在集成有gpu(graphicsprocessingunit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器601还可以包括ai(artificialintelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。

存储器602可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是有形的和非暂态的。存储器602还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器601所执行以实现本申请中提供的调整音频单元的方法。

在一些实施例中，终端600还可选包括有：外围设备接口603和至少一个外围设备。具体地，外围设备包括：射频电路604、触摸显示屏605、摄像头606、音频电路607、定位组件608和电源609中的至少一种。

外围设备接口603可被用于将i/o(input/output，输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中，处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上；在一些其他实施例中，处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路604用于接收和发射rf(radiofrequency，射频)信号，也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路604包括：天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wirelessfidelity，无线保真)网络。在一些实施例中，射频电路604还可以包括nfc(nearfieldcommunication，近距离无线通信)有关的电路，本申请对此不加以限定。

触摸显示屏605用于显示ui(userinterface，用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。触摸显示屏605还具有采集在触摸显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。触摸显示屏605用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，触摸显示屏605可以为一个，设置终端600的前面板；在另一些实施例中，触摸显示屏605可以为至少两个，分别设置在终端600的不同表面或呈折叠设计；在再一些实施例中，触摸显示屏605可以是柔性显示屏，设置在终端600的弯曲表面上或折叠面上。甚至，触摸显示屏605还可以设置成非矩形的不规则图形，也即异形屏。触摸显示屏605可以采用lcd(liquidcrystaldisplay，液晶显示器)、oled(organiclight-emittingdiode,有机发光二极管)等材质制备。

摄像头组件606用于采集图像或视频。可选地，摄像头组件606包括前置摄像头和后置摄像头。通常，前置摄像头用于实现视频通话或自拍，后置摄像头用于实现照片或视频的拍摄。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能，主摄像头和广角摄像头融合实现全景拍摄以及vr(virtualreality，虚拟现实)拍摄功能。在一些实施例中，摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路607用于提供用户和终端600之间的音频接口。音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器601进行处理，或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路607还可以包括耳机插孔。

定位组件608用于定位终端600的当前地理位置，以实现导航或lbs(locationbasedservice，基于位置的服务)。定位组件608可以是基于美国的gps(globalpositioningsystem，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于：加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。

加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号，控制触摸显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器612可以检测终端600的机体方向及转动角度，陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3d动作。处理器601根据陀螺仪传感器612采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器613可以设置在终端600的侧边框和/或触摸显示屏605的下层。当压力传感器613设置在终端600的侧边框时，可以检测用户对终端600的握持信号，根据该握持信号进行左右手识别或快捷操作。当压力传感器613设置在触摸显示屏605的下层时，可以根据用户对触摸显示屏605的压力操作，实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器614用于采集用户的指纹，以根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器601授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商logo时，指纹传感器614可以与物理按键或厂商logo集成在一起。

光学传感器615用于采集环境光强度。在一个实施例中，处理器601可以根据光学传感器615采集的环境光强度，控制触摸显示屏605的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏605的显示亮度；当环境光强度较低时，调低触摸显示屏605的显示亮度。在另一个实施例中，处理器601还可以根据光学传感器615采集的环境光强度，动态调整摄像头组件606的拍摄参数。

接近传感器616，也称距离传感器，通常设置在终端600的正面。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中，当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时，由处理器601控制触摸显示屏605从亮屏状态切换为息屏状态；当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时，由处理器601控制触摸显示屏605从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图6中示出的结构并不构成对终端600的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在示例性实施例中，还提供了一种计算机可读存储介质，存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述实施例中的识别动作类别的方法。例如，所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王永杰
技术所有人：广州酷狗计算机科技有限公司
我是此专利的发明人

上一篇：一种袪红血丝面膜的制作方法
上一篇：一种基于电磁力的多集群航天器构形重构控制方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。