惯性音频滚动的制作方法

文档序号:14652203发布日期:2018-06-08 22:03阅读:321来源:国知局
惯性音频滚动的制作方法

诸如互联网之类的基于分组的通信网络已经发展为允许在作为通信系统的一部分的不同用户终端的用户之间高效地传输大量通信业务。可以经由适合在两个或更多用户的用户终端之间路由通信数据的服务器在基于分组的网络上交换通信数据。

为了参与通信会话,每个用户在他/她相应的终端上运行通信客户端应用。当用户运行通信客户端时,客户端允许用户向通信系统的其他用户提出联系请求或者从通信系统的其他用户接受联系请求,并且由此变成预先约定的联系人,并接着与这些联系人中的一个或多个建立通信连接以便通过网络发送和接收通信。可以存在用户可以向通信系统的其他用户提出联系请求或者从通信系统的其他用户接受联系请求的其他方式,例如通过电子邮件邀请的方式。在所连接的用户间的通信会话中,用户可以使用其相应的用户终端来通过网络发送经编码的通信数据流,以由在通信会话中连接的一个或多个其他用户终端接收。所发送的数据流可以在服务器处被处理并且被转发至参与所述通信会话的其他用户终端中的每个用户终端。

通信数据可以包括用户捕获的音频和/或视频数据以及基于文本的消息(即时消息传送,IM),其作为在两个用户终端之间的一对一通话或者在三个或更多个用户终端之间的会议通话的一部分。通信客户端还可以用于传送其他数据,例如允许用户共享诸如联系人细节、文档和/或媒体文件之类的文件。通信客户端还可以具有与其他应用交互的能力,以使得与这些应用相关联的数据能够被共享。例如,第一用户终端可以用于呈现可以作为通信会话的一部分来现场共享的幻灯片演示。

通信数据通常是实时地交换的以使得现场进行通信会话,但是一些通信系统还可以提供可以存储消息并记录整个通信会话以便其随后可以由用户终端下载的云存储系统。涉及视听数据的通信会话可以以视频文件的形式被记录并存储在云存储介质上。所记录的通信会话视频文件可以由被邀请为所记录的通信会话的一部分的用户终端中的一个用户终端下载和回放。这在被邀请为特定通信会话的一部分的一个或多个联系人离线或因其他缘由无法参入通信会话的事件中可以是有用的。另一原因在于用户可能只想要重新观看或重新收听他是其一部分的通信会话。所下载的视频记录可以通过媒体播放应用回放并且根据观看用户的偏好来控制。



技术实现要素:

本公开的发明人已经意识到,当用户想要导航通过对所记录的通信会话的回放时,他通常不得不使用屏幕控件沿时间线“拖动”或滑动视觉标记。所述时间线通常表示记录的持续时间。例如,用户沿时间线手动地拖动视觉标记或者以其他方式在沿时间线的点处点击,以便跳转至记录中的那个时刻。尽管该控制回放的方式对于媒体播放应用的用户而言是熟悉的,但是这不是导航所记录的通信会话的一种非常有效或有用的方式。

因此,将期望拥有一种使得用户能够快速找到用于在用户的用户终端处回放所记录的通信会话中感兴趣或相关的部分的更加便利的方式。本申请的发明人已经发现,所记录的通信会话的回放能够通过用户输入滚动控制来导航,其中,媒体播放应用的用户界面的一部分以连续、流畅的方式来滚动。

根据本公开的第一方面,提供了一种用于控制对所记录的通信会话的回放的方法,所述方法包括:由用户终端访问采用了媒体文件的形式的通信会话的记录,其中,所述媒体文件包括至少一个音频分量;由所述用户终端访问与所述媒体文件相关联的元数据,其中,所述元数据包括对被确定为在所述通信会话期间已经发生的多个事件中每个事件的相应的一个或多个可视表示的指示,其中,所述可视表示中的至少一些可视表示包括从所记录的通信会话的至少一个通信流转换的文本,并且其中,所述元数据还包括将所述相应的可视表示链接至所述事件的时序信息;使用在所述用户终端上运行的媒体播放应用来播放所述媒体文件;以及控制对所述媒体文件的回放,以使得所述音频分量的回放速率与用户滚动通过所述可视表示的速率同步。

根据本公开的第二方面,提供了一种用于控制对所记录的通信会话的回放的用户终端,所述用户终端包括:处理器和至少一个存储元件,它们共同被配置为:访问和存储采用了媒体文件的形式的通信会话的记录,其中,所述媒体文件包括至少一个音频分量;与所述媒体文件相关联的元数据,其中,所述元数据包括对被确定为在所述通信会话期间已经发生的多个事件中每个事件的相应的一个或多个可视表示的指示,其中,所述可视表示中的至少一些可视表示包括从所记录的通信会话的至少一个通信流转换的文本,并且其中,所述元数据还包括将所述相应的可视表示链接至所述事件的时序信息;被配置为回放所述媒体文件的媒体播放应用;被配置为显示所述媒体播放应用的用户界面的可视显示单元;其中,所述媒体播放应用被配置为控制对所述媒体文件的回放,以使得所述音频分量的回放速率与用户滚动通过所述可视表示的速率同步。

根据本公开的第三方面,提供了媒体播放应用,其在非瞬时性计算机可读介质上实施并且包括代码,所述代码被配置为当在用户终端上运行时执行上文描述的本公开的第一方面的方法。

提供了该发明内容以用简化形式引入在以下的具体实施方式中进一步描述的概念的选择。该发明内容不旨在标识所要求保护的主题的必要特征和关键特征,也不旨在用于限制所要求保护的主题的范围。

附图说明

为了更好地理解本发明并且示出其如何被实施,通过示例的方式对附图进行参考,其中:

图1是通信网络的示意性表示。

图2是用户终端的示意性框图。

图3是云会议平台的示意性框图。

图4是用于记录和分析通信会话的流程图。

图5是电子通信的内容的表示。

图6a是在用户终端上运行的媒体播放应用的用户界面的示意性表示。

图6b是在用户终端上运行的媒体播放应用的用户界面的另一示意性表示。

图7a至7d是媒体播放应用的用户界面在“缩放功能”模式期间另外的示意性表示。

图8是执行搜索功能的媒体播放应用的用户界面的另一示意性表示。

具体实施方式

图1和2示意性地示出了通信系统100,在该情况下,是在诸如互联网之类的分组交换网络上实现的通信系统。多个终端用户终端102和服务器104各自连接至互联网,其示意性地被表示为通信“云”108,通信“云”108包括用于在用户终端102和/或服务器104之间路由数据分组的多个相互联网的路由节点。这些服务器中的一个或多个可以是适合当在用户终端102之间时接收、处理和引导通信数据流的视听多点控制单元(AV MCU)104a。AV MCU 104a还被配置为连接至云会议平台105。云会议平台可以通过网络108远程地连接至AV MCU 104a。可替代地,AV MCU和云会议平台105可以被实现为单个单元。云会议平台105还经由AV MCU 104a来接收通信数据流。云会议平台105被配置为进一步处理所接收到的通信数据流并且存储通信会话的记录以供通信系统100的一个或多个用户终端随后访问。在下文描述了如在本公开的上下文中所使用的云会议平台105的细节。

用户终端102与网络108之间的连接中的每个连接可以包括经由有线或无线调制解调器的链路,并且可以经由或可以不经由诸如局域网或蜂窝网运营商的基于分组的服务等之类的另一网络进行。尽管网络108被称为分组交换网络,其可以替代地被实现为电路交换网络。用于访问互联网的各种可能的布置的细节对于本领域技术人员而言将是熟悉的。用户终端中的每个用户终端被示出为与用户A、B、C相关联。应当理解的是,可能存在比由图1所示出的那些用户终端更多或更少的用户终端。用户终端102可以是以下中的任何一个(但不限于):个人计算机(PC)、膝上型计算机、移动电话(智能电话)、游戏控制台、个人数字助理(PDA)、平板计算机、可穿戴技术设备,例如智能手表、智能珠宝或虚拟现实耳机等。为了本公开的剩余的目的,用户终端102被示出为智能电话。

为了实现用于在联系人之间发送和接收通信数据的通信系统,多个用户终端102中的每个用户终端安装有通信客户端应用222的相应实例,如在图2中所示出的。通信客户端222被配置为发送和接收多种类型的通信数据,包括但不限于:捕获的音频数据(例如,互联网协议语音VoIP数据)、捕获的视频数据、即时消息传送(IM)文本数据、和/或文件传递。通信客户端还可以被配置为发送和接收作为在一个或多个用户终端处执行的呈现的一部分的视听数据。

通信客户端可以被配置为支持两个或更多个用户终端102之间的远程屏幕。此外,通信客户端应用仍然可以被配置为与在用户终端102上运行的多个其他应用进行交互。以此方式,第一用户可以共享他们对在其用户终端102处使用这些其他应用中的一个或多个应用的观点并且与在通信会话中的其他用户终端102共享所述观点。例如,第一用户终端(例如,与用户A相关联的102a)可以运行幻灯片演示应用以便与通信会话中的一个或多个其他用户共享预先准备的演示。通信客户端222a能够访问幻灯片应用或者以其他方式与幻灯片应用进行交互,以便生成表示该演示并且能够被发送至通信会话102中的其他用户终端102的通信数据。例如,所述演示的所有视听元素可以被编码成音频和视频数据,并且作为通信会话的一部分被发送至其他用户终端102。因此,可以在给予演示的第一用户与通信会话中接收该演示的一个或多个其他用户之间共享该演示。尽管第一用户在共享他的演示,但是用户仍然可以发送其他通信数据。因此,例如,第一用户(演示者)可以对其演示提供视听评论,并且可以在通信会话中的所有用户之间进行讨论。演示者、和/或具有来自演示者的许可的其他用户中的一个或多个用户能够通过在该演示中的一个或多个点处添加可视或可听的注释来与演示本身进行交互。

在实施例中,演示可以与运行处理演示的应用的相应实例的两个或更多用户终端102远程地托管。尽管在以上的示例中使用了幻灯片演示,但是演示可以采用各种不同的形式,包括对文档的共享和对音频和/或视频媒体的共享,例如播放视频或音频文件。

如在图2中所示出的,用户终端102包括以一个或多个中央处理单元(CPU)为形式的处理装置200。处理装置200可操作地耦合至多个设备:用于连接至网络108的网络接口202,诸如内部或外部硬盘驱动和/或闪速存储器之类的非易失性存储介质204,以RAM 206为形式的易失性存储介质、诸如LED或LCD屏幕之类的显示器208,能够接收用户输入控制的诸如触摸屏系统、键盘、鼠标或轨迹板等之类的一个或多个用户输入设备210,一个或多个麦克风212,一个或多个音频扬声器214。终端102安装有通信客户端应用222的实例,这在于客户端222被存储在非易失性存储介质204中并且被布置为在处理装置200上运行(通常在也运行在处理装置200上的操作系统220的控制之下)。客户端应用222包括I/O层224、客户端引擎层226、和客户端用户界面(UI)层228。

在操作中,I/O层224处理用于编码和解码文本、语音、和/或视频通信的较低等级的编码解码器,以为了通过网络108发送和接收的目的。接着,客户端引擎226负责管理联系人列表并且负责建立与AV MCU服务器104a的通信信道。UI层228负责经由显示器208向用户输出屏幕上的用户界面,包括用于管理通信的屏幕上的控件。

终端102可以安装有其他应用的一个或多个实例,每个实例在图2中被表示为在操作系统220的控制之下在处理装置200上运行的软件栈240。这些其他应用240可以采取许多不同的形式并且可以包括幻灯片演示应用、文本编辑应用、媒体播放应用等。如在上文中所描述的,通信客户端222可以被配置为与这些其他应用240进行交互,以使得通信数据可以包括涉及其他应用240的屏幕共享演示,例如第一用户可以使用幻灯片应用来向通信会话中的其他用户终端102屏幕共享幻灯片。

可替代地或除了用户终端102被安装有其他应用240中的一个之外,用户终端可以被配置为在线地访问应用的网络版本。例如,用户终端102可以被安装有适合通过网络108访问远程在线应用的互联网客户端应用260(网络浏览器)。云会议平台105可以被配置为托管和运行一个或多个这样的在线应用340。通信客户端222能够与互联网客户端应用260交互,以使得通信数据能够包括与在线应用相关的数据,例如,屏幕共享演示可以基于使用在线幻灯片应用而在通信会话中被共享。

参考图3,示出了云会议平台105的更加详细的表示。云会议平台105可选地包括网络接口301,网络接口301被配置用于通过网络108接收由AV MCU 104a转发的通信数据流。云会议平台105还包括一个或多个中央处理单元350和诸如内部或外部硬盘驱动和/或闪速存储器之类的至少一个非易失性存储介质352、以RAM 354为形式的易失性存储介质。在非易失性存储介质352上存储的是一系列通信分析软件模块300,包括自动话音识别引擎302、话音翻译引擎304、自然语言处理引擎(NLP)306、音频分频引擎308、视频分析引擎310、和屏幕共享/幻灯片分析引擎312。稍后在本公开中更加详细地描述这些中的每一个。CPU被配置为结合RAM 354来运行分析软件模块300。

云会议平台105还包括用于存储元数据事件文件的事件存储314,元数据事件文件表示在通信分析软件模块300对所记录的通信数据流的分析期间检测到的事件的发生,将在下文更加详细地描述其过程。如在上文中所提及的,云会议平台105还可以托管和运行一个或多个在线应用。当在云会议平台105上运行的其他应用240或在线应用340中的一个用于例如编辑、交互、和/或共享作为通信会话的一部分的数据时,也可以检测到事件(并存储其可视表示)。

参考图4,流程图示出了在云会议平台105处执行以用于记录通信会话并使得该记录可用于回放的步骤。在步骤402处,云会议平台105从AV MCU 104a接收一个或多个通信会话的通信数据流。云会议事件平台105被配置为解决所接收的、与不同的通信会话相关联的数据流。所接收的针对每个通信会话的通信数据包括音频数据流、视频数据流、屏幕共享流(例如,幻灯片演示)、以及数据文件传输中的一个或多个。

在步骤404处,所接收的每个通信会话的通信数据流被存储在非易失性存储介质352处,以使得每个通信会话被记录。在步骤406处,在已经存储了通信数据流之后,分析所述通信数据流以确定在每个通信会话期间发生的事件。这涉及云会议平台105根据情况将通信分析软件模块300中的一个或多个应用至所存储的通信流中的每个。例如,视频分析引擎310将仅被应用至视频流,而屏幕共享/幻灯片分析引擎312仅被应用至屏幕共享流。执行分析以便确定事件在通信会话期间已经发生。可以实时地执行步骤402到406,即在通信会话期间当其发生时。在该场景中,云会议平台105与AV MCU 104a进行交互以实时地记录通信数据流并对其进行分析。

可替代地,可以在云会议平台105处对完成了的通信会话的记录进行访问和分析,而不是实时地记录独立的通信流。例如,对通信会话的记录可以是视频或音频文件。可以由AV MCU 104a或与通信系统相关联的另一服务器(图3中未示出)来生成视频或音频文件,文件从其被上传至云会议平台105。可替代地,可以由通信会话中的用户终端102中的一个生成和上传所记录的视频或音频文件。云会议平台105可以通过将一个或多个通信分析软件模块300应用至所接收的视频或音频文件来对其进行分析。以该方式,所述分析是对所记录的视频或音频文件执行的而不是对从AV MCU 104a所接收的所存储的通信流执行的。

下文提供了作为步骤406的一部分执行的分析的一些示例。所存储的音频数据流可以被输入到自动话音识别引擎(ASR)302。合适的ASR 302是MicrosoftASR服务。ASR 302通过运行在话音识别技术领域的技术人员公知的一系列算法来工作。ASR 302可以被配置为识别多于一种语言的音频话音数据。ASR 302转换所存储的音频话音数据并且以经识别的语言将文本数据输出为通信会话的全部文本转录(transcript)。所述全部文本转录本身可以被认为是通信会话的事件的可视表示。经转换的输出文本可以被输入至NLP引擎306,以使得可以从经转换的输出文本提取关键字(和/或关键短语)。然而,如果NLP 306只能识别并提取特定语言的关键字,则经转换的输出文本可以首先被输入到自动话音翻译引擎304。合适的话音翻译引擎304的示例是Microsoft翻译服务。话音翻译引擎304使用已知的语言处理算法将输入文本从第一语言转换至与NLP 306兼容的第二语言。

NLP 306接收经转换的输出文本(如果需要的话,经翻译的)以使得其可以自动地提取随后回放所记录的通信会话的用户可能感兴趣的关键词。NLP 306可以包括用来提取关键词的多个已知的算法和技术。这些算法可以包括针对关键词和关键短语提取的机器学习算法,例如在由Turney,Peter D.(2000)所著的“用于关键短语提取的学习算法(Learning algorithms for keyphrase extraction)”中描述的“C.45”和“GenEx”(http://dx.doi.org/10.1023/A:1009976227802);和/或由Mihalcea等所著的“文本排列:将顺序带到文本中(TextRank:Bringing Order into Texts)”描述的用于文本处理的基于图的排列模型(2004)(http://web.eecs.umich.edu/~mihalcea/papers/mihalcea.emnlp04.pdf)。

由NLP 306所使用的其他已知的NLP方法可以包括Microsoft Azure机器学习API,其被配置为将ASR 302的(经翻译的)经转换的输出文本看作输入并且返回表示所述输入文本中关键谈话点的字符串列表。所述API采用从Microsoft的复杂自然语言处理工具包中已知的技术。

总之,NLP 306检测例如具有积极或消极意图的关键词和关键短语。NLP 306还可以提取被确定为具有积极或消极情绪的输入文本串中的关键短语。此外,可以将在输入字符串中所识别的日期和时间提取为关键词。同样,可以将日历事件和位置可以提取为关键词。本领域技术人员将理解可以由NLP 306提取其他类型的关键词和关键短语。

由NLP 306提取的个体关键词和关键短语中的每个构成了由NLP 306对事件的检测。由NLP 306检测到的每个事件的表示被存储(如稍后在步骤408处所描述的),其中,所述表示中的每个表示包括所提取的关键词或关键短语文本,它们被表示为文本的一部分。

所存储的音频数据流也被输入至音频分析引擎308。音频分析引擎可以与ASR 302并行地接收音频数据流。音频分析引擎308分析输入音频数据的音频属性例如以确定通信会话中的说话者(用户)的沉默、大笑、大喊、改变的发生。每一次音频分析引擎308进行这样的确定时,事件文件被生成并且被存储(如下文在步骤408所描述的)。由音频分析引擎308所确定的事件的表示被存储,以使得所述事件的表示包括音频事件的发生的基于文本的细节,例如“[鼓掌]”、“[沉默]”、“[用户X发言]”等。

所存储的视频数据流被输入至视频分析引擎310。视频分析引擎310可以使用算法来分析视频数据的视觉性质,例如以确定在通信会话中由说话者(用户)做出的手势的发生、针对用户显示的可视ID、在所捕获的视频中的显著改变。在所捕获的视频中所确定的改变的示例可以包括房间或视角的改变,以及一个或多个用户进入和/或离开房间,例如“用户B已经加入会话”或者“用户C已经从相机移开”。识别已经进入或离开房间的用户可以是基于使用脸部识别软件的视频分析引擎310的。脸部识别技术可以是有用的,以使得在单个视频场景中捕获的两个或更多个用户(例如,共同的演示者)可以被确定为通信会话中的两个不同的用户。每一次由视频分析引擎310对这些发生中的任何一个发生进行确定,则事件的表示被生成且被存储(如下文在步骤408处所描述的)。由视频分析引擎310确定的事件的表示被存储,以使得表示包括视频事件的发生的基于文本的细节,例如“[场景改变]”、“[手势:指]”;“[手势:挥手]”标志语言手势等。

如果屏幕共享(包括幻灯片演示)作为通信会话的一部分被执行,则所存储的屏幕共享通信数据被输入至屏幕共享/幻灯片分析引擎312。例如,光学字符识别(OCR)技术可以用于分析在共享文档中显示的文本或手写的注释。在屏幕共享涉及数字演示的场景中,OCR可以不是必须的(例如,共享幻灯片演示中的幻灯片)。当通信会话中的第一用户已经使用幻灯片放映给出演示时,屏幕共享/幻灯片分析引擎312可以确定何时已经显示了新的幻灯片,自动地提取幻灯片标题的文本以及幻灯片中的内容,例如标题、副标题、突出显示的文本等。每次由屏幕共享/幻灯片分析引擎312进行了这样的确定时,该事件的表示被生成并且被存储(如下文在步骤408处所描述的)。由屏幕共享/幻灯片分析引擎312确定的事件的表示被存储,其中表示包括所提取的文本。当屏幕共享/幻灯片分析引擎312确定新的幻灯片已经被显示并且幻灯片没有标题时,所存储的事件的表示可以仅包括指示幻灯片号码的文本(例如“幻灯片3”)。

当在云会议平台105上运行的其他应用240或在线应用340中的任何一个用于以某一方式传输数据时,也可以确定事件的发生。例如,如果通信会话中的一个或多个用户调用其他应用240或在线应用340中的一个,则其使用可以被确定为特定通信会话的事件。作为一个示例,通信会话中的一个或多个用户可以在通信会话期间通过键入文本或输入手绘注释到数字笔记应用中来记笔记,所述数字笔记应用例如Microsoft (其是如图3中示出的App 342的示例)。在云会议平台105上运行的在线记笔记应用识别笔记已经被记录并且生成对事件的表示。对事件的表示可以包括实际的文本和/或用户记录的手绘笔记。可替代地,对事件的表示可以是以下指示:笔记是由通信会话中的特定用户记录的。记笔记的用户可以决定不将笔记与其他用户共享,在该情况下,笔记将不被确定为事件并且将保持私有,仅仅对做该笔记的用户可访问。

作为另一示例,对正被共享的文档的编辑可以由与处理文档相关联的在线应用识别。例如,如果通信会话中的用户中的任何用户使用Microsoft来编辑幻灯片放映演示,则在云会议平台105上运行的在线PowerPoint应用(“Office 365”App的另一示例)识别该编辑并且生成针对该编辑的事件的表示。所生成的对事件的表示包括所述编辑的基于文本的细节,例如“[由用户X添加的额外文本]”。所述编辑本身也被记录为通信会话的记录的一部分,以使得当所记录的通信会话随后在用户终端102上被访问和回放时,所述编辑能够被看见。

作为另一示例,第一用户可以使用他的用户终端102上的照片应用来在通信会话期间拍摄并共享照片。在云会议平台105上运行的在线照片应用344识别照片已经被共享并且生成对事件的表示,该对事件的表示包括正被共享的照片的基于文本的细节,例如“[由用户X共享的照片]”。在该情况下,可能不能够记录对实际照片的共享以供在用户终端102处随后回放。替代地,所述照片可以被存储在云会议平台105的存储器352中,以使得用户终端102可以在回放所记录的通信会话时在合适的点处下载所述照片。

类似地,在另一示例中,第一用户可以在通信会话期间共享联系人卡片、参与者列表、和/或日历事件数据。诸如Microsoft 或Microsoft 346之类的在云会议平台105上运行的合适的在线应用识别这样的数据已经被共享并且生成对事件的表示,该对事件的表示包括正被共享的数据的基于文本的细节,例如,[从用户X接收新的联系人卡片]、[从用户X接收的新参与者]、和/或[从用户X接收的新日历事件]。在该情况下,可能不能够记录对实际数据的共享以供在用户终端102处随后回放。替代地,所述数据可以被存储在云会议平台105的存储器352中,以使得用户终端102可以在回放所记录的通信会话时在合适的点处下载所述数据。

在步骤408处,从由通信共享软件模块300所执行的分析确定的所产生的事件被存储在事件存储314处。所述事件可以被表示并存储为以JavaScript对象表示(JSON)格式的事件文件318,但是也可以使用其他格式。每个事件文件318包括针对该事件的文本和/或其他可视表示、关于该事件何时在相关联的通信会话期间发生的时间戳、以及所分配的相关性值(在下文中更加详细地描述的)。可视表示可以是文本数据的一部分,包括从所记录的通信会话的全部文本转录中提取的文本。当后续回放所记录的通信会话时,文本的该部分可以与所记录的通信会话一起被显示并且与其匹配。因此,可以通过与所记录的通信会话相关联的一系列时间元数据来表示事件。事件文件318可以被串联以使得针对所记录的每个通信会话存储单个分析结果文件320。事件存储器314可以是需要针对访问的授权的安全存储,例如,可以在元数据被访问之前使用如主动目录认证的已知的认证方法。

在实施例中,由于表示元数据事件的数据被存储至事件存储314,因此相关性模块356可以运行算法以向表示事件的文本的每个部分分配相关性值。例如,文本的某些部分可以被确定为具有最大的相关性,例如幻灯片放映演示中的幻灯片的标题。所分配的相关性值可以是向文本的最相关部分分配的具有较高值整数的整数。所分配的值的范围可以取决于在所记录的通信会话中已经发生的不同类型的事件的数量。在实施例中,表示一些类型的事件的文本的部分可能被认为比表示其他类型的事件的文本的部分更相关或更重要,并且因此相应地被分配了更高的相关性值。另外,可以向表示相同类型的事件的文本的部分分配不同的相关性值。例如,从NLP分析306所确定的不同的关键词或关键短语是基于对这些所确定的关键词(或关键短语)的内容的比较而各自被分配了不同的相关性值等级的文本的部分。

向表示当前事件的文本的部分分配的相关性值可以受到向在通信会话中发生当前事件之后或之前不久发生的一个或多个其他事件的表示分别分配的一个或多个相关性值的影响。作为示例,当在通信会话中在发言的用户改变时,可以检测到音频事件。该音频事件的表示可以被相关性模块356认为是重要的。因此,向该音频事件的表示分配相应地高的相关性值。作为响应,可以向在说活者改变事件之后的预先定义的时间段内发生的事件的表示各自分配与其本来已经被分配的值相比有所增加的相关性值。因此,说活者改变音频事件的重要性在这些随后的事件的表示中得到反映。

在步骤410处,与特定的通信会话相关联的所存储的通信数据流被一起处理并且被格式化成可以被存储在非易失性存储介质352处的媒体文件316。即,所接收的通信会话的所有视频和音频数据流被同步到从开始到结束重新创建通信会话的媒体文件316中。取决于通信数据流的类型,媒体文件316可以是视频文件或音频文件。例如,如果针对通信会话所接收的数据流仅包括音频数据流,则所述数据流可以被格式化成音频文件。为了方便起见,我们在下文中可以引用视频文件316。生成和存储视频文件316的步骤可以在于步骤402处接收了通信数据流之后立即由云会议平台105发起。所述视频文件可以是以任何合适的格式的,包括但不限于MP4、mpg、AVI、FLV、WMV、MOV。

在所描述的主要实施例中,本公开涉及一种一个或多个用户可以由此共享幻灯片放映演示的屏幕共享方法。在该场景中,针对通信会话中的所有接收用户终端的输出视频将是相同的。因此,针对想要随后回放所记录的通信会话的任何用户而言,针对每个用户的视频文件316将是相同的。

在本公开范围之内的可替代的实施例中,通信会话包括视频会议界面,通信会话中的每个通信客户端被配置为由此向会话中的其他用户输出视频。云会议平台105可以被配置为生成视频文件316的相应版本,其中针对参与该通话的每个用户都有一个,加上针对不是该通话的一部分的其他用户的版本。例如,如果参与该通话的用户想要回放所记录的会话,则他的用户终端102将能够访问与他相关联的视频文件316。这就是如此用户可以重新体验该通信,如同当最初进行该会话时最初向他显示的那样。这是有用的,因为在通话中在每个相应的用户终端102处通常将不同地视频会议界面。针对没有参与通信会话的用户,可以针对这些用户生成通用视频文件,在该通用视频文件中表示了参与该会话的所有用户。在另外的实施例中,云会议平台105可以被配置为仅生成和存储对于想随后回放所记录的通信会话的所有用户都相同的一个视频文件316。该场景中的示例可以包括演讲或Keynote演讲的视频记录。

在步骤412处,云会议平台105将来自通信会话的所有元数据(即,事件文件318或分析结果文件320)与针对该会话的合适的视频文件316相关联。所述元数据可以被编码为所生成的视频文件316本身的一部分,或者其可以保持与视频文件316相分离,例如作为端数据的流。当被编码为所生成的视频文件316(例如,MP4格式)的一部分时,所述元数据可以被嵌入在以可以由大多数标准媒体播放应用280和/或网络客户端(网络浏览器)260识别的标准元数据格式的视频文件中。这样的媒体播放应用280和媒体播放应用280可以支持对所述元数据的使用,例如导航通过视频的章和/或以各种方式显示所述元数据(例如,副标题)。这些应用能够使用在本公开中所描述的大多数元数据。然而,被配置为识别在本文中所公开的整个范围的元数据的新的媒体播放应用280和/或媒体播放应用280可能需要被安装在用户终端102上,以使得用户可以享受如在本文中所公开的完整体验。

所述端数据可以包括所有事件文件318(或者单个结果分析文件320)。可替代地,所述端数据可以包括如由ASR 302输出的通信会话的完整转录。所述转录可以包括文本和对其他可视表示(例如,图形图标)的指示。用户终端102接收转录并且可以基于在用户终端102处执行的对转录的分析来确定事件的发生并且将元数据事件文件存储在本地存储器存储204处。

在另外的实施例中,可以由用户终端102来执行对事件(元数据)的确定和存储。例如,用户终端102的处理器200可以被配置为自身直接分析所取回的媒体文件316并且从所记录的通信会话来确定事件的发生。为此,用户终端可以被配置有与在云会议平台105处使用的通信数据分析模块300类似的一个或多个分析模块(未示出)。以该方式,用户终端102被配置为将所记录的通信会话的通信流转换成文本。针对从由用户终端102生成的转录所确定的任何事件,这些可以作为事件文件(或者作为结果分析文件)被存储在本地存储器存储204中,类似于在云会议平台105处的事件存储器314上存储的事件文件318(或单个结果分析文件320)。因此,在实施例中,用户终端102仅仅需要从云会议平台105访问视频文件(媒体文件)316。应当理解的是,如在本公开通篇中所使用的术语“访问的”元数据包含用户终端102获得元数据(即,事件文件或单个结果分析文件)的所有方式。此外,用户终端102能够采用如在本文中所描述的访问元数据的方法中的任何一个或组合。

对于将元数据与视频文件316相关联(即,上文的步骤412)的云会议平台105可替代地或另外地,云会议平台105可以被配置为在通信会话仍在进行的同时向AV MCU 104a实时地发送元数据。这可以是指云会议平台105的现场应用。在该场景中,元数据因此由针对通信会话的所有参与者的AV MCU 104a而被现场实时地并入到通信会话中。因此,事件的可视表示(显示事件)可以当它们在播出该通信会话的媒体播放应用280或媒体播放应用280的可滚动导航区域612中发生时被现场示出。在下文中更加详细地描述了可滚动导航区域612。所述可视表示可以包括如先前所描述的一系列不同的类型,例如从ASR 302输出的(经翻译的)文本的部分、由使用其他应用的用户采取的动作(例如,拍摄的照片、对幻灯片放映演示进行的编辑等)、以及对其他音频和/或视频事件的表示。

事件(显示事件)的表示也可以在通信会话的“接近实时”的回放中被示出。例如,参与现场通信的一个或多个用户可以选择暂停在其用户终端102处对现场通信的播出。例如,用户可以暂停通信会话以便进行或接听另一通话。当针对其用户终端102上的本地用户暂停通信会话时,通信会话本身在其他参与者之间继续并且继续被记录为视频文件316(如在上文中所描述的)。可替代地或另外地,可以在后台将所述通信会话记录至用户终端102的存储204。当用户准备好时,其可以选择“恢复”所述通信会话的回放。作为响应,用户终端102可以从通信会话被暂停的点处开始从云会议平台105访问并下载视频文件316(或者访问通信会话的本地记录)。用户终端102还访问元数据(如在上文中所描述的),其意味着在通信会话中已经发生的所有事件(包括自从通信会话被暂停时起已经发生的事件)的可视表示可以被显示在可滚动导航区域612中。因此,用户可以通过在导航区域612实施惯性滚动动作滚动通过显示事件来追赶上现场会话,其与所记录的通信的时间的相关点同步,以前进通过通信会话直到其赶上正在进行的现场会话为止。稍后将详细描述该惯性滚动概念。可替代地,用户可以选择按钮或某一控件而不是使用惯性滚动动作来重新加入现场的实时通信会话。显然,用户无法前进超过仍然是现场的通信会话的时间点。然而,用户通过向回滚动通过所显示的在所记录的会话中先前已经发生的事件来选择“倒回”会话。例如,这在用户认为其可能已经错过了一些事情或者想要再次观看或收听会话中的一些东西的情况下可以是有用的。当然,如果现场的实时通信会话仍在进行,则用户可以再次选择返回该现场的实时通信会话。

因此,尽管在本文中参考所记录的通信会话描述了主要的实施例,但本公开的方面也与现场的、正在进行的通信会话相关。

在步骤414处,当通信会话完成时,云会议平台105生成以文本总结通信会话的内容的电子邮件500。云会议平台105可以具有被邀请成为该通信的一部分但出于无论何种原因未加入的任何用户的知识。在该情况下,云会议平台105可以自动地向没有加入该通信会话的这些用户发送电子邮件。尽管我们提及电子邮件,但是云会议平台105能够通过包括即时消息传送(IM)和/或SMS的其他通信方式来发送基于文本的摘要。

另一种可能性在于云会议平台105可以向一个或多个用户发送推送通知,通知他们所记录的通信能够由他们访问。所述推送通知可以例如在用户的通信客户端222中被显示。接着,用户可以决定何时取回基于文本的摘要。可替代地,用户可以忽略或丢弃该通知。在的确加入该通信会话的用户想要访问和重新回放所记录的通信会话的一种方便的方式的情况下,还可以向所述用户中的任何一个用户发送电子邮件摘要。另外,电子邮件摘要可以被发送至具有主人或管理员许可的任何其他联系人。例如,如果在所记录的通信会话中没有敏感内容,则更广泛地散布所述电子邮件可以是有益的,例如向协作者的更广泛的团队或者向一般邮件列表散布。

图5示出了以列表形式总结通信会话的内容的电子邮件500的示例表示。邀请包括至所记录的视频文件316的第一文本链接502。第一文本链接502可以表现为通信会话的标题,例如,基于从屏幕共享/幻灯片分析312确定的以及从合适的事件文件318(或所产生的分析文件)读取的共享的幻灯片放映演示的标题。在图5中所示出的示例中,如从第一幻灯片所确定的演示的标题是“吃水果的益处”。通过轻敲或者以其他方式选择第一文本链接502,用户终端102将能够访问视频文件316,以使得他们能够流式传播视频文件或将其下载。当用户终端102已经访问了视频文件316或已经将其下载时,所述文件将从记录的开始处起在安装于用户终端102(例如,网络客户端(网页浏览器)260或媒体播放应用280)上的媒体播放应用280中回放。记录从开始处回放是因为第一链接502表示这样的通信会话的事件,其在数据流分析期间被确定在通信开始时已经发生并且因此加盖有在通信会话的开始处的时间的时间戳。因此,第一文本链接502直接链接至视频文件316的开始处的开始。

摘要邮件500还可以包括文本链接,例如幻灯片放映演示中的个体幻灯片504的标题的列表。如同第一文本链接502一样,链接504可以从屏幕共享/幻灯片分析引擎312确定并且从合适的事件文件318(例如,所产生的分析文件)读取。在所示出的示例中,存在显示有标题“香蕉”、“橙子”和“苹果”的三个链接504。其他的链接可以被示出为表示被确定为在特定幻灯片的演示期间已经发生的事件的副标题。例如,引号506中的一个或多个链接是基于NLP 306所认为的在通信会话中说出的关键词或关键短语。例如,在“香蕉”链接504下,显示了链接“一口气吃27根香蕉对你的健康可能是危险的”,而在“橙子”链接504下,显示了链接“每天喝250毫升橙汁是非常好的维生素C的来源”。可以包括并突出显示其他链接,例如,当可视事件发生508时,或者当音频事件发生510时。例如,可视事件链接“[视频剪辑]”508和音频事件链接“[鼓掌]”被示出在“香蕉”链接504下。应当理解的是,取决于通信会话的内容,可以存在更多或更少的链接。

因此,电子邮件摘要500中的每个链接与由通信数据分析模块300检测到的事件相对应。如所描述的,所述链接中的每个链接是基于所检测到的事件的,其中,每个事件被加盖有通信会话期间的时间点的时间戳。因此,每个链接直接链接至视频文件316的对应的时间点。因此,通过在任何时刻在所显示的链接中的任何一个链接上轻敲,第一用户终端102访问视频文件316并且链接至所记录的通信会话中的对应的时刻。可以在运行在用户终端102上的媒体播放应用280中播出所记录的通信会话。诸如在用户终端102上运行的一个或多个应用240或网络客户端应用260之类的其他的应用也可以被配置为并且适合于播放所记录的通信会话。为了方便起见,在下文中我们仅提及用于播出所记录的通信会话的媒体播放应用280。通过轻敲或选择特定的链接,使得所记录的通信会话的回放立刻向前或向后跳转到与所选择的链接所基于的事件的时间戳相对应的时间点。可以由用户多次重新选择相同的链接,以使得其可以不断从可能特别感兴趣的特定时间点起对所记录的通信会话进行回放。

当用户终端102访问或下载所记录的视频文件316时,其还访问与所记录的通信会话相关联的事件文件318(或者单个结果分析文件320)。例如,如果视频文件316被下载,则事件文件318(或单个结果分析文件320)也从云会议平台105被下载。如果视频文件316从云会议平台105被流式传播,则与事件文件数据相关的数据也可以被流式传播。可替代地,如果事件文件318已经在步骤412(上文所描述的)处被编码为单个视频316本身的一部分,则将无须单独访问事件文件318。

图6a示出了在用户终端102上运行的媒体播放应用280的示例用户界面600的示意性示图。媒体播放应用280被配置为通过播放所访问的视频文件316来回放所记录的通信会话。媒体播放应用可以是通信客户端应用222的集成部分或者其可以是在用户终端102上运行的单独的应用。当所记录的通信包括视频分量时,在媒体播放应用用户界面600的第一区域602中显示所述视频。视频分量将包括对所记录的通信会话的所有可视元素的回放,包括显示所共享的幻灯片放映演示中的幻灯片。媒体播放应用UI 600还包括显示所记录的通信会话的持续时间中的时间点的计时器604。回放控件606包括屏幕上熟悉的控件,因此用户可以使用按钮608来暂停/恢复对所记录的通信会话的回放。

对所记录的通信会话的音频回放与视频分量是同步的。音频从媒体播放应用(或者通信客户端应用222,如果媒体播放应用与其集成)播出,而不中断在用户终端102上运行的其他应用的任何音频流的播出。因此,如果所记录的通信会话是仅录音的音频,或者如果用户无需或无法看见显示器208,则他可以仅收听音频输出。

跳过控制按钮210允许用户前进或后退到当在通信会话中引入下一个或前一个幻灯片时回放的时间点。跳过控制按钮210还可以用于前进或后退到当检测到的下一个或前一个事件发生时的时间点。在实施例中,用户设置可以允许用户前进或后退到当下一个或前一个类型的事件发生时的时间点,例如,用户可以仅想要跳过音频事件的发生。因为媒体播放应用280可以访问元数据,即事件文件318(或单个结果分析文件320),其知道当选择跳过按钮610时,要跳过什么回放时间点。因此,当所记录的会话的回放是视频而不是实际的幻灯片放映时,元数据允许用户以逐个幻灯片为基础有效地跳过视频。在实施例中,用户可以双击跳过控件210以回到所记录的通信会话的开始或结束处。

作为使用回放控制按钮206的可替代方案,用户能够通过与在第一区域602中所显示的视频进行交互来控制所记录的通信会话的回放。例如,通过在区域602中轻敲或点击,回放可以被暂停/恢复。此外,通过对在602中的视频区域执行扫动动作(或者通过在区域602中的视频的左和右边缘上轻敲或点击),回放将前进(例如,扫动左边/轻敲右边缘)或后退(扫动右边/轻敲左边缘)到当下一个或前一个幻灯片被引入通信会话中时回放的时间点。可以在播放回放时或者当其已经被暂停时,实现跳过所记录的通信会话的能力。在实施例中,如果用户想要在区域602中显示内容的更大视图,其可以侧向旋转其用户终端102以获得区域602的全屏视图。本领域技术人员将理解,可以由CPU 200连同用户终端102的加速度计类型的设备(未示出)来进行这样的侧向旋转的确定。

如果所记录的通信会话仅包括音频分量,则用户仍然可以跳到音频录音中的下一个或前一个事件,例如,已经从NLP 306和/或音频分析引擎308确定为已发生的任何事件。尽管不存在所记录的视频分量,但是云会议平台105可以生成可视元素作为格式化视频文件316的一部分。该可视元素可以是在区域602中显示的静态图像(例如,用于指示正在回放仅音频通信会话的声波符号)。可替代地,可视元素可以包括将所记录的通信会话回放的过程可视化的一系列图像。所述图像还可以通过显示事件的可视表示来指示在通信会话中发生的最近的事件。因此,用户仍然在区域602中看见关于在通信会话期间发生了什么的一些有帮助的视觉线索。

与在媒体播放应用UI 600上使用所显示的控制按钮606一样,用户终端102还可以包括一个或多个物理控件,例如控制按钮650,其还可以用于以如在本文中描述的任何方式来控制对所记录的通信会话的回放。可替代地或另外地,物理控件650可以是连接至用户终端102的另一输入设备210的一部分,例如,键盘、鼠标、或耳机/耳麦控件。

在实施例中,媒体播放应用UI 600还包括导航区域612。由用户终端102访问的元数据(事件文件318或单个分析结果文件320)被可视地表示并且被显示在导航区域612中。所述元数据可以被加载以使得被表示和显示的每个事件与对所记录的通信会话的回放相同步。因此,当事件在所记录的通信会话的回放中发生时,该事件可以在导航区域612中最显著地被可视地表示。这基于包括在所存储的每个事件文件的时间戳是可能的。

在实施例中,针对所记录的通信会话确定的事件的可视表示可以被加载到导航区域612中以使得它们是可滚动的。例如,在所记录的幻灯片放映演示的回放开始时,第一幻灯片的标题614a(例如,演示的标题、幻灯片编号和/或“开始”)可以在与计时器604对准的起始位置处被显示。在图6a中所示出的示例中,回放刚刚开始并且因此计时器604被示出为“00:00”。在第一幻灯片的标题614a下方是多个其他被显示的事件,包括:每个在幻灯片614b的显示期间检测到的随后的幻灯片标题614b(“香蕉”)、关键短语616、音频事件618([鼓掌])和可视事件620([视频剪辑]),随后是在幻灯片614c显示期间检测到的另一个幻灯片标题614c(“橙子”)以及另一个关键短语616。每种类型的显示事件可以由与显示事件的文本接近地示出的图形624来表示。

随着所记录的通信会话的回放进行,计时器604进行累加计数,并且被示出在导航区域612中的显示事件自动地向上滚动。在实施例中,当在导航区域612中显示的下一个事件与计时器604对准时,要在回放时发生的下一个事件发生。如果已经确定存在的事件非常少,则所有这些事件都可以被示出为能够在导航区域612中滚动通过的显示事件。另一方面,如果已经确定存在许多事件,则可滚动导航区域612中所显示的对应的事件可以限于相比其他具有更大相关性的事件。这是基于分配至表示事件(如在上文中所描述的)的每个文本部分的相关性值来确定的。因此,较不相关的事件的表示可以不在可滚动的导航区域612中被显示。导航区域612的可用屏幕面积也可能影响到有多少显示事件被示出。例如,如果导航区域612的屏幕面积受限,则为了保持导航区域612整洁,具有较高相关性的事件的表示可以作为显示事件被示出,而具有较低相关性的事件的表示则可以被省略。相反,如果导航区域612的屏幕面积适当地较大,则被分配了较低相关性值的事件的表示中的一些表示也可以连同更加相关的显示事件一起作为可滚动的显示事件被示出。导航区域612中示出的显示事件可以以基于下一个事件何时在播放中发生的进度自动地滚动。例如,如果下一个时间要在一分钟后发生,则自动滚动能够调整进度以使得如在导航区域612中所显示的对应的显示事件变得与回放中的正确时刻处的计时器604对准。

显示事件的滚动被描述为与所记录的通信会话的回放同步。然而,显示事件可以具有与例如在上文中所描述的幻灯片的改变以及所提取关键词和关键短语相比较高的分辨率。例如,导航区域可以显示如由ASR 302(或用户终端102处的本地ASR)所确定的通信会话的完整转录。在该情况下,显示事件可以是所显示的文本转录的一部分,例如按照段落、句子、词语、短语所断开的。导航区域612例如逐句地滚动通过显示事件,同时一直与媒体文件316的回放同步。这允许在导航区域612中显示更加精细的细节水平。

在实施例中,一旦显示事件已经发生,其就可以继续滚动直到其滚动离开导航区域612的顶端为止。可替代地,当前或最新近的显示事件可以保持与计时器604对准直到其被下一个显示事件替换。刚刚被替换的先前的显示事件可以接着向上滚动。已经发生但是仍然被示出为在计时器604上方滚动的显示事件可选地可以被示出为“变暗”以指示所记录非通信会话中链接至那些显示事件的事件已经在回放中发生。

在实施例中,滚动标记605可以随着回放的进行而被显示,其被示出为从导航区域612的顶部到底部向下移动。这给予用户关于他们在所记录的会话中多远的一些指示。随着显示事件向上滚动,滚动标记605将在所记录的通信会话的结尾处逐渐到达到导航区域612的底部。

图6b示出了在如计时器604所示出的时间“01:00”处的媒体播放应用用户界面600的经更新的表示。现在在区域602中显示的是标题幻灯片之后的下一个幻灯片。导航区域612中针对第一幻灯片614a的显示事件能够被看到已经滚动到计时器604上方,而针对当前幻灯片614b(“香蕉”)的显示事件现在与计时器604对准。新显示事件614d(“苹果”)则因为其他显示事件已经滚动上来而现在被示出为已经滚动到导航区域612的底部“之上”。

导航区域612中的所有显示事件也能够由用户来选择。如果被用户选择,则回放就基于将该显示事件链接至媒体文件316的回放中的事件的时间戳而跳转至所记录的通信会话中的时间点。导航区域612被动态地更新以示出被选择的显示事件以及计时器604。导航区域612中的显示事件接着再次如在上文中所描述的从该点起向上滚动。因此,如导航区域612中所示出的显示事件具有与在电子邮件概要500中所显示的可选择链接(502、504、506、508、510)非常相似的作用。选择电子邮件概要500中的所述链接中的一个或者选择导航区域612中对应的显示事件在媒体播放应用UI600中具有相同的效果。

惯性滚动

导航区域612也能够通过用户控制来滚动。媒体播放应用使用惯性滚动技术以使得用户越快速或越用力地执行向上或向下滚动通过导航区域612中的显示事件的动作,则显示事件就滚动得越快(在本文被称为快速滚动)。当用户停止快速滚动时,导航区域612中的显示事件的滚动速度逐渐降低直到达到正常播放滚动速度(即,当播放滚动速度与音频回放同步时)为止,并且其中音频回放以与其原本被记录相同的速率被播出(此后称为音频回放的正常速度)。可替代地,在所记录的通信会话的回放被暂停时,用户可以在导航区域612中执行对显示事件的惯性滚动。在该情况下,当用户停止滚动时,导航区域612中的显示事件的滚动速度逐渐降低直到其停止为止。显示事件的一般向上滚动在用户选择恢复对所记录的通信会话的回放时恢复。在实施例中,惯性导航效果意味着导航区域612中的显示事件以连续的方式被滚动。也就是说,显示事件表现为以连续、流畅的运动向上移动通过导航区域612,而不是从一个离散的显示事件直接跳转到下一个显示事件。

尽管显示事件在本公开中被描述为向上滚动,但是在可替代的实施例中,显示事件可以向下滚动或者以侧向运动来滚动,例如在导航区域612中从左向右或者从右向左滚动。在任何情况下,在滚动通过导航区域612中的显示事件的同时,计时器604可以基于滚动的速度而动态地更新以反映出用户滚动通过的时间点。计时器604将随着用户滚动通过通信会话中过去或未来的显示事件而在时间上向后回退或向前前进。

在实施例中,滚动标记605可以仅当用户在导航区域612中执行滚动动作时被示出。例如,当用户停止与导航区域612交互时,滚动标记605可以消失,该消失是立即地或者逐渐地淡出的。可替代地,滚动标记605可以始终保持可见。如果用户一路滚动至通信会话的开始或结尾,则滚动标记将到达导航区域612的顶部或底部且不再移动。计时器604将在“00:00”处(即,所记录的通信会话的开始处)停止,或者在表示通信会话的最终结尾的持续时间处停止。

在实施例中,当用户进行对在导航区域612中所显示的事件的滚动时,所记录的通信会话的音频分量仍然被播放并且保持同步以供用户收听。用户越快地滚动通过显示事件,则所记录的通信会话的音频分量就越快地被播出。通过在媒体播放应用(或者在视频文件316被流式传输的情况下在云会议平台105)处使用一种或多种音频算法,音频分量的回放能够被加快和减慢,但是被处理以使得其保持能够被用户理解。例如,不与事件相关联的音频数据的分段可以基于用户多快地滚动通过在导航区域612中所示出的显示事件而以更高的速度被播放。

然而,音频的其他分段可以与事件相关联,例如NLP 306从其得出关键词或关键短语的事件的发生和/或音频分析引擎308从其生成的事件的音频分段。对于这些音频分段而言,快速音频回放可以被短暂放慢至正常或接近正常的速度以使得用户能够清楚地理解与事件相关联的音频。如果用户意识到他们对所听到的内容感兴趣,他们就能够停止滚动,在该情况下,回放将从其正在播放的地方开始并且以正常速度继续。在602处,所记录的通信会话的视频分量也将被更新以从相关时间点开始播放。另一方面,如果用户决定他们对该音频分段不感兴趣,则他们可以继续滚动通过导航区域612中的显示事件以使得音频回放再次加速。

如果用户正在滚动通过导航区域612中的显示事件但是是以适中的速度滚动的,则音频分量的回放可以被相应地加速而无需针对与事件相关联的音频分段减慢。例如,音频回放仍然可以一直到达到某一滚动速率还被认为是可理解的,并且因此无需使得音频的回放速度下降到正常播出速度。

在实施例中,导航区域612中的显示事件的滚动速率可能受到媒体播放应用280的限制。例如,媒体播放应用280可以施加不能够被超过的最大滚动速率。作为结果,由于音频分量的回放保持与滚动速率同步,因此回放速度类似地被限制。这对于确保音频分量的回放速度不会变的很快以至于其有可能变得无法被用户理解而言是有用的。

在用户滚动通过导航区域612中的显示区域的实施例中,音频算法可以包括“基音同步重叠相加(Pitch Synchronous OverLap Add)”数字信号处理技术,以使得音频回放能够被加速但针对基音变化进行校正。以该方式,音频回放能够被加速但同时对因此发生的基音的非自然增加进行补偿。该方法对于音频话音信号是特别有利的。

音频算法还可以在用户向后滚动通过在导航区域612中所示出的显示事件时使用。在该情况下,音频回放快速向后播放。然而,可以使用已知技术以使得尽管音频在时间上向后进行,但音频的短样是快速向前播放的。因此,由于音频不是逆向播放,所以用户可以能够挑选出快速向前播出的音频中的片段。如以上针对与事件相关联的音频分段所描述的实施例,快速音频回放可以暂时地被减慢至正常或接近正常的速度以使得用户能够清楚地理解与事件相关联的音频。如前所述,用户能够决定停止向后滚动,在该情况下,回放将从其正在播放的地方并且以正常速度继续。可替代地,用户可以继续向后滚动显示的事件以使得快速回退音频回放技术被恢复。

如在上文中所描述的,如果使用媒体播放应用280的惯性滚动特征,则在用户停止快速滚动通过导航区域612中的显示事件时,滚动速度逐渐降低直到达到正常的回放滚动速度。同样,如在上文中所描述的,音频算法可以被配置为将回放的速度与滚动的速度同步。因此,在实施例中,在所记录的通信会话的回放期间,音频分量的回放速度可以在用户停止快速滚动通过导航区域612中的显示事件之后立即逐渐降低回正常播放滚动速度。如果用户在回放被暂停的时停止快速滚动通过导航区域612中的显示事件,则回放保持暂停,但是当用户恢复回放时,回放将从所记录的通信会话中与用户已经滚动到的地方对应的点处恢复。

以上实施例是关于导航区域612中的显示事件的滚动描述的。然而,在可替代的实施例中,可以没有确定的事件,在该情况下,导航区域612将并不被填充有表示那些事件的文本。然而,导航区域612仍然可以由用户滚动以控制音频分量的播放速度,如在上文中所描述的。

通过允许用户向后和向前滚动通过导航区域612中的所有显示事件,用户能够快速且容易地导航至所记录的通信会话的播放中的合适的显示事件,包括表示在回放中先前已经发生的事件的显示事件。在用户滚动通过导航区域612中的显示事件时,在602处的回放的视频显示可以保持与显示事件的滚动同步。在实施例中,为了在该场景下节省处理和电力资源,视频的回放可以包括仅输出视频的关键帧。可选地,关键帧可以处于经降低的分辨率。可替代地,当用户滚动通过导航区域612中的显示事件时,在602处的回放的视频显示可以在其位置处暂停以便节省处理和电力资源。快速更新视频以反映滚动通过的显示事件将是资源密集的。因此,在602处的所记录的通信会话的视频可以仅当用户已经停止滚动通过显示事件时被更新。然而,计时器604可以被动态地更新以反映用户正滚动通过的时间点。因此,计时器连同显示事件、滚动标记605、以及同步的音频回放一起给予用户关于所记录的通信会话中正在发生什么的好的指示。在可替代的实施例中,视频分量在由用户所控制的滚动速度处于正常播放滚动速度或者处于由媒体播放应用280确定为在正常播放滚动速度的预先确定的范围(例如,正常播放滚动速度的+/-10%)内的速度的情况下被更新。

缩放功能

在实施例中,在导航区域612中所显示的单独的文本部分(事件的表示)的数量可以是基于已经向文本的每个部分分配的相关性值以及基于导航区域612的用户可控制的缩放等级功能的。当文本的部分作为步骤408(上文描述的)的一部分被存储并且被分配了相关性值时,相关性模块356算法也工作以将每个相关性值与导航区域612的缩放等级相关联。例如,被认为具有最高相关性的文本部分可以与导航区域612的最低缩放等级相关联。最低缩放等级(即,缩得最小)可以被认为是“概览”缩放等级。在示例实施例中,在幻灯片放映演示中表示幻灯片的改变的文本部分可以被分配最高的相关性。因此,这些文本部分则与概览缩放等级相关联。作为结果,当控制导航区域612的缩放等级缩小至概览缩放等级时,将仅在导航区域612中显示具有已经与概览缩放等级相关联的相关性值的这些文本部分。概览缩放等级可以被设置成当发起对所记录的通信会话的回放时针对导航区域612的默认起始缩放等级。类似地并且如在下文中更加详细地解释的,较低的相关性值相应地与导航区域612的更放大的等级相关联。因此,当媒体播放应用280将导航区域612放大到已经与向一个或多个文本部分分配的较低相关性值相关联的缩放等级时,这些文本部分(加上具有所分配的较高的相关性值的文本部分)将在导航区域612中被显示。因此,当放大或缩小时,导航区域612被配置为显示不同相关性等级的文本部分,以使得用户能够根据需求快速且容易地看到合适等级的细节。

在可替代的实施例中,相关性值可以由在用户终端102处运行的算法(在下文中为“用户终端相关性算法”)来确定,而不是由在云会议平台105处的相关性模块356分配的相关性值。当用户终端102访问元数据(事件文件318或单个分析结果文件320)时,用户终端相关性算法可以分析并比较表示每个事件的单个文本部分并且向每个部分分配相关性值。

在实施例中,所分配的相关性值(由相关性模块356或用户终端102分配的)可以是基于由通信系统100的多个用户所展示的动作的。即,可以这样说,所分配的相关性值是“众包(crowd sourced)”的。作为一个示例,参与通信会话的用户可以响应于他们所观看和/或听到的内容而提交现场反馈。可以通过在用户终端102的用户界面中呈现的“喜欢”按钮的方式来提交反馈。可选地,可以经由AV MCU 104a向云会议平台105发送该反馈。所述反馈可以从任何数量的用户来收集,例如从数百个到潜在地数百万个观看演示的用户收集。接着,可以由相关性模块356或个体用户终端102在分配相关性值时使用所述反馈。对于检测到的与积极反馈中的峰值相关的事件(即,所接收的大量的“喜欢”),相对于否则已经分配了的值而言,增加了向表示该事件的文本部分分配的相关性值。因此,事件表示的相关性可以基于当事件在通信会话中发生时与该事件相关联的受欢迎程度。

另外,众包技术可以基于用户如何与所记录的视频文件316的回放进行交互。即,当用户回放视频文件时,可以从用户终端102提交如上文所描述的反馈,即而不是作为现场通信会话的一部分来提交反馈。因此,在该场景中,可以增大或减小已经向事件的表示分配的相关性值(如上文解释的,通过相关性模块356或用户终端102)。因此,所述表示可以基于来自用户的反馈随着时间变得更相关或更不相关。例如,可以通过与上文描述的实施例类似的“喜欢”按钮的方式提交反馈,以使得受欢迎事件的表示具有所分配的增加的相关性。接收反馈的其他方式包括监视用户如何(详尽)导航所记录的视频文件316。例如,回放的受欢迎的时间点可以使得向在这些时间点发生的事件的表示分配增加的相关性值。作为另一示例,用户可以输入搜索项以搜索针对特定的事件表示的事件元数据的内容(如在下文更详细解释的)。搜索项和/或所选择的搜索结果可以作为反馈被发送至云会议平台105。因此,用户中的受欢迎的搜索项和/或搜索结果可以由云会议平台105确定。基于该众包信息,可以向与受欢迎的搜索项和/或搜索结果相关的事件的表示分配增加的相关性值。

因此,通过跟踪用户与所下载的视频文件316的交互的反馈,可以定期地更新向事件的表示分配的相关性值,以反映这些用户的整体行为。以该方式,随后从云会议平台105访问或下载视频文件316的用户终端102也将能够访问最新的元数据。已经访问了视频文件316的用户终端102可以被配置为从云会议平台105下载经更新的元数据以作为端数据流。

与所分配的相关性值相关联的相应的缩放等级还可以由在用户终端102处的用户终端相关性算法来确定,而不是由在云会议平台105处的相关性模块356算法来确定。在该情况下,用户终端相关性算法还可以将可用于导航区域612的显示大小面积考虑在内。例如,与所分配的相关性值相关联的缩放等级可以在用户控制导航区域612的缩放等级之前被预先计算。可替代地,所分配的相关性值可以与每次用户通过放大或缩小导航区域612来控制缩放功能的缩放等级相关联。

尽管潜在地更加处理器密集,但是因为接着可以将导航区域612的可用面积的大小考虑在内,所以当用户控制缩放功能时,将文本部分的相关性与缩放等级关联可以是有益的。例如,如果由媒体播放应用280所确定的导航区域612足够大,则可以在不使导航区域612拥挤的情况下显示更多的文本部分。例如,还可以显示更多的文本部分,其可能包括相关性程度比已经在导航区域612中显示的文本的部分更低的文本部分。通过对比,如果导航区域612较小,则用户终端相关性算法可以被配置为当导航区域612被缩小时给予被分配有最高相关性程度的文本部分优先级。这有助于确保导航区域612不会挤满了经显示的文本部分。在另外的实施例中,导航区域612的缩放等级可以仅仅基于导航区域612的大小而由媒体播放应用280动态地调整,即不需要用户控制所述缩放功能。这在回放所记录的通信会话期间重新调整导航区域612的大小的情况下可以是有用的。

图7a描绘了示例场景,其中,导航区域612已经被缩小到概览缩放等级,以使得在导航区域612中显示的文本部分表示已经分配有最高相关性值的每个幻灯片改变615。幻灯片的每个改变615被示出为由屏幕共享/幻灯片分析模块312确定的新幻灯片的标题。如果针对任何特定的幻灯片或页面没有标题,则其可以被示出为通过幻灯片编号或页编号(例如,“幻灯片5”或“第5页”)在导航区域612中被表示。计时器604被示出在“00:00”处,即在回放的开始处。作为结果,标题为“吃水果的益处”的第一幻灯片被示出为在第一区域602中被显示。如果在回放所记录的通信会话期间缩放功能没有被改变,则如在上文中所描述的,显示事件(文本部分)随着那些事件在所记录的通信会话的回放中发生而向上滚动导航区域612。

用户可以通过在网络客户端用户界面600中显示的缩放控制按钮672和674来控制导航区域612的缩放等级。通过轻敲或以其他方式选择按钮672(放大,“+”),放大导航区域612以使得媒体播放应用280用已经被分配了较低相关性值的更多经显示的文本部分来填充导航区域612。通过对比,轻敲或以其他方式选择按钮(缩小,“-”),缩小导航区域612以使得媒体播放应用280减小在导航区域612中显示的文本部分的量,从而仅显示已经被分配了较高相关性值的文本部分。如果缩放等级是完全放大或完全缩小,则可以“变暗”合适的控制按钮672或674以指示用户无法在该方向上再进一步控制缩放了。

尽管屏幕上的缩放控件被示出为按钮672、674,但是可以通过诸如虚拟滑块控件之类的其他方式来控制缩放。当用户通过不同的缩放等级进行缩放时,可以暂时地显示缩放控件旁边的标签以指示诸如“概览缩放等级”、“最大缩放等级”等的缩放等级。取决于存在多少用于显示文本部分的不同缩放等级(即,基于所分配的不同相关性值的数量),可以将不同的缩放等级相应地按级分配,例如,如果在导航区域612中存在用于显示文本部分的四个不同的缩放等级,则缩放控件可以将缩放等级显示为“1/4”、“2/4”、“3/4”和“4/4”中的一个。

可以实现对缩放功能的控制以使得每次用户轻敲或选择放大或缩小控制时,媒体播放应用280被配置为使得导航区域612的缩放等级被缩放至已经与相关性值关联的下一个缩放等级。接着,媒体播放应用280在导航区域612中显示已经被分配有合适的相关性值的文本部分。

可以使用浮点缩放值来实现分别与所分配的相关性值关联的缩放等级,以使得用户可以动态地放大和缩小导航区域612,而无需缩放等级“卡在”或“锁定”到预先定义的离散的缩放等级。当用户控制导航区域612的缩放功能以使其达到已经与向一个或多个文本部分分配的相关性值关联的浮点值时,将在导航区域612中显示这些文本部分(加上具有所分配的较高相关性值的文本部分)。这可以提供更流动且更自然的用户体验。

控制按钮还可以用于使导航区域612的缩放等级产生改变,例如,通过不同的控制按钮和/或轮式控件的方式。本领域技术人员可以知道放大或缩小导航区域612的其他方式,并且放大或缩小导航区域612的其他方式可以包括但不限于,诸如进行手指开合手势之类的触摸屏控件。

图7b至7b示出了相同的媒体播放用户界面600,其回放所记录的相同通信会话但是在回放中随后的时间点上并且在逐渐放大等级的导航区域中。

在图7b中,回放已经前进至“01:00”并且正在播放下一幻灯片。在该点上,缩放等级仍然在概览缩放等级上,以使得仅具有最高相关性的文本部分仍然在导航区域612中被显示。在回放期间的某一点上,导航区域612的缩放功能可以被控制成进一步放大。这由图7c示出。

在图7c中,已经增加了缩放等级意味着将在导航区域中显示具有与新的缩放等级关联的相关性值相比相等或更大的相关性值的文本部分。因此,现在在导航区域612中包括被认为具有比文本的其他部分更低相关性的一些文本部分。这些较不相关的文本部分可以提供可以帮助导航所记录的通信会话的更加详细的信息。这些较不相关的文本部分可以与所记录的通信会话的一个分区相关联,其中一个或多个更相关的文本部分也已经针对所述分区相关联。即,与已经被分配更大相关性值的文本部分相比,已经被分配较低相关性值的较不相关的文本部分可以提供关于所记录通信的一部分的更多细节。尽管被称为“较不相关”,但是当在导航区域612中显示时,这些文本部分提供对用户而言有时特别有用的重要信息源。例如,这些新近显示的较不相关的文本部分可以包括以下中的一个或多个:基于NLP分析306检测到的关键词和/或关键短语616;对音频事件618的指示(例如,沉默、大笑、鼓掌、音乐、说活者的改变等);对可视事件620的指示(例如,手势、视频剪辑等);和/或从屏幕共享/幻灯片分析312检测到的对事件622的指示(例如,文本副标题、文本元素,例如基于OCR的捕获)。

当导航区域612被放大时,所记录的通信会话的回放不间断地继续并且所述文本部分(显示事件)可以如在上文中所描述的向上滚动通过导航区域612。可选地,还可以利用计时器625来显示所显示的每个文本部分,计时器624指示在所记录的通信会话中其所表示的事件被检测到的时间点。例如,在图7c中,“[鼓掌]”文本部分表示在所记录的通信会话中在“01:25”处发生音频事件。

在实施例中,用户能够选择向文本部分分配的相关性值的范围。例如,如果存在较大数量的事件,则用户可以选择用户设置以使用更宽范围的相关性值。根据可用的相关性值的范围,相关性模块356(或用户终端102)必须给文本部分分配可用的相关性值中的一个,以确定文本部分中的哪些文本部分与其他文本部分相比更加相关。例如,可以将关键短语确定为比音频事件更加相关。通过使用更大数量的不同的相关性值,相应地存在变得与这些相关性值相关联的更大数量的缩放等级。因此,向用户提供了用于在媒体播放应用280放大或缩小导航区域612时改变如何显示不同相关性程度的文本部分的较细粒度。相反地,用户可以降低可用的相关性值的范围,以使得当媒体播放应用280放大并缩小导航区域612时,存在较少的方式来显示不同相关性程度的文本部分。

在图7d中,所记录的通信会话的回放已经前进至“06:00”且导航区域612已经放大到最高缩放等级(即,最放大)。在该情况下,媒体播放应用280被配置为将所记录的音频数据流的全部转录显示为由ASR 302输出。全部转录可以被认为是具有最低可能相关性值的文本部分。分配了较高相关性值的所确定的其他文本部分还可以被包含或者可以被禁用以防止中断所显示的全部转录的流。用户可以滚动通过全部转录,在该情况下,通信会话的回放可以保持同步,如在上文中所描述的。可以针对文本的每个分区(例如,段落或检测到的主题的改变)显示计时器625,以便不使得导航区域612过于拥挤。

在实施例中,当用户控制导航区域612的缩放功能时,他可以不想改变所记录的通信会话的回放的位置。因此,在一个实施例中,控制导航区域612的缩放以使得当用户放大或缩小时,其以当前的回放位置为中心。即,缩放将以与计时器604对准的文本部分为中心。媒体文件316的回放不受影响并且不受对缩放等级的任何改变而不间断地继续。用户还可以在回放被暂停时放大并缩小所显示的文本部分。

在可替代的实施例中,用户可以想要使用缩放功能来活动地改变所记录的通信会话回放的位置。例如,如果用户选择放大或缩小导航区域612中的特定区域,则媒体播放应用280控制所记录的通信会话的回放以使其跳转到用户已经放大到(或缩小到的)的最近的文本部分并且从该点继续播放,即回放将保持与用户放大或缩小到的文本部分同步。如在上文中所描述的,从该点起所显示的文本部分(或转录)可以继续向上滚动导航区域612。

如在上文中所描述的,在导航区域612中所显示的所有文本部分也是由用户可选择的。如果由用户选择,则回放基于文本部分被表示的事件的时间戳而跳转到所记录的通信会话的时间点。如果导航区域612已经被放大以查看音频分量的整个转录,则可以选择每个句子以使得回放跳转到所记录的通信会话的该时间点。动态地更新导航区域612以示出与计时器604对准的所选择的文本部分(或者当完全放大时,显示全部转录的一部分)。从该点起所显示的文本部分(或者转录)可以如在上文中所描述的继续向上滚动导航区域612。

参考图8,在实施例中,媒体播放应用UI 600还可以包括搜索框680。用户可以输入以文本字符串为形式的搜索项。可替代地,可以说出搜索项并且通过在用户终端102上运行的话音识别模块(未示出)来识别所述搜索项。可以在回放所记录的通信会话期间或当其被暂停时输入搜索项。媒体播放应用280针对与所输入的搜索项匹配的结果来查看事件元数据的内容。所述结果可以在宽泛的意义上匹配,例如搜索可以自动地寻找经搜索的项的相关变型,包括同义词、单数和复数形式、已经潜在的拼写错误。可替代地或另外地,搜索可以使用自然语言处理方法。例如,针对“水果”的搜索可以给出包括诸如“香蕉”、“橙子”、“苹果”等之类的相关文本的关键词和/或关键短语的结果。

可以针对元数据的内容(例如,从ASR 302输出的文本的内容、或者从OCR分析确定的文本)来进行选择。此外,可以针对在通信会话期间发生的事件的类型来进行选择,包括但不限于音频事件、可视事件、当特定用户发言时、和/或当特定用户加入或离开会话时。

媒体播放应用280可以针对所搜索的项分析跨所有缩放等级的元数据。例如,即使所记录的音频数据流的全部转录通常仅当导航区域612被完全放大时才显示,但当导航区域612被进一步缩小时可以找到匹配。

可以以自动完成的方式显示搜索结果,例如在用户输入每个键入的字符时在搜索框下方显示最接近的匹配的列表并且更新所述列表。每个结果可以由图形682指示,例如以指示已经发现的事件类型,例如幻灯片改变事件、音频事件、可视事件等。在由ASR 302导出的关键词、关键短语或全部转录的一部分中发现的结果可以显示有引号(“”),以指示该结果是转录的一部分。还可以给所述结果提供上下文,即如果在转录中发现所搜索的词,则可以显示针对结果的短摘录,其中所搜索的词以粗体或以某种方式突出地示出。因此,用户可以更容易地理解所搜索的项如何在通信会话中被使用的上下文。结果列表可以根据其所分配的相关性等级或者按照时间顺序而被存储。在实施例中,可以在结果旁边示出计时器684,以指示在所记录的通信会话中发生事件的时间点。

用户可以选择所建议的搜索结果中的一个,并且作为响应,媒体播放应用280使得所记录的通信会话的回放位置(或暂停位置)径直跳转到回放的对应时间点。此外,通过选择结果,导航区域612被更新以显示被示出为与计时器604对准的对应的文本部分。在可替代的实施例中,对搜索结果的选择不改变或中断当前的回放位置,但是可以更新导航区域612以在显著的位置示出对应的文本部分,例如,在导航区域612的顶部或者在导航区域612的中间。

如果所选择的结果与具有所分配的相关性值的文本部分相关联以使得其已经能够以导航612当前所处的缩放等级显示,则媒体播放应用280不引起缩放等级的改变。可替代地,所选择的结果可以与相对于在导航区域612的当前的缩放等级上正在显示的文本部分相比具有所分配的更低的相关性值的文本部分关联。在该情况下,媒体播放应用280控制缩放等级,以使得其放大到与较低相关性值相关联的缩放等级,这使得与所选择的结果相关联的文本部分被示出为与计时器604对准地在导航区域612中被显示。

在实施例中,可视表示可以被显示在媒体播放应用的第一区域中,其中,所述第一区域与被配置为显示对媒体文件的回放的用户界面的第二区域是分离的。

在实施例中,至少一个通信流可以包括音频流。

在实施例中,访问所述元数据可以包括:从服务器接收从所述至少一个通信流转换的所述文本的转录;或者在所述用户终端处执行对所述至少一个通信流的所述转换;或者这两者的组合。

在实施例中,滚动通过可视表示可以包括滚动通过如在所述用户界面的所述第一区域中显示的可视表示,以使得每个可视表示与在所述用户界面的所述第二区域中对所述媒体文件的所述回放同步地被显示。

在实施例中,所述事件是基于对所记录的通信会话的所述至少一个通信数据流的分析而确定的,所述一个或多个事件包括以下中的一个或多个的发生:使用自然语言处理技术所确定的关键词或关键短语;从对所记录的音频流或所记录的视频流的属性的分析所确定的事件;和/或从对屏幕共享数据的分析所确定的事件,所述分析可选地包括光学字符识别技术。

在实施例中,所述滚动速率包括默认滚动速率,在所述默认滚动速率期间对所述音频分量的所述回放被保持为正常速率,其中,所述正常速率是所述音频分量在所述通信会话中原本被记录的速率。

该方法可以包括基于在所述用户终端处接收由用户输入的控制动作来动态地调节滚动速率。

在实施例中,动态地调节所述滚动速率的步骤可以包括基于惯性滚动原理自动地调节所述滚动速率,以使得由所述用户控制为比所述默认滚动速率快的滚动速率响应于所述用户停止所述控制动作而逐渐地下降回所述默认滚动速率。

该方法可以包括当所述滚动速率比所述默认滚动速率快并且高于预先确定的阈值水平时,对于被确定为已经发生了相应事件的所述音频分量的一个或多个部分,通过将所述滚动速率降低至所述正常速率或接近所述正常速率来控制所述回放速率。

在实施例中,如果用户将滚动速率继续控制为比默认速率快,则音频分量的播放速率可以保持与较快的滚动速率同步。

在实施例中,如果在对所述部分中的一个部分的回放期间,所述用户停止对已经被降低至所述正常速率或接近所述正常速率的所述滚动速率进行控制,则对所述媒体文件的所述回放继续但是采用所述正常速率,并且所述滚动速率返回至所述默认滚动速率。

该方法可以包括对较快的滚动速率施加最大限制。

该方法可以包括,基于对用户的输入的控制,以向前或向后的方向来调节滚动速率以使得媒体文件的经同步的回放分别前进或后退。

在实施例中,媒体文件可以包括视频分量,并且媒体播放应用被配置为在用户界面的第二区域中且与滚动速率同步地回放视频分量。

在实施例中,可以通过使用在用户终端上运行的一种或多种音频算法来将音频分量的播放速率与滚动速率同步。

在实施例中,所述一种或多种音频算法包括“基音同步重叠相加”数字信号处理技术。

可以根据在上文中所描述的方法中的任何方法来配置本公开的第二方面的用户终端。

本公开的第三方面的媒体播放应用可以被配置为执行在上文中所描述的方法中的任何方法。

一般而言,可以使用软件、固件、硬件(例如,固定逻辑电路)、或这些实现的组合来实现在本文中所描述的功能中的任何功能。如在本文中所使用的术语“模块”、“功能”、“组件”和“逻辑”一般表示软件、固件、硬件、或其组合。在软件实现的情况下,模块、功能、或逻辑表示当在处理器(例如,CPU或多个CPU上)被执行时执行指定任务的程序代码。程序代码可以存储在一个或多个计算机可读存储器设备中。在下文中所描述的技术特征是平台独立的,这指的是可以在具有多种处理器的多种商业计算平台上实现所述技术。

例如,用户终端102和/或云会议平台105还可以包括使得这些设备的硬件执行操作的实体(例如,软件),例如处理器、功能块等。例如,用户终端102和/或云会议平台105可以包括能够被配置为保存指令的计算机可读介质,所述指令使得这些设备且更具体地使得操作系统以及这些设备相关联的硬件执行操作。因此,所述指令用于配置操作系统和相关联的硬件以执行操作并且以该方式使得操作系统和相关联的硬件的转换以执行功能。可以由计算机可读介质通过多种不同的配置来向用户终端102(或云会议平台105)提供指令。

计算机可读介质的一个这样的配置是信号承载介质,并且因此被配置为例如经由网络向计算设备发送指令(例如,作为载波)。计算机可读介质还可以被配置为计算机可读存储介质并且因此不是信号承载介质。计算机可读存储介质的示例包括随机存取存储器(RAM)、只读存储器(ROM)、光盘、闪速存储器、硬盘存储器、以及可以使用磁性的、光学的、以及其他技术来存储指令和其他数据的其他存储器设备。

尽管已经用特定于结构特征和/或方法动作的语言描述了本主题,但是,应当理解的是,在所附权利要求中所定义的主题不一定限于在上文中所描述的具体特征或动作。相反,在上文中所描述的具体特征和动作是作为实现权利要求的示例形式而公开的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1