监视数字传输环境性能的方法和确定服务潜在质量的系统的制作方法_2

文档序号:8447349阅读:来源:国知局
方讲话分析、重叠讲话分析、话音交替速率、麦克风静 音分析或链路故障率中之一;W及(C)使用组合单元将来自至少第一分类器和第二分类器 的输出组合W产生异常工作的可能程度的输出。
[0029] 根据本发明的另一方面,提供一种用于确定提供至联网的会议系统中的端点处的 参与者的服务的潜在质量的系统,该系统包括:一系列采集单元,用于采集和聚合来自会议 的参与端点的系统状态信息;第一分类单元,用于将会议活动分类为参与者之间的规范的 有效会议;至少第二分类单元,用于将会议活动分类为参与者之间的非规范的有效会议; W及聚合器,其与第一分类单元和至少第二分类单元互连,聚合器基于来自第一分类单元 和第二分类单元的输出来根据其确定故障可能性水平和置信水平。
[0030] 在一些实施方式中,采集单元中的至少之一采集信息,该信息包括每个端点处的 参与者的同步语音或通信活动。在一些实施方式中,系统状态信息优选地能够包括每个端 点处的语音水平随时间的变化。在一些实施方式中,系统状态信息优选地能够包括每个端 点处的残余回声水平随时间的变化。在一些实施方式中,系统状态信息优选地能够包括每 个端点处的参与者的随时间的相互沉默。在一些实施方式中,系统状态信息优选地能够包 括参与者的话音的重叠程度。在一些实施方式中,系统状态信息优选地能够包括参与者的 麦克风静音变化。在一些实施方式中,系统状态信息优选地能够包括每个端点处的参与者 的随时间的单方讲话。在一些实施方式中,系统状态信息优选地能够包括参与者的链路故 障和重新连接。
【附图说明】
[0031] 现在将参照附图仅通过示例来描述本发明的实施方式,在附图中:
[0032] 图1示意性示出包括实现上下文感知(contextaware)处理的额外监视设施的 VoIP环境;
[0033] 图2示出图1的布置的一部分;
[0034] 图3示出多点会议的H态马尔科夫过程建模;
[00巧]图4示出参数会议分析的流程图;
[0036] 图5示出来自示出AGC水平、输入水平、噪声水平和回声水平的有效统计记录的输 出;
[0037]图6示出会议的持续时间中来自扬声器的语音活动的示例记录拟及
[003引图7不出一系列会议会话的不例传输脉冲(burst)长度分布。
【具体实施方式】
[0039] 本发明的优选实施方式提出在电话会议期间呼叫参与者的明面表现和行为的度 量。虽然可能不知道问题的直接来源,如果在电话会议内观察到异常的人类行为,则该在测 量中被利用,其可W归因于通话提供基础设施的故障而不是具体端点故障。
[0040] 优选实施方式总体上涉及集成的会议系统,其中,可W直接访问将在会议的中央 服务器或主要主机上可得到的所有的客户端动作和/或会议的状态变量的集合。实施方 式具体呈现为涉及语音会议系统,然而应当明白和设想的是,本发明也可W涉及附加参与 方之间的视频和/或其他传感和通信信息的系统。一些示例包括共享介质、文本、书写 板(whiteboard)、视觉幻灯片、其他音频内容、控制数据巧日在游戏和在线合作系统中使用 的)、文件传输W及一般可简化为W实时方式在参与方之间发送和消耗的数字数据的任何 事物。
[0041] 优选实施方式的核也提供对算法、启发式分类器和训练的分类器(机器学习)的使 用W识别会议活动的状态之间的转换,专注于能够指示会议系统的一些故障或不期望的性 能的异常的人类行为的特定模式。
[0042] 优选实施方式提供评定如下系统中的会议QoS的手段具有特别指出的重要 性,该系统动态地利用会议中的会议动态W提供配置资源的不均匀的分布(Blundell和 Mathy2004)。通过具体示例,正在收听但没有直接贡献很多的特定会议参与者可W被分配 在一个或两个方向中较差的网络链路。下行链路上的音频可能具有到会议的主体的较大的 延迟,并且利用兀余编码或前向纠错(然而该招致延迟),将会在较差的网络链路上产生可 接受的QoS。上行链路上的音频是不频繁的,并且仅需要一旦参与者进行与其他参与者交互 时具有实质质量。会议中的资源的该种动态分配对项目是合理的,然而,基于根据物理参数 和适当的模型得到的M0S来测量QoS的现有技术不是很好地适合于会议中的该种优化的资 源分配。
[0043] 最终,可能根据到对于一个或更多个用户来说变成有问题的点的服务提供而使电 话会议劣化。因此,应当依赖于会议参与者的相对重要性和需求而不只是为链路的集合获 得的M0S。优选实施方式提供通过观察用户的行为来评定整个会议的适当质量的手段。
[0044] 优选实施方式提供上下文感知处理,在于通过利用在电话会议和用户端点上获得 的信息的广泛的集合来实现结果或成果。
[0045] 首先参照图1,示出了经由服务器6进行电话会议的上下文感知客户端2至4的优 选实施方式1的示例操作环境。经由VoIP连接8、9进行会议。服务器6负责实施会议系 统。在该实施方式中,示例IP网络语音(VoIP)被示为具有客户端之间的H个通信链路的 1,并且维持每个客户端与服务器之间的单独的相关数据流、信息流W及实施规则。
[0046] 上下文感知会议系统的优选实施方式1的网络环境可W是有线网络条件或无线 网络条件如LAN/WAN、WiFi、2G/3G/4G、蓝牙等。客户端的类型可W是个人计算机(PC)、平板 电脑或移动客户端等。
[0047] 还提供了单独的分析网络。其包括数据流20、21,信息22、23W及规则25、26。
[0048] 在端点20或会议服务器的在参与者中的每个参与者上的边缘21处采集数据。该 数据可w包括下列中的一些或全部:与会议参与者中的其余参与者对准的语音活动时间; 连接和断开;讲话的音量水平的变化一对任何增加的水平的强调;重复;噪声水平;随着 时间的特性和变化;损害(nuisance)水平;回声或残余回声水平;在端点处使用的具体类 型和硬件;端点处的装置配置或硬件的变化。可W被记录的其他数据可W包括:电话会议 连接和断开的时间;每个端点处W及因此横跨电话会议的语音活动;每个端点处的噪声、 语音和损害水平;端点的静音。
[0049]每个端点监视数据的集合(例如,噪声水平、VAD(语音活动检测)活动),并且对于 信息将其减少(例如,问题端点,最近语音活动百分比),并且该可W用于由规则单元例如25 对动作实施的规则的集合中。针对每个客户端到服务器的接口复制数据、信息和规则的相 似结构21、23、26,并且针对服务器整体复制数据、信息和规则的相似结构28、29、30。具有 来自所有端点例如20、22、25和服务器接口 21、23、26的数据流的服务器上的规则30可W 用于基于异常的人类行为生成有效的会议度量。
[0050] 优选实施方式基于如下观察:有效的会议将遵循多方之间的特征行为模式。
[0051]该信息的聚合用于检测会议问题所特有的潜在故障行为或相应的集合。一些示例 可W包括;会议中的非预期的较长沉默停顿我们仍然在线吗?");已经很积极的参与者 在没有任何来自他人的关于他们的迫切离开的确认或响应的情况下退出进行中的对话;长 的沉默之后是停顿和"你们还在吗"之类响应;特定的人退出会议并且活动变得停止、沉默 或偶发直到他们返回W及重新开始典型的有效的对话;局部端点静音的使用(即使当存在 被抑制的较小语音活动(本地对话)时);具有表示困难通信的增大的语音水平的语音讨论 的重复;异常"什么?",然后较响的响应;由较短的非语音传输的有规律的和/或增大的频 率指示的导致损害的端点(假定损害控制不在适当位置);主扬声器的中断,随后是指示各 方确定谁导致"干扰"的活动然后一方迅速静音;尝试的通信一加入会议的某人仅稍后离 开,或重复尝试和重新连接;诸如回声水平或增益控制的参数的异常趋势,其导致传异常输 特性或损害水平。
[0052]从(机器学习)分类器得出的所涉及的规则和数据的集合可W用于提供识别异常 的人类行为的某种可靠性。通过连续的利用和数据采集,分类器系统和规则可W不断地进 展。因为具有多种多样的会议使用情况,系统设计还可W包括在会议中的某个点检测"正 常"活动的分类器,并且任何异常的活动的存在被使用该分类中的置信水平指示,并且对照 至少一些参与者之间存在正常会议活动的置信度进行测量。
[0053] 机器学习可W提供在完整的通话链路或会议故障(归因于较差QoS的一个或更多 个用户断开连接)之前出现的异常行为的检测和预测水平。近来的工作在分析会议中的模 式方面指出该是成熟的区域(Dong,Lepri等人,2012),然而,其通常被用在监视和改进小 会议中个体的性能和有效性方面。
[0054]下面的伪码表示整体结构或算法。
[00巧]在每个端点处:
[0056] 针对每峽捕获数据
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1