通过指派用于数据群集的情境标签来管理移动装置中的情境模型的制作方法_4

文档序号:8417891阅读:来源:国知局

[0063] 返回到图2,由系统200用于群集数据的技术如下。出于描述的简单性起见,以下 相对于从仅一个数据流利用的群集进行描述,但以下描述可应用于多个数据流。此处,使用 以下步骤,群集由群集模块240处理且由情境推断模块260使用以推断用户的情境。其它 步骤或以下步骤的变化可如本文进一步所描述而使用。
[0064] 1)例如经由群集模块240群集数据流。这涉及将每一数据点指派于有限数目的群 集ID中的一者。每一群集ID被指派表示所述ID的模型以使得可将未来数据点与不同群 集模型进行比较以确定相似性。
[0065] 2)例如经由统计数据模块230编译统计数据。对于所发现的每一群集,使其与当 用户在此群集中时计算的来自低级特征和推断的相关统计数据关联。
[0066] 3)例如经由情境建模模块250指派情境标签。对于每一群集,基于经编译低级特 征/推断统计数据学习情境标签。在最简单情况中,这可通过以某种方式平均化所述低级 特征/推断而完成。举例来说,可针对每一群集ID执行计算,包含检测到语音的时间的平 均分数、可见的蓝牙装置的平均数目及其最常发生的运动状态。如果对于特定群集,语音的 分数大于某一阈值,蓝牙装置的平均数目大于某一阈值且最常见运动状态是"停置",那么 可将适当情境标签(例如"会议中")指派给所述群集。
[0067]4)例如经由情境推断模块260推断情境。在稍后时间点,对于用户的当前数据流, 找到具有与当前数据的最接近匹配模型的群集且输出其标签作为所推断情境。
[0068] 以上过程由图4中的图400说明。在图400中所示的实例中,群集几个小时的音 频环境数据。x轴展示时间且y轴展示群集数目。图解说明在各种时间点处计算的低级特 征/推断。低级特征和推断在图400中标记为A-H,其是在图主体下方界定。发现五个音频 环境群集,且图解说明通过所述群集的遍历的时间序列。揭示最高群集含有大量语音和人 群特征以及少量打字。此音频环境群集被给予情境标签"会议"。揭示第二群集含有一些语 音,以及用户单独的许多实例。此群集被给予情境标签"固定电话"。将相似处理应用于第 三和第四群集。最下群集含有在家推断的许多实例,并且还持续整夜。将情境标签"睡觉指 派给此音频环境"。
[0069] 虽然一般来说可任意使用情境标签集合,但在以上实例中情境标签表示用户情 形。在不同实例中,情境标签可表示企业地点类型,例如体育馆、咖啡厅、办公室、会议室、休 息室、演讲厅等。这些可根据基于Wi-Fi指纹(例如,"微观地点")的群集而习得。每一微 观地点可对应于房间/区域,且情境标签可对应于此房间/区域的描述。随后可基于例如 语音、运动状态、蓝牙装置密度、周围音频能级、访问的日时、群集中花费的时间量等特征/ 推断而习得情境标签。
[0070] 在以上实例中,假定群集不跨越情境边界。如果经群集数据流是位置或音频环境, 且情境标签是关于用户情形或地点类型(如在上述实例中),那么此假设通常是正确的。举 例来说,当用户进入会议时,通常在地点(例如,从其办公室到会议室)和音频环境(例如, 从对应于行走的音频环境到对应于会议的音频环境)两者中观测改变。在一些实施例中, 可在其中群集跨越情境边界的情况中推断或确定群集和/或情境。
[0071] 本文所描述的用于群集数据且使用经群集数据执行情境推断的技术可应用于多 种使用情况。这些使用情况的实例包含(但不限于)以下各项:
[0072] 交通工具内检测(例如驾驶):利用GPS速度和基于GPS的炜度/经度轨迹作为 低级特征来对音频环境群集加标签。使用当前音频环境群集来分类交通工具内对非交通工 具内。
[0073] 测量睡觉时间:利用在家推断和日时(即,半夜)作为低级特征来将音频环境群集 加标签为睡觉群集对不睡觉群集。通过睡觉群集中花费的小时数目测量睡觉时间。
[0074] 室内/室外检测:利用许多低级特征将微观地点群集加标签为室内或室外。特征 包含例如可见卫星的数目和对应信号强度(例如,给定为RSSI或其它测量);可见Wi-Fi AP的数目和对应信号强度(例如,给定为RSSI或其它测量);基于广播的装置ID (例如,桌 上型计算机、打印机等)的静止蓝牙装置的可见度;音频信号上的目标声音检测(室内/室 外);环境光传感器读数或记录;相机红/绿/蓝(R/G/B)强度,其给出可从其确定光源类 型的光颜色(例如,荧光对自然光);以及等等。从当前微观地点群集分类室内对室外。
[0075] 会议中检测:利用许多低级特征将微观地点群集加标签为室内或室外。特征包含 例如可见个人蓝牙装置的数目;目标声音检测;日时;在家/工作推断;等。使用当前微观 地点群集分类会议中对不在会议中。
[0076] 区域(例如,在家/工作/其它/交通中)检测:利用许多低级特征来将宏观地点 群集加标签为在家/工作/其它。基于当前宏观地点群集分类区域。当前宏观地点群集的 不存在可与交通中推断相关联。特征包含例如日时;群集中花费的小时数目;群集中花费 的最长时间;在给定时间(例如,上午3:00)群集中花费的时间的频率;等。
[0077] 再次返回到图2,系统200也可以用以群集多个数据流。当群集一个以上数据流时 (例如,音频环境和微观地点),上文对于一个数据流所述的推断程序可经增强。以上程序 群集且利用多个数据流的实例增强如下。也可以使用其它增强。
[0078] 1)例如经由群集模块240单独地群集每一数据流。
[0079] 对于每一群集数据流,将每一数据点指派于有限数目的群集ID中的一者。每一群 集ID被指派表示所述ID的模型以使得可将未来数据点与不同群集模型进行比较以确定相 似性。
[0080] 2)例如经由统计数据模块230编译统计数据。对于每一数据流,使每一所发现的 群集与当用户在此群集中时计算的所有低级特征和推断关联。
[0081] 3)例如经由情境建模模块250指派情境标签和置信度值。对于每一数据流,基于 经编译低级特征/推断学习用于每一群集ID的情境标签。使置信度值与每一习得的情境 标签关联。举例来说,如果特定音频群集极接近于会议中预期所见的语音分数和蓝牙密度, 那么指派情境标签"会议"且使高置信度值与此群集/标签关联。如果特定微观地点群集 具有稍微(但不特定)接近对于会议预期的等级的语音分数和蓝牙密度,那么指派情境标 签"会议"但使低置信度值与此群集/标签关联。
[0082] 4)例如经由情境推断模块260推断情境。在稍后时间点,对于每一数据流将用户 确定为在特定群集中。如果存在具有冲突情境标签的多个群集,那么选择具有最高置信度 值的情境标签。
[0083] 在某些情况下,群集模块240可经配置以在上述步骤(1)中联合地群集数据。举 例来说,群集模块240可经配置以将子群集的每一相异组合处理为单独的群集。作为一实 例,如果存在M个音频群集和N个地点群集,那么可产生MN个联合群集。同样或替代地,群 集模块240可经配置以对来自多个传感器的每一相异数据群组指派一个群集。
[0084] 为了考虑当前数据流与任何先前观测群集不一致,即其来自新的尚未见的群集的 可能性,情境推断模块260可经配置以在执行以上步骤(4)中描述的动作之前首先包含距 离测试。距离测试确定当前数据流距最近的群集模型的距离。如果此距离大于某一阈值,那 么这指示不存在与和当前数据流具有至少阈值程度的关系的情境标签相关联的已知群集。 因此,不推断情境,且情境推断模块260输出"未知的情境"、"先前未见的情境"和/或其它 合适的标签。
[0085] 在以上步骤⑶和⑷中,情境建模模块250和/或情境推断模块260可以多种方 式将置信度值指派给习得的情境标签。较一般方法是为每一群集指派用于可能情境标签中 的每一者的后验概率以使得当在总体所有可能情境标签上求和时所述后验概率总和为一。 在融合步骤中,跨越各种数据流以某种方式组合这些概率,例如通过乘法。举例来说,如果 当前音频群集具有对于情境=会议的〇. 8概率和对于情境=不在会议的0. 2概率,且当前 地点群集具有对于情境=会议的〇. 4概率和对于情境=不在会议的0. 6概率,那么总推断 将指派对于情境=会议的〇. 8x0. 4 = 0. 32的值和对于情境=不在会议的0. 2x0. 6 = 0. 12 的值。由于情境标签"会议"具有较高值,因此提供其作为输出标签。
[0086] 来自如上文针对一个数据流或多个数据流所描述的步骤(4)的情境推断模块260 的输出可采取各种形式。可能的输出包含对应于具有最高置信度值的情境的硬决策输出、 对应于最可能情境的概率分布的软决策输出(例如,作为概率向量的输出)等等。其它输 出也是可能的。
[0087] 如上文所描述的情境标签学习步骤由图5中的图500图解说明。上述情境标签推 断步骤由图6中的图600图解说明。一般来说,图500展示通用情境模型的构造,所述情境 模型例如可在移动装置处实时产生或初始地在移动装置处基于所观测或导入数据流离线 建构,或可在发射或加载到例如移动装置等另一装置上之前由例如服务器或计算机等装置 确定。所述模型由群集组成,所述群集例如经由群集模块240在阶段510从N个数据流形 成。还在阶段520例如经由统计数据模块230针对其它数据流计算低级特征和推断(F/I)。 对于每一群集,例如使用统计数据模块230在阶段530计算用于低级特征和推断的相关统 计数据(例如,群集中存在的语音的分数)。在阶段540这些统计数据使得能够将标签指派 给群集(例如,由情境建模模块250),从而产生含有群集与其标签之间的映射的模型550。 以此方式,从其它数据流获得的信息可用以表征一或多个群集和/或对一或多个群集加标 签。基于此模型,图600展示在后续跟踪期间,在阶段610计算与从N个数据流取样的数据 相关联的最近的
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1