媒体内容发现以及角色组织技术的制作方法_2

文档序号:9620903阅读:来源:国知局
精确地识别为不具有吸引力,因为他 们具有小于〇的吸引力值,表示他们不具有吸引力。如上所述,角色模型116-128的第二维 (或第二值)描述了角色是科学家还是非科学家。针对所有科学家的搜索将识别在第二维 中具有值1的所有角色模型。在图1的示例中,针对科学家的搜索返回结果一一谢尔登、莱 纳德、霍华德、拉杰、伯纳黛特和艾米一除了潘妮之外的所有人。
[0030] 此外,针对角色的特定特点的搜索可能取决于角色模型矢量的多个维度。例如,可 通过识别具有将他们识别为"喜欢科学"而且"擅长科学"的角色模型的角色来进行针对"科 学家"的搜索。
[0031] 矢量空间还可用于确定角色之间的距离。该距离表示了(类似的或不类似的)两 个角色彼此有多关联。多种技术可被用来确定两个角色之间的距离。
[0032] 采用第一技术,可采用加权的欧氏距离来确定与第一角色模型矢量(Xl,x2,x3,x4) 相关的第一角色f以及与第二角色模型矢量(yi,y2,y3,y4)相关的第二角色f之间的距离d, 加权的欧氏距离为:
[0033] _ " _ 一一
一、. ...........,
[0034] 一般地说,针对N维空间的第一角色f与第二角色^之间的加权的欧氏距离d可使 用下述等式计算:
[0035]
[0036] 作为该第一技术的示例,可使用图1的角色模型116和118来如下地计算谢尔登 和莱纳德之间的距离,假设对于所有i有权值β1 :
[0037]
[0038] 如该计算所示,具有相同值的角色模型的元素不对距离有贡献。因此,如果两个角 色具有相同的角色模型,他们的距离将为〇。在谢尔登和莱纳德的情况下,他们共享许多但 不是所有属性。具体地,谢尔登和莱纳德之间的差异是他们的吸引力和他们的友好度。友 好度的开方差值的贡献(即,4)比吸引力的的开方差值所导致的贡献(即,1)更大。由此, 两个角色之间的距离是5的平方根。
[0039] 采用第二技术,与第一角色模型矢量(Xpx2,x3,x4)相关的第一角色f和与第二角 色模型矢量(yi,y2,y3,y4)相关的第二角色#之间的距离d可通过进行角色模型的值的比较 来确定:
[0040]
[0041] 在该比较中,两个比较值的结果在它们不相等时为1类似地,两个比较值的结果 在它们相等时为0。如果七和丫:不相等,(Xl! =yi)的值将为1。这将贡献值1至距离 禮或者,如果七和71相等,(Xl! =yi)的值将为0。这将不对距离ipfl产生贡献。 由此,在角色共享属性时,使用该第二技术,针对角色的距离将较小。
[0042] 再次地,事实可能是,某些轴总体上更重要或者就特定用户而言比其它用户更重 要。这再次地可以由一系列"权值"I表示。更一般地说,第一角色f和第二角色|之间针 对N维空间的距离d可采用下述等式进行计算:
[0043]
[0044] 作为该第二技术的示例,可采用图1的角色模型116和118如下地计算谢尔登和 莱纳德之间的距离:
[0045] d(Sheldon,Lenonard) = ( (-1) != (-1)) +(1 != 1)+ ((-1) != 0)+ ((-1) != 1) =2
[0046] 如该计算所示,具有相同值的角色模型的元素不对距离做出贡献。因此,如果两个 角色具有相同的角色模型,他们的距离将为0。在谢尔登和莱纳德的情况下,他们共享许多 但不是全部的属性。具体地,霍华德和拉杰之间的差异是吸引力的友好性。这两个差异的 每一个都对距离产生相同量的共享(即,1)。由此,这两个角色之间的距离为2。
[0047] 这两种技术都使用常用于计算矢量空间中的距离的简单的对称的函数。然而,在 角色的情况下,事实可能是,在计算从第一角色I至第二角色f的距离时,可能会更重要地 考虑对角色f"重要"的属性,同时在计算从角色f至角色#的反向距离时,可能会考虑对角 色,"重要"的属性。例如-可能会确定不管何时角色在特定属性上是"中性的",该属性 上的"权值"为〇,否则该属性上的"权值"为1。在该情况下,从谢尔登至莱纳德的距离为:
[0051] 因此,谢尔登至莱纳德的距离大于莱纳德至谢尔登的距离,这是因为"外表"对于 谢尔登的角色比莱纳德的角色更凸显。存在许多方式来使得这些距离函数变得更复杂来适 应角色空间或者特定用户的特征。
[0052] 在完全的一般意义上,将角色空间中的两个元素变成数量的任意函数可用作距离 函数。对于距离d:
[0053]
[0054] 在另一示例中,用于确定两个角色之间的距离的第一和第二技术都将得到潘妮和 谢尔登之间的距离大于针对谢尔登和莱纳德计算的距离。潘妮和谢尔登之间的距离对于这 两种技术都会得到它们的最大值,这是因为潘妮和谢尔登在他们的角色模型的所有四个维 度上都是完全相反的。
[0055] 如上所述,角色之间的距离表示了角色之间的相似度。因此,在已知消费者喜欢特 定角色时,计算系统可推荐与已知角色相距相对较小的距离的其它角色。系统可推荐与已 知角色相距的距离小于具体阈值的所有已知角色。可替换地,或者此外地,系统可推荐X个 最接近的角色,其中X是用户设置的或者系统确定的阈值。可替换地,或者此外地,系统可 根据相关性或距离的水平来推荐排列的列表。
[0056] 开发角色模型
[0057] 图1所示的角色模型116-128提供了单个电视节目的示例。为了开发跨越大量媒 体内容的大量角色的角色模型,自动化技术、部分自动化技术、手工技术及其组合被采用。 下文讨论了多种技术,它们可单独或者组合使用。
[0058] 文本的语义分析可被用来开发角色模型。在基于文本的不同媒体之间识别与角色 相关的文本,例如网站。从文本中汇集与角色相关的项。语义分析技术随后被用来将角色 映射至期望的特征空间。例如,可通过识别与潘妮106关联的文本来采用语义分析开发针 对潘妮106的角色模型。例如,在文本是相对于角色的名字或图像的特定数量的单词或更 少单词时,可利用角色来识别文本。从识别出的文本中汇集诸如"工程师"、"科学"或"善于 分析"之类的各种项。这些术语被映射至角色的适当属性。在该情况下,适当属性是"科学 家"。在一个示例中,每次项被映射至角色属性时,该角色的属性值增大一个确定的量一例 如1。类似地,当项被映射至角色的属性的负面时,例如"不喜欢数学",该角色的属性值减 小一个确定的量一例如1。在任一情况下,属性值增大或减小的确定的量可基于该项的强度 值。项"工程师"可具有强度值0.25,同时项"美丽动人"具有强度值1.0。类似地,"极其 美丽动人"可具有强度值1. 5。映射和强度值可存储在数据库中以方便在开发角色模型时 进行访问。
[0059] 描述角色的项的潜在源包括角色的官方网页、角色的维基百科网页以及角色出 现的节目、粉丝专页、社交网络主页、社交网络聊天工具(例如,来自Twitter的推文、 Facebook评论等)以及其他源。
[0060] 汇集用户对角色的响应也可用来开发角色模型。例如,与角色的属性关联的响应 可被确定为"积极的"或"消极的"并且可被用来相应地增大或减小角色模型中的属性值。 可从网络上汇集用户的响应,例如社交网络、网页、电子邮件等。此外,角色模型可基于用户 明确的拇指向上和拇指向下、利用用户喜欢的其它网页和/或用户作为一部分的互联网组 聚集用户对角色的偏好、提到角色的网页和互联网组的专家评价、针对节目的尼尔森评级、 奖项、行业性杂志、专家评论和编辑复审。
[0061] 调查方法可被用来开发角色模型。可进行调查以访问大众对于角色的属性的意 见。调查可询问多个问题来获得针对更敏感的属性的潜在值。例如,为了访问"社会能力" 属性,可询问回答者角色是否有很多朋友,角色是否熟悉大众文化,以及角色是否能够适应 正式以及非正式场合。
[0062] 例如,这些调查可以是审视每个回答者对角色的总体反应的标淮长度的调查或者 采用诸如MechanicalTurk之类的服务的询问回答者单个分开的问题的小型调查。
[0063] 专家验证可被用来开发角色模型。诸如"代理"或"道德角色"之类的具体属性可 受益于各种领域的专家的给料,包括媒体学习和心理学。对于这些属性,调查方法可组合来 占据数据库的大部分,其中确保方法被用来占据的大部分的对随机选择的子集的专家验证 遵循这些领域的最佳实践。
[0064] 用户反馈可被用来开发角色模型。用户对角色的响应可被汇集并被用来反馈至角 色模型的数据库。例如,当消费者经由社交网络赞同与朋友分享或观看媒体内容中的给定 角色时,促使消费者提供为什么他们喜欢、分享或观看该特定角色或媒体内容的反馈。
[0065] 角色偏好函数
[0066] 因此,用于确定距离的所述技术还没有从消费者的角度在各种角色属性的重要性 之间做出区分。更精确地,已经定义可应用至任意角色的单个距离函数。通过考虑消费者 是否更关心沿角色模型的一些维的相似性(相对于角色模型的其它维),可以精炼这些搜 索技术。关于消费者的该偏好信息被捕获在角色偏好函数中而且被用于确定偏好和角色之 间的距离。
[0067] 不同消费者可具有不同角色偏好函数,它们中的每一个都基于相关的消费者的偏 好。例如,杰西卡作为开电视的人,可能仅仅关心角色的性别以及角色的吸引力。具体地, 她喜欢具有吸引力的角色以及女性角色。可以直接或者间接收集这些偏好。例如,用户可 直接输入他们的偏好或者通过识别用户喜欢哪个角色来学习用户的偏好。如上文间接提到 的那样,可在一系列针对每个属性的"权值"βi中对这些用户专用偏好进行编码。在此,杰 西卡的角色偏好函数被表示为:
[0068] f(jessica) =β! ·Ci+0 ·c2+β3 ·c3+0 ·c4
[0069] 其中β2,β3都大于0。在该示例中,第二和第四属性上的系数(即,。2科学家属 性的系数以及c4友好度属性的系数)为〇,因为杰西卡不关心它们,而且她喜欢的属性上的 系数(即
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1