用于内容项目的关联内容的选择的制作方法

文档序号:6594825阅读:133来源:国知局
专利名称:用于内容项目的关联内容的选择的制作方法
技术领域
本发明涉及用于另一内容项目的关联内容项目的选择,并且特别地但非排他性地涉及适合于用户所选内容项目的广告的选择。
背景技术
近年来,文本文档、多媒体、以及娱乐内容的可用性和提供已经大量增加。例如,可用电视和无线电频道的数目已经相当可观地增长,且互联网的普及已提供了新的内容分发手段。而且,互联网已经为一般用户提供了网页、博客、在线文本文档等形式的文本文档的看起来无尽的来源。此外,提供与用户消费的内容有关的附加关联内容变得使人感兴趣。此类关联内容可以例如是广告,诸如插入电视节目中或添加到网页的广告。为了提供使单独用户特别感兴趣的关联内容,期望的是,此类内容具体地适于单独用户的偏好简档和用户当前正在访问的特定内容。特别地,已经提出广告具体地适于正在消费的内容和单独用户的内容消费偏好。例如,当用户访问网页时,期望的是,任何关联广告反映用户的偏好和特定网页的特性。可以通过从内容库选择关联内容,使得其与所选内容相匹配来实现关联内容的此类目标和个性化。例如,当用户在设备上选择了诸如网页或音乐剪辑的特定内容项目时,设备可以访问本地或远程内容储存器以检索与内容项目相匹配的关联内容项目。此类关联内容选择和提供正在变得越来越重要。例如,广告是从在线应用程序和服务产生收入的关键方法。日益增加的内容、搜索和其它网页应用以及网络服务甚至用户设备很可能由于从做广告收集的输入而得到大量补贴。基于用户上下文和偏好的广告的目标已经被证明增加/改进了用户对广告的响应。例如,用于网页搜索站点的商务模型在很大程度上基于做广告。在这种情况下,使搜索查询与用于广告贮存库中的广告的关键字匹配,并选择匹配广告以将其呈现给用户。 这种技术的扩展已被应用于网页中的广告插入,其中,基于网页中的广告关键字的出现来选择广告。然而,已经发现在许多情形下此类广告的选择是次优的。例如,在 B. Ribeiro-Neto, M. Cristo, P. B. Golgher、E. Silva de Moura 在巴西的萨尔瓦多 2005 年 8 月 15 19 日 Proceedings SIGIR' 05 的"Impedance Coupling in Content-targeted Advertising”中已经证明在网页与广告之间趋向于存在词汇失配。已经建议可以通过考虑补充信息来改进广告的选择,诸如具有到广告的超链接的网页的信息。提出的另一方法是首先基于从原始网页导出的术语(term)来执行网页搜索。从通过搜索提供的网页提取进一步的术语,并然后在选择广告时使用这些附加术语。然而,虽然此类方法可以改进广告与用户内容的匹配,但是其趋向于最适合于基于服务器的匹配,在基于服务器的匹配中,可以缓存许多网页以辅助匹配处理。事实上,该方法趋向于不太适合于资源受限设备,诸如移动电话或机顶盒。事实上,该方法将要求大量计算和储存资源和/或将趋向于是缓慢且不切实际的。例如,对于重复地执行搜索的移动电话而言,使用标准在线网页搜索工具将导致非常慢的处理。此外,对于便携式设备而言,用于检索和处理搜索结果的通信和资源要求趋向于过度。此外,现有方法趋向于导致关联内容的次优选择,并且期望的是改进关联内容与单独用户和消费内容的匹配的准确度。而且,在一些系统中,可能期望连同从远程服务器接收到的内容一起提供本地地存储的关联内容。例如,内容服务提供商可能希望提供较便宜(或免费)的内容服务作为用户接受呈现的广告的回报。这些广告可以被本地地缓存在用户的设备上,并且设备从本地地缓存的那些广告中自主地选择适当的广告。此类方法可以提供很多优点,包括例如减少对远程服务器的负载和要求并允许用户具有能够与多个不同的在线应用和服务一起使用的单个简档。然而,其要求对用户设备本身执行关联内容匹配,从而要求一种适合于资源受限设备的方法。因此,用于选择关联内容项目的改进方法将是有利的,并且特别地,允许改进灵活性、改进内容项目选择、减少资源使用、改进对资源受限设备的适用性、促进实现和/或改进性能的系统将是有利的。

发明内容
因此,本发明寻求优选地单独或以任何组合方式减轻、缓解或消除上述缺点中的一个或多个。根据本发明的一方面,提供了一种选择内容项目的方法,该方法包括提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;提供语义图集合,所述语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘;提供搜索术语集合,该搜索术语集合包括表征第一内容项目的术语;响应于所述语义图集合的第一语义图,扩展所述搜索术语集合以生成已扩展术语集合;确定已扩展术语集合与所述多个关联术语集合中的每一个之间的相似性度量;以及响应于所述相似性度量,从所述内容项目组中选择用于所述第一内容项目的关联内容项目。在许多实施例中,本发明可以允许改进和/或促进对与第一内容项目相关联的内容项目的选择。特别地,在考虑比直接从第一内容项目可获得的术语集合更大的术语集合的情况下,通过匹配可以实现对关联内容项目与第一内容项目的改进的匹配。此外,术语集合的扩展可以适于特定内容项目和/或用户的偏好,由此改进关联内容项目的选择方面的准确度。本发明对于资源受限设备或情形中的管理内容项目的选择而言可能是特别有利的。具体地,可以使用语义图来实现对降低术语扩展的资源的要求。特别地,对语义图的通信和储存资源要求趋向于是低的,由此改进用于分发和存储语义图数据的适用性。所述方法可以特别地适合于具有大量诸如移动电话或其它便携式设备的低资源设备的系统。此外,在许多实施例中,本发明可以允许改进对用户偏好的适应性,因为语义图能够容易地适于单独用户,由此提供个性化术语扩展,导致改进所选关联内容项目的个性化。根据本发明的另一方面,提供了一种内容设备,该内容设备包括关联术语处理器,所述关联术语处理器用于提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;接收机,所述接收机用于从远程服务器接收语义图集合,该语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘;搜索术语处理器,所述搜索术语处理器用于提供搜索术语集合,该搜索术语集合包括表征第一内容项目的术语;扩展处理器,所述扩展处理器用于响应于语义图集合的第一语义图来扩展搜索术语集合以生成已扩展术语集合;相似性处理器,所述相似性处理器用于确定已扩展术语集合与所述多个关联术语集合中的每一个之间的相似性度量;以及选择处理器,所述选择处理器用于响应于相似性度量来从所述内容项目组中选择内容项目。根据本发明的另一方面,提供了一种包括如上文所定义的内容设备的通信系统。本发明的这些及其它方面、特征和优点根据在下文中描述的(一个或多个)实施例将是显而易见的,并将参考下文中描述的(一个或多个)实施例对其进行阐明。


将仅以示例的方式参考附图来描述本发明的实施例,在附图中图1是图示根据本发明的一些实施例的通信系统的元件的示例;图2是图示语义图的示例;图3是图示根据本发明的一些实施例的内容设备;图4是图示根据本发明的一些实施例的选择关联内容的方法的示例;图5是图示根据本发明的一些实施例的生成语义图的方法的示例;以及图6是图示根据本发明的一些实施例的扩展术语集合的方法的示例。
具体实施例方式以下说明集中于可应用于选择用于诸如文本文档、网页、以及音乐剪辑的内容项目的广告的本发明的实施例。然而,将理解,本发明不限于此应用,而是可以应用于许多其它类型的内容项目。图1图示了用于向能够消费内容的内容设备101分发内容的通信系统。在特定示例中,内容设备101是能够向用户呈现内容的移动蜂窝式设备,包括向用户呈现视频剪辑、 音乐剪辑、文本文档和网页。在该示例中,由耦合到通信网络的内容服务器103来提供内容,所述通信网络在本特定示例中是互联网105。互联网105经由基站109耦合到支持内容设备101的蜂窝式系统107。蜂窝式通信系统107可以例如是全球移动通信系统或通用移动电信系统。在该系统中,内容设备101能够访问内容服务器103以检索内容项目。内容项目可以例如是音乐剪辑、视频剪辑、文本文档、网页、电子邮件、短消息服务消息等。在该系统中,内容项目具有使用文本数据来表征内容项目的关联表征数据。例如,内容项目可以具有包括表征内容的各种关键字的关联元数据。在一些示例中,内容项目本身可以包括可以被直接用作表征数据的文本数据。例如,网页的文本可以被提取并用作表征数据。将理解,虽然图1为了简单和清楚起见仅图示了单个内容服务器103,但是该系统可以包括很多内容服务器,从该内容服务器,可以向内容设备101提供内容项目。例如,在网页冲浪期间,可以从不同的服务器提供单独的网页。在该示例中,内容设备101还可以从广告服务器111接收内容项目。在该示例中, 广告服务器111被耦合到蜂窝式通信系统107并由独立于内容服务器103的任何运营商的蜂窝式网络运营商来操作。由广告服务器111提供的内容项目并不意图由内容设备101的用户来单独地选择,而是意图与来自内容服务器103的用户选择内容项目自动地相关联。 因此,意图在没有任何特定用户选择的情况下由内容设备101来自动地呈现广告。在该示例中,由内容设备101来选择关联内容项目,使得它们与用户选择的内容项目相匹配,并且具体地,使得它们与内容设备101当前正在呈现的内容项目相匹配。在该特定示例中,关联内容项目是广告,但是将理解,在其它实施例中,关联内容项目可以是其它类型的内容项目,诸如提供与正在呈现的内容项目有关的附加背景信息的内容项目(例如可以呈现用于当前正在呈现的歌曲的演唱者的唱片分类目录)。在该示例中,广告与基于文本的表征数据相关联。表征数据可以例如是表征内容项目的基于文本的元数据。元数据可以由广告服务器111通过应用于基于文本的内容的关键字提取处理来生成,所述基于文本的内容诸如广告本身中的超链接页面。这可以提供内容设备101在使广告和用户选择的内容匹配时能够使用的附加信息。在线广告常常超链接至使得用户能够获得更多信息或进行购买的网页,并且此网页因此将通常包括对表征广告有用的文本。因此,在图1的系统中,内容设备101可以自动地选择由蜂窝式网络运营商提供的广告,以使从完全独立于蜂窝式网络运营商的内容源提供的用户选择内容和蜂窝式系统本身相匹配。此外,该系统通过使用能够容易地发射到并存储在单独的资源受限内容设备上的补充域特定数据来改进用户选择内容项目和广告的匹配。以一个或多个语义图的形式来提供此数据,所述语义图具有作为术语(诸如关键字)的节点和具有表示由边缘链接的节点之间的关联强度的值的边缘(节点之间的链路)。在图1的系统中,内容设备101从内容服务器103检索所选内容项目,并且此外接收用于所选内容项目的基于文本的表征数据。另外,内容设备101从广告服务器111接收广告以及描述广告的基于文本的表征数据。基于文本的表征数据包括描述内容的术语集合, 诸如关键字集合。另外,广告服务器111提供关于不同主题的多个语义图。然后,内容设备101继续使用语义图来扩展用于所选内容项目的术语集合。这得到已扩展术语集合,其通常包括提供与所选内容项目有关的有用信息的附加术语。然后,内容设备101使用已扩展术语集合来找到可以连同所选内容项目一起呈现给用户的一个或多个匹配广告。例如,当用户选择了特定网页时,还可以呈现由蜂窝式网络运营商提供的一个或多个广告。这些广告被自动地选择为特别地与用户当前正在浏览的网页有关。语义图是具有与术语(每个术语包括一个或多个字)相对应的节点的连接网络形式的数据结构。在图2中示出了此类图的两个(简化)示例(一个对应于乐队“黑眼豆豆 (Black Eyed Peas) ”的主题且另一个对应于外出就餐的主题)。由广告服务器111来提供用于多个主题中的每一个的语义图。如稍后将描述的,可以例如通过处理文本文档的适当训练集合(离线或在线)来逐渐地构建每个语义图。利用这些主体内的术语的共现来构建术语的连接网络。图节点组成文本术语的表示,并且图边缘表达图中的术语之间的关系(在共现的意义上)。在特定示例中,为语义图的每个节点存储的属性是术语的词元(串值)、训练文档中的术语频率(反映术语在每个文档中出现的频率的数值)、训练集合中的术语的文档频率(反映呈现术语的训练集合的文本文档的数目的数值)、以及术语类型(例如,术语是名词、命名实体(即人、地点、机构等)或形容词)。图的每个边缘连接两个节点/术语并且指示这些术语在训练集合中以适当的文本关系共现(例如取决于术语的类型、它们是在相同句子中还是相同文档中出现)。边缘可以具有反映认为链接或关联术语的密切程度的边缘值。例如,边缘值可以指示术语的共现的次数(例如在句子中或在文档中)。作为示例,对于给定内容项目而言,内容设备可以具体地使用以下步骤来选择适当的广告 主题分类可以将内容项目分类为与特定主题有关,并且可以选择与此主题相对应的语义图。 基于图的扩展使用所选语义图来扩展具体地可以与用于内容项目的表征数据的术语相对应的搜索术语集合。具体地,可以从语义图中选择附加术语并将其添加到搜索术语集合以生成已扩展术语集合。 相似性计算生成用于广告的术语集合与已扩展术语集合之间的相似性的计
笪弁。 广告选择根据相似性值来选择一个或多个广告。具体地,可以选择具有最高相似性值的(一个或多个)广告。因此,通过执行表征用户选择内容项目的术语集合的扩展,使用语义图来改进用户选择内容项目与广告之间的匹配的准确度。这允许已扩展术语集合提供所选内容项目的更准确和多样的表征。例如,如果用于用户选择内容项目的原始搜索术语包括用于特定团队运动和该运动的特定运动员的术语,则该扩展可能导致添加识别运动员的当前团队的术语,即使其未被包括在原始术语集合中。而且,语义图提供表示用于特定主题或域的术语配置的简洁表示(即,术语及其之间的关联)。因此,可以利用相对低的资源使用来传输和处理图,并且因此该方法对于资源受限设备和资源受限通信系统而言是非常有利的。此外,语义图非常适合于被动态地更新以反映单独用户的特定偏好和特性。此更新可以例如基于用户的内容消费并具体地基于由用户选择的内容的特性。因此,最后,语义图不仅可以表示主题的语义表示,而且可以表示用于该主题的用户的特定偏好。该方法的基本益处是语义图简洁得足以跨越诸如蜂窝式通信系统的受限资源网络进行发射,同时包含足够的信息来显著地改进自动选择的广告的相关性。图3图示了内容设备101的元件的示例,并且图4图示了选择关联内容项目(诸如广告)的方法的示例。该方法可以由内容设备101来执行并将参考图3来进行描述。内容设备101包括能够通过蜂窝式通信系统107的空中接口与基站107通信的收发信机301。收发信机301具体地能够与内容服务器103和广告服务器111通信。收发信机301被耦合到能够从内容服务器103检索诸如网页的内容项目的内容呈现处理器303。 此外,内容呈现处理器303能够经由适当的用户界面(未示出)向用户呈现所接收到的内容项目。此外,内容设备101包括能够存储从广告服务器111下载的广告集合的关联内容储存器305。内容设备101还包括关联内容下载控制器307,关联内容下载控制器307被耦合到收发信机301和关联内容储存器305并被布置为访问广告服务器111以下载广告集合。另外,关联内容下载控制器307以用于每个下载广告的术语集合的形式下载表征数据。每个广告术语集合包括表征广告的一个或多个术语集合。在一些实施例中,关联内容下载控制器307还可以下载用于尚未被下载到内容设备101的广告的术语集合,从而允许内容设备101选择从广告服务器111可获得、但尚未被下载到内容设备101本身的广告。 如果选择了此类广告,则内容设备101可以继续从广告服务器111对其进行检索。关联内容下载控制器307被耦合到关联术语处理器309,其中,存储了用于广告的术语集合。因此,关联内容下载控制器307和关联术语处理器309执行步骤401,在步骤401 中,广告术语集合被存储在内容设备处。此外,内容设备101包括语义图处理器311,语义图处理器311被耦合到收发信机 301并能够从远程服务器接收语义图集合,所述远程服务器在本特定示例中是提供广告的同一服务器,即广告服务器111。所接收到的语义图中的每个包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘。因此,收发信机301和语义图处理器311执行存储语义图集合的步骤403。将理解,语义图集合通常包含多个语义图,但是在一些实施例中其可以仅包括单个语义图。此外,内容设备101包括搜索术语处理器313,搜索术语处理器313被耦合到内容呈现处理器303。当选择、检索、接收、和/或由内容呈现处理器303呈现新内容项目时,搜索术语处理器313可以从内容呈现处理器303接收指示应当针对内容项目选择一个或多个适当广告的命令。在这种情况下,搜索术语处理器309继续执行步骤405,在步骤405中, 生成用于内容项目的搜索术语集合。搜索术语集合包括表征内容项目的术语,并且可以具体地通过简单地从表征内容项目的元数据提取所有关键字来生成。在内容项目是文本文档 (诸如网页)的其它示例中,搜索术语处理器313可以例如通过本领域技术人员将已知的自然语言处理从实际文本提取关键字。搜索术语处理器313被耦合到扩展处理器315,扩展处理器315进一步被耦合到语义图处理器311。扩展处理器315接收来自搜索术语处理器313的搜索术语集合和来自语义图处理器311的语义图集合。然后,扩展处理器317继续执行步骤407,在步骤407中,通过基于至少一个语义图来扩展搜索术语而生成已扩展术语集合。将理解,如果语义图集合包括不止一个图,则可以选择可用语义图中的一个(或者可能是多个)。例如,可以确定用于当前内容项目的主题,并且可以选择相应的语义图。因此,利用来自用户的语义图集合的相关术语来扩展表征内容项目的元数据。具体地,给定当前内容的主题,可以添加表示高度相关术语的新术语。此外,如果已经针对特定用户定制了语义图,则该扩展还可以具体地添加鉴于用户的特定个人兴趣和偏好而相关的术语。扩展处理器315被耦合到被馈送已扩展术语集合的相似性处理器317。此外,相似性处理器317被耦合到关联术语处理器309,关联术语处理器309提供用于可用广告的存储术语集合。然后,相似性处理器317继续执行步骤409,在步骤409中,确定已扩展术语集合与每个广告术语集合之间的相似性度量。因此,相似性处理器317生成指示已扩展术语集合和用于存储广告的每个术语集合相匹配的良好程度的相似性值。相似性处理器317被耦合到选择处理器319,选择处理器319继续执行步骤411, 在步骤411中,响应于相似性度量来选择存储广告中的广告。作为简单示例,选择处理器 319可以简单地选择具有最高相似性值的广告。在一些实施例中,选择处理器319还可以被布置成响应于用户偏好简档来选择 (一个或多个)广告。将理解,在不同的实施例中可以不同地处理所选广告。在特定示例中,选择处理器 319被耦合到关联内容储存器305和内容呈现处理器303,并且被布置成从关联内容储存器 305提取所选(一个或多个)广告并将该(一个或多个)广告提供给内容呈现处理器303, 内容呈现处理器303然后继续连同所选内容项目一起将其呈现给用户。因此,如前所述,提供了一种用于针对用户选择内容项目来选择适当关联内容项目的非常有利的方法。该方法特别地非常适合于资源受限设备和通信系统并改进了广告选择的准确度。在下文中,将更详细地描述各种方面、考虑和特征。在特定系统中,由广告服务器111来生成用于多个主题的初始语义图并将其传送到内容设备101。在图5中图示了广告服务器111用来生成语义图的方法。该方法在步骤501开始,在步骤501中,提供训练内容项目集合。训练内容项目可以具体地是已知与特定主题相关联的文本文档集合,对于所述特定主题而言,生成了语义图。该训练内容项目集合可以例如是手动地收集的文本文档(诸如网页)。作为另一示例, 训练内容项目集合可以例如被生成为使用特定搜索准则找到且与特定主题相关的网页。步骤501后面是步骤503,在步骤503中生成术语集合。具体地,广告服务器111 可以从文本文档提取相关词语。作为特定示例,如技术人员将已知的,可以使用解析和自然语言处理来处理包括网页文档的训练集合。结果可以是文本段集合(网页文档可以根据其结构由不止一个文本段组成),其中,每个文本段由指示例如词语类型(名词、副词、命名实体等)的句子和关联信息的集合组成。然后,广告服务器111可以提取这些文本段中的术语(以及具体地词语)。因此,在步骤503中,生成包括从训练内容项目提取的术语的术语
皇A
朱口 ο将理解,在一些实施例中,训练内容项目不一定是文本文档。例如,训练内容项目可以是具有基于关联文本的元数据的视频剪辑,并且在步骤503中生成的术语集合可以对应于从元数据提取的术语。步骤503后面是步骤505,在步骤505中,广告服务器111继续生成用于语义图的节点。节点中的每个将对应于在步骤503中生成的术语集合中的术语。在本示例中,在步骤505中为术语集合中的每个术语生成节点。这可能导致在本示例中稍后将被删除的大语义图。然而,将理解,在一些实施例中,可以在步骤505中从术语的子集仅生成节点,例如通过在同一步骤中将节点生成和稍后描述的删除整合(即,步骤505还可以包括如稍后将描述的删除语义图的步骤509)。在该特定示例中,广告服务器111生成用于每个名词、命名实体、和伴随名词的形
10容词的节点。此外,生成节点值,其包括术语词元(串值)、训练文档中的术语频率(数值)、训练集合中的术语的文档频率(数值)、和术语类型(例如,术语是名词、命名实体还是形容词)。对于已为其创建节点的术语而言,更新节点值(具体地,可以修改术语频率和文档频率)。步骤505后面是步骤507,在步骤507中,为语义图生成边缘。基于训练集合中的术语的共现来生成边缘。此外,对于连接两个节点的每个已生成边缘而言,计算边缘值。该边缘值指示与两个节点相对应的两个术语之间的关联的强度。具体地,将边缘值计算为指示用于两个节点的术语的共现频率。特别地,创建以下的边缘 两个名词之间或名词与命名实体之间的句子中的所有共现。 名词和相邻形容词之间的所有共现。 训练文档中的两个命名实体之间的所有共现。此外,将边缘值确定为存储这些共现中的每一个的数目的合成值。虽然在一些实施例中,可以直接使用得到的图,但图5的示例性方法进一步包括步骤509,在步骤509中进一步删除图。在许多情形下,这可以得到改进的广告选择。事实上,对于大语义图而言,可能得到更加不精确的结果,因为具有许多术语和连接的大图通常将表示“语言学”噪声的基本程度。此外,可以通过减小语义图的尺寸来基本上降低通信资源要求、以及对内容设备101的存储器和处理资源要求。因此,在本示例中,步骤507后面是步骤509,在步骤509中,连同关联边缘一起从图去除在步骤505中生成的许多节点。具体地,如果用于节点的术语的已确定术语频率值低于给定阈值,或者如果用于节点的术语的文档频率值低于给定阈值,则广告服务器101可以去除节点。具体地,可以基于对图中的这些值的统计来确定用于术语频率值和文档频率值两者的下阈值(例如,可以去除具有低于平均术语频率值的术语频率值的所有节点,并且可以去除具有低于平均文档频率的50%的文档频率值的所有节点)。另外或替代地,广告处理器111可以去除与存在于比给定数目多的语义图中的术语相对应的节点。这种方法可以允许通过识别存在于多个语义图中的术语来进行跨主题删除。此类术语将趋向于是具有不太具体的主题相关性并因此不大可能会帮助在广告之间进行选择的一般术语。其例外情况可以是针对在一个主题(例如高术语频率)中普遍但在其它主题 (例如低术语频率)中无意义的术语而言,并且可以对删除进行修改以将其考虑在内。另外或替代地,广告处理器111可以响应于第一术语属于未包括的术语子集的检测来去除与来自第一语义图的第一术语相对应的节点。具体地,可以预定义未包括命名实体集合(例如“单位”),并且广告服务器111可以去除用于属于此未包括命名实体集合的术语的任何节点和关联边缘。替代地或另外,广告服务器111可以通过去除一个或多个边缘来删除语义图。具体地,如果用于由边缘连接的节点的术语的共现值低于阈值,则可以去除边缘。例如,可以基于来自图的共现统计来导出用于两个术语之间的共现的下阈值。如果两个术语之间的共现频率低于该阈值(例如平均共现值),则术语之间的边缘未被包括在已删除图中。此删除准则在减小图尺寸方面是非常有效的,因为趋向于常常存在常常是根据情况的且不指示术语之间的强关系的单个共现。图6图示可以如何执行图4的步骤407、即可以如何执行术语集合扩展的特定示例。在本示例中,内容设备101存储多个语义图,每个语义图与特定主题有关。因此,当执行步骤407时,内容设备101最初选择将被用于术语集合扩展的语义图。具体地,内容设备101可以首先确定用于搜索术语集合,即用于表征用户选择内容项目的术语集合的主题。例如,可以将搜索术语集合的术语与已知主题的关键字相比较, 并且可以选择已经找到最匹配关键字的主题。然后,内容设备101能够继续选择为此主题存储的语义图。在图6的示例中,选择一个语义图作为与搜索术语集合最密切相关的语义图。具体地,内容设备可以执行子步骤601,在子步骤601中,确定每个语义图与搜索术语激活之间的术语相似性。此术语相似性反映语义图的术语与搜索术语集合的术语之间的相关性。作为简单示例,可以简单地将相似性值确定为也作为语义图中的节点存在的搜索术语集合的术语的数目。作为更准确且复杂的示例,可以将包含术语、U = 1. . . N}的图g和搜索术语c的相似性值确定为
权利要求
1.一种选择内容项目的方法,所述方法包括提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;提供语义图集合,所述语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间的关系相对应的边缘;提供搜索术语集合,所述搜索术语集合包括表征第一内容项目的术语; 响应于所述语义图集合的第一语义图,扩展所述搜索术语集合,以生成已扩展术语集合;确定所述已扩展术语集合与所述多个关联术语集合中的每一个关联术语集合之间的相似性度量;以及响应于所述相似性度量,从所述内容项目组中选择用于所述第一内容项目的关联内容项目。
2.根据权利要求1所述的方法,其中,扩展所述搜索术语集合的步骤包括选择具有与所述搜索术语集合中术语相对应的术语的所述第一语义图的节点的子集;选择用于所述节点子集中节点的相邻节点的集合;以及将所述相邻节点的至少一些术语包括在所述已扩展术语集合中。
3.根据权利要求2所述的方法,其中,选择所述节点的子集的步骤包括响应于所述搜索术语集合中的术语的共现程度,进一步选择所述节点的子集。
4.根据权利要求2所述的方法,其中,选择所述节点的子集的步骤包括响应于节点值和边缘值中的至少一个,进一步选择所述节点的子集。
5.根据权利要求2所述的方法,其中,选择所述相邻节点的集合的步骤包括响应于用于相邻节点的节点值和边缘值中的至少一个,选择所述相邻节点的集合。
6.根据权利要求2所述的方法,进一步包括确定在属于包括所述相邻节点的子集的组的节点和与所述搜索术语集合中的术语相对应的节点之间的所述第一语义图中的边缘连接;以及响应于所述边缘连接,选择要被包括在所述已扩展术语集合中的所述相邻节点的术语。
7.根据权利要求1所述的方法,进一步包括确定所述语义图集合中的每个语义图与所述搜索术语集合之间的术语相似性,用于语义图的所述术语相似性反映所述语义图的术语与所述搜索术语集合的术语之间的相关性; 以及响应于所述术语相似性,选择所述第一语义图。
8.根据权利要求1所述的方法,其中,所述语义图集合中的每个语义图与主题相关联, 并且所述方法进一步包括确定与所述搜索术语集合相关联的搜索主题;以及响应于所述搜索主题,选择所述第一语义图。
9.根据权利要求1所述的方法,其中,所述第一内容项目是文本内容项目,并且所述方法进一步包括生成所述搜索术语集合,以包括所述文本内容项目的文本术语。
10. 一种内容设备,包括关联术语处理器,所述关联术语处理器用于提供多个关联术语集合,所述多个关联术语集合中的每个关联术语集合包括表征内容项目组中的内容项目的术语集合;接收机,所述接收机用于从远程服务器接收语义图集合,所述语义图集合中的每个语义图包括与术语相对应的节点和与由边缘连接的节点的术语之间关系相对应的边缘;搜索术语处理器,所述搜索术语处理器用于提供搜索术语集合,所述搜索术语集合包括表征第一内容项目的术语;扩展处理器,所述扩展处理器用于响应于所述语义图集合的第一语义图来扩展所述搜索术语集合,以生成已扩展术语集合;相似性处理器,所述相似性处理器用于确定所述已扩展术语集合与所述多个关联术语集合中的每一个关联术语集合之间的相似性度量;以及选择处理器,所述选择处理器用于响应于所述相似性度量来从所述内容项目组中选择内容项目。
全文摘要
内容设备可以基于用于关联内容的文本表征数据和用户选择内容项目来选择用于用户选择内容项目的关联内容,诸如广告。使用已扩展术语集合之间的语义图和相似性值来扩展表征用户选择内容项目的术语集合,并计算描述关联内容的术语集合。然后,基于相似性值来选择特定关联内容项目。基于语义图的术语集合扩展可以允许在提供适合于资源受限情形的处理的同时改进在选择适当关联内容方面的准确度。特别地,可以保持低的通信资源、存储器资源、以及计算资源使用。
文档编号G06Q30/00GK102160079SQ200980136773
公开日2011年8月17日 申请日期2009年8月24日 优先权日2008年9月19日
发明者扬尼斯·科姆帕齐亚里斯, 本·布拉图, 福蒂斯·梅内梅尼斯, 西梅恩·帕帕佐普洛斯, 西蒙·沃丁顿 申请人:摩托罗拉移动公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1