额外丰富内容元数据生成器的制造方法

文档序号:6625756阅读:169来源:国知局
额外丰富内容元数据生成器的制造方法
【专利摘要】本公开涉及额外丰富内容元数据生成器。在一个实施方式中,方法包括接收与由内容提供者提供的内容项相关的内容元数据;从一个或多个外部源检索额外元数据,额外元数据包括内容元数据的语言变化版本;将内容元数据连同额外元数据存储在存储设备中,其中内容元数据被存储为与额外元数据关联;接收来自用户的搜索请求,搜索请求包括以第一语言变化版本表示的一个或多个搜索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项的相关元数据;识别存储为与相关元数据关联的额外的相关元数据,额外的相关元数据包括相关元数据的语言变化版本;以及增加一个或多个额外搜索项至搜索请求,一个或多个额外搜索项对应于额外相关元数据。
【专利说明】额外丰富内容元数据生成器

【技术领域】
[0001] 本公开内容总体上涉及用于内容元数据生成的方法和装置。

【背景技术】
[0002] 随着新的混合网络(除了具有广播能力(例如,地面电视(TV)、卫星TV、电缆TV), 还具有宽带因特网能力(例如,数字用户线路(DSL)或者电缆))的迅速发展,流媒体内容 变得越来越流行。现在用户可利用和可进入包括多媒体和视听觉(AV)内容的越来越多的 内容。这样大量的增加可能随着传统的广播产业通过开发新一代的机顶盒(STB)和能够流 传送和回放此类内容的配套设备(例如,计算机、移动电话、平板电脑、手持设备等)进入互 联网电视机顶盒业务(OTT)汇聚世界而进一步增加。TV用户现在期望TV内容搜索与它们 在因特网世界中一样简单、丰富和高效。


【发明内容】

[0003] 因此,根据本发明的一个方面,提出一种方法,包括:接收与由内容提供者提供的 内容项有关的内容元数据;从一个或多个外部源检索额外元数据,额外元数据包括内容元 数据的语言变化版本;将内容元数据连同额外元数据存储在存储设备中,其中,内容元数据 被存储为与额外元数据关联;接收来自用户的搜索请求,搜索请求包括以第一语言变化版 本表示的一个或多个搜索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项 的相关元数据;识别存储为与相关元数据关联的额外的相关的元数据,额外的相关的元数 据包括相关元数据的语言变化版本;以及增加一个或多个额外的搜索项至搜索请求,一个 或多个额外的搜索项对应于额外的相关的元数据。
[0004] 根据本发明的另一个方面,提出一种装置,包括:管理单元,可操作地接收与由内 容提供者提供的内容项相关的内容元数据;创建单元,可操作地从一个或多个外部源检索 额外元数据,额外元数据包括内容元数据的语言变化版本;存储单元,可操作地存储内容元 数据连同额外元数据,其中,内容元数据被存储为与额外元数据关联;其中,管理单元被另 外可操作为:接收来自用户的搜索请求,搜索请求包括以第一语言变化版本表示的一个或 多个搜索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项的相关元数据; 识别存储为与相关元数据关联的额外的相关的元数据,额外的相关的元数据包括相关元数 据的语言变化版本;以及增加一个或多个额外的搜索项至搜索请求,一个或多个额外的搜 索项对应于额外的相关的元数据。
[0005] 根据本发明的又一方面,提出一种或多种计算机可读有形存储介质,利用包括计 算机可执行指令的软件编码并且当软件被执行时,可操作为:接收与由内容提供者提供的 内容项相关的内容元数据;从一个或多个外部源检索额外元数据,额外元数据包括所接收 的内容元数据的语言变化版本;将所接收的内容元数据连同额外元数据存储在存储设备 中,其中,所接收的内容元数据被存储为与额外元数据关联;接收来自用户的搜索请求,搜 索请求包括以第一语言变化版本表示的一个或多个搜索项;在所接收的内容元数据或者额 外元数据中识别匹配一个或多个搜索项的相关元数据;识别存储为与所识别的相关元数据 关联的额外的相关的元数据,额外的相关的元数据包括所识别的相关元数据的语言变化版 本;以及增加一个或多个额外的搜索项至搜索请求,一个或多个额外的搜索项对应于额外 的相关的元数据。

【专利附图】

【附图说明】
[0006] 结合附图,从以下详细描述中将更充分地理解并领会本发明,在附图中:
[0007] 图1是根据本发明的实施方式构造和操作的系统的简化框图示图;
[0008] 图2是根据本发明的实施方式构造和操作的包括额外丰富(extra-rich,超丰富) 内容元数据生成器的系统的简化框图示图;
[0009] 图3是描述根据本发明的实施方式的操作额外丰富内容元数据生成器的方法的 流程图;和
[0010] 图4是根据本发明的实施方式的与具体演员相关的不同的元数据之间的关系的 方框图示图。

【具体实施方式】
[0011] 概述
[0012] 在一个实施方式中,方法包括接收与由内容提供者提供的内容项相关的内容元数 据;从一个或多个外部源检索额外元数据,额外元数据包括内容元数据的语言变化版本; 将内容元数据与额外元数据存储在存储设备中,其中,内容元数据被存储为与额外元数据 关联;接收来自用户的搜索请求,搜索请求包括以第一语言变化版本表示的一个或多个搜 索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项的相关的元数据;识别 存储为与相关的元数据关联的额外的相关的元数据,额外的相关的元数据包括相关的元数 据的语言变化版本;并且增加一个或多个额外的搜索项至搜索请求,一个或多个额外的搜 索项对应于额外的相关的元数据。
[0013] 示例性实施方式
[0014] 在以下描述中,阐述大量的具体细节以提供对本发明的各种原理的全面理解。然 而,本领域技术人员将理解不是所有这些细节始终必要地需要用于实践本发明。在此情况 下,为了避免不必要地使一般概念模糊,并未详细地示出众所周知的电路、控制逻辑、和用 于惯用算法和处理的计算机程序指令的细节。
[0015] 虽然本发明的原理在此被大量地描述为与电视广播和OTT环境以及相关的电视 应用有关,这个是为方便展现起见选择的示例,没有限制性。
[0016] 类似地,虽然本发明的原理在此被大量地描述为与汉语语言变化版本和格式有 关,这个是为方便展现起见选择的示例,没有限制性。
[0017] 在一些国家中和/或对于某些语言,使用传统的远程控制搜索内容(诸如TV节 目、与演员/导演等相关的额外的信息)不容易、不方便、和甚至有时不可能。例如,使用通 常仅支持拉丁字的传统的远程控制来输入汉字是困难的。因此,在传统的电视广播世界的 这些区域中,内容搜索不被看做是重要的业务范围。然而,电视广播产业正在进入具有用作 用于内容消耗的新媒体的配套设备(例如,个人计算机、智能电话、平板电脑等)的提升的 多屏融合世界。这些配套设备提供包括新的和更加便利的搜索的新的功能和语言输入能 力。实际上,用户现在可以使用不同的输入类型例如,诸如绘制或者键入字(例如,中文简 体字和繁体字)的人工录入、声音录入等搜索。因此,可靠的跨平台内容搜索支持变为此类 国家和/或语言的重要的发行物。
[0018] 并且,TV用户现在期望内容搜索与他们在因特网世界中一样简单和高效。通常, 提供搜索因特网以发现包含一个或多个指定关键字的内容的搜索引擎(软件程序),并 且返回与含有关键字的内容链接的搜索结果条目。诸如Google(www. google, com)或者 Yahoo(www. yahoo, com)的广泛搜索引擎使用网络爬虫(Web crawler)访问非常大量的内 容项(例如,网页)。然后,称为索引器的另一个程序解析这些内容项并且基于每个内容项 的元数据创建搜索索引。每个搜索引擎使用专有算法创建索引以理想地仅返回用于每个查 询的有意义的搜索结果。然而,由于某些语言的复杂性和多样性,原始的内容元数据可能无 法提供足够的信息以允许搜索引擎返回一致的和/或精确的搜索结果。再次参考中文语言 示例,不同类型的书面中文格式在不同的区域中存在。简体中文通常在中国大陆使用,而繁 体中文在香港和台湾使用。此外,这些不同的区域也可以使用不同的方言。事实上,普通话 是中国大陆的官方语言(也被称作汉语拼音-在下文中称为拼音),然而,广东话广泛地用 于香港或者甚至在中国大陆的南部(威妥玛式拼音法(Wade-Giles Romanization)-在下 文中称作香港拼音)。并且,台湾有其自己的稍微不同于汉语和香港拼音的语言发音(台湾 通用拼音-在下文中称作台湾拼音)。这些拼音变化版本被中国用户广泛地用作关键字输 入,因为它们被转录为拉丁字,并且因此更加便利的进行搜索(尤其利用仅支持拉丁字输 入的远程控制)。例如,如果用户搜索与"Jackie Chan"(众所周知的演员)相关的内容并 且使用它的简体中文格式("成龙")作为关键字,然后将仅回复包含这个具体书面格式的 搜索结果。利用以另一个格式书面的元数据的索引的内容项,诸如:
[0019] 繁体中文:"成龍";
[0020] 拼音:"Cheng Long,';
[0021] 香港拼音:"Sing Lung" ;
[0022] 台湾拼音:"Cheng Lung" ;或者
[0023] 甚至英语:"Jackie Chan"。
[0024] 可能没有发现,并且因此没有作为搜索的结果返回至用户。为了返回更加精确的 和一致的搜索结果,用户行为也是可以被考虑的标准。利用上文给出的示例进一步进行,观 察到繁体中文用户大量使用拼音简写作为关键字搜索。拼音简写通常对应于全部拼音的首 个字母/字。以下给出"Jackie Chan"的拼音简写:
[0025] "CL" 用于大陆(Cheng Long)和台湾(Cheng Lung)拼音;和
[0026] "SL" 用于香港拼音(Sing Lung)。
[0027] 因此,需要能够考虑语言变化版本、用户的行为和简档,从而提供更加准确的、个 性化的和相关搜索结果的系统。例如,使用"CL"作为关键字搜索的台湾用户应当能够接收 包括"Jackie Chan"作为演员的电影的繁体中文格式的搜索结果。
[0028] 另一个挑战涉及地理的和版权限制。对于OTT平台,地理限制不再是问题。在开 放因特网世界中,用户(例如,注册消费者)可以自身位于世界各地通过OTT消费内容。然 而,在某些区域/范围中,对一些内容项的访问可能被限制和/或不同版本的相同的内容项 可以由于文化差异、版权或者其他管制法律被广播。例如,"泰坦尼克3D"电影的定制版本 在中国大陆被特殊准备和播放-即,一些场景被去除-但是"断背山"电影没有被允许播 放。而且,电影片名在电影被播放时可以被翻译为国家语言。在中文示例中情形甚至更加 复杂,因为电影片名可以被翻译为多种中文片名。为了阐明这个,考虑詹姆斯邦德的最后的 片名为"Skyfall"的电影的示例。在中国,"Skyfall"可以被翻译为 :
[0029] 中国大陆的"大破天幕杀机";
[0030] 香港(繁体中文)的"新鐵金剛:智破天凶城";和
[0031] 台湾(繁体中文)的"空降危機"。
[0032] 增加拼音变化版本和简写,"Skyfall"还可以被翻译为:
[0033] 大陆拼音的"Da Po Tian Mu Sha Ji "和"TMSJ"作为相应的简写,"Da Po"通常 被忽略因为其为形容词;
[0034] 香港拼音的"Zhi Po Tian Xiong Cheng"和相应的简写"ZPTXC";以及
[0035] 台湾拼音的"Kong Jiang Wei Ji "和相应的简写"KJWJ"。
[0036] 本领域技术人员将理解存在其他非标准的形式诸如:"詹姆斯邦德2012"、或者 "邦德23"等。因此,需要能够考虑这些限制的系统。
[0037] 本发明,在其实施方式中,提供当考虑区域和/或版权限制时使用户能够轻易地 进行内容搜索并且获得准确、个性化和一致的搜索结果的改善方法和相关的装置。
[0038] 现在参考图1,它是根据本发明的实施方式构造和操作系统的简化的方框图示图。
[0039] 头端110通常通过通信网络130与多个客户端设备120通信。附带地或可选地,多 个头端110与单个的客户端设备120或者通过通信网络130与多个客户端设备120通信。 为了描绘和描述的简单性,并且不限制本发明的一般性,在图1中示出与仅一个头端110通 信的仅一个客户端设备120。
[0040] 通信网络130包括以下中至少一个:基于卫星的通讯网络;基于电缆的通讯网络; 常规地面广播电视网络;基于电话的通讯网络;基于电话的电视广播网络;基于移动电话 的电视广播网络;互联网协议(IP)电视广播网络;以及基于计算机的通讯网络。应理解,在 替换的实施方式中,通信网络130可以,例如,通过双向混合通信网络,诸如组合电缆-电话 网络,组合卫星-电话网络,基于组合卫星-计算机通信网络,或者通过任何其他适当的网 络实现。对于本领域的一些技术人员,实现通信网络130的其他方式将是明显的。
[0041] 客户端设备120可以是能够通过通信网络130与头端110通信的任何类型的设 备。客户端设备120可以是例如(但是不限制本发明的一般性),机顶盒(STB)、PVR(个人 的视频信号记录器)、DVR (数字视频记录器)、诸如便携式计算机、台式机或者个人计算机 (PC)的配套设备、诸如iPadTM的平板电脑、诸如个人数字助理(PDA)的可移动计算装置、移 动电话、或者任何合适的手持设备。图1示出设置在头端110和显示设备140之间的客户端 设备120。在此类情形中,客户端设备120通常通过数字AV接口(例如,HDMI、DVI等)或 者通过模拟AV接口(例如,单元(RGB、YPbPr)、混合式(NTSC、PAL、SECAM)、S-视频、SCART、 RF同轴、D-端子(D-端子)等)操作连接至显示设备140。尽管在图1中作为分离的实体 示出,在本发明的其他实施例中,客户端设备120可以是具有显示设备140的整体。
[0042] 显示设备140通常由用户,例如通过远程控制单元(RCU) 150操作。本领域技术人 员将理解可以使用诸如PC、移动电话、平板电脑或者其他合适的手持设备的其他设备操作 显示设备140。根据使用的设备,用户可以使用包括例如,用于计算机的计算机鼠标、用于移 动电话的键盘按钮、或者甚至用于支持直接操纵的设备的用户的手指的各种方法录入搜索 关键字。通过使用一个或多个在上文作为示例给出的各种手段,用户可以搜索、浏览、请求、 和选择AV内容以观看(诸如实时事件广播、视频点播(VOD)资产、记录事件等)或者任何 合适的信息和/或元数据。客户端设备120内的操作系统软件监测与显示设备140和/或 客户端设备120的用户交互。
[0043] 此外,通常位于头端侧110的额外丰富内容元数据生成器160(ERCMG)可操作地通 过通信网络130与搜索引擎170和客户端设备120通信。图1仅示出一个通信网络130。 尽管在图1中示出为被嵌入头端110,本领域技术人员将理解在本发明的进一步实施方式 中,ERCMG 160可以是可操作与头端110通信的分离的实体。
[0044] 最后,提供搜索引擎170(作为头端110的单元示出)。当用户操作RCU 150和选 择菜单时,输入一个或多个搜索项诸如字和/或数量或者通过在显示设备140 (嵌入和/或 相关于客户端设备120)上显示的应用进行动作,可以通过通信网络130将请求发送至头端 110并且由搜索引擎170接收。请求可以是对元数据、TV节目或者内容、或者任何其他额外 的信息的请求。然后,搜索引擎170可以将请求传递/转发至ERCMG 160。作为响应,ERCMG 160返回包括原始的搜索请求的不同的语言变化版本的相关的额外丰富元数据至搜索引 擎170,并且通过增加这个相关的额外丰富元数据至原始的搜索请求来更新请求。然后,搜 索引擎使用更新的搜索请求进行搜索并且一组相关的搜索结果在显示在显示设备140上 之前被发送回至客户端设备120。ERCMG 160还能够通过考虑与用户相关的有用的情境信 息诸如,例如(但是不限制本发明的一般性),地理位置、初始语言输入、简档、优选、搜索历 史等适应搜索结果的相关性/排列。这样做,定义如何排列和显示搜索结果的权重规则由 ERCMG 160使用所述情境信息创建并然后应用在通过搜索引擎170获得的搜索结果上。
[0045] 现在参考图2,图2是根据本发明的实施方式的包括额外丰富内容元数据生成器 (ERCMG)的系统的简化框图示图。以下将详细地描述与图3的方法有关的图2的系统的操 作。
[0046] 过程在步骤300开始,并且在步骤301,内容提供者202 (例如,TV操作员)发送 与内容项(例如,构成TV时间表或者VOD目录的部分的程序)相关的内容元数据至ERCMG 260。通常,内容元数据可以被通过资产分配接口(ADI)、使用元数据描述(例如,电缆实验 室ADI规格描述资源(诸如TV节目和商业广告)如何可以从内容源极分配至TV广播员)定 义资源如何标记和分类的产业方针、或者线性业务量信息接口(例如,XML流量接口(XTI), 其为用于输入XML格式化流量数据至流动数据库服务器和从流动数据库服务器输出XML格 式化流量数据的基于Java的应用)被接收和摄入。本领域技术人员将理解可以使用任何 其他合适的用于元数据摄入的格式。一旦摄入,内容元数据被存储和索引在ERCM数据库 266中从而对用户可用。在摄入期间或者摄入之后,一些或者所有摄入内容元数据被转发 至ERCMG 260和由ERCM管理单元261接收。通常,在内容制备平台期间,这个内容元数据 摄入操作预先在内容提供者/TV操作者的控制下进行。
[0047] 在步骤302, ERCM创建子单元262检查ERCM管理单元261接收的内容元数据并且 然后使用一个或多个网络爬虫来检索额外元数据从而使内容提供者提供的原始的内容元 数据丰富。通常,网络爬虫被用于访问、解析和从外源诸如(但是不限制本发明的一般性), 由内容提供者指定的网站入口提取元数据。本领域技术人员将理解,任何其他合适的网络 来源可以被访问,只要网络爬虫能够解析和提取来自该网络源的元数据。在本发明的一个 实施方式中,网络爬虫被用于搜索与原始的内容元数据的子集相关的额外元数据。例如,由 内容提供者提供的原始的内容元数据可以包括用于每个TV或者VOD节目的一个或多个图 像、类型和/或次类型、片名、开始和结束时间、持续时间、一个或多个视频、摘录、不同演员 的名字、导演的名字等。因此,网络爬虫可以检索在TV或者VOD节目中呈现的与片名或者 演员相关的额外元数据。这些额外元数据通常包括对应于原始的内容元数据的区域或者语 言变化版本的演员/导演/标题的额外的名字,版权信息和区域限制等。
[0048] 在中文语言和区域变化版本的背景下,网络爬虫可以访问不同的门户网络诸如例 如(但是不限制本发明的一般性),时光网(中国大陆的内容元数据门户网络)、香港雅虎 电影、或者True电影(台湾)并且提取以书面的汉字表示的额外元数据。在包括原始的内 容元数据的情形中,例如:
[0049] "Jackie Chan"作为演员,网络爬虫可以能够检索以下对应于其区域和/或语言变 化版本以及社交共用名字的额外元数据中至少一个:
[0050] 简体中文的"成龙";
[0051] 繁体中文的"成龍";和/或
[0052] Jackie Chan的中文原名"陈港生"。
[0053] "Skyfall"作为电影片名,网络爬虫可以能够检索以下对应于其区域和/或语言 变化版本以及社交共用名称的额外元数据中至少一个:
[0054] 中国大陆的"大破天幕杀机";
[0055] 香港(繁体中文)的"新鐵金剛:智破天凶城";
[0056] 台湾(繁体中文)的"空降危機";和/或
[0057] 作为社交共用名字的"詹姆斯邦德2012"或者"邦德23"。
[0058] 对本领域中的技术人员显而易见的是原始的内容元数据可以被以任何合适的格 式设置并且网络爬虫被配置为检索缺失的额外元数据。
[0059] 在步骤303,确定是否网络爬虫没有发现一个或多个额外元数据。如果成功地检索 所有的额外元数据,然后过程直接进行至步骤305。相反地,在缺失一个或多个额外元数据 的情形中,创建子单元262的ERCM可以在移动至步骤305之前在步骤304通过词典检查来 检索缺失的额外元数据。
[0060] 一旦被网络爬虫检索到,额外元数据被集中并且可以被存储为与原始的内容元数 据在多个索引中关联或者在ERCM数据库266的表267和268中。通常,原始的内容元数据 利用它们相应的额外元数据,即,对应于原始内容元数据的语言变化版本的额外元数据相 关联和存储。并且,创建子单元262的ERCM还可以进行以汉字书面的原始内容元数据和以 汉字书面相应的额外元数据的拼音映射。因此,在包括原始内容元数据和额外元数据的情 形中,例如:简体中文的"成龙";繁体中文的"成龍";和作为JackieChan的中文原名的"陈 港生",进行以下拼音映射:
[0061] 大陆拼音的 "Cheng Long" ;
[0062] 香港拼音的"Sing Lung" ;和/或
[0063] 台湾拼音的 "Cheng Lung"。
[0064] 并且,可以为Skyfall样本进行以下拼音映射:
[0065] 大陆拼音的 "Da Po Tian Mu Sha Ji " ;
[0066] 香港拼音的 "Zhi Po Tian Xiong Cheng" ;和 / 或
[0067] 台湾拼音的 "Kong Jiang Wei Ji "。
[0068] 在步骤306, ERCM创建子单元262进一步创建拼音简写。通常,采用拼音格式的每 个单词的首个字母以创建拼音简写。因此,拼音简写被表示为以下:
[0069] 对于 "Jackie Chan,':
[0070] "CL"用于大陆和台湾拼音;和/或
[0071] "SL"用于香港拼音。
[0072] 对于"Skyfall" :
[0073] "TMSJ"用于大陆拼音;
[0074] "ZPTXC"用于香港拼音;和/或
[0075] "KJWJ"用于台湾拼音。
[0076] -旦被处理,原始内容元数据和关联的额外元数据,拼音和拼音简写被在ERCM管 理单元261的控制下进一步相关联地存储在存储单元266 -在下文中称作ERCM数据库 266 -(步骤307)。虽然仅在图2中示出一个ERCM存储单元266,本领域技术人员将理解可 以采用单个或者多个存储器单元、数据库等作为存储手段。原始内容元数据和关联的额外 元数据以及它们的拼音和拼音简写可以被存储在多个索引或者表中。图2示出两个表267 和268。表267是通常包括大陆中文(S卩,简体中文)、大陆汉语拼音和TV操作员直接保持 或者更新的相同的元数据的英语语言变化版本的元数据表。为了说明,以下表1示出包括 用于在上文给出的两个示例的元数据变化版本的元数据表267 :
[0077] 表1 -兀数据表267
[0078]

【权利要求】
1. 一种方法,包括: 接收与由内容提供者提供的内容项有关的内容元数据; 从一个或多个外部源检索额外元数据,所述额外元数据包括所述内容元数据的语言变 化版本; 将所述内容元数据连同所述额外元数据存储在存储设备中,其中,所述内容元数据被 存储为与所述额外元数据关联; 接收来自用户的搜索请求,所述搜索请求包括以第一语言变化版本表示的一个或多个 搜索项; 在所述内容元数据或者所述额外元数据中识别匹配所述一个或多个搜索项的相关元 数据; 识别存储为与所述相关元数据关联的额外的相关的元数据,所述额外的相关的元数据 包括所述相关元数据的语言变化版本;以及 增加一个或多个额外的搜索项至所述搜索请求,所述一个或多个额外的搜索项对应于 所述额外的相关的元数据。
2. 根据权利要求1所述的方法,其中,所述从一个或多个外部源检索额外元数据包括:采集和解析一个或多个网络源,其中,所述一个或多个网络源包括以不同的语言变化 版本提供额外元数据的一个或多个网络入口;和 从所采集和所解析的一个或多个网络源中的每一个提取所述额外元数据。
3. 根据权利要求1所述的方法,其中,所述从一个或多个外部源检索额外元数据包括 检索与所述内容元数据的子集相关的额外元数据。
4. 根据权利要求3所述的方法,其中,所述内容元数据的所述子集包括以下的至少一 个: 演员名字; 导演名字; 片名;和 版权和/或区域信息。
5. 根据权利要求1所述的方法,其中,所述额外元数据包括以下语言变化版本的至少 一个: 书面格式; 发音格式;和 社交共用名字。
6. 根据权利要求5所述的方法,其中,所述书面格式包括简体中文和/或繁体中文。
7. 根据权利要求5所述的方法,其中,所述发音格式包括香港、台湾通用和/或汉语拼 音。
8. 根据权利要求5所述的方法,其中,对应于所述发音格式的简写创建另外的语言变 化版本。
9. 根据权利要求8所述的方法,其中,所述简写通过采用发音格式的每个所述额外元 数据的每个单词的首个字母创建。
10. 根据权利要求8所述的方法,其中,包括以第一语言变化版本表示的一个或多个搜 索项的所述搜索请求为发音格式的简写。
11. 根据权利要求1所述的方法,所述方法进一步包括: 创建限定如何排列和显示搜索结果的权重规则;和 应用所述权重规则至使用包括所述一个或多个搜索项和所述一个或多个额外的搜索 项的所述搜索请求获得的搜索结果。
12. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括将以对应于所述第一语言变化版本的语言变化版本的搜索结果排列为高于其他搜 索结果。
13. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括将以之前搜索的所述用户最频繁使用的语言变化版本的搜索结果排列为高于其他 搜索结果。
14. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括将以定义在所述用户的简档中的语言变化版本的搜索结果排列为高于其他搜索结 果。
15. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括将以对应于所述用户的当前位置的语言变化版本的搜索结果排列为高于其他搜索 结果。
16. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括根据所述用户的当前地理位置和当地版权限制去除语言变化版本的一些搜索结果。
17. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括根据所述用户的当前地理位置和当地版权限制替换语言变化版本的一些搜索结果。
18. -种装置,包括: 管理单元,可操作地接收与由内容提供者提供的内容项相关的内容元数据; 创建单元,可操作地从一个或多个外部源检索额外元数据,所述额外元数据包括所述 内容元数据的语言变化版本; 存储单元,可操作地存储所述内容元数据连同所述额外元数据,其中,所述内容元数据 被存储为与所述额外元数据关联; 其中,所述管理单元被另外可操作为:接收来自用户的搜索请求,所述搜索请求包括以 第一语言变化版本表示的一个或多个搜索项;在所述内容元数据或者所述额外元数据中识 别匹配所述一个或多个搜索项的相关元数据;识别存储为与所述相关元数据关联的额外的 相关的元数据,所述额外的相关的元数据包括所述相关元数据的语言变化版本;以及增加 一个或多个额外的搜索项至所述搜索请求,所述一个或多个额外的搜索项对应于所述额外 的相关的元数据。
19. 一种或多种计算机可读有形存储介质,利用包括计算机可执行指令的软件编码并 且当所述软件被执行时,可操作为: 接收与由内容提供者提供的内容项相关的内容元数据; 从一个或多个外部源检索额外元数据,所述额外元数据包括所接收的内容元数据的语 言变化版本; 将所接收的内容元数据连同所述额外元数据存储在存储设备中,其中,所接收的内容 元数据被存储为与所述额外元数据关联; 接收来自用户的搜索请求,所述搜索请求包括以第一语言变化版本表示的一个或多个 搜索项; 在所接收的内容元数据或者所述额外元数据中识别匹配所述一个或多个搜索项的相 关元数据; 识别存储为与所识别的相关元数据关联的额外的相关的元数据,所述额外的相关的元 数据包括所识别的相关元数据的语言变化版本;以及 增加一个或多个额外的搜索项至所述搜索请求,所述一个或多个额外的搜索项对应于 所述额外的相关的元数据。
【文档编号】G06F17/30GK104424362SQ201410444283
【公开日】2015年3月18日 申请日期:2014年9月2日 优先权日:2013年9月3日
【发明者】李宇亮, 克里斯·米尔斯, 伊恩·R·谢尔顿, 斯图尔特·P·阿什比, 安德鲁·瓦伦廷 申请人:思科技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1