生成和呈现横向概念的制作方法

文档序号:6359560阅读:161来源:国知局
专利名称:生成和呈现横向概念的制作方法
生成和呈现横向概念
背景技术
常规地,用户从如下本地应用或者远程服务器接收查询制定(queryformulation)辅助,所述本地应用或者远程服务器基于常规搜索引擎先前从用户或者向常规搜索引擎提交查询的其他用户接收的查询来提供高速缓存的名词(term)。常规搜索引擎从用户接收查询以对如下网页定位,这些网页具有与在接收的查询中包括的名词匹配的名词。常规搜索引擎通 过在与常规搜索引擎的所有用户远离的服务器上高速缓存从所述所有用户向常规搜索引擎发送的名词并且向针对常规搜索引擎录入用户查询的用户显示高速缓存的名词中的一个或者多个名词来辅助用户制定查询。用户选择高速缓存的名词中的任何一个名词以完成查询并且接收如下网页的列表,这些网页具有与在用户查询中包括的名词匹配的名词。

发明内容
本发明的实施例涉及用于响应于来自用户的查询而呈现和生成横向概念的系统、方法和计算机可读介质。除了与用户查询匹配的搜索结果之外还呈现横向概念。搜索引擎从客户端设备接收查询。又搜索储存器(storage)以定位与查询的匹配。如果匹配存在,则横向概念生成器从储存器取回与查询对应的内容。横向概念生成器又标识与内容关联的类别。横向概念生成器也获得与每个类别关联的附加内容。横向概念生成器执行在取回的内容与附加内容之间的比较以向每个标识的类别分配分数。横向概念生成器基于向与每个类别对应的内容分配的分数选择若干类别并且返回取回的内容和若干类别作为横向概念。如果匹配未存在,则横向概念生成器比较储存器中存储的内容与查询以创建用来标识类别的内容集合并且基于查询与内容集合中的内容之间的相似性计算分数。提供这一发明内容以便以简化形式介绍下文在具体实施方式
中进一步描述的概念的选择。这一发明内容并非旨在标识要求保护的主题内容的关键特征或者必要特征、也并非旨在用作确定要求保护的主题内容的范围的孤立辅助。


下文参照这里通过引用而结合于此的以下附图具体描述本发明的示例实施例
图I是图示了根据本发明实施例的示例计算设备的框 图2是图示了根据本发明实施例的配置成生成横向概念的计算机系统的示例部件的网络 图3是图示了根据本发明实施例的用于生成横向概念的计算机实施的方法的逻辑图;图4是图示了根据本发明实施例的用于生成知识内容的替代计算机实施的方法的逻辑图;并且
图5是图示了根据本发明实施例的响应于用户查询而返回的横向概念的图形用户界面。
具体实施例方式本专利以满足法定要求的特异性描述用于取得专利的主题内容。然而该描述本身并非旨在限制本专利的范围。而是,发明人已经设想也可以用其它方式具体化要求保护的主题内容以与其它当前或者将来技术结合地包括与在本专利中描述的步骤或者步骤组合相似的不同步骤或者步骤组合。另外,虽然术语“步骤”和“块”这里可以用来意味着运用的方法的不同要素,但是除非明确描述个体步骤的顺序以及除了这样之外,术语应当解释为意味着在这里公开的各种步骤之中或者之间的任何特定顺序。
如这里所用,术语“横向概念”指代代表查询的正交主题的字词或者短语。如这里所用,术语“部件”指代硬件、固件和软件的任何组合。本发明的实施例提供如下横向概念,这些横向概念允许用户导航具有结构化数据、半结构化数据和未结构化数据的大的内容集合。计算机系统通过处理与用户提供的查询匹配的内容集合并且选择用于内容的类别来生成横向概念。横向概念包括所选类别的子集。横向概念与匹配查询的搜索结果一起呈现给用户。横向概念允许搜索引擎提供与查询或者对应于查询的内容正交的概念。用户又可以选择横向概念之一以在结构化、未结构化和半结构化数据的组合中搜索与横向概念对应的内容。在一个实施例中,横向概念可以存储于如下索引中,该索引具有指向从用户接收的一个或者多个查询的指针。因而,可以响应于在计算机系统中包括的搜索引擎处接收的后续查询——与先前查询相似——来返回横向概念而无需处理内容。例如,搜索引擎可以从用户接收针对西雅图太空针的查询。搜索引擎处理查询以标识横向概念和搜索结果。可以从与用于西雅图太空针的内容一起存储的元数据结构选择横向概念。或者可以从通过解析与用户查询关联的搜索结果而生成的特征矢量选择横向概念。存储结构可以包括元数据(例如用于西雅图太空针的内容属性)。西雅图太空针内容属性可以包括塔属性、西雅图吸引地属性和建筑属性。塔属性可以包括如下数据,该数据指定西雅图太空针和其它塔(比如台北101、帝国大厦、迪拜塔和上海环球金融中心)的名称和高度。西雅图吸引地属性可以包括用于西雅图中的其它吸引地(比如西雅图太空针、派克街鱼市场、西雅图艺术博物馆和国会山)的名称和位置的数据。建筑属性可以包括用于在塔属性中包括的每座塔的建筑类型、现代的、古代的等的数据。搜索引擎可以返回西雅图太空针内容属性中的任何内容属性作为横向概念。取而代之,计算机系统可以处理搜索结果以生成与搜索结果一起返回的横向概念。解析与搜索结果关联的内容以标识特征矢量。特征矢量包括与内容关联的类别元素。特征矢量用来比较搜索结果并且计算搜索结果之间或者搜索结果与查询之间的相似性分数。计算机系统基于相似性分数来选择特征矢量中的类别并且响应于用户查询而返回这些类别作为横向概念。生成横向概念的计算机系统可以包括存储设备、搜索引擎和附加计算设备。搜索引擎从用户接收查询并且返回包括内容和横向概念的结果。储存器被配置成存储内容和横向概念。在一些实施例中,内容包括结构化、未结构化和半结构化数据的集合。图I是图示了根据本发明实施例的示例计算设备100的框图。计算设备100包括总线110、存储器112、处理器114、呈现部件116、输入/输出(I/O)端口 118、输入/输出(I/O)部件120和电源122。计算设备100仅为适当计算环境的一个例子而并非旨在暗示关于本发明的使用或者功能范围的任何限制。计算设备100也不应解释为具有涉及所示部件中的任何部件或者组合的任何依赖或者要求。计算设备100通常包括多种计算机可读介质。举例而言而非限制,计算机可读介质可以包括随机存取存储器(RAM);只读存储器(ROM);电可擦除可编程只读存储器(EEPR0M)、闪存或者其它存储器技术;CDR0M、数字万用盘(DVD)或者其它光学或者全息介质;磁盒、磁带、磁盘存储或者其它磁存储设备或者可以用来对所需信息编码并且由计算设备100访问的任何其它介质。可以使用由计算设备100 (比如个人数据助理或者其它手持设备)执行的计算机代码或者机器可用指令(包括计算机可执行指令(比如程序模块))来实施本发明的实施例。一般而言,包括例程、程序、对象、模块、数据结构等的程序模块指代执行特定任务或者实施特定抽象数据类型的代码。可以在多种系统配置(包括分布式计算环境(在这些环境中,任务由通过通信网络链接的远程处理设备执行))中实践本发明的实施例。计算设备100包括直接或者间接耦合以下部件的总线110 :存储器112、一个或者 多个处理器114、一个或者多个呈现模块116、输入/输出(I/O)端口 118、I/O部件120和示例电源122。总线110代表如下总线,该总线可以是一个或者多个总线(比如地址总线、数据总线或者其组合)。虽然为了清楚而用线条示出了图I的各种部件,但是实际上描绘各种模块并非如此清晰,并且作为比喻,线条将更准确地为灰色并且模糊。例如可以将呈现部件116 (比如显示器设备)视为I/O部件。处理器114也具有存储器112。未区分“工作站”、“服务器”、“膝上型电脑”、“手持设备”等,因为都是在图I的范围内设想的。存储器112包括形式为易失性和/或非易失性存储器的计算机可读介质和计算机存储介质。存储器可以是可拆卸的、不可拆卸的或者其组合。示例硬件设备包括固态存储器、硬驱动、光盘驱动等。计算设备100包括从各种实体(比如存储器112或者I/O部件120)读取数据的一个或者多个处理器114。呈现部件116向用户或者其它设备呈现数据指示。示例呈现部件116包括显示器设备、扬声器、打印机、振动模块等。I/O端口 118允许计算设备100在物理和逻辑上耦合到包括I/O部件120的其它设备(其中一些其它设备可以是内置的)。示例I/O部件120包括麦克风、操纵杆、游戏垫、碟形卫星天线、扫描仪、打印机、无线设备等。生成横向概念的计算机系统包括搜索引擎、储存器(storage)和横向概念生成器。横向概念可以与内容和涉及内容的查询一起存储于储存器中。搜索引擎接收查询并且向客户端设备发送包括与查询对应的内容的结果和横向概念。客户端设备将结果与至少一些横向概念的列表一起显不。图2是图示了根据本发明实施例的配置成生成横向概念的计算机系统200的示例部件的网络图。计算机系统200具有客户端设备210、网络220、搜索引擎230、横向概念生成器240和储存器250。客户端设备210经由网络220连接到搜索引擎230。客户端设备210允许用户录入查询。客户端设备210向搜索引擎230发送查询。客户端设备210又接收包括横向概念的结果并且向用户显示结果和横向概念。在一些实施例中,客户端设备210可以是能够有网络可访问性的任何计算设备。照这样,客户端设备210可以采用多种形式,比如个人计算机(PC)、膝上型计算机、移动电话、个人数字助理(PDA)、服务器、⑶播放器、MP3播放器、视频播放器、手持通信设备、工作站、这些描绘的设备中的任何组合或者能够有网络可访问性的任何其它设备。网络220连接客户端设备210、搜索引擎230、横向概念生成器240和储存器250。网络220可以是有线的、无线的或者二者。网络220可以包括多个网络或者网络的网络。例如,网络220可以包括一个或者多个广域网(WAN)、一个或者多个局域网(LAN)、一个或者多个公共网(比如因特网)或者一个或者多个专用网。在无线网络中,诸如基站、通信塔或者甚至接入点(以及其它部件)之类的部件在一些实施例中可以提供无线连通。虽然为了清楚而图示了单个部件,但是本领域技术人员将理解网络220可以实现在任何数目的客户端设备210之间的通信。搜索引擎230是针对从客户端设备210接收的查询提供结果的服务器计算机。在一些实施例中,搜索引擎230响应于查询而提供横向概念。搜索引擎230可以针对从客户端设备210接收的每个查询而返回某一数目(例如前三个)横向概念。搜索引擎230可以从 横向概念生成器240或者储存器250接收横向概念。横向概念生成器240响应于查询而生成横向概念。在一个实施例中,横向概念生成器240包括初始处理部件242、相似性引擎244和编索引引擎246。横向概念生成器240从储存器250接收类别和内容。内容和类别又由横向概念生成器240的一个或者多个部件242、244 和 246 处理。初始处理部件242被配置成对与搜索引擎230接收的查询匹配的内容定位、分析内容并且使用一种或者多种数据处理方法来提取信息。就这一点而言,初始处理部件242可以用来分析内容并且从三类数据提取信息未结构化数据、结构化数据和半结构化数据。未结构化数据可以包括具有系列文本行的文档。包括在未结构化的数据的类别中的文档可以具有很少的元数据或者没有元数据。另一方面,结构化数据可以包括传统数据库,在该数据库中,信息被结构化和参考。半结构化数据可以包括比如研究论文或者证券交易委员会归档之类的文档,其中文档的部分包括文本行而文档的部分包括用于示例的表格和图形。在半结构化数据的情况下,可以分析文档的结构化成分作为结构化数据并且可以分析文档的未结构化成分作为未结构化数据。特征矢量用来比较与查询匹配的内容。特征矢量可以包括以下元素一组字词(word)、概念和分数。该组字词代表内容的摘要或者采样。概念对内容分类。并且分数包含用于内容和与查询匹配的附加内容的相似性测量。例如,用于太空针内容的特征矢量可以包括一组字词“为世界博览会而建造的纪念碑”、概念“塔”和分数“零”。可以基于向特征矢量分配的分数选择特征矢量的概念元素作为横向概念。可以手动地或者自动地生成特征矢量的元素的值。主题内容专家可以人工填充特征矢量的元素。取而代之,横向概念生成器240可以自动填充特征矢量的元素。初始处理部件242可以包括词法分析、语言分析、实体提取分析和属性提取分析。在一个实施例中,初始处理部件242创建用于储存器250中的内容的特征矢量。初始处理部件242自动填充用于特征矢量的字词和概念。在某些实施例中,初始处理部件242从储存器250中的本体(ontology) 252或者从如下字词选择概念,这些字词是从内容提取的。相似性引擎244计算如下相似性分数,该相似性分数填充用于特征矢量的分数元素。相似性引擎244是横向概念生成器240的部件。相似性引擎计算在用于从储存器250取回的内容的特征矢量中存储的相似性分数。分数可以代表与储存器250中的与查询匹配的其它内容的相似性或者与搜索引擎230接收的查询的相似性。相似性分数又用来从在与匹配查询的内容关联的特征矢量中标识的概念选择若干类别。向搜索引擎230返回所选类别作为横向概念。在一个实施例中,相似性引擎244可以使用特征矢量来计算与查询匹配的内容之间的相似性。可以使用针对多维矢量的勾股定理基于特征矢量之间的距离来计算相似性分数。例如,当储存器250包括与查询匹配的内容时,横向概念生成器240可以基于向若干类别中的每个类别内的内容分配的分数返回若干类别。横向概念生成器240从储存器250获得匹配内容和对应类别。横向概念生成器240又生成用于匹配内容的特征矢量。横向概念生成器240还使用与匹配内容关联的类别来生成内容集合。内容集合中的每个内容由横向概念生成器240处理以创建特征矢量。又比较用于内容集合的每个特征矢量与用于匹配内容的特征矢量以生成相似性分数。又用相似性引擎244计算的相似性分数更新用于内容集合的特征矢量。相似性引擎244可以选择每个类别中的具有高相似性分数的多个特征矢 量、将分数平均并且向类别分配经平均的分数。在一个实施例中,相似性引擎244选择被分配最高分数的每个类别内的三个特征矢量以计算向类别分配的平均分数。因此作为例子,可以向搜索引擎230返回具有最高分数的前五个类别作为横向概念。在另一实施例中,相似性引擎244可以计算内容与查询之间的相似性。可以使用用于多维矢量的勾股定理基于特征矢量之间的距离来计算相似性分数。例如,当储存器250未包括与查询匹配的内容时,横向概念生成器240可以基于向若干类别中的每个类别内的内容分配的分数返回若干类别。横向概念生成器240从储存器250获得与查询有关的预定数目的内容以及对应的类别。在一个实施例中,横向概念生成器从储存器250获得具有高查询相似性分数的五十项内容。横向概念生成器240又生成用于查询的特征矢量。横向概念生成器240也使用与获得的内容关联的类别来取回内容集合。横向概念生成器240处理内容集合中的内容以创建特征矢量。又比较用于内容集合中的内容的特征矢量与用于查询的特征矢量以生成相似性分数。又用相似性引擎244计算的相似性分数更新用于内容集合的特征矢量。相似性引擎244可以选择每个类别中的具有高相似性分数的多个特征矢量、将分数平均并且向类别分配经平均的分数。在一个实施例中,相似性引擎244选择被分配最高分数的每个类别内的三个特征矢量以计算向类别分配的平均分数。又可以向搜索引擎返回具有最高分数的前五个类别作为横向概念。相似性引擎244可以使用词频来计算用于储存器250中的内容的查询相似性分数。相似性引擎在与查询的匹配未存储于储存器250中时计算查询相似性分数(S,)。Si = ,其中freq(w)是储存器中的查询(w)的频率,而docfreq是
被选择用于比较的内容内的查询的频率。相似性引擎244收集被分配最大Sq的内容,并且前五十个文档用来生成横向概念。编索引引擎246是横向概念生成器240的可选部件。编索引引擎246从相似性引擎244接收横向概念并且将横向概念与生成横向概念的查询一起存储于索引254中。与先前处理的查询相似的后续查询又可以绕过横向概念生成器240并且获得存储于索引254中的横向概念。
储存器250向搜索引擎230提供内容和先前生成的横向概念。储存器250存储内容、本体252和索引254。在某些实施例中,储存器250也包括存储每个内容的主语、宾语和谓语的一个或者多个数据仓库,例如关系数据库和/或平面文件数据库等。索引254将内容与先前生成的横向概念一起参考。所述内容可以包括结构化的、半结构化的和未结构化的数据。在一些实施例中,内容可以包括具有存储于平面文件数据库中的属性的视频、音频、文档、表格和图像。计算机系统200可以用算法生成横向概念或者内容属性可以用作横向概念。例如,西雅图太空针或者特定股票的内容属性可以存储于储存器250中。可以分别响应于针对西雅图太空针或者特定股票的搜索查询而提供内容属性作为横向概念。西雅图太空针内容属性可以包括塔属性、西雅图吸引地属性和建筑属性。塔属性可以包括如下数据,该数据指定西雅图太空针和其它塔(比如台北101、帝国大厦、迪拜塔和上海环球金融中心)的名称和高度。西雅图吸引地属性可以包括用于西雅图中的其它吸引地(比如西雅图太空针、派克街鱼市场、西雅图艺术博物馆和国会山)的名称和位置的数据。建筑属性可以包括用于针对塔属性中包括的每座塔的建筑类型(现代的、古代的等)的数据。计算机系统 200可以返回西雅图太空针内容属性中的任何内容属性作为横向概念。特定股票也可以包括股票内容属性。例如,MSFT内容属性可以包括类型属性、产业属性和盈利(PE)属性。类型属性包括针对例如法人、公司、股份有限制等企业类型的数据。产业属性可以指定例如食品、娱乐、软件等产业,并且PE属性包括PE的值。计算机系统200可以返回任何股票内容属性作为横向概念。计算机系统200用算法生成的横向概念可以存储于索引254中。在某些实施例中,又可以用存储于索引254中的横向概念对搜索引擎230接收的与储存器250中的特征矢量匹配的后续查询做出响应。对于给定查询,索引254可以存储若干横向概念。因而,搜索引擎230可以访问索引254以获得横向概念列表。横向概念使用户能够导航储存器250中的内容。本体252包括与储存器250中的内容对应的字词或者短语。可以从多个本体选择与储存器250中的内容关联的类别。每个本体252包括针对领域的分类法和领域中的字词或者短语之间的关系。分类法指定领域中的字词或者短语之间的关系。领域可以包括医药、艺术、计算机等。横向概念生成器240又可以基于相似性向与内容关联的类别分配分数。在一个实施例中,横向概念生成器240基于与响应于查询而获得的内容的相似性计算分数。在另一实施例中,横向概念生成器240基于与查询的相似性计算分数。横向概念生成器240基于分数选择若干类别作为横向概念。在一些实施例中,响应于来自用户的查询而向客户端设备发送存储于索弓I中的一个或者多个横向概念用于向用户呈现。取而代之,可以基于从用户接收的查询来动态地生成横向概念。计算机系统可以执行至少两种用于动态地生成横向概念的计算机实施方法。在第一实施例中,基于在与查询匹配的内容和储存器中的其它内容的特征矢量之间的分数选择横向概念。图3是图示了根据本发明实施例的用于生成横向概念的计算机实施方法的逻辑图。该方法在计算机系统连接到客户端设备网络时在步骤310中初始化。在步骤320中,计算机系统接收用户查询。计算机系统又在步骤330中从储存器获得与用户查询对应的内容。在步骤340中,计算机系统标识与对应于用户查询的获得的内容关联的类别。在一个实施例中,类别包括ー个或者多个本体中的短语。在另ー实施例中,类别包括与用户查询对应的获得的内容的属性。计算机系统又在步骤350中从储存器取回与每个标识的类别对应的内容集合。在步骤360中,计算机系统基于向内容集合中的内容分配的分数选择若干标识的类别作为横向概念。在一个实施例中,横向概念可以包括正交概念。横向概念可以存储于计算机系统的储存器中。在某些实施例中,将内容表示为特征矢量。并且基于在特征矢量之间的相似性向内容分配分数。计算机系统向提供用户查询的用户显示横向概念。计算机系统也可以基于向内容分配的相似性分数过滤与横向概念一起 显示的内容。在一个实施例中,计算机系统显示前三个横向概念。计算机系统在ー些实施例中可以通过标识与获得的内容的特征矢量对应的平面的法线来选择正交概念。计算机系统又处理创建与法线创建的平面平行的平面的、用于内容集合的特征矢量以获得与那些特征矢量关联的内容的类别。在步骤370中,可以基于向类别内的内容分配的分数返回这些类别中的若干类别作为横向概念。该方法在步骤380中终止。如上文提到的那样,计算机系统可以执行至少两种用于动态地生成横向概念的计算机实施方法。在第二实施例中,基于在用于查询和储存器中的内容的特征矢量之间的分数选择横向概念。计算机系统可以在储存器未包含与查询的匹配时执行这一方法。在ー些实施例中,确定匹配而未使用用于查询中包括的名词的词干。因此,计算机系统的储存器可以包括如下其它匹配,这些匹配基于查询中包括的名词的词干。这些其它匹配可以用来生成横向概念。图4是图示了根据本发明实施例的用于生成知识内容的可替换计算机实施方法的逻辑图。该方法在计算机系统连接到客户端设备网络时在步骤410中初始化。在步骤420中,计算机系统接收用户查询。在步骤430中,计算机系统计算在储存器中的内容与用户查询之间的相似性。在步骤440中,计算机系统创建如下内容集合,该内容集合具有与用户查询相似的预定数目的内容。计算机系统又在步骤450中标识与内容集合中的内容对应的每个类别。在步骤460中,计算机系统基于向内容集合中的内容分配的分数选择若干标识的类别作为横向概念。在某些实施例中,将查询和内容表示为特征矢量。并且基于用于查询和内容的特征矢量之间的相似性向内容分配分数。计算机系统向提供用户查询的用户显示横向概念。计算机系统也可以基于向内容分配的相似性分数过滤与横向概念一起显示的内容。在ー个实施例中,计算机系统显示前三个横向概念。在一个实施例中,可以在横向概念中包括正交概念。通过标识与查询的特征矢量对应的平面的法线来选择正交概念。计算机系统又处理创建与法线创建的平面平行的平面的、用于内容集合的特征矢量以获得与那些特征矢量关联的内容的类别。在步骤470中,可以基于向类别中的内容分配的分数返回这些类别中的若干类别作为横向概念。该方法在步骤480中終止。在某些实施例中,在由搜索引擎提供的图形用户界面中显示所选的横向概念。与如下捜索结果一起提供横向概念,这些搜索结果匹配于搜索引擎接收的用户查询。用户可以选择横向概念以向搜索引擎发出查询并且取回与所选横向概念对应的附加内容。图5 是图示了根据本发明实施例的响应于用户查询而返回的横向概念的图形用户界面500。图形用户界面包括搜索文本框510、搜索结果区域520和横向概念区域530。响应于在搜索文本框510中录入的用户查询而显示图形用户界面500。在用户发起捜索之后向搜索引擎发送用户查询。搜索引擎用结果列表做出响应并且结果显示于捜索结果区域520中。搜索引擎也用横向概念做出响应。横向概念显不于横向概念区域530中。如果用户从横向概念区域530选择横向概念,贝U与所选横向概念相关的搜索结果显不于搜索结果区域520中。 概括而言,横向概念允许用户使用从内容或存储未结构化、结构化和半结构化内容的计算机系统的存储结构导出的信息来遍历未结构化、结构化和半结构化内容。用户可以向搜索引擎发送查询,该搜索引擎返回多个結果。此外,搜索引擎也可以提供横向概念。横向概念可以对应干与在捜索结果中包括的内容关联的ー个或者多个类别。当用户点击横向概念时,更新结果以包括与横向概念关联的附加内容。描述的各种部件以及未示出的部件的许多不同布置是可能的而未脱离本发明的精神和范围。已经描述本发明的实施例,g在例示而非限制。应理解,某些特征和子组合具有效用并且可以在未參考其它特征和子组合时加以运用并且是在权利要求的范围内设想的。无需以描述的具体顺序完成在各种图中列举的所有步骤。
权利要求
1.一种计算机实施方法,用于向用户呈现与搜索查询对应的横向概念,所述方法还包括 接收用户查询; 从储存器获得与所述用户查询对应的第一组内容; 标识与所获得的第一组内容关联的多个类别; 选择所述多个标识的类别的子集作为横向概念;以及 响应于所述用户查询而返回所述第一组内容和所选择的横向概念。
2.根据权利要求I所述的方法,其中所述类别包括所述内容的短语或者属性。
3.根据权利要求I所述的方法,其中将所述内容表示为特征矢量并且基于特征矢量之间的相似性向所述内容分配相似性分数。
4.根据权利要求3所述的方法,还包括向提供所述用户查询的用户显示所述横向概念并且基于向所述内容分配的所述相似性分数过滤与所述横向概念一起显示的内容。
5.根据权利要求I所述的方法,还包括向提供所述用户查询的用户显示前三个横向概念。
6.根据权利要求I所述的方法,还包括在所述储存器中存储所述横向概念。
7.一种或者多种计算机可读介质,存储用于执行一种用于生成横向概念的方法的计算机可执行指令,所述方法还包括 接收用户查询; 计算储存器中的内容与所述用户查询之间的相似性; 创建具有与所述用户查询相似的预定数目的内容的内容集合; 标识与所述内容集合中的内容对应的每个类别;以及 响应于所述用户查询而返回所述内容集合和从所述标识的类别选择的横向概念。
8.根据权利要求7所述的介质,其中所述类别包括所述内容的短语或者属性。
9.根据权利要求7所述的介质,其中将所述内容表示为特征矢量并且基于所述特征矢量与所述用户查询的相似性向所述内容分配分数。
10.根据权利要求9所述的介质,还包括向提供所述用户查询的用户显示所述横向概念。
11.根据权利要求10所述的介质,还包括基于向所述内容分配的所述相似性分数过滤与所述横向概念一起显示的内容。
12.根据权利要求7所述的介质,还包括在所述储存器中存储所述横向概念。
13.一种具有处理器和存储器的计算机系统,所述计算机系统被配置成生成横向概念,所述系统还包括 搜索引擎,配置成接收用户查询; 储存器,配置成存储内容和对应类别;以及 横向概念生成器,其通信地连接到所述搜索引擎和储存器,其中所述横向概念生成器被配置成基于所述存储的内容的相似性分数从与储存器中的内容关联的类别选择横向概念,所述搜索引擎向所述用户查询提供包括所生成的横向概念的结果,并且所述储存器存储与所述用户查询对应的所述生成的横向概念。
14.根据权利要求13所述的计算机系统,其中当所述用户查询匹配于所述储存器中存储的内容时从所述储存器中存储的匹配内容选择类别。
15.根据权利要求13所述的计算机系统,其中当所述用户查询在所述储存器中不具有匹配时从与所述用户查询相似的内容集合选择类别。
全文摘要
提供用于生成横向概念的系统、方法和计算机存储介质。该系统包括用于接收用户查询的搜索引擎、用于存储内容及其关联类别的储存器以及横向概念生成器。横向概念生成器连接到搜索引擎和储存器这二者。横向概念生成器基于用于存储的内容的相似性分数从与内容关联的类别选择横向概念。
文档编号G06F17/40GK102725758SQ201180008411
公开日2012年10月10日 申请日期2011年1月12日 优先权日2010年2月5日
发明者A.C.苏伦德兰, A.斯里瓦斯塔瓦, M.斯里肯思, P.瓦达迪, R.普拉萨德, T.纳姆, V.瓦拉马尼 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1