用于关注点元数据检索的数据提供者的分级编排的制作方法_2

文档序号:9438863阅读:来源:国知局
定实施例,所属领域的一般技术人员将理解各种实施例的元件、步骤以及组件可布置在替代结构中同时保持在说明书的范围内。此外,本文中提供描述,额外实施例将显而易见,并且因此描述不仅仅参考特定描述的实施例,而是参考能够实现本文描述的功能或结构的任何实施例。
【附图说明】
[0031]本发明的各方面通过实例来说明。在附图中,相同参考数字指示类似元件,且:
[0032]图1说明可并有一或多个实施例的系统的简化图;
[0033]图2说明可根据一或多个实施例操作的一种潜在方法的各方面;
[0034]图3说明可根据一或多个实施例使用的装置的简化图;
[0035]图4说明可根据一或多个实施例操作的一种潜在方法的各方面;
[0036]图5说明可与各种系统和装置的一或多个实施例的各方面一起使用的计算装置的一个潜在实施例。
[0037]图6说明可与各种系统和装置的一或多个实施例的各方面一起使用的网络的一个潜在实施例。
【具体实施方式】
[0038]本发明的各方面涉及用于关注点计算技术的联网搜索。确切地说,描述用于分类和组织数据提供者,作为关注点搜索的一部分的系统、装置以及方法。额外实施例可能描述使用这一编排与反馈和性能分析来改进关注点(POI)搜索。
[0039]举例来说,在一个潜在实施例中,使用根据一个实施例的系统的人可能是在车中想要搜索用餐场所的乘客。这一系统用户可能使用移动电话创建POI搜索请求,POI搜索请求包括短语“靠近我的良好用餐场所”。移动装置可然后使用户的当前位置与请求整合并且将POI搜索请求传送到可处理请求的服务器。
[0040]在服务器处,语言分析模块可处理对靠近所提供的位置的“良好用餐场所”的搜索以识别具有如通过搜索短语的语言分析模块解释确定的某些特征的餐馆。服务器可存取许多潜在数据源,所述数据源可识别与所述搜索有关的关注点。为了避免在提供响应之前花费过量时间,服务器可用数据源质量度量值将潜在数据源优先排序。在用语言分析模块解释POI搜索请求之后,系统可开始发送一系列查询到数据源,从最高优先级数据源开始。
[0041]因为不同数据源可以不同等待时间作出响应,对查询的响应可能不全部同时接收。代替等待所有查询得到响应,系统可在接收时从数据源获取POI元数据,并且用响应数据流响应于POI搜索请求。随着在服务器处接收越来越多结果,可合并每个关注点的元数据,并且每个关注点的兼容或冲突元数据可用以创建合并元数据。当创建合并元数据时对于在搜索期间识别的每个POI更新可然后流式传输到用户。
[0042]另外,当在服务器处接收来自不同数据源的响应时,可测量与自其接收响应的每个数据源相关的质量。举例来说,可测量从将查询传送到特定数据源到接收来自所述数据源的响应的总时间作为数据源质量。另外,可测量信息的数量或质量作为数据源质量。用以确定数据源质量的这一分析可在接收响应时实时进行,或可在稍后的时间分析以有效地使用资源。
[0043]因此,根据所述潜在实施例的系统可以加速方式从基于质量的分级组织的数据源提供POI搜索数据,系统用于连续测量并且更新数据源质量。
[0044]如本文中所描述,“关注点”是匹配一组描述词的个别物理位置。所述关注点可使用在地图上的地址、座标或指示通过其物理位置描述,并且可进一步与描述位置细节的广泛多种元数据相关。举例来说,餐馆、博物馆、在固定位置的雕象、指示牌或任何其它这类位置可被视为关注点。在某些情况下,如快餐车的关注点可被视为关注点,即使其不永久固定在特定位置。
[0045]“关注点搜索请求”是指可用以识别关注点的一组描述词、短语、问题或用户输入。举例来说,“餐馆”、“洗手间”、“汽车租赁”和/或任何其它这类描述词可用以识别关注点作为搜索请求的一部分。
[0046]如本文所用,“关注点元数据”和“元数据”是指描述个别关注点,并且当关注点响应于单一搜索请求时可将个别关注点彼此区分的特征。举例来说,POI元数据可包含地址、电话号码、营业时间、提供的食品/饮料、食品类型、价格、用户评论、物理描述等。
[0047]“数据源”是指存储与个别POI相关的元数据的计算装置。可基于数据源的结构、名称、外观、质量、操作者和/或任何其它属性进一步区别数据源。
[0048]“合并元数据”是指来自多个数据源的聚集成描述个别关注点的单一组元数据的元数据。用于合并这类元数据的方法可排除冲突元数据数据,或可基于自其接收元数据的数据源的可信度设定元数据的置信度水平。合并元数据的方法的各方面可基于来自先前搜索的用户偏好和反馈设定。如果特定POI的具有一周更新的参考源和POI的个别网站都识别POI的电话号码,而知识库中的两年条目识别单独电话号码,那么合并元数据可包含来自前两个来源的兼容元数据并且排斥来自知识库的冲突元数据。在其它实施例中,所有这类元数据可能被排斥,或所有这类元数据可能被合并,取决于用户或系统设定冲突的细节包含于合并元数据中。这类合并元数据的额外描述在下文描述。
[0049]如本文所用,“兼容元数据”是指与另一元数据一致或证实另一元数据的来自多个数据源的元数据。这类元数据不必是其它兼容元数据的精确复制,但可简单地是通过以可通过POI搜索计算机或规则引擎分析和识别的方式暗示或推断而使得另一段元数据更可能正确的元数据。
[0050]另一方面,“冲突元数据”是使得另一段元数据不大可能正确的元数据。直接与其它元数据矛盾的元数据是冲突元数据。举例来说,一段元数据阐述位置在特定时间关闭而另一段元数据阐述位置在相同时间将打开的是冲突元数据。不直接冲突,但通过分析推断可能使得另一段元数据不大可能真实的元数据也可为冲突元数据。
[0051]“数据源质量”是指关于来自数据源的响应的信息。响应时间或从传送查询到接收响应的时间是一种潜在数据源质量。测量来自来源的适用数据量或数据源响应于查询平均提供多少数据的数据量可为另一种数据源质量。此外,从数据源接收的数据的正确性可为另一种数据源质量。这类质量可在从数据源接收响应之后立即评估,如在响应时间测量的情况下。正确性和完整性质量可需要额外分析,并且可依赖于随时间的许多响应的测量和分析。
[0052]“数据源优先级”是指基于数据源质量信息用以在请求来自数据源的信息时确定何时使用并且以何顺序使用的度量。所述优先级可设定为通过数据源质量信息的分析创建的数字。举例来说,平均响应时间可直接用作数据源优先级,其中较少响应时间在数据源查询的排序中指定为较早优先级。在其它实施例中,用户可选择优选数据源,并且这一偏好可使用加权公式进一步与完整性、正确性的测量以及响应时间测量整合以产生每个数据源的数据源优先级。额外实施例可测量与特定数据源相关的成本,或用于将响应时间与来自数据源的特定元数据的其它相对值加权的任何其它这类系统。
[0053]用于关注点(POI)搜索的标准基于位置的服务从网络上的单一来源或数据提供者检索POI元数据。通过这类搜索检索的POI元数据可包含例如地址、电话号码、营业时间、提供的食品/饮料等。Google Places?、Yelp, com?以及OpenStreetMap ?都是提供这种元数据的服务的实例。但是,即使一些数据提供者提供精确和良好维持的元数据,无一者提供用于个别POI的全面和一致信息。举例来说,Google Places可包含查找给定餐馆的营业时间的元数据,但是,描述所述餐馆提供的食品类型的精确元数据可能由单独数据提供者(如众包的OpenStreetMap?)或在餐馆网站上列出。在这类不同数据源中元数据格式和语义也不同类。举例来说,虽然某些数据源可提供POI地址,这可由不同标签,如“地址”或“位置”识别。一些数据源还可以在单一字符串中使用全地址,而其他将其分成部分(号码、街道、邮政编码/邮递区号、国家)。对于如电话号码或替代地名的其它信息也是这样。最后,在不同区域中并且通过不同数据提供者的POI覆盖度可变化相当大,甚至对于主提供者。特定挑战出现在操作含有多个商店的大型零售园区/购物中心中。在这种情况下仅一个或几个主要商店(例如超市)可被一些数据提供者列出作为关注点,即使可获得其它设施(例如附属于超市综合体的车辆加燃料站)。
[0054]此外,因为这类搜索可不由具有与搜索的物理位置或关注点的直接连接的实体组织,所以可用于这类搜索的数据的数量和质量可能广泛变化,并且可能来自各种各样的潜在来源。由于商店迀移或改变,来自一些来源的数据对于特定关注点可为过时的。由于从多个来源整合数据的复杂性和当请求关于关注点的信息时用户可能具有的独特需求
[0055]图1描述用于检索POI元数据时数据提供者的分级编排的系统的一个实施例。图1的系统包含装置110、用户10UP0I搜索计算机120以及多个数据源155。装置110可为任何计算装置,如蜂窝式电话、膝上型计算机、平板计算机、台式计算机、汽车定位辅助装置或能够从用户101接收输入以创建POI搜索请求112并且将所述POI搜索请求112传送到POI搜索计算机120的任何这类装置。
[0056]虽然图1的实施例展示在装置110上创建搜索,其中在单独POI搜索计算机120中执行额外处理和查询,但是在替代实施例(如图3展示的实施例)中,可通过装置110执行处理、语言分析以及查询,基本上将装置110和POI搜索计算机120整合到单一计算装置中。
[0057]POI搜索计算机120包含POI搜索处理和质量测量模块130、语言分析模块150以及元数据通信模块140。模块130可起管理与将POI请求(包含来自装置110的POI搜索请求112)发送到POI搜索计算机120的装置中的一些或全部的通信的作用。在某些实施例中,模块130可首先管理对关注点的搜索,并且然后管理对来自多个数据源的额外元数据的搜索,而在其它实施例中模块130可起引导对关注点和相关POI元数据的搜索作为整合搜索的作用。另外,在各种实施例中,还可以在接收的POI搜索请求上使用语言分析作为响应于POI搜索请求的个别POI的识别的一部分。
[0058]当来自用户的POI搜索请求经模块130处理时,每个POI搜索请求(如POI搜索请求112)用以创建对多个不同数据源的查询。当模块130处理POI搜索请求112时,识别适当数据源155。在某些实施例中,至少一部分数据源可标准化用于所有POI搜索请求,而在其它实施例中,整个组的数据源可基于个别POI搜索请求的分析定制并且确定。作为这个的一部分,数据源155可为可用于POI搜索计算机120的所有数据源的子集,或可包含可用于POI搜索计算机120的所有数据源。
[0059]另外,模块130存储或可存取可用于POI搜索计算机120的数据源中的每一个的数据源优先级。这类数据源优先级可基于许多因子。在一个潜在实施例中,数据源优先级仅基于响应时间的预期或测量历史,以在发出查询中将响应速度优先排序。在其它实施例中,多个因子的加权公式可用以创建每个数据源的数据源优先级值。一组非限制的因子实例可包含历史元数据响应数量、历史元数据响应质量、与元数据相关的成本、用户设定的加权因子或任何其它这类因子。用户设定的加权因子的实例可包含不使用某些数据源或不看见个别POI的任何响应直到某一类型的元数据经识别或识别有个别POI的一定置信度水平的偏好。
[0060]在模块130识别查询和优先级之后,系统可然后将查询和优先级132传送到元数据通信模块140。这一模块140可起在多个查询传递到数据源155时基于相关优先级管理所述多个查询的通信的作用。在某些实施例中,元数据通信模块140可起在使用由数据源优先级识别的顺序时创建多线程查询作用。在替代实施例中,查询的这一通信可以不同方式管理。在一个潜在实施例中,基于查询和优先级132查询可尽可能快的发送到个别数据源。但是,如果发送过多数目的查询和/或同时接收过多数目的响应,那么所述系统可能产生瓶颈问题,并且当发送与单一搜索相关的许多查询时还可能在满配系统中产生问题。在替代实施例中,基于优先级,每个查询可单独发送,模块140在发送额外查询之前等待响应。这类实施例可包含超时以防止特定响应拖延或经数据源155丢弃。在一个类似实施例中,可在接收响应之前发送一定数目的查询,其中只要接收响应就发送新查询。可发送五个查询,例如第六个和随后查询仅在接收响应时发送。在某些实施例中,如果从查询中的任一者接收足够数据(或从先前查询累积元数据),那么可停止进一步查询并且将数据呈现给用户。
[0061]在
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1