发现路由系统和引擎的制作方法_4

文档序号:9713579阅读:来源:国知局
码、城市或国家)。每个人类专家、人群组和/或机器可提供有助于发现并寻求解决接收自路由引擎135的问题或异常的思路。用于订阅接口模块160和订户之间交互的用户接口被优选地配置通过以下进行访问:移动设备、平板电脑、智能手机、音频设备、文本设备、视频设备、搜索引擎、网络爬虫、浏览器、云、个人计算机或订户可访问的任何终端。
[0066]在一个实施例中,通过将包含在订户标识符中的属性与包括异常的描述符-数值对的品质或特性、描述符本身、已经被验证为显著的异常的任何数目的条件或者表明订户和显著异常之间的有用的兼容性的任何其它信息进行比较,订阅模块155被编程为在数据上进行操作以将异常与订户进行匹配。从另一个角度来看,任何数目的确认的显著异常的描述符-数值对和订户之间的关联性可取决于其相应的包括属性的标识符,该属性例如专长领域、专长水平、可用性以及地理位置等。这种关联性是基于分配至每个订户的标识符。订阅模块155的又一个功能可以生成关联性通知。生成通知的可能延伸是将分配通知传输至接受者,例如:识别的专家订户、知识数据库105、订阅模块155、订阅接口模块160、分析模块145、交叉验证模块175或第三方。关联性通知可被格式化用以传输至:移动设备、平板电脑、平板手机、智能手机、音频设备、文本设备、视频设备、搜索引擎、网络爬虫、浏览器、云、个人计算机或接受者可访问的任何接口。
[0067]在与异常有关的专长相关联的专家识别之后,订阅可被预定(如,其中专家是计算机,通过在雇佣合同中的条款,作为资金收到的条件等)或被初始化/执行。在与难题或异常相关联之后,当新难题或异常产生并且事先从合适专家中寻找订阅的需求不可预知时,提供订阅的机会有利地使得系统适应。在一些实施例中,当期望此后的订阅时,订阅接口模块160具有识别专家的搜索能力。
[0068]除了允许在用于订阅初始化的时间轴中的灵活性之外,每个订阅的术语可变化,例如:在每个雇用的基础上,对于在时间上有限或规定的持续时间(例如,每日、每周、每月、每年两次、每年、两年一次等)、在挑战或竞争基础上(如,订户竞争发现解决方案,并且在第一个可接受解决方案被发现之后术语结束),或至永远。订阅在费用基础、奖励基础上通过合同、或其它雇用形式可被自动维持。通过自我识别、分配、搜索、现存目录的同化(assimilat1n)、学术证书、引用、推荐、推理、或预测来识别专家。订阅可通过组织者或开放平台(例如,wik1-基因组学、arXiv.0rg以及PLoSONE.0rg)、通过自动系统或通过注册服务来控制。在一些示例系统中,具有在相同区域的专长的订户可竞争(如,通过提交申请)或投标访问。
[0069]每个订户的标识符可包括任何数目的包括专业的专长(如,肿瘤专家、心脏病专家、霉菌学家、营养专家、地质学家、物理学家、统计学家等)、描述符、可用性、位置、影响因子、对等体或消费者评级、性能分数等的属性或特性。因此,标识符的格式可大大变化并且可以是编码的标识符(其中一个或更多个特性以数值或其它机器可读格式被编码)、隶属于个人或专业识别的元数据集(例如,名字、题目、从属关系、地址等)或者可被提供为登录凭证。此外,每个问题或异常作为组(由发现路由引擎135或其它系统进行自识别或分配)、相关的专家较大组的部分、或结合机器专家独立地被匹配到不止一个专家。在一些领域(例如,粒子物理学)中,通常研究小组由众多可独立或共同订阅的研究人员组成。在更进一步的实施例中,专家可参与(如,独立地、直接地或间接地)生成在分析引擎中得到分析的数据。例如,专家订户可以是对基因组排序并且分析的设施的研究者或指导者。
[0070]更通常的,订阅模块155与知识数据库105、分析模块145、以及交叉验证模块175中的至少一个信息化地耦合。在图1中描绘的实施例中,订阅模块155经由发现路由管理模块150与知识数据库105、分析模块145以及交叉验证模块175信息化地耦合。在一些实施例中,订阅接口模块160或订阅模块155允许订阅的专家访问异常的描述符-数值对、衍生出描述符-数值对的数据集和/或存储在知识数据库105中的进一步数据集。此外,可以期望的是,订户进一步将数据集与他的标识符相关联以允许与其它数据甚至其他订户的交叉连接。类似的,订阅接口模块160可嵌入订阅模块155中,这两者可被并列配置,和/或可进一步嵌入在知识数据库105中。
[0071]可期望的是,知识数据库105和订阅数据的控制和维护根据数据入口的环境、空间约束、功率限制、规则或其它考虑的情况可被接合或分离。在另一预期的实施例中,订阅模块155耦合至分析模块145。这种耦合是特别的有利的,其中订户期望修改分析协议(或者甚至是数据集的范围),以在计算机上模拟(in silico)实验或设定用于分析的替代的限制。由订户进行的这种修改可以自动方式、或经由操作员输入(在这种情况下,订阅模块155和/或订阅接口模块160可被配置为图形用户界面)而被执行。
[0072]在图1中,所示的订阅模块155耦合至发现路由管理模块150,该发现路由管理模块150将数据流提供至分析模块145和交叉验证模块175。这种耦合布置允许订阅模块155访问所确认的显著异常的描述符-数值对以及执行专家订户与验证的异常的关联所需要的牵连条件。此外,专家也能够修改交叉验证协议以进一步改进分析和/或交叉验证。因此,订阅模块155和与发现路由管理模块150耦合的模块之间的数据传送可采取永久信息交换(包括学习)、短暂信息交换、信息传送、成批协议等的形式。
[0073]专家订户是基于机器的示例性情况包括对计算机进行编程以执行具体的分析步骤例如多变量分析。也可实施算法以供应专家数据分析、解释、图形/曲线图、图表、表格、或类似功能。算法可以并行运行以提高数据分析的速率,或者至少部分地同时调查可替换的假设或解决方案。基于机器的专家的能力可通过采用机器学习技术来被改进。由专家订户提供的洞察力也可整体地进行关于未来结果的预测和开发用于达到所期望的结果的策略。
[0074]在图1中描绘的发现路由系统100的优选实施例中,知识数据库105包含包括110、120以及130的一系列数据集。数据集120由包括描述符121和数值122、描述符123和数值124、描述符125和数值126以及描述符127和数值128的描述符-数值对组成。数据集120从知识数据库105传输至数据库接口模块140,并随后传输至发现路由管理模块150。发现路由管理模块150将数据集120路由至分析模块145以识别任何数目的异常的描述符-数值对。分析模块145然后将识别为异常的任何描述符-数值对(例如(i)描述符121和数值122,及(i i)描述符125和数值126)传输至发现路由管理模块150。
[0075]进一步,在接收到异常的描述符-数值对后,发现路由管理模块150将异常对传输至交叉验证模块175以验证异常的描述符-数值对的显著性。如上所述,交叉验证码模块175经由网络接口 170信息来检索先验知识165,所述网络接口信息提供异常的描述符-数值对(异常)与可能的条件相关联的线索或建议。交叉验证模块175遍历交叉验证数据以首先确定异常的描述符-数值对是否与任何感兴趣的条件或特征具有建议的关联性。如果关联性存在于异常的描述符-数值对和任何数目的感兴趣的条件或特征(如,疾病)之间,那么交叉验证模块175遍历数据集120,以确定在数据集120中的其它描述符-数值对是否验证/确认异常的描述符-数值对和所关联的条件或特征之间的关联性/关系。如果交叉验证模块175发现异常的描述符-数值对和任何数目的识别的条件或特征之间的关系的二次确认,例如描述符121和数值122,那么交叉验证模块175指定异常的描述符-数值对是显著的并经由发现路由管理模块150将确认的显著异常的描述符-数值对传输至订阅模块155。如果未识别二次确认,那么异常描述符值对(例如描述符125和数值126)是不被确认的,并且其不被传输至订阅模块155。
[0076]在一些实施例中,交叉验证模块175不指定具有确认/验证的二次数据的所有异常的描述符-数值对。例如,当存在显示与异常的描述符-数值对相关联的异常和关联的条件之间的密切关系(例如,因果关系、关联性等)的先验知识时,一些实施例的交叉验证模块175不指定异常的描述符-数值对。这种例外的原因是,由于存在与描述符-数值对和关联的条件之间的关联性有关的充分信息,异常的描述符-数值对不再导致发现新信息。
[0077]另外,在这套实施例中,订阅模块155经由订阅接口模块160收集来自订户的信息,例如订户集体180、机构订户185和个体订户190。订阅模块155可导入用户数据以填充包括每个订户标识符的属性。可替换地或组合地,订阅模块155可使用用户数据来生成包括每个订户的标识符的所有属性或附加属性。在接收到确认的显著异常的描述符-数值对后,订阅模块155将描述符-数值对、条件和/或感兴趣的特性与每个订户的标识符进行比较以发现匹配。当发现匹配时,订阅模块155经由订阅接口 160可生成并发送通知到至少一些匹配的订户,在发现感兴趣的关于关联的条件或特征时,通知他们确认的显著异常的描述符-数值对。
[0078]图2示出了用于路由发现的过程200。过程200通过遍历(在步骤205)来自知识数据库的数据集并评估数据以识别异常而开始。数据集可以类似于在图1中的数据集110、120以及130。知识数据库可以类似于图1中的知识数据库105。异常的识别可以类似于在图1中的分析模块145的功能的方式发生,包括来自在数据集中每个描述符-数值对的数值与限定符的比较,该限定符可包括用于相关的描述符的正常值和用于正常值的阈值区间。如果在步骤210中确定在描述符-数值对中存在异常(S卩,在描述符-数值对中的数值不同于超出阈值规范),然后过程200进行到步骤215以确定是否存在异常和条件之间的关联性。在另一方面,如果在描述符-数值对中发现没有异常,则过程200返回步骤205继续遍历数据集以发现下一个描述符-数值对。因此,进而评估每个描述符-数值对:如果没有检测异常,那么评估下一个描述符-数值对。
[0079]当检测到异常的描述符-数值对时,在过程200中的下一个步骤是确定(在步骤215)是否存在条件和异常之间的关联性。这种确定可以类似于在图1中的交叉验证模块175的功能的方式来执行。这个步骤可包括遍历先验知识,例如,用于异常的描述符-数值对和感兴趣的任何条件或特征之间的关联性的建议的论文、网站、参考文本或在图1中的先验知识165。如果在步骤220中没有发现感兴趣的条件或特征和异常的描述符-数值对之间的关联性,那么过程200返回步骤205以遍历来自知识数据库的数据集从而识别来自另一个描述符-数值对的异常。如果在步骤220中检测到异常的描述符-数值对和感兴趣的条件或特征之间的关联性,那么过程200进行到步骤225以遍历用于二次证明的数据集。
[0080]在识别异常的描述符-数值对和感兴趣的条件或特征之间的关联性之后,下一个步骤225是遍历衍生出异常的描述符-数值对的数据集并搜索感兴趣的条件或特征的二次证明。这个步骤225可以类似于在图1中的交叉验证模
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1