用于准备用于搜索数据库的系统的方法以及用于执行向所连接的数据源的查询的系统和方法_2

文档序号:9932656阅读:来源:国知局
查询服务的高级架构;W及 图6示出用于存储注释数据的图示。
[0027] 图1示出根据本发明的用于捜索数据库的系统的示例。
[0028] 用于捜索数据库的系统包括用户终端100,其包括诸如计算机之类的处理构件 110、诸如键盘之类的输入构件140、W及诸如监视器和/或打印机之类的输出构件140。处理 构件110连接到数据源120,例如SPAR化端点,其WRDF兼容格式存储信息并且基于数据库 (例如泣巧類辨)而创建。
[0029] 用户可W在输入构件130处输入语义查询300。语义查询300被转发给处理构件110 的通信模块116。由处理构件100生成的捜索结果380从通信模块116转发给输出构件140。
[0030] 另外,处理构件110包括与数据源120通信的捜索模块112、适于将所接收的语义查 询300转换成数据库查询的转换器模块114、W及用于存储要由转换器模块114使用的注释 数据和注释规则的存储器118。
[0031] 参照图2,更详细地解释运样的系统的准备。首先,分析要捜索的包含信息的数据 库125的数据结构200。然后,通过WRDF兼容格式(其可W通过SPAR化或SPAR化兼容语言来 捜索)并且使用第一概念210存储数据库125中所包含的信息来创建数据源120。为了创建数 据源120,执行注释过程220,其使数据库125的数据结构200与数据源120的第一概念210和 RDF格式相关。
[0032] 由于SPAR化的固有结构,在类和性质方面描述数据。用于实现数据源120的注释过 程220必须提供从数据库125的数据结构200的元素向数据源120的数据结构中的类和性质 的映射。运可W是1:1映射或者更复杂的映射。
[0033] 而且,可W分析两个或更多数据库125。在该情况下,注释过程220提供所有数据库 125的数据结构200向数据源120的数据结构中的类和性质的映射。
[0034] 另一方面,利用注释过程,分析和/或考虑包括第二概念235的特定用户术语230。 针对用户术语230的每一个第二概念235与数据源120的至少一个第一概念210而创建对应 相关性,并且将其存储在存储器118中(注释过程240)。在更复杂的系统中,针对用户术语 230的每一个第二概念235与包括数据源120的至少一个第一概念210的至少一个查询模板 而创建相关性,并且将其作为注释规则存储在存储器118中。
[0035] 注释过程220、240可W手动地执行,或者自动地执行一一如果数据库125的数据结 构200具有某一或已知结构的话。在这R翻辨数据库125的情况下,自动注释过程220、240是 可能的,因为医学数据主要存储在分级结构中。
[0036] 如图4中所图示的,在分级的顶部处,存在例如患者类。此处使用的数据源120的第 一概念210是"患者"。数据库125的数据结构200例如包括数据元素202"姓"和"名",每一个 包括对应参数值204。每一个患者可W具有任意数目的医学类。医学类可W包含针对临床决 策支持相关的数据,诸如诊断、手续(procedure)、手术信息、实验室数据W及任何更多的数 据。
[0037] 通过从根部向要注释的性质导航该分级,可W W简单的方式生成SPAR化查询。在 查询不应当返回在数据源中所找到的所有值的数据而是应当返回例如仅属于特定患者或 医学案例的值的数据的情况下,生成对应过滤器。此处再次,技巧拽S@的分级结构使得有可 能自动地生成运些过滤器。
[0038] 参照图1和3,现在更详细地解释执行查询。
[0039] 首先,用户在输入构件130处输入语义查询300,其包括特定用户术语230的预限定 第二概念230。该语义查询300经由通信模块116而转发给处理构件110的转换器模块114。转 换器模块114自动地将所接收的语义查询300转换成使用SPAR化并且包括数据源120的第一 概念210的数据库查询340。当运样做时,转换器模块114针对存储在存储器118中的注释数 据和注释规则320进行恢复(revert)。
[0040] 特别地,用户可W在语义查询300中输入期望的患者和/或医学案例作为参数。转 换器模块114将运些参数值输入到从存储器118所获取的对应SPAR化查询模板中。
[0041] 数据库查询340然后被转发给处理构件110的捜索模块112,其然后基于经转换的 数据库查询340而捜索所连接的数据源120。捜索模块112从所连接的数据源120检索对应的 捜索结果。
[0042] 该捜索结果被转发回到处理构件110的转换器模块114。转换器模块114自动地将 捜索结果转换成使用包括第二概念235的特定用户术语230的捜索结果380。当运样做时,转 换器模块114再次针对存储在存储器118中的注释数据和注释规则320进行恢复。经转换的 捜索结果380然后经由通信模块116转发给输出构件140。
[0043] 尽管数据库125可W具有复杂的数据结构200和/或数据模型,但是系统使得用户 能够使用特定用户术语230输入语义查询300并且虑及使用特定用户术语230向用户输出捜 索结果380。特别地,用户不需要知晓要捜索的包含信息的数据库125的复杂数据结构200。 用户甚至不需要具有关于在数据源120中所使用的第一概念210和SPAR化的知识。作为结 果,基于预先执行的两个步骤注释过程,信息系统可W W非常快速且高效的方式执行用户 的语义查询,使得可W减少所要求的处理能力和时间,从而节省能量和时间。
[0044] 在下文阐明本发明的附加或可替换的方面和优点。
[0045] 本发明优选地设及从复杂临床信息系统查询医学数据。然而,其也适用于其它领 域。
[0046] 在过去,在医院中使用的信息系统习惯于主要是开账单驱动的。不过,在患者治疗 期间,在运些系统中收集并且存储大量医学数据。最近,存在使该数据可用于临床评估并且 在医学工作人员的日常工作处支持医学工作人员的趋势。现代临床信息系统争取为其用户 提供临床决策支持,例如它们可W -提供针对适当治疗的建议, -基于规则在后台中分析变得可用于患者的新数据(例如实验室值)并且报告异常, -针对似真性检查用户输入,和/或 -支持用户输入具有合理默认值的新数据或系统已经知晓的数据。
[0047] 对于所有运些高级应用而言,对患者的临床数据的可靠访问是关键的。因此,实现 的复杂性与可W从由临床信息系统所使用的数据结构访问数据的方式相关。然而,出于各 种理由,临床信息系统趋向于具有非常复杂的数据模型。例如,系统已经在较长的时间段之 上开发,因而其数据模型已经有机地增长。另外,已经由不同开发团队使用其自身的特定惯 例开发了不同模块。而且,多个技术在使用中。此外,为了在高程度上支持其顾客的过程,系 统必须是可定制的。运可能引起甚至允许用户限定其自身的数据结构那么远。因为运样的 结构不处于系统的控制之下,所W其具体语义含义本身未知。
[0048] 为了允许基于其语义含义处理复杂数据,本发明优选地使用被称为语义web的技 术方案。该技术的部分是SPARQL,用于语义数据的标准化查询语言。通过SPAR化端点暴露其 数据的系统可W W通用方式被查询。然而,运仅是解决方案的部分,因为查询必须根据由系 统所使用的数据模型来确定;因此为了查询数据,仍旧必须知晓讨论中的系统的(复杂)底 层数据模型。
[0049] 为了解决该特定问题,本发明提出一种与其具体存储结构独立地但是基于其语义 含义查询数据的方式。为此目的,使用语义web技术集的另一部分:术语。术语列出在特定领 域内使用的专口名词(还命名为"概念")并且向它们分配含义。通过使临床信息系统的数据 模型的元素与来自术语的专口名词相关联一一被称为注释的过程一一,其可W被分配含 义。对于医学领域,已经存在可W被用于该目的多个术语,比如SNOMED CT、LOINC或ICD。
[0050] 作为结果,经注释的数据可W容易地由应用访问,从而提供临床决策支持。假设查 询服务就位,则那些应用不必知晓它们要求的数据存储在哪里W及如何存储,但是可W仅 针对特定术语概念进行查询。运有效地"隐藏"底层数据模型的复杂性。
[0051] 为了使得能够实现该方案,提出一种维持用于信息系统的数据结构的注释数据的 机制。优选地,所谓的知识工程师限定系统的数据模型元素的含义并且创建注释数据。查询 服务访问W该方式创建的注释数据并且将其翻译成实际物理数据结构上的查询。
[0052] 作为总结,本发明优选地设及一种用于向复杂数据模型的元素分配语义含义的方 案。分配方法针对语义查询的执行而优化。在相符的方法或系统中: -语义概念与数据模型的特定实体相关联, -针对语义概念的查询直接被翻译成SPAR化查询,并且 -SPAR化查询然后在要查询的信息系统所提供的SPAR化端点上执
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1