在文本输入期间建议相关术语的制作方法

文档序号：6362134阅读：160来源：国知局

专利名称：在文本输入期间建议相关术语的制作方法
技术领域：
本发明涉及在报告的文本输入期间建议自动补全术语。本发明进一步涉及分析多个报告。
背景技术：
临床遭遇，例如患者检查，通常以文本报告的形式记录。这些报告可以由临床医师，例如医师或者护士口述或者键入。这种报告的例子是放射学报告，其典型地包含患者病史的一些要素(用于研究的临床迹象和/或原因)、对所执行成像过程的描述，以及放射学调查的结果(发现和印象)。为了加速文本输入，可使用自动补全来预测下一词语(word)或者各词语。这可借助于字符串模式匹配来实现。当键入词语的开头时，可建议那一词语的补全。为此，自动补全算法可在词典中找出一个或者更多词语，该词语的开头具有与刚刚键入的字符相同的字符。例如，输入“pros”可以匹配例如“prostate”或者“prostaglandin”的字符串。更复杂精密的算法可以匹配短语:例如，“enlarged pros”将匹配“enlarged prostate”而不是“prostaglandin”，因为第一个短语在统计上看起来是远远更常用的。这些匹配通常作为可能性菜单被呈现给用户，从而可以快速地选定正确的可能性。E.HyvOnen和E.MSkalS 的在Proceedings of the first Asia Semantic Web
Conference (ASWC2006), Beijing, Springer-Ver lag, New York, August4_9, 2006 中题名为
“Semantic autocompletion”的论文(在下文中:Hyv0nen等)公开了基于将输入字符串与
词汇表中的可用词语列表匹配的自动补全。该论文进一步公开了不仅将用户书写的文本补全为类似的词语，而且补全为其标引在字面水平上可能不涉及输入的匹配的本体论概念。

发明内容
在报告的文本输入期间改善自动补全术语将是有利的。为了更好地解决这一问题，本发明的第一方面提供了一种系统包括:-文本输入单元，用于使得用户能够将文本输入当前报告中；-节段分析器，用于确定所述当前报告的多个节段；-当前节段检测器，用于检测所述当前报告中所述用户正在操作的节段，从而获得当前节段；-术语提取器，用于提取在所述当前报告中出现的术语，从而获得提取术语，以及识别所述当前报告中出现所述提取术语的节段，从而获得提取术语节段，其中所述提取术语节段和所述当前节段是不同的节段；-同现访问单元，用于访问多个同现统计，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述至少一个第一节段中包括所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率；-术语选择器，用于基于所述提取术语、所述提取术语节段、所述当前节段、以及至少一个所述同现统计来选择至少一个频繁同现术语；以及-指示器，用于给所述用户提供所述至少一个频繁同现术语的指示。被指示给用户的频繁同现术语具有相对高的概率是用户想要输入该报告中的词语，因为术语的选择是基于将其中同现术语经常出现的节段考虑在内的同现统计。该同现统计对于给定的领域背景(例如，放射学、心脏病学、神经学)是特定的。与常规的字符串匹配相比，通过考虑在报告的其他节段中写下的术语而获得了改进，其使得能够建议对于正在被输入的报告而言是更加特定的自动补全术语。这一改进是基于这样的洞察:报告的特定节段可能包括特定类型信息，该信息可能与当前节段中的术语不同地相关联。作为具体例子，在放射学报告的患者病史节段中出现的术语与当在该报告的发现节段中出现同一术语时相比，可能与诊断节段中的术语不同地相关联。在另一方面中，本发明提供一种用于分析多个报告的系统，包括-节段分析器，用于确定将所述报告划分为节段的划分；-通用节段确定器，用于确定在多个所述报告中通用的多个节段；-术语提取器，用于从所述报告的所述通用节段中提取出多个术语，以及将每个术语与其所出现的所述节段和报告相关联；-同现统计生成器，用于生成多个同现统计，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率，其中至少一个第一节段不同于所述第二节段。这一系统生成可由所提出的自动补全系统使用的同现统计。该同现统计使得能够生成更加有用的自动补全建议，因为该同现统计提供了关于在报告的特定的不同节段中同现的同现术语的信息。用于分析多个报告的系统可与用于建议自动补全术语的系统合并；可选地，该系统可在不同的环境中实现。当同现统计指示多个第一术语和多个第一节段时，该多个第一节段的至少一个第一节段不同于第二节段。报告可包括文档，其中节段包括节段标题和节段主体。节段标题允许检测节段的存在，并且这便于所提出的系统提取术语并且将所提取的术语与适当的节段相关联。可选地或者另外地，报告可包括多个文件，其中不同的文件包括报告的不同节段。这使得在自动补全处理中包含来自更早日期或者由一个或多个不同临床医师创建的信息变得更加容易。这样，可给用户提供更加相关的自动补全术语。报告可包括数字化形式，其中域需要由用户填入。用于填入一些域中的信息可来自不同的系统并且可以被存储作为一个或者多个数据库中的记录。术语可包括单个的词语或者由多个词语组成的短语。例如，提取术语和/或第一术语可包括包含多个词语的表达。这允许改进建议，因为针对提取术语和/或第一术语的多个词语的组合可生成更加特定的同现统计。该系统可包括自然语言处理器，用于将提取术语和/或第一术语与本体论中的本体论概念相关联，并且其中该同现统计涉及本体论概念与第二术语同现的概率。这改进了同现统计和/或所建议术语的准确性。术语选择器操作性耦接至文本输入单元并且被布置为接收由用户输入的术语的一部分，并且被布置为基于术语的该接收部分来选择频繁同现的术语。这样，所建议的术语与已经由用户部分输入的词语是相关的。术语选择器可被布置为选择其开头与术语的该接收部分相匹配的频繁同现术语。这提供了自然的自动补全处理，其中用户输入术语的开头并且被提供有与所输入的开头匹配的完整术语。报告可包括患者医学报告，并且节段可包括患者病史节段、临床发现节段，和/或诊断节段。这描述了典型的医学报告方案。在另一方面中，本发明提供一种工作站包括一个或多个所提出系统。在仍另一方面中，本发明提供一种在报告的文本输入期间建议自动补全术语的方法，包括-使得用户能够将文本输入当前报告中；-确定所述当前报告的多个节段；-检测所述当前报告中所述用户正在操作的节段，从而获得当前节段；-提取在所述当前报告中出现的术语，从而获得提取术语，以及识别所述当前报告的其中出现所述提取术语的节段，从而获得提取术语节段，其中所述提取术语节段和所述当前节段是不同的节段；-访问多个同现统计，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述第一节段中包含所述第一术语连同在所述第二节段中包含所述第二术语的频率；-基于所述提取术语、所述提取术语节段、所述当前节段、以及至少一个所述同现统计来选择至少一个频繁同现术语；以及-给所述用户提供所述至少一个频繁同现术语的指示。在另一方面中,本发明提供一种分析多个报告的方法，包括-确定将所述报告划分为节段的划分；-确定在多个所述报告中通用的多个节段；-从所述报告的所述通用节段中提取出多个术语，以及将每个术语与其所出现的所述节段和报告相关联；以及-生成多个同现统计，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述第一节段中包括所述第一术语连同在所述第二节段中包含所述第二术语的频率，其中至少一个第一节段不同于所述第二节段。在另一方面中，本发明提供一种计算机程序产品，其包括用于使得处理器系统执行在本文中阐明的一个或多个方法的指令。本领域技术人员将意识到的是可以以任何被认为是有益的方式来将以上提及的本发明的实施例、实现方式和/或方面中的两个或者更多个相组合。本领域技术人员基于说明书可以实现与所描述的系统的修改和变型相应的图像采集设备、工作站、系统，和/或计算机程序产品的修改和变型。

参照下文描述的实施例，本发明的这些和其他方面将变得显而易见并且得到阐述。在图中，
图1是用于在文本输入期间建议自动补全术语的系统的框图；图2是用于分析报告的系统的框图；图3是分析报告的方法的流程图；以及图4是在文本输入期间建议自动补全术语的方法的流程图。
具体实施例方式在下文中，将借助于例子来描述实施例。例如，考虑如下的正在被键入的临床文档:“32岁男性呈现出左耳耳鸣。MDCT示出影响左耳道的团块(32yo male presenting with tinnitus in left ear.MDCT showsmass impinging on left auditory canal.)，，。在作者已经键入“耳道(auditory canal)，，中的“au”时,字符串匹配自动补全可提供“au”、“审计员(auditor)”、“听力(audition)”、“听觉的(auditory)”、“耳道(auditory canal)”、“常染色体(autosomal)”,等等。使用在本文中描述的技术，“耳道(auditory canal)”将被提升至列表的顶部，因为其具有与“耳鸣(tinnitus)”的相对高的同现频率。作为第二例子，考虑关于多发性硬化症的放射学报告，包含句子:“在白质中未观察至丨J异常亮度(No abnormality intensity observed in the white matter.)，，。当前已知的方法可将“白质(white matter)”中的字母“w”与所有以字母“w”开头的词语相匹配，或者甚至所有的以字母“w”开头的常用放射学术语。然而，考虑到之前的上下文，可以一种使最相关的术语放在顶部的方式来缩小和分类该列表。子系统可被布置为分析先前报告和临床文档，以便“学习”和存储不同术语之间的相关性。另一子系统可被布置为分析当前输入的报告，从而可以基于(a)目前为止输入的报告当前内容，以及(b)先前学习的术语之间的相关性，来建议新的术语。此外，子系统可被布置为向用户显示所建议的术语。图1图示了用于建议自动补全术语的系统。可在报告的文本输入期间建议这些自动补全术语。该系统可至少部分在计算机系统中实现。这种系统可包括工作站。系统的部分可被实现在经由客户端系统访问的服务器系统中，其中该客户端系统可包括工作站。该系统可包括显示器、文本输入设备，例如键盘和/或包括实时声音识别软件的口述输入器、用于控制该系统的鼠标、用于与服务器通信和/或用于取回报告、统计学数据、和/或用于将完成的报告传送给接收器的通信端口。该系统可包括用于存储报告和/或统计学数据和其他数据的存储装置。该系统可包括文本输入单元2，其用于使得用户能够将文本输入当前报告I中。该文本输入单元2可包括例如文本编辑器，或者词语处理器，用于使得用户能够编写文本文档，其可能由用户决定以格式化报告并且根据用户自己的洞察力来给节段提供标题。也可能的是文本输入单元2示出了其中用户可键入适当文本的多个文本输入域，其中该文本输入域可对应于报告的通用节段。当完成报告时，文本输入单元2可将该域融入单个的文档中或者将该域存入数据记录中，例如患者的电子数据记录中。文本输入单元2可被布置为接收声音识别子系统的输出，使得用户能够通过口头地说出文本的词语来输入报告。该系统可包括节段分析器3，其用于确定当前报告的多个节段。该节段分析器3可包括用于确定报告中的节段的文本解析器。节段分析器3可通过检测节段的标题和相应的节段主体来完成这。可选地，节段分析器3可使用自然语言处理通过分析文本的上下文例如临床历史、检查、发现，基于通常在那些节段中出现的主题来识别不同的节段。当文本输入单元2使用针对该节段的独立输入域时，节段分析器3可至少在一定程度上被并入文本输入单元中，因为该节段由输入域确定。该系统可包括当前节段检测器4，其用于检测当前报告中用户正在操作的节段。这一节段在本文中被称为当前节段10。为此，当前节段检测器4操作性地与文本输入单元2和节段分析器3耦接。当前节段检测器4可使用例如光标位置，或者最后一个词语或者字符所加入的位置，作为当前节段10。该系统可包括术语提取器5，其用于提取出在当前报告中出现的术语，从而获得提取术语8。术语提取器5使用所检测的节段来确定所提取术语在当前报告的哪个节段中出现，从而获得提取术语节段9。提取术语8和提取术语节段9可被视为提取对15。术语提取器5可处理当前报告I的所有或者至少部分以提取出在其中出现的词语，并且将那些词语与相应的节段相关联。提取术语中的一个或多个可能出现在与当前节段10不同的提取术语节段9中。该系统可包括同现访问单元6，其用于访问多个同现统计7。为此，同现访问单元6可提供对例如数据库或者存储区域的接口。该同现统计提供关于在特定知识领域的报告中频繁地同现的术语的信息。这样，提取术语8和提取术语节段9可被匹配于具有同现统计的术语和节段，并且那些同现统计可提供关于用户想要输入的可能词语的信息。同现统计可指示第一术语、第一节段、第二术语、第二节段，以及报告在第一节段中包含第一术语连同在第二节段中包含第二术语的频率。对于一些同现统计，第一节段可不同于第二节段，然而对于一些其他同现统计，第一节段可与第二节段相同。同现统计也可涉及在一个、二个、或者更多个节段上分布的多于两个的词语。例如，同现统计可指示多个对，每个对包括术语和其中出现该术语的相应节段，以及术语和节段的同现频率，其指示报告在节段中包含所有的术语频繁程序，由多个对指示。该系统可包括术语选择器11，其用于选择至少一个频繁同现术语12。为此，术语选择器11可接收关于提取术语8、提取术语节段9、当前节段10，以及至少一个同现统计7的信息。术语选择器11可被布置为特定地考虑从报告中的与当前节段10不同的提取术语节段9中提取出的一个或多个提取术语8。例如，术语选择器11可被布置为从同现访问单元6中接收针对由术语提取器5提取出的提取术语8的所有同现统计。同样，术语选择器11可被布置为从同现访问单元6中接收指示多个第一术语和第一术语节段的所有同现统计，其中那些所接收的同现统计的第一术语和第一术语节段各自匹配于提取术语8和提取术语节段9的提取对15。之后，术语选择器11可通过同现频率而分类所接收的同现统计，从而最频繁出现的同现术语处于列表的顶部。该列表可局限于仅包含最频繁同现的术语。也可通过第一术语的数量来分类所接收的同现统计，以让更加特定的建议术语优先，该更加特定的建议术语与相对大量地出现在当前报告中的提取术语频繁地同现。该列表可向用户示出。为此，系统可包括指示器13以给用户提供至少一个频繁同现术语12的指示。用户可使用用户接口元件从列表中选择术语，并且文本输入单元2可被布置为将选定的术语插入当前节段中。当完成报告时，该系统可被配置为或者可使得用户能够按要求存储或者传送该报告。
图2示出了用于分析报告的系统的框图。该系统可被实现在与用于建议自动补全术语的系统类似类型的硬件上。用与图1中相同的附图标记来指示多个同现统计7，因为其涉及相同或者类似的数据结构。用于分析报告的系统具有对多个报告或者报告集合21的访问。这一报告集合21可被并入数据库中或者作为简单文档集合存储在文件结构中。用于分析报告的系统可包括节段分析器22，其用于确定将多个报告21划分为节段的划分。为此，节段分析器22可被布置为一个接一个地，或者并行地，处理报告，并且检测每个经处理报告的节段标题和节段主体。检测节段的其他方式在以上涉及用于建议自动补全术语的系统的节段分析器3中描述。用于分析报告的系统可包括通用节段确定器23，其用于确定多个报告21通用的多个节段。这样，获得多个通用节段。通用节段确定器23可被布置为将不同报告的节段的节段标题相比较，并且当足够大量的报告具有相同的节段标题或者类似的节段标题时，该节段可由节段标识符标注并且被标记为通用节段。用于分析报告的系统可包括术语提取器24，其用于从报告的通用节段中提取出多个术语25，并且将每个术语与其所出现的节段和报告相关联。术语提取器24可类似于用于建议自动补全术语的系统的术语提取器5，然而，术语提取器24被布置为处理多个完成的报告而不是在开始创建过程中的报告。用于分析报告的系统可包括同现统计生成器26，其用于生成多个同现统计7。这种同现统计可指示第一术语、第一节段、第二术语、第二节段，以及报告在第一节段中包含第一术语连同在第二节段中包含第二术语的频率。同现统计生成器26可将从不同节段中提取出的术语相组合以获得涉及在不同节段中的术语的同现的同现统计，并且因而同现统计的第一节段可不同于第二节段。多个同现统计可进一步包括涉及在同一节段之内的术语的同现的同现统计，在这种情况下第一节段和第二节段是相同的。所生成的多个同现统计可由参照图1所描述的用于自动补全术语的系统来使用。用于分析报告的系统和用于建议自动补全术语的系统可被合并为单个系统，其能够基于多个报告来生成同现统计并且在新报告的创建期间建议自动补全术语。然而，也可能的是该两个系统被实现为分离的实体，从而产品开发者或者技术人员可使用用于分析报告的系统来准备同现统计7的组，其可由大量的用户使用作为用于建议自动补全术语的系统的输入。以下特征可应用于自动补全系统和报告分析系统两者。可以以很多不同的格式来提供报告，而基本上不影响系统的工作。例如，报告可具有文档的格式，例如无格式文本文档或者格式化文本文档。该报告也可具有XML文档的格式。这种XML文档的XML代码可用于编码多种事物；例如，XML代码可用于指示节段。文档的节段可由节段标题和节段主体构成。例如，接着空白行的是节段标题行，并且接着节段标题的是空白行和节段主体。在格式化文本文档或者XML文档中，可借助于元数据来指示标题和/或节段的位置。节段分析器3、22可包含用于取回关于节段的任何这种信息的解析器。报告1、21可包括多个文件。例如，不同的文件包括报告的不同的节段。这使得识别不同的节段变得容易。由术语提取器5提取出的提取术语8，和/或由同现生成器26使用或者在同现统计中的第一术语可包括多个词语，例如包括一系列词语的表达或者短语。这一表达可例如包括后面跟着名称的形容词。也可能的是多个词语不是固定顺序的表达，而是多个词语可出现在特定节段中的任何位置。当这一多个词语中的每一个在那一节段中出现时，同现统计指示与第二术语的同现频率。然而，也可能的是将系统配置为使得每个同现统计仅涉及一个第一术语(其可是一系列词语的表达)，并且针对出现在节段中的不同词语，生成独立的同现统计。术语选择器可将来自相关同现统计的多个信息相组合以改善对频繁同现术语12的选择。该系统可包括自然语言处理器14、27。该自然语言处理器14、27可被布置为将提取术语8和/或第一术语与本体论中的本体论概念相关联。这可以使用在自然语言处理领域本身中已知的技术来完成。可以使用与多个报告21的知识领域相关的本体论。因此，同现统计可涉及本体论概念与第二术语同现的概率。第二术语也可对应于本体论概念。术语选择器11操作性地耦接至文本输入单元2并且被布置为接收由用户输入的术语的一部分，并且被布置为基于术语的该接收部分来选择频繁同现术语12。这样，所建议的术语可以是更加相关的，因为它们与用户已经输入的术语的该部分对应。例如，术语选择器11被布置为选择其开头与术语的所接收部分匹配的至少一个频繁同现术语12。然而，这并不是限制性的。术语选择器11可以选择任何术语，该术语具有作为术语的子字符串的键入部分。报告1、21可包括患者医学报告，并且节段包括患者病史节段、临床发现节段，和/或诊断节段。然而，该系统也可用于其他知识领域。图3示出了分析多个报告的方法的流程图。该方法可包括步骤31:确定将报告划分为节段的划分。该方法可包括步骤32:确定多个报告通用的多个节段。该方法可包括步骤33:从报告的通用节段中提取出多个术语，以及将每个术语与其所出现的节段和报告相关联。该方法可包括步骤34:生成多个同现统计，同现统计指示第一术语、第一节段、第二术语、第二节段，以及报告在第一节段中包含第一术语连同在第二节段中包含第二术语的频率。如本领域技术人员鉴于本描述包括对系统的描述所显而易见的，该方法可包括另外的步骤或者受到修改。图4示出了在报告的文本输入期间建议自动补全术语的方法的流程图。该方法可包括步骤41:使得用户能够将文本输入当前报告。该方法可包括步骤42:确定当前报告的多个节段。该方法可包括步骤43:检测当前报告中用户正在操作的节段，从而获得当前节段。该方法可包括步骤44:提取在当前报告中出现的术语，从而获得提取术语，并且识别当前报告中该提取术语所出现的节段，从而获得提取术语节段，其中该提取术语节段和当前节段是不同的节段。该方法可包括步骤45:访问多个同现统计，同现统计指示第一术语、第一节段、第二术语、第二节段，以及报告在第一节段中包括第一术语结合在第二节段中包含第二术语的频率。该方法可包括步骤46:基于提取术语、提取术语节段、当前节段，以及至少一个同现统计来选择至少一个频繁同现术语。该方法可包括步骤47:向用户提供至少一个频繁同现术语的指示。如本领域技术人员鉴于本描述包括对系统的描述所显而易见的，该方法可包括另外的步骤或者受到修改。在本文中描述的方法和系统也可在软件中实现作为计算机程序产品。实际上，可使用一个或多个计算机系统来实现该方法和系统。一个系统可分析存储在例如医院放射学信息系统(RIS)中的报告。存储术语之间的提取的相关性以供今后使用。随着键入或者口述新的报告，通过计算机系统，联合所提取的相关性来连续地分析该报告。在线分析用于基于对先前报告和当前报告的组合分析来建议潜在的合适术语，然后将该术语显示在计算机屏幕上。现有技术本身中已知的自然语言处理(NLP)可以用于从自由文本临床文档中提取出相关的术语或者概念，并且在该文档之内识别出它们的上下文。这些可以存储在数据库或者其他结构化格式(例如，XML)中。作为例子，考虑报告节段:“病史:45岁女性表现出左耳耳鸣和手部麻刺。”NLP方法可用于将这转换成一格式，描述内容(例如人口统计学、发现、问题)、详细信息(例如身体部位、性别、年龄)、唯一识别出概念的字母数字代码(例如UMLS代码)，以及报告的节段(例如“过去病史”)。例如，以上叙述的报告节段可被转换为以下:发现:人口统计学年龄>>[45，[idref, 4],年，[idref, 6]]节段名称 >> 报告过去病史项性别女性问题:耳鸣身体部位耳朵区域 >> 左边代码>>UMLS:C0521421_ 整个耳朵
`
节段名称 >> 报告过去病史项代码>>UMLS: C0040264_ 耳鸣问题:麻刺身体部位》手部代码》UMLS:C0018563_手部确定性》高度确定节段名称 >> 报告过去病史项代码>>UMLS: C0423572_ 发麻这一处理可对大型报告组执行。这一步骤可对在放射学信息系统(RIS)、实验信息系统(LIS)、或者医院信息系统(HIS)中包含的所有文本数据执行。可能的是将被分析的报告组限制于那些由特殊的作者组例如医疗专家编写的报告。这一作者组可是单独的个体，因而个人化建议系统。该作者组也可被选定以便获得针对相关知识领域有效的建议。为此，该作者组可包括高级医师组、医院内部的部门组、部门内部的科室组、或者横跨多个医院的组。从每个报告中提取出的结构化数据要素可以存储在数据库中。在简单的实施例中，该数据库包括报告标识符和术语列表。此外，其中发现术语的节段可存储在数据库中。在一例子中，我们可具有以下的简化数据库:
权利要求
1.一种用于在报告的文本输入期间建议自动补全术语的系统，包括: -文本输入单元(2)，用于使得用户能够将文本输入到当前报告(I)中； -节段分析器(3)，用于确定所述当前报告的多个节段； -当前节段检测器(4)，用于检测所述当前报告中所述用户正在操作的节段，从而获得当前节段(10)； -术语提取器(5)，用于提取在所述当前报告中出现的术语，从而获得提取术语(8)，以及识别所述当前报告的其中出现所述提取术语的节段，从而获得提取术语节段(9)，其中，所述提取术语节段(9)和所述当前节段(10)是不同的节段； -同现访问单元(6)，用于访问多个同现统计(7)，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率； -术语选择器(11)，用于基于所述提取术语(8 )、所述提取术语节段(9 )、所述当前节段(10)、以及至少一个所述同现统计(7)来选择至少一个频繁同现术语(12)； -指示器(13)，用于给所述用户提供所述至少一个频繁同现术语(12)的指示。
2.一种用于分析报告的系统，包括 -节段分析器(22)，用于确定将多个报告(21)划分为节段的划分； -通用节段确定器(23)，用于确定在多个所述报告(21)中通用的多个节段； -术语提取器(24)，用于从所述报告的所述通用节段中提取出多个术语(25)，并且将每个术语与其所出现的所述节段和报告相关联； -同现统计生成器(26)，用于生成多个同现统计(7)，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率，其中，至少一个第一节段不同于所述第二节段。
3.如权利要求1或2所述的系统，其中，报告包括文档，并且其中，节段包括节段标题和节段主体。
4.如权利要求1或2所述的系统，其中，所述报告(I，21)包括多个文件，并且其中，不同的文件包括所述报告的不同节段。
5.如权利要求1或2所述的系统，其中，所述提取术语(8)和/或所述第一术语包括包含多个词语的表达。
6.如权利要求1或2所述的系统，包括自然语言处理器(14)，用于将所述提取术语(8)和/或所述至少一个第一术语与本体论中的至少一个相应的本体论概念相关联，并且其中，所述同现统计涉及所述至少一个本体论概念与所述第二术语同现的概率。
7.如权利要求1所述的系统，其中，所述术语选择器(11)操作性耦接至所述文本输入单元(2)并且被布置为接收由所述用户输入的术语的一部分，并且被布置为基于所述术语的所接收的部分来选择所述频繁同现术语(12)。
8.如权利要求7所述的系统，其中，所述术语选择器(11)被布置为选择其开头与所述术语的所接收的部分相匹配的至少一个频繁同现术语(12)。
9.如权利要求1或2所述的系统，其中，所述报告(I，21)包括患者医学报告，并且所述节段包括患者病史节段、临床发现节段，和/或诊断节段。
10.一种工作站，包括如权利要求1和2中任一项或者两者所述的系统。
11.一种在报告的文本输入期间建议自动补全术语的方法，包括: -使得(41)用户能够将文本输入到当前报告中； -确定(42)所述当前报告的多个节段； -检测(43)所述当前报告中所述用户正在操作的节段，从而获得当前节段； -提取(44)在所述当前报告中出现的术语，从而获得提取术语，以及识别所述当前报告的其中出现所述提取术语的节段，从而获得提取术语节段，其中，所述提取术语节段和所述当前节段是不同的节段； -访问(45)多个同现统计，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率； -基于所述提取术语、所述提取术语节段、所述当前节段、以及至少一个所述同现统计来选择(46)至少一个频繁同现术语；以及 -给所述用户提供(47)所述至少一个频繁同现术语的指示。
12.—种分析多个报告的方法,包括: -确定(31)将所述报告划分为节段的划分； -确定(32)在多个所述报告中通用的多个节段； -从所述报告的所述通用节段中提取出(33)多个术语，并且将每个术语与其所出现的所述节段和报告相关联；以及 -生成(34)多个同现统计，同现统计指示至少一个第一术语、至少一个第一节段、第二术语、第二节段，以及报告在所述至少一个第一节段中包含所述至少一个第一术语连同在所述第二节段中包含所述第二术语的频率，其中，至少一个第一节段不同于所述第二节段。
13.一种计算机程序产品，包括用于使得处理器系统执行如权利要求11或12所述的方法的指令。
全文摘要
一种用于在报告的文本输入期间建议自动补全术语的系统。文本输入单元(2)用于使得用户能够将文本输入到当前报告(1)中。术语选择器(11)用于基于提取术语(8)、提取术语节段(9)、当前节段(10)、以及同现统计(7)来选择至少一个频繁同现术语(12)。指示器(13)给所述用户提供所述至少一个频繁同现术语(12)的指示。一种用于分析报告的系统包括同现统计生成器(26)，用于生成多个同现统计，同现统计指示第一术语、第一节段、第二术语、第二节段，以及报告在所述第一节段中包含所述第一术语连同在所述第二节段中包含所述第二术语的频率。
文档编号G06F17/27GK103189858SQ201180052198
公开日2013年7月3日申请日期2011年10月31日优先权日2010年11月1日
发明者M·C-C·李, E·科昂-索拉尔, 钱悦晨申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M·C-C·李;E·科昂-索拉尔;钱悦晨
技术所有人：皇家飞利浦电子股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。