从电子文献集合传送查询结果的方法、系统及设备的制作方法

文档序号:6596593阅读:127来源:国知局
专利名称:从电子文献集合传送查询结果的方法、系统及设备的制作方法
技术领域
本发明涉及电子文献集合、向该电子文献集合提交查询,以及显示查询结果。更具体地,本发明涉及通过向待检索的知识产权文献的各个章节指定权重来生成检索简要,并基于对至少一个检索简要所返回的查询结果的关联性显示该查询结果。
背景技术
向世界范围的任何专利局提交的用于审查的所有知识产权文献都必须满足一定的条件,这些条件包括各个知识产权文献必须是新颖的、实用的和非显而易见的。为了恰当地准备用于审查的知识产权文献,了解相关技术领域中的先前知识产权文献(即,现有技术)是有帮助的,这是因为每项发明只能授予一项专利权。确定现有技术的过程即为检索。 通常,检索结果有助于随后知识产权申请的撰写人将精力集中到可授权主题或可保护主题上,并帮助制定一套合理的策略,以实现发明人或知识产权所有人的目标。已知,在技术革命进入到当今的电子信息时代之前,知识产权检索是通过手工进行的。检索者浏览公开内容,并基于分类系统确定该公开内容的分类,随后在该分类内进行文献及记录的检索。已认识到,检索者基于所进行的检索的限定范围直观地浏览知识产权文献的适当章节。随着信息技术的出现,由于大多数授权知识产权和公开的申请仅以电子形式存在,所以手工检索已不适用于大多数的审查。随着电子格式的知识产权文献的出现, 手工检索所采用的相似策略也可用于检索电子知识产权数据库。可采用不同类别的检索,以获得不同的结果。例如,可采用新颖性检索,以确定是否提交知识产权的申请。可采用产品规避侵权检索,以确定产品是否落在现有知识产权的权利要求的保护范围内。可采用无效检索,以确定已授权的知识产权的权利要求是否有效等。现有的电子知识产权文献检索工具不支持不同类别的检索。因而,检索人(也称为检索者)需要承担如下工作量根据检索的范围,在检索时限定知识产权文献中需要浏览的章节。由于数据库中的授权知识产权和公开的未决的知识产权申请的数量不断增加,所以每次检索需要浏览更多的相关文献,从而增加了检索者的负担。因此,检索者需要使用一种工具用于识别查询提交结果来减轻与评估该查询结果相关的工作量,并且该工具利用知识产权文献的电子格式的优势。该工具应当使检索者能够在检索过程中利用知识产权文献的不同章节,从而更高效率且更有成效地确定准确、关联和期望的检索结果。

发明内容
本发明包括用于高效及有效地检索专利文献集合的方法、系统和产品。在本发明的一个方面中,提供了一种用于向电子文献集合的检索结果指定关联性的计算机执行方法。对专利文献的集合进行汇编并编索引,所述集合中的各个所述文献具有多个章节。识别所述集合中的各个所述文献的各个所述章节。为所述文献集合组建检索简要。所述检索简要包括从所述集合中的各个文献选择的至少一个经识别章节。对于各个简要,向各个所选择章节指定权重。在向所述集合提交查询时,选择检索简要,并将查询数据与所述文献集合的经识别的并指定有权重的章节中的数据进行比较。对返回于文献汇编的各个文献计算关联性评分,所述文献汇编生成于所述提交查询。基于所述经计算的关联性评分,对所述文献汇编评定等级。然后,基于所述等级对所述汇编的结果进行动态限定。 基于所应用的所述动态限定,生成所述经分类的相关文献的第一汇编。在本发明的另一方面中,提供了一种计算机系统,所述计算机系统包括与存储介质通信的处理器,电子文献集合存储在所述存储介质上。所述电子文献集合是知识产权文献的汇编。基于知识产权文献的特性,所述集合中的各个所述文献具有多个章节。使用控制器对所述文献集合进行汇编和编索引。所述控制器与文献管理器通信,所述文献管理器识别所述集合中各个文献的各个章节。另外,简要管理器用于为所述文献集合组建检索简要。所述简要管理器与所述文献管理器通信,并将经汇编集合中的各个文献的经识别章节选入所述检索简要中。除了将具体章节选入所述简要中之外,所述简要管理器还向各个简要中的各个所选择章节指定权重。所述权重是相关章节的重要性的反映。在查询时,查询管理器向所述文献集合提交查询。所述查询包括选择至少一个检索简要以及将查询数据与所述文献的在所述简要中反映出的各个所述章节中的数据进行比较。在所述检索管理器的所述提交之后,生成相关专利文献的汇编并将其返回。所述返回于汇编的各个文献包括与具有指定权重和关联性评分的至少一个经识别简要章节中的数据的查询匹配。还设置关联性导航器与所述查询管理器进行通信,从而对所述汇编中的文献评定等级并基于所述等级动态地限定所述汇编的结果。基于所应用的所述动态限定,生成经分类的相关文献的第一汇编。在本发明的又一方面中,提供了一种设有计算机可读载体的产品,所述计算机可读载体包括计算机程序指令,其用于向计算机存储器上的电子文献集合的检索结果指定关联性。所述计算机可读载体包括对所述文献集合指定关联性的计算机程序指令。提供用于对知识产权文献的集合进行汇编和编索引的指令。将所述集合中的各个所述专利文献划分成多个章节。在对所述集合编索引之后,提供用于识别所述集合中各个文献的各个所述章节的指令。一旦识别了所述文献的所述章节,提供用于为所述文献集合组建检索简要的指令。所述检索简要选自所述集合中各个文献的各个经识别章节。此外,提供用于对所述检索简要中经识别的各个所述章节指定权重的指令。当向所述文献集合提交查询时,提供指令用于选择至少一个检索简要并将查询数据与所述集合中的所述文献的在所述简要中经识别的所述章节中的数据进行比较。然后,提供指令为返回于文献汇编的各个文献计算关联性评分并基于所述评分对所述集合中的文献评定等级。一旦完成所述等级评定,则基于所述等级,提供指令来动态限定所述汇编的结果。基于应用于所述汇编的所述动态限定,生成经分类的相关文献的第一汇编并将其返回。通过以下参照附图而进行的对本发明优选实施例的说明,本发明的其他特征和优点将更加明显。


这里参照的附图构成说明书的一部分。除非明确说明,附图所示的特征仅用于说明本发明的某些实施例,而不是说明本发明的所有实施例。另外,这不含有与之相反的意思
图1是表示识别专利文献的章节以生成一个或多个简要的过程的流程图。 图2是表示为一个或多个简要生成次权重的过程的流程图。
图3是表示采用次权重来反映各个简要章节中产生字符串匹配的位置的过程的流程图。
图4是表示生成次级简要和向提交查询返回的检索结果指定权重的过程的流程图。 图5是表示对查询结果集合应用次级简要的过程的流程图。 图6是表示对查询结果分类的过程的流程图。
图7是表示根据本发明优选实施例对所返回和经分类的结果指定关联性的过程的流程图。
图8是表示对基础文献集合的查询结果的显示进行动态限定的过程的流程图。 图9是表示利用图形用户界面作为工具对基础文献集合的查询结果动态地设置限定的过程的流程图。
图10是表示图形用户界面实施例的框图。
图11是表示用于分类和解析基础文献集合中的查询结果的一组工具的框图。
具体实施例方式应容易理解,这里,可以通过不同的配置来布置和设计本发明例如在附图中概述及图示的组件。因此,如附图所示,下文对本发明的设备、系统和方法的详细说明仅是选自本发明的有代表性的实施例,而不是要限制本发明要求保护的范围。本说明书中描述的功能单元称作管理器和控制器。管理器和/或控制器可以在诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑器件等可编程硬件器件中实现。管理器和/或控制器也可以由各种处理器执行的软件来实现。例如,由可执行代码构成的指定管理器和/或控制器可以包括计算机指令构成的一个或多个物理块或逻辑块,这些计算机指令可以被构建成例如对象、程序、函数或其他结构。尽管如此,等同管理器和/或控制器的可执行文件无需物理地放置在一起,而是可以包括存储在不同位置的不同指令,当这些指令逻辑地联合在一起时,则它们组成管理器和/或控制器并实现管理器和/或控制器的规定目标。事实上,由可执行代码构成的管理器和/或控制器可以是一条指令或多条指令, 甚至可以分布于多个不同的代码段、不同的应用程序、及多个不同的存储器中。同样地,这里,操作数据可以在管理器和/或控制器的范围内指定(be identified)和说明,并且其可以实施为任何适当的形式,也可以构建在任何适当类型的数据结构内。操作数据可以集成为单个数据集合,或可以分布到包括不同存储器在内的不同位置,还可以至少部分地作为电子信号存在于系统或网络上。整个说明书中所提到的“所选实施例”、“一个实施例”或“实施例”意味着,结合该实施例所描述的特定特点、结构、或者特征包含在本发明的至少一个实施例中。因此,在整个说明书各处出现的用语“所选实施例”、“在一个实施例中”或“在实施例中”不一定是指同一个实施例。而且,在一个或多个实施例中,可以以任何适当的方式组合所描述的特点、结构或者特征。在下文中提供大量的详细描述,以便全面理解本发明的实施例。然而,所属技术领域的技术人员应意识到,在省略一个或多个特定细节,或用其他方法、构件、用具等的情况下,也可实现本发明。在其它情况下,为避免使本发明的发明点变得费解,对于众所周知的结构、用具或者操作则不再详细示出或说明。通过参考附图可以更好地理解本发明的实施例,其中,在整个说明书中,使用相同的附图标记表示相同的部分。下面仅用举例的方式简述与在此所保护的发明相一致的设备、系统和方法的某些优选实施例。
概沭知识产权文献集合是授权公布和公开的申请的汇编。专利文献集合是知识产权文献集合的子集。专利文献包括授权专利的形式和公开专利申请的形式。这两种文献分类之间的差别确定了它们的可行使权利的价值。更具体地,授权专利是能够在法院行使的实际财产权,而公开专利申请是未授权的申请,即是未决的专利权。各个专利文献被解析成多个章节,各个章节包含书面的词或短语(也称为字符串数据)。为了能够检索集合,基于集合中各个文献的章节,对各个文献进行解析,并向知识产权文献各个经解析的章节指定权重。 权重是文献中一个或多个特定章节的重要程度的数值度量,以用于查询。所选文献章节与指定到所选择章节的权重一起构成了检索简要。基于检索范围,可将检索锁定在文献的特定章节,或者可对文献各个章节中匹配查询的数据指定不同的权重。为能够根据提交查询显示查询结果,可对该结果的关联性进行动态限定。更具体地,可以基于该查询结果的统计分析、该查询结果的整体、和/或检索简要的特征来动态调整伴随该结果的关联性。因此, 检索简要的生成和选择直接涉及检索结果的量化和显示。
技术细节下面,将参照构成说明书的一部分的附图来说明实施例,附图示出了可实现本发明的特定实施例。应注意的是,在不偏离本发明的范围的情况下可以进行结构改变,从而采用其他实施方式。应认识到,授权公布和公开的知识产权文献的说明文献划分成多个章节。各个章节对于提交完整的申请是必要的,且各个章节具有各自的用途。这里将不详细讨论基础知识产权的各个章节。然而,基于公开的目的,需要识别专利(作为知识产权文献的示例)的不同章节。对于大多数情况,各个专利申请包括名称、优先权日、摘要、背景技术、发明内容、 附图简要说明(如果有的话)、说明书附图(如果有的话)具体实施方式
和权利要求。基于检索的目的,在专利领域中采用了不同的检索类别。例如,侵权和/或产品规避侵权检索与权利要求中的用语相关,因而基本上与文献集合包括的权利要求相关。有效和/或无效检索与任何已知的现有技术相关,因而需要识别专利文献的优先权日。当发明人在提交专利申请之前或之后想要确定其发明的新颖性时,发明人或其代理人或代表人可以采用新颖性检索。该检索可以不注重权利要求,而重点关注发明的具体实施方式
。因此, 如本文所述,各个检索向文献集合中的专利文献的不同章节指定权重。图1是表示为生成一个或多个简要而对专利文献的章节进行识别的过程的流程图100。以美国专利商标局为例,根据当前做法原则,向美国专利商标局提交的各个专利申请文献包含以下章节名称、背景技术、发明内容、附图简要说明、附图、优选实施方式的详细说明、权利要求书和摘要,其中背景技术包括技术领域和现有技术的说明。在一个实施例中,并不是所有专利文献都包含附图,例如,化学文献或一些国外专利和专利文献。类似地, 在其他国家和地区的专利局和以前的国内实践中,专利文献可能具有不同数量的章节,或者这些章节可能以不同顺序出现。因此,对于查询来说,在向集合中的专利文献的一个或多个章节指定权重之前,需要识别集合中的文献的来源、文献的不同章节以及章节的组织顺序。首先,对专利文献集合进行汇编和编索引(步骤10 。应认识到,在本领域中,专利和专利出版物是由多个章节组成。在对文献进行汇编之后,识别文献集合中各个专利的各个章节(步骤104)。将变量NT。tal指定为专利文献中章节的数量(步骤106)。为满足不同的检索需要,生成不同的简要。通过向专利文献的章节的不同组合指定权重,和/或通过在检索期间将文献的一个或多个章节忽略不予以考虑,来生成简要,其中上述忽略是通过向该章节指定0值来实现的。为了实现基于简要所进行的检索,至少生成一个简要。然而, 在一个实施例中,为了实现简要的选择以满足特定检索的需要,生成了多个简要。一旦在步骤106中识别出专利文献的章节,初始化与简要标识相关的计数变量X,并将其指定为整数 1 (步骤108),然后将与专利文献的章节相关的计数变量N指定为整数1 (步骤110)。从专利文献集合的章节N开始,判断是否将章用作正在生成的简要(简要x)的一部分(步骤 112)。如果步骤112中的判断结果是肯定的,则将章节N加入到简要、中(步骤114)。在选择章的情况下,向章节N指定主权重(步骤116)。主权重是一个数字值,其用于表示与专利文献集合的其他章节相比,章节N对于简要x的重要性,上述其他章节包括任何先前所选择的章节以及待加入到简要中或待从简要中忽略的章节。在步骤116之后或如果步骤 112中的判断结果是否定的,则递增与专利文献的章节相关的变量N(步骤118)。随后判断经汇编和编索引的集合中专利文献的所有已识别章节是否受到评估,以便将该章节加入简要x或从简要x中忽略(步骤120)。如果步骤120中的判断结果是肯定的,则结束简要x的简要生成过程(步骤122)。相反,如果步骤120中的判断结果是否定的,则接下来返回到步骤112,为简要x考虑集合中的其余章节。随后,判断是否还为文献集合生成任何其它简要 (步骤124)。如果步骤124中的判断结果是肯定的,则接下来递增计数变量X(步骤126), 并返回到步骤110。相反,如果步骤124中的判断结果是否定的,停止简要x的生成,并将X 的数值指定到变量)(T。tal (步骤128)。因此,可以为专利文献集合生成一个或多个简要,且各个简要向专利文献集合中的一个或多个经识别章节指定了权重。如图1所示,可以生成一个或多个简要,以用于强调或弱化专利文献的所选章节在检索过程中的利用程度。图2是表示向各个已生成的简要增加附加权重值的流程图200。 更具体地,基于各个简要中所选章节中的匹配字符串的数量,可以将附加权重(次权重)加入到权重值中或从权重值中减去。如图2所示,变量)(T。tal指定成用于表示所生成的简要的数量(步骤20 ,而计数变量X指定为整数1 (步骤204)。此后,如图2所示,变量YT。tal指定成用于表示简要x中指定有权重的章节的数量(步骤206)。为了评估简要的各个章节, 计数变量Y指定为整数1 (步骤208)。随后,判断是否将次权重加入到简要x的章节γ中 (步骤210)。如果步骤210中的判断结果是否定的,则接下来跳到步骤230以评估该简要中的下一章节(如果该章节存在的话)。相反,如果步骤210中的判断结果是肯定的,则接下来通过二次查询来判断指定的次权重是否为分层结构(步骤212)。更具体地,各个简要可包括分等级的权重值,这取决于在通过选择简要进行检索期间返回的数据字符串匹配的数量。如果步骤212中的判断结果是否定的,则接下来设定必须返回的数据字符串匹配的最小阈值,以向章节γ指定次权重(步骤214)。在步骤214之后,为简要x的章节γ设定次权重值(步骤216)。步骤214和216处的输入用于设定参数,该参数满足在步骤212中所生成的次权重结构。因此,对于每个简要的章节,可设定次权重值,以用于在超过匹配阈值时对检索结果指定权重。除设定单个次权重值之外,简要的各个所选章节可配置成具有分等级的次权重阈值。如果步骤212中的判断结果是肯定的,则接下来将指定简要x的章节分等级阈值的数量指定为变量ZT。tal (步骤218),分层计数变量Z设定为整数1 (步骤220)。在步骤220 之后,设定必须返回的数据字符串匹配的最小阈值(步骤222),以向简要x的章节γ的分层 Z指定次权重,从而为简要χ的章节Y的分层ζ指定次权重值(步骤224)。一旦为所选分层 ζ指定了权重值,则递增分层计数变量Z (步骤226),接着判断是否已为简要χ的章节γ的所有分层指定了权重值(步骤228)。如果步骤228中的判断结果是否定的,则接下来返回步骤222。相反,如果步骤228中的判断结果是肯定的或者是在步骤116之后,则接下来递增计数变量Y,以对所选简要的下一章节进行评估(步骤230)。随后,判断是否已对所选简要的所有章节进行了分层次权重阈值的指定的评估(步骤23 。如果步骤232中的判断结果是否定的,则接下来返回到步骤210,而如果步骤232中的判断结果是肯定的,则接下来递增简要计数变量X(步骤234)。在步骤234之后,判断是否已对所有已生成的简要进行了次权重的指定的评估(步骤236)。如果步骤236中的判断结果是否定的,则接下来返回到步骤206,而如果步骤236中的判断结果是肯定的,则接下来停止向已生成简要的所选章节指定分等级的次权重阈值(步骤238)。因此,各个简要可以具有分等级的次权重,以用于向各个简要的所选章节以及简要内匹配字符串的数量指定权重。如图2所示,分等级(即分层)的次权重可应用于简要的各个单独章节,其中,每个次权重是以查询字符串与正受到解析的文献集合中的数据之间的匹配数量的一个或多个阈值为基础的。在另一实施例中,如图3所示,次权重可反映出字符串匹配在一个或多个简要章节中出现的位置。该次权重可以与图2所示的次权重相互分离,也可以补充到图2 所示的次权重中。如图3所示,变量)(T。tal指定为用于表示所生成简要的数量(步骤302), 而计数变量X指定为整数1 (步骤304)。此后,变量YT。tal指定为用于表示简要x中的指定有权重的章节的数量(步骤306),而计数变量Y指定为整数1 (步骤308)。随后判断是否要将次权重加入到简要、的章节υ中(步骤310)。如果步骤310中的判断结果是肯定的, 则接下来将简要、的章节υ划分成多个子章节(步骤312)。步骤312中的划分可以采用不同的实施方式。例如,在一个实施例中,可以将其划分成三个子章节,其中第一子章节限定为第一个句子,第三子章节限定为最后一个句子,第二子章节限定为位于第一和第三子章节之间的所有数据。类似地,在另一实施例中,简要x的章节γ可以划分成多个章节,每个章节的长度与在整个简要χ的章节γ中的所占比例有关。不论采用何种方法来确定子章节的数量,简要χ的各个章节γ都可以划分成两个以上的子章节,其中向子章节指定的次权重不仅用于反映出简要χ的章节υ中的匹配字符串,而且用于反映出上述匹配在所选子章节中的位置。在步骤312之后,变量ZT。tal指定为简要x的章节γ中所生成的子章节的数量(步骤314),而计数变量Z指定为整数1 (步骤316)。向简要χ的章节γ的子章节ζ指定次权重(步骤318)。在步骤318中的指定之后,递增计数变量Z (步骤320),接着,判断在简要x的章节υ中是否还存在没有进行次权重指定的评估的子章节(步骤32幻。如果步骤322中的判断结果是否定的,则接下来返回到步骤318。相反,如果步骤322中的判断结果是肯定的或步骤310中的判断结果是否定的,则接下来递增计数变量Y(步骤324)。随后,判断在简要x中是否存在没有进行次权重的指定评估的章节(步骤326)。如果步骤326中的判断结果是否定的,则接下来返回到步骤310。相反,如果步骤3 中的判断结果是肯定的,则接下来递增计数变量X (步骤328),并判断是否已对所有简要进行了次权重的指定评估(步骤 330)。如果步骤330中的判断结果是否定的,则接下来返回到步骤306,而如果是肯定的,则停止次权重的指定过程。因此,可基于简要的章节的物理位置将其划分成多个子章节,其中将次权重指定到一个或多个经识别的子章节。在图1至图3中,为了检索出匹配字符串组合的专利文献并且对各个具有匹配的文献的不同章节指定权重,生成基础简要。基于具有匹配字符串组合的文献汇编,也可以采用次级简要。更具体地,在向检索者显示结果之前,基于二次考虑,可以采用次级简要向该结果指定次权重。对于使用次权重,可以利用专利文献的不同特征,这包括但不仅限于优先权日和/或
公开日。专利领域中,优先权日表示同族专利中的最早时间。更具体地,当首次提交详细说明某发明的专利申请时为该发明建立优先权日。专利文献(a patent document)的
公开日表示已授权公布专利的授权日期,而专利出版物(a patent publication)的
公开日表示未决的专利申请的
公开日期。次级简要可以利用这些记录日期中的一个日期或全部日期而生成。图4是表示生成次级简要的过程的流程图(步骤400),该次级简要基于与提交查询所返回的文献日期相关的日期要素向检索结果指定权重。在一个实施例中,日期要素可以包括但不仅限于
公开日、申请日以及国外优先权日。首先,设定次级简要“次级-简要”(步骤40幻。提交查询得到的文献数量指定为变量NT。tal (步骤404),而计数变量N指定为整数1(步骤406)。对于返回文献集中的文献N,对其优先权日进行检索(步骤408), 接下来递增计数变量N(步骤410)。然后,判断是否已完成所返回文献集的次级-简要的要素的检索(步骤412)。如果步骤412中的判断结果是否定的,则接下来返回步骤408。相反,如果步骤412中的判断结果是肯定的,则接下来基于提取出的次级-简要的要素执行分类算法,从而分类该检索结果中的文献(步骤414)。分类算法可以采用多种不同的形式,因此,本发明将不限于任何特定的分类算法。一旦对集合中的文献分类完毕,变量文献■指定为文献集中具有最早次级-简要日期的一个文献(步骤416),并且变量文献NEW指定为文献集中具有最新次级-简要日期的一个文献(步骤418)。变量日期-范围限定为变量文献·和文献NEW的差值(步骤420),并且将日期-范围划分为多个章节(步骤42幻。步骤 422中可以采用不同实施例划分日期-范围。例如,在一个实施例中,可以划分三个子章节, 其中第一子章节限定为最接近文献NEW的相关日期的文献,第三子章节限定为最接近文献M 的相关日期的文献,而第二子章节限定为日期位于第一和第三子章节之间的所有文献。类似地,在又一实施例中,日期-范围可以划分为多个章节,其中各个章节具有同等的该文献集合中的文献分布。因此,不论采用何种方法,可以向文献集的各个子章节指定次权重,该次权重具有基于该次权重的查询结果的关联性。基于至少一个次级数据标准对查询结果中的文献分类之后,变量ZT。tal指定为日期-范围的章节数量(步骤424),而计数变量Z指定为整数1 (步骤426)。向日期-范围z 指定权重(步骤428),接下来递增变量Z (步骤430)。在步骤430之后,判断是否已为各个子章节指定权重(步骤432)。如果步骤432的判断结果是否定的,则接下来返回步骤428。相反,如果步骤432的判断结果是肯定的,则停止为各个已生成的子章节指定权重。因此,为了在显示数据之前能够进一步突出次级要素,可以生成次级简要来向结果集指定次权重。向文献集合的查询结果应用次级要素并非局限为日期。图5是表示向结果集应用次级简要的流程图(步骤500),该结果集未采用任何一个专利文献的相关日期。在启动检索时,选择一个或多个文献集合以实现查询(步骤50 。在一个实施例中,文献集合可以是知识产权文献集合的形式。同样地,在一个实施例中,文献集合可以是不同国家的形式,例如由美国专利商标局、日本专利局、欧洲专利局等公布文献的集合。一旦选择该文献集合, 则选择了用于检索的简要(步骤504)。简要的实施例已在上面图1至图3中加以说明。基于步骤502和504中选择的完成,开通查询,并且将查询提交至该简要和所选文献集合(步骤506)。在一个实施例中,查询是字符串查询。确定集合中发生至少一次查询事件的文献的数量,将该数量指定为变量)(T。tal (步骤508),而匹配文献的计数变量X指定为整数1 (步骤510)。此外,变量NT。tal指定为用于提交查询所选的简要的章节数量(步骤512),而所选简要的计数变量N指定为整数1(步骤514)。为各个文献x的章节N计算评分。在一个实施例中,评分计算成章节N中查询匹配的数目与向章节N指定的点的数目的乘积(步骤516)。 在一个实施例中,指定于章节,的点表示该特定章节在集合中的重要程度。在步骤516之后,递增变量N(步骤518),接下来判断是否该简要的所有章节已被评估(步骤520)。如果步骤520的判断结果是否定的,则返回步骤516。相反,如果步骤 520的判断结果是肯定的,则递增变量X(步骤522)。接着,判断是否该数量下的所有文献已被评估(步骤524)。如果步骤524的判断结果是肯定的,则停止对所返回的文献进行分数评估(步骤526)。相反,如果步骤524的判断结果是否定的,则返回步骤514,通过简要的章节对下一文献进行评分。一旦对所有文献和所选简要指定评分,则为各个文献以及根据提交查询返回的所选简要计算总评分(步骤526)。如图5所示,汇编中各个文献均具有评分,该评分是基于字符串匹配数量和简要中指定的相关权重的数值形式。应理解,在执行专利检索的过程中,重要的是判断哪些检索结果更相关。例如,除了将评分作为查询匹配的贡献要素以外,还利用评分对匹配文献指定等级。该等级表示与其他返回文献相比,哪些返回的文献被评定为更相关。该等级评定利用不同要素,并且这些要素可包括基于评分的等级和/或等级与次级要素的结合。图6是表示对由查询返回的文献进行分类的过程的流程图600,该分类基于各个返回文献以及各个简要的章节的指定评分。如图6所计算的,变量)(T。tal指定为进行至少一次提交查询返回的文献的总数量(步骤60 。然后,遵循分类算法来分类文献(步骤604)。 在一个实施例中,可以从最高评分至最低评分,或者从最低评分至最高评分的顺序分类文献。分类算法可以采用多种不同的形式,因此,本发明将不限于任何特定的分类算法。一旦对整个集合中的文献分类完毕,也可对查询所选简要的各个文献集合进行分类,从而在各个章节内产生一类文献。在一个实施例中,返回文献的分类过程可看成评分结果的等级评定过程。变量NT。tal表示检索所选的简要中章节的数量(步骤606)。章节计数变量N初始化为整数1 (步骤608),并且文献计数变量X初始化为变量1 (步骤610)。对于章节N,对应于至少一次查询输入的各个文献x划分成第一文献x至最后文献XT。tal (步骤612)。一旦对章节N分类完毕,则递增变量N(步骤614),接下来判断是否对所选简要的所有章节进行分类评估(步骤616)。如果步骤616的判断结果是否定的,则接下来返回步骤612。相反,如果步骤616的判断结果是肯定的,则表示已经通过所选简要的所有章节对所有文献进行分类。因此,查询结果的分类是在两个级别上执行的,第一级别是对其整体的查询,而第二级别是通过组成该简要的所选章节的分类。一旦文献集合的分类完毕,则采取不同工具传送分类查询结果。更具体地,当对查询结果的查询和分类完成以后,传送给查询提交者的数据是基于整个查询的结果关联性, 和/或基于经提交的查询简要的各个章节的关联性。图7是表示向所返回和经分类的检索结果指定关联性的过程的流程图700。该返回检索结果的分层的数量指定为变量TT。tal (步骤702)。在一个实施例中,变量TT。tal是静态变量。然而,在另一实施例中,变量TT。tal可以是动态变量。关联性评估可以在两个级别上执行,第一级别是基于查询结果中的所有文献, 而第二级别的评估基于文献集合的各个简要。变量)(T。tal表示根据查询所返回和经分类的所有文献(步骤704),而变量)(T。tal被分层数量TT。tal除,以计算指定到各个分层(T表示) 的查询结果的数量QS (步骤706)。为将查询结果指定到分层τ,分层计数变量T初始化为整数1 (步骤708),而计数变量X表示指定到分层的文献,并初始化为整数1 (步骤710)。在步骤708和710进行初始化之后,将文献χ指定到分层τ (步骤71 。在步骤712进行上述指定以后,递增变量X(步骤714),然后判断是否分层τ填满查询结果(步骤716)。如果步骤716的判断结果是否定的,则接下来返回步骤712。相反,如果步骤716的判断结果是肯定的,则表示已完成对分层τ的查询结果指定。接着,递增变量T (步骤718),接下来判断是否完成所有对分层的查询结果指定(步骤720)。如果步骤720的判断结果是否定的,则接下来返回步骤710。相反,如果步骤720的判断结果是肯定的,则停止对生成的分层指定查询结果。应当注意,可以从最相关到最不相关的分类方式至上而下地向分层指定查询结果的分类表,或者从最不相关到最相关的方式至下而上地向分层指定查询结果的分类表。类似地,在一个实施例中,在经分类和分等级的结果中出现拐点,并且相邻分层在该拐点处被划分。因此,为了突出所选的经分类文献的关联性,向分层指定查询结果。如上所述,可以不考虑提交查询的简要,以粗略原则分类查询结果。然而,也可以依据简要原则(profile basis)(也称为细化原则)进行分层指定。更具体地,可以参考简要的特征,根据所返回文献的关联性顺序对提交查询中的各个简要进行分类。为了实现对简要的利用,向简要指定的各个文献集也可以图7所示的方式划分为分层。该细化简要的分层指定能够使查询结果基于简要的特征进一步传送。如上所述,可以解析文献集合查询结果中的各个专利,以基于关联性提供结果的显示。在一个实施例中,可以显示该结果以对知识产权文献的返回汇编的指定章节中的匹配数据值强调或去除强调。类似地,在一个实施例中,基于关联性,对检索结果的显示加以限制。就向查询结果指定分层而言,仅能够查看到选择的分层,其中该选择的分层可以是那些被认为包含更多相关查询结果的分层。类似地,就查询结果评分而言,可以设定限制使得对所提交的查询仅显示那些规定分数内的结果。查询结果的显示限制不应当局限于本文描述的实施例,可以采用其他形式将查看到的查询结果限定为那些仅具有一定相关性评分的结果。在一个实施例中,经分类的查询结果静态地显示为相关文献的汇编。然而,在另一实施例中,基于所返回文献的分级,可以动态限定文献集合的返回。该动态方面支持改变相关性标准以反映查询结果。图8是表示对查询结果的显示进行动态限定的一个实施例的流程图800。如上所述,基于提交查询要素的关联性数值因素,对根据查询返回的各个文献分类(步骤80幻。基于该数值数据(即,向各个所返回文献指定的关联性的数值因素),对所返回文献的汇编应用曲线拟合例行程序(步骤804)。该曲线拟合例行程序计算汇编数据的理论函数。更具体地,该曲线拟合例行程序基于关联性的原始数值因素确定该理论函数。 基于该曲线拟合例行程序,汇编中的一些文献与该理论函数的曲线吻合或接近该理论函数曲线(步骤806)。计算理论函数的一个或多个导数(步骤808)。为了动态地限定汇编的结果,选择理论函数的导数的数量(步骤810)。更具体地,为了将汇编的结果限定为最相关文献,该动态选择将限定在该曲线拟合例行程序的理论函数的一阶导数内。类似地,为了扩展汇编的结果而获取更大量文献,该动态选择将扩展至二阶导数(或者更高阶)。基于所选导数的数量,在导数选择范围内的文献汇编被返回(步骤812)。因此,基于文献与曲线拟合例行程序的理论函数的近似程度,对返回文献的汇编进行动态调整。图8所示的动态选择过程和工具表示限定汇编结果的一个实施例。在另一实施例中,利用图形用户界面作为源代码的上层(veneer),从而实现用户对经分类的汇编的常规结果的交互和修改。图9是表示通过使用图形用户界面动态地限定汇编的结果的过程的流程图。如上所述,基于提交查询要素的关联性数值因素,对根据查询返回的各个文献进行分类(步骤90幻。检索结果绘制成图形(904)。可以采用不同形式的图形。在一个实施例中,该图形可以是二维图形形式,其中以所返回文献数量为一个轴,而相关性的数值因素为另一个轴。在界面上提供能够使文献数量限定于所选关联性数值的机制(步骤906)。在一个实施例中,在用户界面上提供游标(slider),并且通过定点工具(pointing tool),该游标可以移动到图形的任何关联值(步骤908)。基于游标的移动,动态地改变相关文献的数量和被认为相关的特定文献。更具体地,该游标起到分界线的作用,其中指定有该游标位置上方的关联性的所有文献被认定为相关文献而被返回(步骤910),而指定有该游标位置下方的关联性的所有文献则不返回(步骤91幻。在一个实施例中,指定有游标位置的关联性的所有文献被认定为相关文献而返回。相反,在一个实施例中,指定有游标位置的关联性的所有文献被认定为不相关而不返回。因此,可以移动该图形用户界面的游标,以调整被认定为相关的文献并将其返回文献汇编中。如图9所示,可以采用图形用户界面来提供便于相关文献动态选择的工具。图10 是表示图形用户界面实施例的框图1000。更具体地,计算机系统1000具有处理单元1002, 所述处理单元1002通过总线结构1008连接到存储器1006。在一个实施例中,虽然仅示出一个处理单元1002,但在扩展设计中可以提供更多个处理单元。图示的系统1000与配置成存储文献集合1042的存储介质1040通信连接。在一个实施例中,电子文献集合包括专利文献的汇编,该专利文献包括授权专利和公开的专利申请。存储介质1040与处理单元 1002通信连接。此外,图示的该系统与可视显示器1050通信连接,以显示可视数据。采用输入设备1052与可视显示器1050进行通信。可以采用多种不同形式的输入设备,其包括但不限于键盘、鼠标、跟踪球、电子笔等。基于单个结果携带的经计算的关联性评分以及构成该汇编的文献数量,在可视显示器1050上提供图形用户界面1054,以传送查询结果的汇编的图形显示。在一个实施例中,图形界面用户IOM用作处理单元1002中运行的源代码的上层。该图形用户界面内提供可通过输入设备访问的图形机制1060,以实现查询结果的子集的动态选择。在一个实施例中,图形机制1060是游标的形式,游标代表查询结果的图形表示内的分界线。随着图形机制1060在图形表示范围内移动,修改将落入汇编中的特定查询结果。在一个实施例中,选择引用自图形机制1060 —侧的所有文献和/或落入该图形机制内的所有文献包含于查询结果中,并且排除引用自图形机制1060另一侧的所有文献。 因此,该图形用户界面的图形机制1060是对查询结果的汇编应用动态修改的工具。采用如图1至图9所示的过程和/或指令向文献集合提交查询,并且响应于该查询解析该集合。然而,本发明不应当限于过程或指令集,在一个实施例中,可以包括与文献集合通信连接的硬件元件。图11是表示基于提交查询的检索简要的提交将查询结果分类和解析成一个或多个分层的一组工具的框图1100,其中包括向该检索简要经识别的知识产权文献的不同章节指定权重。如图所示,计算机系统1102具有处理单元1104,所述处理单元1104以总线结构1108连接到存储器1106。在一个实施例中,虽然仅示出一个处理单元 1104,但在扩展设计中可以提供更多个处理单元。图示的系统1102与配置成存储文献集合 1142的存储介质1140通信连接。在一个实施例中,电子文献集合包括专利文献的汇编,该专利文献包括授权专利和公开的专利申请。存储介质1140与处理单元1104通信连接。此夕卜,图示的系统与可视显示器1150通信连接,以显示可视数据。此处图示和说明的各个部分支持提交至文献集合1142的查询。控制器1160设置在计算机系统1102本地,并与存储器1106和处理单元1104通信连接。控制器1160负责对文献集合1142汇编和编索引。控制器1160与文献管理器1162 通信连接,文献管理器1162用于识别集合中各个文献的各个章节。如上所述,在专利文献集合的情况下,各个专利或公开的专利申请是由特定的、形式统一的章节组成。然而,并不是所有专利文献集合都具有统一的形式(layout)。因此,文献管理器1162用于识别集合中文献的章节,且在一个实施例中,文献管理器1162用于识别经识别章节的显示顺序。简要管理器1164设置成与文献管理器1162通信连接。简要管理器1164为文献集合1142组建检索简要。更具体地,简要管理器1164有助于选择文献的一个或多个章节,并为各个所选章节指定权重。其中,所选择的章节是查询中包含的由文献管理器1162识别的章节。在一个实施例中,权重是数字值,以表示所选章节中匹配数据的重要性。因此,由简要管理器 1164组建的检索简要提供了文献集合中与查询相关的章节的概要。查询管理器1166与简要管理器1164通信连接,而且查询管理器1166设置在计算机系统1102本地,并与存储器1106通信连接。查询管理器1166负责通过向文献集合1142 提交查询来选择至少一个检索简要。更具体地,查询管理器1166将查询数据与文献集合 1142章节中的数据进行比较,该章节在简要中识别并具有指定权重。查询管理器1166与关联性导航器1168通信连接。该关联性导航器用于基于关联性评分为汇编中的文献评定等级,并且基于该等级动态地限定该汇编中的结果。通过查询管理器1166进行的比较并结合使用关联性导航器1168,生成了基于所应用的动态限定的相关专利文献的汇编。在一个实施例中,该汇编显示在可视显示器1150上。类似地,在一个实施例中,该汇编可以保存在易失性或永久性存储器中。为了方便向查询提交者的传送,查询管理器与分类管理器通信连接,以基于文献分类评定提交查询结果的等级。在一个实施例中,控制器1160、文献管理器1162、简要管理器1164和查询管理器 1166可设置在计算机系统1102本地的存储器1106中。然而,本发明不限于该实施例。例如,在一个实施例中,控制器、文献管理器、简要管理器和查询管理器1160-1166每一个可作为硬件工具驻留在本地存储器1106的外部,或者它们可以硬件和软件的组合来实施。类似地,在一个实施例中,控制器和管理器1160-1166可以驻留在与存储介质1140通信连接的远程系统中。因此,控制器和控制器可以实施为软件工具或硬件工具,以用于支持向电子文献集合提交一个或多个查询,以生成相关专利文献的汇编。在一个实施例中,本发明以软件实施,所述软件包括但不限于固件、常驻软件、微代码等。本发明可以是通过计算机可用介质或者计算机可读介质访问的计算机程序产品的形式,该计算机可用介质或者计算机可读介质提供由计算机或任何指令执行系统使用的程序代码,或者提供与计算机或任何指令执行系统通信连接的程序代码。出于说明的目的,计算机可用介质或计算机可读介质可以是能够容纳、存储、通信、传播、或者传输程序的装置, 上述程序由指令执行系统、设备或装置使用或与指令执行系统、设备或装置通信连接。本发明范围内的实施例还包括制造的产品,该产品包括其中具有编码程序代码的程序存储装置。该程序存储装置可以是能通过通用或专用计算机访问的任何可得到的介质。举例来说,该程序存储装置可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁存储设备、或者能用于存储期望程序代码方法并能够由通用或专用计算机访问的任何其他介质。上述装置的组合也应当包含在该程序存储装置的范围内。上述介质可以是电子学系统、磁系统、光学系统、电磁系统、红外系统或半导体系统(或设备或装置)。计算机可读介质的示例包括半导体或者固态存储器、磁带、可移动的计算机软盘、随机存取存储器(RAM)、只读存储器(ROM)、硬盘和光盘。目前的光盘示例包括只读的高密度磁盘B (CD-ROM)、读/写高密度磁盘B (CD-R/W)和DVD。适用于存储和/或执行程序代码的数据处理系统至少包括一个通过系统总线直接或间接地连接到存储元件的处理器。存储元件可包括在程序代码实际执行时所使用的本地存储器、大容量存储器和缓存存储器。该缓存存储器临时存储至少一些程序代码,从而在执行过程中可以减少从大容量存储器中取代码的次数。输入/输出或I/O设备(包括但不限于键盘、显示器、定点设备等)可以直接或通过中间I/O控制器耦合到系统。网络适配器也可以耦合到系统,以便使数据处理系统可以通过中间的私人或公共网络与其它数据处理系统或远程打印机或存储设备相耦合。软件工具可以是能够由计算机可用介质或计算机可读介质访问的计算机程序产品的形式,该计算机可用介质或计算机可读介质用于提供由计算机或者任何指令执行系统使用的或与计算机或者任何指令执行系统通信连接的程序代码。
相对现有技术的优点已知,在本领域中各个知识产权文献具有为符合法定提交条件而要求的限定概貌的章节。生成一个或多个简要,以有助于向文献集合提交查询。各个简要向文献中的一个或多个经识别的章节施加权重。权重表示经识别的章节的重要性,并对返回汇编中的各个文献施加数值。并不是所有的检索都是如此。例如,已认识到,化学领域中的知识产权文献即使在具有附图的情况下,也仅具有有限数目的附图。因此,化学领域中的查询可以去除对附图的强调,而提高对书面文本的强调。向集合提交不同的检索,以获得不同的结果。因此, 生成多个简要,且各个简要选择不同的经识别章节,并向不同的所选章节指定不同权重,使得能够高效且有效地提交查询,以产生所关注的文献汇编结果。一旦生成简要并且为提交查询选择至少一个简要,则下一步通过使所选简要并列的方式显示查询结果。在一个实施例中,该查询产生文献汇编,该汇编接着被分类并置于分等级分类的分层中。这使得在显示查询结果的同时能够直接显示关联性。在又一实施例中,基于简要中所选的章节,可以进一步传送查询结果,其中基于简要中所表示的单个章节以及各个章节中的文献的分类,显示第二组查询结果。因此,利用简要的选择来既生成查询结果,又基于关联性并以使所选简要并列的方式显示查询结果。
可诜实施例应当理解,尽管出于说明的目的而在此说明了本发明的一些特定实施例,但在不偏离本发明的精神和范围的前提下可以作各种修改。特别地,存在不同形式的知识产权文献,包括专利、商标和著作权。在专利文献的分类中,可对文献进一步分类,包括授权专利、 公开的专利申请、专利摘要和实用新型注册。这些文献中的一些文献可以包括相同数量的以相同顺序排序的章节,而其他一些文献可包括不同数量的章节和/或不同的顺序。基于所包括的章节独立地生成简要,且不必关心这些章节在基础文献中的排列顺序。另外,尽管已经具体地说明了与知识产权文献相关的电子文献集合(包括授权专利和公开的专利申请、商标注册和申请以及著作权注册和申请),然而,本发明不应当限于电子文献的这些特定分类。在一个实施例中,电子文献集合可包括具有所限定多个章节的任何类型的文献。这将使管理者能够将文献解析成所限定的章节,为一个或多个所限定的章节创建具有相应权重的多个简要,并对具有所选简要的文献集合提交查询。如上所述,可以对查询简要的选择进行动态修正。在一个实施例中,在保持查询内容的同时对查询简要的修正可以改变汇编中返回的文献以及文献在汇编中呈现的关联性的顺序。因此,本发明的保护范围仅由所附的权利要求及其等同物限定。
权利要求
1.一种由计算机执行的用于向电子文献集合的检索结果指定关联性的方法,其包括对知识产权文献的集合进行汇编和编索引,所述集合中各个所述文献具有多个章节;识别所述集合中各个所述文献的各个所述章节;为所述文献集合组建检索简要,其中,所述检索简要包括从经汇编的集合的各个所述文献中选择的至少一个经识别的章节;在所组建的检索简要中,向各个所选择的经识别的章节指定权重;在查询时,向专利文献集合提交查询,所述查询包括选择至少一个检索简要,并将查询数据与所述集合中所选择的简要的具有所指定权重的各个所述文献章节中的数据进行比较;对返回于文献汇编的各个文献计算关联性评分,所述文献汇编根据所述提交查询生成;基于所述经计算的关联性评分,对所述文献汇编中的文献评定等级;基于所述等级,对所述汇编的结果进行动态限定;以及经分类的相关文献的第一汇编基于应用于所述汇编的所述动态限定。
2.根据权利要求1所述的方法,进一步包括,基于所述汇编的所述分类,将所述文献汇编划分成分等级的分层。
3.根据权利要求2所述的方法,进一步包括,基于所要求的所述分等级分层的选择,限定查询结果的显示。
4.根据权利要求2所述的方法,进一步包括,在所述等级评定中出现的拐点处划分相邻分层。
5.根据权利要求1所述的方法,进一步包括,对所述文献的第一汇编应用次级分级要素,并且基于所述次级分级要素对所述经分类的汇编评定等级。
6.根据权利要求5所述的方法,其中,所述次级分级要素选自由申请日
公开日、国外优先权日、按字母表顺序列表的标题、权利人构成的组以及上述各项的组合。
7.根据权利要求1所述的方法,进一步包括,作为所述第一汇编的子集的文献的第二汇编,并且基于所述检索简要中出现的次级标准为所述子集计算第二关联性评分。
8.根据权利要求7所述的方法,进一步包括,分别对各个文献的子集进行分类。
9.根据权利要求8所述的方法,进一步包括,向所述经分类的子集动态地指定关联性限定,并且基于所述指定的关联性限定对所述查询结果的返回进行限定。
10.根据权利要求1所述的方法,进一步包括,基于所述经计算的关联性评分生成所述第一汇编的图形表示,以及所述汇编中以经计算的不同评分表示的文献的数量。
11.根据权利要求10所述的方法,进一步包括,所述图形表示上用于表示分界线的游标,所述游标用来包括所述汇编,从而包括引自所述分界线一侧的所有文献,并排除所述分界线另一侧的所有文献。
12.权利要求1所述的方法,进一步包括,向所述第一汇编应用曲线拟合例行程序,其中所述例行程序计算所述第一汇编的数据的理论函数,并计算所述函数的至少一个导数。
13.根据权利要求12所述的方法,其中,动态地限定所述汇编的结果的所述步骤包括 选择所述函数的导数,并返回落入所选择的所述函数的导数范围内的数据。
14.一种系统,其包括处理器,其与存储器和存储介质通信连接;知识产权文献集合,其保存在所述存储介质上,且所述集合中的各个所述文献具有多个章节;控制器,其与所述处理器通信连接,并对所述文献集合进行汇编和编索引;文献管理器,其与所述控制器通信连接,并用于识别所述集合中各个文献的各个章节;简要管理器,其与所述文献管理器通信连接,并为所述文献集合组建检索简要,其中, 所述检索简要包括从经汇编的集合的各个所述文献中选择的至少一个经识别的章节,且所述简要管理器通过所组建的检索简要向各个所选择的、经识别的章节指定权重;查询管理器,其在查询时向所述文献集合提交查询,所述查询包括选择至少一个检索简要以及将查询数据与所述集合中所选择的简要的具有所指定权重的各个所述文献章节中的数据进行比较,所述查询使得通过所述查询提交产生由所述查询管理器返回的相关文献的汇编,且各个所述相关文献具有向具有所指定权重和关联性评分的至少一个经识别简要章节中的数据提交的查询匹配;关联性导航器,其与所述查询管理器通信连接,并基于所述相关性评分对所述汇编中的所述文献评定等级,以及基于所述等级动态地限定所述汇编的结果;以及经分类的相关文献的第一汇编,其基于对所述汇编的所述动态限定的应用。
15.根据权利要求9所述的系统,进一步包括,向文献的所述第一汇编应用次级分级要素,从而基于所述次级分级要素对经分类的所述第一汇编评定等级。
16.根据权利要求15所述的系统,其中,所述次级分级要素选自由申请日
公开日、国外优先权日、按字母表顺序列表的标题、权利人构成的组以及上述各项的组合。
17.根据权利要求16所述的系统,进一步包括,编辑为所述第一汇编的子集的文献的第二汇编,并且基于所述检索简要中出现的每个次级标准为所述子集计算第二关联性评分。
18.根据权利要求17所述的系统,进一步包括,与所述关联性导航器通信连接的分类管理器,所述分类管理器基于所述次级关联性评分来对各个汇编分类。
19.根据权利要求14所述的系统,进一步包括,基于所述汇编的分类将文献的所述第一汇编划分成分等级的分层,以及基于分等级分层的选择对查询结果的显示进行限定。
20.根据权利要求19所述的系统,进一步包括,所述关联性导航器在所述等级中出现的拐点处划分相邻分层。
21.根据权利要求1所述的系统,进一步包括,基于所述经计算的关联性评分的所述第一汇编的图形表示,以及所述汇编中以经计算的不同评分表示的文献的数量。
22.根据权利要求21所述的系统,进一步包括,用于与所述图形表示通信的工具,其中所述工具为汇编结果动态地设定分界线,从而包括引自所述分界线一侧的所有文献,并排除所述分界线另一侧的所有文献。
23.根据权利要求14所述的系统,进一步包括,运行于所述处理器的用于所述第一汇编的曲线拟合例行程序的指令,所述曲线拟合例行程序计算所述第一汇编的数据的理论函数,并计算所述函数的至少一个导数。
24.根据权利要求23所述的系统,进一步包括,所述关联性导航器将所述第一汇编的结果限定在选择的所述函数的导数范围内,并返回落入所选的所述函数的导数范围内的数据。
25.一种用于向计算机存储器上的电子专利文献集合的检索结果指定关联性的产品, 其包括计算机可读载体和第一汇编,其中所述计算机可读载体包括用于执行关联性指定的计算机程序指令,所述指令包括 用于对知识产权文献的集合进行汇编和编索引的指令,所述集合中的各个所述文献具有多个章节;用于识别所述集合中各个文献的各个所述章节的指令;用于为所述文献集合组建检索简要的指令,其中,所述检索简要包括从经汇编的集合中的各个所述文献选择的至少一个经识别的章节;用于在所组建的检索简要中向各个经识别和经选择的章节指定权重的指令; 用于在查询时向所述专利文献集合提交查询的指令,所述指令包括选择至少一个检索简要以及将查询数据与所述集合中所选择的简要的具有指定权重的各个所述文献章节中的数据进行比较;及用于计算返回于文献汇编的各个文献的关联性评分、并且基于所述经计算的关联性评分为汇编中的文献评定等级的指令,所述文献汇编根据所述提交查询生成; 用于基于所述等级动态地限定汇编的结果的指令;以及所述第一汇编是经分类的相关文献的第一汇编,其中所述分类基于应用于所述文献汇编的所述动态限定。
26.根据权利要求25所述的产品,进一步包括,向所述文献的第一汇编应用次级分级要素、并基于所述次级分级要素对经分类的所述第一汇编评定等级的指令。
27.根据权利要求沈所述的产品,其中,所述次级分级要素选自由申请日
公开日、国外优先权日、按字母表顺序列表的标题、权利人构成的组以及上述各项的组合。
28.根据权利要求33所述的产品,进一步包括,基于所述检索简要中出现的次级标准, 将文献的第二汇编作为所述第一汇编的子集进行汇编的指令。
29.根据权利要求观所述的产品,进一步包括,为所述子集计算次级关联性评分的指令。
30.根据权利要求观所述的产品,进一步包括,基于所述次级关联性评分,将文献的所述第二汇编进行分类的指令。
31.根据权利要求25所述的产品,进一步包括,基于所述汇编的所述分类将所述文献的汇编划分成分等级的分层、并基于分等级分层的选择限定查询结果的显示的指令。
32.根据权利要求25所述的产品,进一步包括,在所述等级中出现的拐点处划分相邻分层的指令。
33.根据权利要求25所述的产品,进一步包括,基于所述经计算的关联性评分的所述第一汇编的图形表示和所述第一汇编中以经计算的不同评分表示的文献的数量,以及用于与所述图形表示进行通信的指令,其中所述指令为汇编结果动态地设定分界线,以包括引自所述分界线一侧的所有文献并排除所述分界线另一侧的所有文献。
34.根据权利要求25所述的产品,进一步包括,对所述第一汇编执行曲线拟合例行程序的指令,所述曲线拟合例行程序计算所述第一汇编的数据的理论函数,并计算所述函数的至少一个导数。
35.根据权利要求34所述的产品,进一步包括,用于将所述第一汇编的结果限定在选择的所述函数的导数范围内、并返回落入所选的所述函数的导数范围内的数据的指令。
全文摘要
本发明提供用于高效率且有成效地检索电子文献集合的方法、系统及产品。将集合中的各个文献预先划分成子章节。生成一个或多个简要,各个简要包括从集合的文献中选择的至少一个章节。此外,向简要中的各个所选章节指定权重。基于查询的参数和简要的选择,通过选择各个文献的子章节,比较查询数据与基础文献集合。文献汇编根据与查询数据匹配的数据生成,并且为汇编中的各个文献计算关联性评分。然后利用关联性评分以向提交查询传送关联性的方式将文献分类。
文档编号G06F17/40GK102483749SQ200980161341
公开日2012年5月30日 申请日期2009年7月22日 优先权日2009年7月22日
发明者贾森·雷斯尼克 申请人:基金Ip有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1