一种法律信息查询的方法和装置与流程

文档序号:12124683阅读:322来源:国知局
一种法律信息查询的方法和装置与流程

本发明涉及一种法律信息查询的方法和装置,尤其涉及一种根据法律咨询问题,给出相应法条的方法和装置。



背景技术:

现有法律法规咨询服务多采取数据库检索方式实现,提供关键字和主题词两个维度的模糊查询、目录查询、领域查询、分类查询和机构查询。功能上以简单问答、关键字匹配为主,缺乏语义容错理解机制;服务上以网页文字访问为主,无法支撑复杂的法律咨询、案情分析、法律检索服务场景。当用户咨询问题不够详细时,无法给出准确地法律条文,甚至因为无法识别用户的法律问题而无法给出相应的法律条文。



技术实现要素:

本发明的目的在于提供一种法律信息查询的方法和装置,克服现有技术中的问题,能够准确把握用户问题,进而给出正确的法律条文,提高了法律信息查询时的准确率。

根据上述目的,本发明提供一种法律信息查询的方法,包括:

提供法律知识库,所述法律知识库包含法律条文,每条法律条文关联有相对应的法律法规要素;对法律咨询问题进行自然语义要素提取,以得到所述法律咨询问题对应的自然语义要素;判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述匹配的法律条文对应的法律法规要素相匹配;若存在,则输出所述匹配的法律条文。

在一实施例中,所述判断的步骤包括:将所述法律咨询问题对应的自然语义要素映射到法律法规要素,作为法律咨询问题对应的法律法规要素;判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的法律法规要素与所述匹配的法律条文对应的法律法规要素相匹配。

在一实施例中,所述判断的步骤包括:判断所述法律知识库中是否存在完全匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述完全匹配的法律条文对应的法律法规要素完全匹配;若存在,则在所述输出的步骤中输出所述完全匹配的法律条文。

在一实施例中,所述判断的步骤还包括:若没有完全匹配的法律条文,则判断是否存在部分匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述部分匹配的法律条文对应的法律法规要素的一部分相匹配;若存在,则在所述输出的步骤中输出所述部分匹配的法律条文。

在一实施例中,所述判断的步骤还包括:若没有完全匹配的法律条文,则判断是否存在部分匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述部分匹配的法律条文对应的法律法规要素的一部分相匹配;若存在,则所述方法还包括:根据所述部分匹配的法律条文中没有匹配到的法律法规要素,生成反问问题进行反问;以及对反问得到的答复进行自然语义要素提取,以得到补充的自然语义要素;其中,所述判断的步骤还包括:判断所述补充的自然语义要素与所述部分匹配的法律条文中没有被匹配到的法律法规要素是否完全匹配;若完全匹配,则在所述输出的步骤中输出完全匹配的法律条文。

在一实施例中,所述根据所述部分匹配的法律条文中没有匹配到的法律法规要素,生成反问问题进行反问包括:将所述部分匹配的法律条文中没有匹配到的法律法规要素组合成选择性问题进行反问。

在一实施例中,所述方法还包括:在自然语义要素提取步骤之前,对所述法律咨询问题进行预处理,所述预处理包括非法词过滤、前后缀过滤、停词过滤和/或拼音过滤;所述自然语义要素提取步骤是对经预处理的法律咨询问题进行自然语义要素提取。

在一实施例中,所述方法还包括:所述法律知识库是可扩展数据库,以接收用户导入的其他法律数据库。

在一实施例中,所述法律知识库包括多个按照地域和/或法律类别进行分类的子库,所述判断步骤包括:根据所述法律咨询问题的地域和/或法律类别,在相应的地域和/或法律类别字库中进行是否存在匹配的法律条文的判断。

在一实施例中,所述方法还包括:若所述法律咨询问题为语音信息,则将所述语音信息转换成文字信息,以供自然语义要素提取。

在一实施例中,所述方法还包括:提供历史咨询问题库,所述历史咨询问题库中的每条历史咨询问题关联有相对应的自然语义要素;判断所述历史咨询问题库中是否存在相匹配的历史咨询问题,使得用户输入问题对应的自然语义要素与所述相匹配的历史咨询问题对应的自然语义要素匹配;若存在,则输出相匹配的历史咨询问题,供用户选择。

在一实施例中,所述法律咨询问题通过以下至少一种方式获取:微信、网页、应用软件、电话、短信、实体机器人和自主咨询终端。

对应上述方法,本发明还提供一种法律信息查询的装置,所述装置包括:法律知识库,所述法律知识库包含法律条文,每条法律条文关联有相对应的法律法规要素;自然语义要素提取模块,用于对法律咨询问题进行自然语义要素提取,以得到所述法律咨询问题对应的自然语义要素;匹配模块,用于判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述匹配的法律条文对应的法律法规要素相匹配;输出模块,用于响应于所述法律知识库中存在匹配的法律条文,则输出所述匹配的法律条文。

在一实施例中,所述匹配模块包括:映射子模块,用于将所述法律咨询问题对应的自然语义要素映射到法律法规要素,作为法律咨询问题对应的法律法规要素;判断子模块,用于判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的法律法规要素与所述匹配的法律条文对应的法律法规要素相匹配。

在一实施例中,所述匹配模块进一步用于判断所述法律知识库中是否存在完全匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述完全匹配的法律条文对应的法律法规要素完全匹配;所述输出模块进一步用于响应于所述法律知识库中存在完全匹配的法律条文,则输出所述完全匹配的法律条文。

在一实施例中,所述匹配模块进一步用于响应于没有完全匹配的法律条文,则判断是否存在部分匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述部分匹配的法律条文对应的法律法规要素的一部分相匹配;所述输出模块进一步用于响应于所述法律知识库中存在部分匹配的法律条文,则输出所述部分匹配的法律条文。

在一实施例中,所述匹配模块进一步用于响应于没有完全匹配的法律条文,则判断是否存在部分匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述部分匹配的法律条文对应的法律法规要素的一部分相匹配;所述装置还包括:反问模块,用于根据所述部分匹配的法律条文中没有匹配到的法律法规要素,生成反问问题进行反问;所述自然语义要素提取模块还用于对反问得到的答复进行自然语义要素提取,以得到补充的自然语义要素;所述匹配模块进一步用于判断所述补充的自然语义要素与所述部分匹配的法律条文中没有被匹配到的法律法规要素是否完全匹配;所述输出模块进一步用于响应于所述补充的自然语义要素与所述部分匹配的法律条文中没有被匹配到的法律法规要素完全匹配,则输出完全匹配的法律条文。

在一实施例中,所述反问模块包括:组合模块,用于将所述部分匹配的法律条文中没有匹配到的法律法规要素组合成选择性问题进行反问。

在一实施例中,所述装置还包括:预处理模块,用于在自然语义要素提取之前,对所述法律咨询问题进行预处理,所述预处理包括非法词过滤、前后缀过滤、停词过滤和/或拼音过滤;所述自然语义要素提取模块对经预处理的法律咨询问题进行自然语义要素提取。

在一实施例中,所述装置还包括:扩展接口,用于接收用户导入的其他法律数据库。

在一实施例中,所述法律知识库包括多个按照地域和/或法律类别进行分类的子库,所述装置还包括:分类模块,用于识别所述法律咨询问题的地域和/或法律类别;所述匹配模块进一步用于响应所述法律咨询问题的地域和/或法律类别,在相应的地域和/或法律类别字库中进行是否存在匹配的法律条文的判断。

在一实施例中,所述装置还包括:语音转换模块,用于响应于所述法律咨询问题为语音信息,则将所述语音信息转换成文字信息,以供自然语义要素提取。

在一实施例中,所述装置还包括:历史咨询问题库,所述历史咨询问题库中的每条历史咨询问题关联有相对应的自然语义要素;问题查找模块,用于判断所述历史咨询问题库中是否存在相匹配的历史咨询问题,使得用户输入问题对应的自然语义要素与所述相匹配的历史咨询问题对应的自然语义要素匹配;问题输出模块,用于响应所述历史咨询问题库中存在相匹配的历史咨询问题,则输出相匹配的历史咨询问题,供用户选择。

在一实施例中,所述装置还包括:咨询问题获取模块,用于通过以下至少一种方式:微信、网页、应用软件、电话、短信、实体机器人和自主咨询终端获取所述法律咨询问题。

如上所述,本发明提供的法律信息查询的方法和装置,具有反问机制,能够同用户互动,并得到完整的法律咨询问题,进而给出准确的法律条文。

附图说明

图1示出了本发明一个方面的法律信息查询的方法的流程图;

图2示出了完全匹配和部分匹配情况下的方法流程图;

图3示出了反问机制的方法流程图;

图4示出了本发明一个方面的法律信息查询的装置的结构图。

具体实施方式

本发明基于自然语义要素提取技术提取问题中的自然语义要素,进而判断问题的自然语义要素与法条的法律法规要素匹配度,同时提供然语义容错机制、可拓展的外部数据接口。对于咨询问题可能存在不完整的情况,本发明的核心在于提供反问机制,以得到完善的咨询问题,进而给出准确的法律条文。此外,本发明还支持:微信、网页、应用软件、电话、短信、实体机器人和自主咨询终端作为咨询问题的获取渠道。

本发明法律信息查询的方法提供有法律知识库,法律知识库内包括众多法律条文,法律知识库可以是现有的法典、地方法规等等,根据不同客户的寻求进行定制。

预先对法律知识库内的法律条文进行法律法规要素提取,得到每个法律条文对应的法律法规要素,可以将提取得到的法律法规要素也保存在法律知识库内。这里的法律法规要素主要指在法律领域的专业用语,例如自然语义中的“房子”,在法律领域对应的是“不动产”,而“不动产”就是法律法规要素。由于法条中一定包含的是法律用语,鉴于此,法条的关键字就是法条的法律法规要素。那么只要能够提取法条的关键字,则能够得到法条对应的法律法规要素。现有技术中可见,通过人工方式对法典或法规中的法条直接进行法律法规要素的提取。同时现有技术中有很多对文本进行关键词提取的技术,主要包括TF-IDF(词频-逆文档频率)、Topic-Model(主题-模型)等算法,运用这些算法对法条进行关键词提取就可以得到法条对应的法律法规要素。

TF-IDF的基本思想是:判断一个词在一篇文章中是否重要,一个容易想到的衡量指标就是词频,重要的词往往会在文章中多次出现。但另一方面,不是出现次数多的词就一定重要,因为有些词在各种文章中都频繁出现,那它的重要性肯定不如那些只在某篇文章中频繁出现的词重要性强。从统计学的角度,就是给予那些不常见的词以较大的权重,而减少常见词的权重。IDF(逆文档频率)就是这个权重,TF则指的是词频。

而Topic-Model则认为文章是由主题组成,文章中的词,是以一定概率从主题中选取的。不同的主题下,词语出现的概率分布是不同的。比如“鱼雷”一词,在“军事”主题下出现的概率远大于在“食品”主题下出现的概率。即Topic-Model认为文档和词语之间还有一层关系。

请参看图1,图1示出了本发明一个方面的法律信息查询的方法的流程图。所述方法包括:

101:对法律咨询问题进行自然语义要素提取,以得到所述法律咨询问题对应的自然语义要素;

102:判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述匹配的法律条文对应的法律法规要素相匹配;

103:若存在,则输出所述匹配的法律条文。

步骤101对法律咨询问题进行自然语义要素提取,实际上还是直接用前述的关键词提取技术将法律咨询问题中的关键词提取出来,即得到自然语义要素。正如前述,很多情况下,用户都会直接用“房子”这类通俗的语言来进行提问,而非直接用“不动产”这样的描述。

步骤102是判断问题对应的自然语义要素描述和法律条文对应的法律法规要素描述的匹配度,当两者匹配后,表示用户所提问题即对应了相关的法律条文,则在步骤103中给出相应的法律条文。

在一实施例中,步骤102的判断过程还包括步骤:

a)将所述法律咨询问题对应的自然语义要素映射到法律法规要素,作为法律咨询问题对应的法律法规要素;

b)判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的法律法规要素与所述匹配的法律条文对应的法律法规要素相匹配。

步骤a)是将前述例子中的问题的自然语义要素“房子”映射到法律法规要素“不动产”得到问题对应的法律法规要素“不动产”,步骤b)判断问题对应的法律法规要素“不动产”是否能匹配到法律知识库中的法条对应的法律法规要素“不动产”。步骤1021中的映射步骤可以通过现有技术中的映射数据库实现,也可通过人工翻译来实现。图1中所指的匹配包括了两种情况:完全匹配和部分匹配。

在一实施例中,具体请参看图2,所述方法包括如下步骤:

200:输入匹配度;

201:判断是否存在完全匹配的法律条文,若存在则进入步骤202,否则进入步骤203;

202:给出完全匹配的法律条文,进入步骤205;

203:判断是否存在部分匹配的法律条文,若存在则进入步骤204,否则进入步骤205;

204:给出部分匹配的法律条文,进入步骤205;

205:结束。

在一实施例中,首先通过映射关系将法律咨询问题对应的法律法规要素找到。此种情况下,完全匹配包含两种情况:一、咨询问题所有法律法规要素都唯一地对应了法条的法律法规要素,法条所有法律法规要素也都唯一地对应了咨询问题的法律法规要素,存在一一对应的关系;二、法条所有的法律法规要素都包含在问题法律法规要素内,但问题还有其他法律法规要素没有包含在法条法律法规要素内。同样部分匹配也包括两种情况:一、咨询问题所有法律法规要素都包含在法条法律法规要素内,但法条法律法规要素里还有没有被问题法律法规要素覆盖的部分;二、咨询问题部分法律法规要素包含法条部分法律法规要素,但法条法律法规要素里还有没有被问题法律法规要素覆盖的部分。

例如一个咨询问题对应的法律法规要素为(A、B、C、D、E、F、G),若法律知识库中存在一个法条对应的法律法规要素也正好为(A、B、C、D、E、F、G),则这种匹配就为完全匹配。或者,存在一个法条对应的法律法规要素为(B、C、D、E、F),则这种匹配也是完全匹配。若法律知识库存在一个(A、B、C、D、E、F、G、H、I),则法条中还有没有被匹配到的(H、I),这种就是部分匹配的情况。若存在一个(C、D、E、F、G、H、I、J、K)的法律条文,其中有(C、D、E、F、G)有所匹配,而法律条文中的(H、I、J、K)没有匹配到,这种情况也是部分匹配。总之,当法律条文中的法律法规要素全被匹配到时则是完全匹配,若法律条文中存在没有匹配到的法律法规要素,则是部分匹配的情况。

在另一优选实施例中,当存在前述部分匹配的情况时还包括反问机制。请参见图3,步骤如下:

301:根据所述部分匹配的法律条文中没有匹配到的法律法规要素,生成反问问题进行反问;

302:对反问得到的答复进行自然语义要素提取,以得到补充的自然语义要素;

303:判断所述补充的自然语义要素与所述部分匹配的法律条文中没有被匹配到的法律法规要素是否完全匹配,若完全匹配则进入步骤304,否则进入步骤305;

304:输出完全匹配的法律条文;

305:结束。

反问的目的是在于更加完整地得到咨询问题的内容,从而能够更加有针对性地给出相应的法条,反问的过程就是不断在完善问题内容的过程。当补充的问题内容(问题对应的自然语义要素)足够多到能够对应到相应的法条上时,给出相应的法条。

在一优选实施例中,将部分匹配的法律条文中没有匹配到的法律法规要素组合成选择性问题进行反问。紧接着前述例子,若法律咨询问题对应的法律法规要素为(A、B、C、D、E、F、G),部分匹配的法律条文有两个,一个条文对应的法律法规要素为(A、B、C、D、E、F、G、H),另一条文对应的法律法规要素为(A、B、C、D、E、F、G、I),则将没有被匹配到的法律法规要素(H)、(I)生成选择性问题,即生成类似“请问您是指H还是I”,若得到的反问回答为“H”则将对应(A、B、C、D、E、F、G、H)的法律条文输出。

在另一优选实施例中,在自然语义要素提取步骤之前,对法律咨询问题进行预处理,这里预处理包括非法词过滤、前后缀过滤、停词过滤和/或拼音过滤。然后,再进行法律法规要素提取、匹配等操作。所述预处理的目的是为了过滤掉对咨询问题内容本身没有意义的部分,进而能够使得提取出来的法律法规要素包含了用户真正想问的内容。

非法词是指一些敏感词汇,有违法律或者道德的内容,现在已经有很多非法词停词库可供使用,选用任意停词库,对照即可进行非法词的停词过滤。

前后缀过滤和停词过滤都是将文本中没有实际意义的词语过滤掉,前后缀过滤主要是过滤掉一些副词、形容词等。停词过滤是通过现有的停词库,来对照完成无意义词的过滤。

拼音过滤是指将用户误输入的拼音字符过滤掉,或者通过词库直接翻译成对应的文字。

在一优选实施例中,本发明提供的法律知识库是可扩展数据库,以接收用户导入的其他法律数据库。这样就能够适应法律、法规变化,或者新增法律法规的情况。

由于各个地方的法律、法规可能会出现不同,各个用户所需的法律类别也不尽相同,在一优选实施例中,本发明提供的法律知识库包括多个按照地域和/或法律类别进行分类的子库,根据不同用户问题类别,在相应的地域和/或法律类别字库中进行是否存在匹配的法律条文的判断。这样就降低了数据库成本,同时大大降低了进行匹配运算时的运算量。

在一优选实施例中,若用户输入的法律咨询问题为语音信息,则将语音信息转换为文字信息。目前语音转文字技术已经相当成熟,在实际应用中可直接将算法嵌入本发明方法中即可。

用户在输入问题时可能无法确切知道自己的问题应当包含哪些自然语义要素和内容,在另一优选实施例中,本发明将用户曾经问过的问题作为历史用户问句保存在历史咨询问题库中,当用户输入问题的过程中,将用户已经输入的问题自然语义要素与历史用户问句库中的历史用户问句对应的自然语义要素进行实时匹配,可以预先用前述的关键词提取技术,将历史用户问句库中的历史用户问句对应的自然语义要素都提取出来,并保存在历史用户问句库中。。当发现历史用户问句库中存在相匹配的历史用户问句,则输出相匹配的历史咨询问题,供用户选择,用户只需选择确认其想要问的问题即可,既提高了用户体验,又避免了当用户问题内容不够全面时可能存在的无法提供法条,或需要不断反问用户才能给出法条的情况。例如,历史问句库中存在一个历史问句包括的自然语义要素为(A、B、C、D、E、F),另一个历史问句包括的自然语义要素为(M、B、Q、D、F),则当用户输入(B、D)时,由于(A、B、C、D、E、F)和(M、B、Q、D、F)都包含了(B、D),则将上述来两个历史问句推荐出来供用户选择。在另一种情况下,用户直接输入了包含自然语义要素(A、B、C、D、E、F)的问句,同历史用户问句库中的一个历史用户问句的自然语义要素完全匹配,此时将此历史用户问句推荐出来供用户确认。

对应前述一种法律信息查询的方法,本发明还提供一种法律信息查询的装置,请参见图4,图4示出了本发明法律信息查询的装置一实施例的结构图。装置400包括:自然语义要素提取模块401、匹配模块402和输出模块403。将法律咨询问题输入自然语义要素提取模块401,并提取法律咨询问题对应的自然语义要素,将提取的法律咨询问题自然语义要素输入匹配模块402,匹配模块402以法律知识库中的法律条文对应的法律法规要素为基础,进行匹配度运算。若存在相匹配的法律条文和法律咨询问题,则让输出模块403输出相匹配的法律条文,在此实施例中,所述相匹配包括前述的完全匹配情况或部分匹配情况。

所述匹配模块402可以包括:

映射子模块,用于将所述法律咨询问题对应的自然语义要素映射到法律法规要素,作为法律咨询问题对应的法律法规要素;

判断子模块,用于判断所述法律知识库中是否存在匹配的法律条文,使得所述法律咨询问题对应的法律法规要素与所述匹配的法律条文对应的法律法规要素相匹配。

在一个例子中,所述匹配模块进一步用于判断所述法律知识库中是否存在完全匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述完全匹配的法律条文对应的法律法规要素完全匹配;

所述输出模块进一步用于响应于所述法律知识库中存在完全匹配的法律条文,则输出所述完全匹配的法律条文。

在另一个例子中,所述匹配模块进一步用于响应于没有完全匹配的法律条文,则判断是否存在部分匹配的法律条文,使得所述法律咨询问题对应的自然语义要素与所述部分匹配的法律条文对应的法律法规要素的一部分相匹配;

所述输出模块进一步用于响应于所述法律知识库中存在部分匹配的法律条文,则输出所述部分匹配的法律条文。

在一优选实施例中,装置400还包括反问模块404,当匹配模块402进行匹配运算的结果为部分匹配时,反问模块404则根据部分匹配的法律条文中没有匹配到的法律法规要素,生成反问问题进行反问。此实施例中,自然语义要素提取模块401还用于对反问得到的答复进行自然语义要素提取,以得到补充的自然语义要素,匹配模块402进一步用于判断补充的自然语义要素与部分匹配的法律条文中没有被匹配到的法律法规要素是否完全匹配,若补充的自然语义要素与部分匹配的法律条文中没有被匹配到的法律法规要素完全匹配,输出模块403输出完全匹配的法律条文。

在另一实施例中,装置400还包括组合模块4041,用于将所述部分匹配的法律条文中没有匹配到的法律法规要素组合成选择性问题进行反问,此处的选择性问题的组合方法同前述方法。

在另一实施例中,装置400还包括预处理模块405,在自然语义要素提取模块401之前,对法律咨询问题进行非法词过滤、前后缀过滤、停词过滤、拼音过滤等预处理操作,而后自然语义要素提取模块401对经过预处理的法律咨询问题进行自然语义要素提取。

更优地,所述装置还包括扩展接口,用于接收用户导入的其他法律数据库。

此外,所述法律知识库可以包括多个按照地域和/或法律类别进行分类的子库,所述装置还包括分类模块,用于识别所述法律咨询问题的地域和/或法律类别,进而可以根据法律咨询问题的地域和/或法律类别,分别进入不同的法律知识库字库进行法条的查询。

在一实施例中,所述装置还包括语音转换模块,当用户输入为语音信息时,转化为文字信息,为后续的自然语义提取提取、匹配等操作提供基础。

更优地,为了更好地获取用户问题,并提高用户体验。所述装置还包括:历史咨询问题库、问题查找模块和问题输出模块。历史咨询问题库包含了用户曾经问过的历史问题;问题查找模块,用于实时查找用户输入的问题是否已经存在于历史问题库中;若存在,则使用问题输出模块输出该历史问题。

法律咨询问题的获取方式涵盖了现有技术中的多种渠道,例如微信、网页、应用软件、电话、短信、实体机器人和自主咨询终端等,所述设备还包括咨询问题获取模块,用于在上述渠道中获取法律咨询问题。

本发明提取法律咨询问题中的自然语义要素,并同法条的法律法规要素进行匹配运算,若匹配则给出相应法条。本发明还提出了问题反问机制,能够更加智能地获取用户的咨询问题信息,进而能够更加准确地给出相应的法律条文。同时,问句智能推荐的功能,大大提高了用户体验。

提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1