本发明属于医疗科研信息检索,具体涉及一种基于医疗科研信息的检索方法、系统及检索终端。
背景技术:
1、在医疗科研领域,研究人员需要从大量的文献和数据中获取相关信息以支持科研工作。传统的检索方法通常要求用户编辑检索表达式,但这样的方式对于非专业人士来说可能存在困难,而且编辑表达式需要花费大量时间。
2、已有的与本发明最相似的实现方案是基于关键词的检索方法。这种方法要求用户编辑检索表达式,通过关键词匹配来检索文献和数据。然而,这种方法存在以下缺点:用户编辑表达式困难:非专业人士可能不熟悉领域相关的术语和表达方式,导致编辑表达式存在困难;时间消耗大:编辑复杂的检索表达式需要花费大量时间,降低了用户的检索效率。
3、现有技术的缺点:用户编辑表达式困难:非专业人士可能不熟悉领域相关的术语和表达方式,导致编辑表达式存在困难。而且医疗科研文献检索所耗费的时间长,需要编辑专业词汇,再将专业词汇进行组合,才能进行检索查找,如果专业词汇无法形成有效的检索式导致无法匹配出想要查询的文献,影响科研人员对系统的使用体验。
技术实现思路
1、本发明提供一种基于医疗科研信息的检索方法,方法可以解决传统编辑检索表达式困难和时间消耗大的问题。本发明的目的是提高用户的检索效率,减少用户编辑表达式的时间。
2、方法包括:
3、步骤一、获取用户输入的检索信息;
4、步骤二、基于大模型的自然语言处理方式对检索信息进行解析,解析出句子结构、词义关系和上下文信息,并提取出关键词信息;
5、其中,大模型包括:多个相同的编码器层,每个编码器层都包含自注意力机制和前馈神经网络;
6、自注意力机制的数学公式如下:
7、attention(q1, k1, v1) = softmax(q1×k1^t 1/ sqrt(d_k1)) * v1;
8、其中,q1、k1和v1分别表示查询、键和值的输入矩阵,d_k1表示注意力机制的维度;
9、前馈神经网络的数学公式如下:
10、ffn(x1) = max(0, xw_1 + b_1)w_2 + b_2;
11、其中,x1表示输入向量,w_1、b_1、w_2和b_2表示模型的参数;
12、大模型还包括:多个相同的解码器层,每个解码器层均包含自注意力机制和编码器-解码器注意力机制;
13、在大模型结构中,编码器层和解码器层之间的连接使用了残差连接和层归一化处理;
14、步骤三、获取用户设置在逻辑运算符,并基于用户设置的逻辑运算符将提取的关键词信息进行组合,配置成检索表达式;
15、步骤四、基于检索表达式与医疗科研文献数据库中的医疗科研文献进行匹配;
16、步骤五、将匹配出的医疗科研文献在用户界面上显示。
17、进一步需要说明的是,步骤二中基于大模型的自然语言处理方式对检索信息进行解析的方式还包括:
18、基于输入的自然语言文本切分成词语;
19、确定每个词语的词性,并提取出关键词信息。
20、进一步需要说明的是,步骤二中基于大模型的自然语言处理方式对检索信息进行解析的方式还包括:
21、分析检索信息中的句子结构,确定词语之间的依存关系,并提取出关键词信息。
22、进一步需要说明的是,步骤二中基于大模型的自然语言处理方式对检索信息进行解析的方式还包括:对用户输入的检索信息中的句子进行词法分析,并将句子切分成词语。
23、进一步需要说明的是,对句子进行词法分析包括:确定句子中词语之间的依存关系,并使用依存句法分析方式、或短语结构句法分析方式来实现。
24、进一步需要说明的是,逻辑运算符包括:与逻辑、或逻辑以及非逻辑。
25、进一步需要说明的是,步骤四还包括:医疗科研文献数据库中储存有多篇医疗科研文献;
26、每篇医疗科研文献配置有关键词标签;
27、基于检索表达式与医疗科研文献数据库中的关键词标签进行匹配;
28、将匹配出关键词标签所对应的医疗科研文献在用户界面上显示。
29、本发明还提供一种基于医疗科研信息的检索系统,系统包括:信息输入模块、信息解析模块、表达式配置模块、文献匹配模块以及文献展示模块;
30、信息输入模块,用于获取用户输入的检索信息;
31、信息解析模块,用于结合大模型的自然语言处理方式对检索信息进行解析,解析出句子结构、词义关系和上下文信息,并提取出关键词信息;
32、其中,大模型包括:多个相同的编码器层,每个编码器层都包含自注意力机制和前馈神经网络;
33、自注意力机制的数学公式如下:
34、attention(q1, k1, v1) = softmax(q1×k1^t 1/ sqrt(d_k1)) * v1;
35、其中,q1、k1和v1分别表示查询、键和值的输入矩阵,d_k1表示注意力机制的维度;
36、前馈神经网络的数学公式如下:
37、ffn(x1) = max(0, xw_1 + b_1)w_2 + b_2;
38、其中,x1表示输入向量,w_1、b_1、w_2和b_2表示模型的参数;
39、大模型还包括:多个相同的解码器层,每个解码器层均包含自注意力机制和编码器-解码器注意力机制;
40、在大模型结构中,编码器层和解码器层之间的连接使用了残差连接和层归一化处理;表达式配置模块,用于获取用户设置在逻辑运算符,并基于用户设置的逻辑运算符将提取的关键词信息进行组合,配置成检索表达式;
41、文献匹配模块,用于根据检索表达式与医疗科研文献数据库中的医疗科研文献进行匹配;
42、文献展示模块,用于显示检索过程信息以及将匹配出的医疗科研文献进行显示。
43、本发明还提供一种检索终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述基于医疗科研信息的检索方法的步骤。
44、从以上技术方案可以看出,本发明具有以下优点:
45、本发明涉及的基于医疗科研信息的检索方法中,用户通过自然语言表达的方式输入检索需求,界面将用户输入传递给大模型进行自然语言理解。大模型将用户输入转换成检索表达式,并将其传递给检索系统。检索系统根据检索表达式从数据库中检索相关的医疗科研文献和数据,并将结果返回给用户界面展示给用户。这样,用户无需编辑复杂的检索表达式,通过自然语言表达的方式进行检索,减少了用户的学习成本和编辑时间。而且本发明涉及的大模型具备自然语言理解能力,能够更准确地理解用户的意图,提高检索结果的相关性。用户友好的界面提供了更好的用户体验,使非专业人士也能够轻松进行检索。
1.一种基于医疗科研信息的检索方法,其特征在于,方法包括:
2.根据权利要求1所述的基于医疗科研信息的检索方法,其特征在于,步骤二中基于大模型的自然语言处理方式对检索信息进行解析的方式还包括:
3.根据权利要求1所述的基于医疗科研信息的检索方法,其特征在于,步骤二中基于大模型的自然语言处理方式对检索信息进行解析的方式还包括:
4.根据权利要求3所述的基于医疗科研信息的检索方法,其特征在于,步骤二中基于大模型的自然语言处理方式对检索信息进行解析的方式还包括:对用户输入的检索信息中的句子进行词法分析,并将句子切分成词语。
5.根据权利要求4所述的基于医疗科研信息的检索方法,其特征在于,对句子进行词法分析包括:确定句子中词语之间的依存关系,并使用依存句法分析方式、或短语结构句法分析方式来实现。
6.根据权利要求1所述的基于医疗科研信息的检索方法,其特征在于,逻辑运算符包括:与逻辑、或逻辑以及非逻辑。
7.根据权利要求1所述的基于医疗科研信息的检索方法,其特征在于,步骤四还包括:医疗科研文献数据库中储存有多篇医疗科研文献;
8.一种基于医疗科研信息的检索系统,其特征在于,系统实现如权利要求1至7任意一项所述的基于医疗科研信息的检索方法;
9.一种检索终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于医疗科研信息的检索方法的步骤。