本申请涉及天然药材信息处理与应用领域,尤其涉及一种用于获取天然药材专域知识的系统。
背景技术:
1、天然药材 (natural medicinal material,nmm) 长期以来被公认为是一种强有力的治疗剂库,其重要性体现在它们所产生的化合物的多样性和生物学相关性上。这些化合物在应对各种病理条件方面起着关键作用,涵盖了从传染病到癌症的广泛范围,并继续作为新药物先导的丰富来源。此外,天然药材在全球范围内,如中国、印度和阿拉伯地区,都有着广泛的临床应用历史,证明了它们在全球医疗保健格局中持久的相关性。尽管它们对医疗保健做出了重大贡献,但由于天然药材自身的复杂性,例如即使物种基源和药用部位均相同,仅炮制方法不同,实际上也对应于不同的天然药材,然而由于其在名称上通常不进行严谨的区分,在利用惯常使用的互联网检索工具,或在现有的数据库中进行信息检索时,往往只能获取片面甚至是错误的知识。
2、以“麻黄”为例,在《中国药典(2020年版)》中详细记载了术语“麻黄”是指源自几个不同物种的天然药材,具体包括ephedra sinica(植物草麻黄)、ephedra intermedia(植物中麻黄)或ephedra equisetina(植物木贼麻黄),而在试图通过互联网搜索引擎查询“mahuang”或“ephedra”来寻求关于“麻黄”的专域知识时,往往只能得到不完整或误导性的条目,例如“ephedra is a medicinal preparation from the plant ephedra sinica”。此外,在天然药材的相关的知识未能按照权威、严谨的方式对应存储的基础上,以互联网搜索为基础的现有的基于对话的平台在获取天然药材专域知识方面不仅并无助益,甚至可能加剧上述不准确之处,例如这些平台可能以肯定的语气断言ephedra sinica是ephedra的单一物种基源,专域知识获取的不正确或不精确,对天然药材科学研究造成了很大的障碍,也必然会损害学术结论的可靠性和有效性,甚至阻碍该领域的研究进展。
3、由此可见,目前的现有技术中尚未发现能够使得包括领域内的专业人员在内的各类用户便利、高效、智能化地获取准确、标准化且全面的天然药材领域相关知识的工具。
技术实现思路
1、提供了本申请以解决现有技术中存在的上述问题。
2、需要一种用于获取天然药材专域知识的系统,能够使得包括领域内的专业人员在内的各类用户便利、高效、智能化地获取准确、标准化且全面的天然药材领域相关知识。
3、根据本申请的第一方案,提供一种用于获取天然药材专域知识的系统,所述系统包括对话应用程序、第一学习模型、搜索引擎和天然药材专域知识库,所述对话应用程序被配置为:为用户提供用户交互界面,接收用户在所述用户交互界面上输入的对话信息,所述对话信息包含意图获取天然药材专域知识的用户提问;并且向用户呈现由第一学习模型生成的所述用户提问的回答;所述第一学习模型被配置为:基于与所述用户的对话历史,判断所述对话历史是否足以回答最新的用户提问;在判断所述对话历史足以回答最新的用户提问的情况下,基于所述对话历史生成对所述最新的用户提问的回答;在所述第一学习模型判断所述对话历史不足以回答最新的用户提问的情况下,对包含所述最新的用户提问的对话信息进行第一处理,并利用第一处理后的对话信息与所述搜索引擎交互;所述搜索引擎被配置为:基于所述第一处理后的对话信息,采用基于共指的图搜索、向量搜索和全文搜索中的至少一种来对所述天然药材专域知识库进行信息检索以获取与最新的用户提问相关联的背景知识,将所述背景知识嵌入所述用户的对话信息,以生成由各轮对话信息与对应的背景知识共同组成的对话历史,并将所述对话历史返回给所述第一学习模型。
4、根据本申请实施例的用于获取天然药材专域知识的系统,通过将专用于天然药材专业领域的对话应用程序、学习模型、搜索引擎和专域知识库结合应用,为用户提供了用于获取天然药材专域知识的专用系统,能够为用户提供对话的方式的友好界面,并能够智能化地精准获取其所需要的权威、准确、标准化且全面的天然药材专域知识,使得天然药材领域的科学研究具有一致的理解和统一的知识基础,从而保证学术结论的有效性和可信度,进而促进该领域研究的健康发展。
5、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
1.一种用于获取天然药材专域知识的系统,其特征在于,所述系统包括对话应用程序、第一学习模型、搜索引擎和天然药材专域知识库,
2.根据权利要求1所述的系统,其特征在于,所述对话应用程序被进一步配置为:在所述用户交互界面上为用户提供对话引导信息,其中,所述对话引导信息包括示例提问以供用户通过点击来查看所述示例提问的回答。
3.根据权利要求1或2所述的系统,其特征在于,所述对话信息为自然语言形式的对话信息。
4.根据权利要求3所述的系统,其特征在于,所述对话信息为不同语言的自然语言形式的对话信息。
5.根据权利要求1或2所述的系统,其特征在于,所述对话应用程序被进一步配置为:
6.根据权利要求5所述的系统,其特征在于,所述回答的语言至少包括中文和英文。
7.根据权利要求5所述的系统,其特征在于,所述回答的格式至少包括json。
8.根据权利要求1或2所述的系统,其特征在于,所述对话信息为多轮,所述对话应用程序被进一步配置为:
9.根据权利要求1或2所述的系统,其特征在于,所述对话应用程序被进一步配置为:对与天然药材、中药材或中医药不相关的用户问题不提供回答。
10.根据权利要求1或2所述的系统,其特征在于,所述对话应用程序被进一步配置为:
11.根据权利要求1或2所述的系统,其特征在于,所述对话应用程序被进一步配置为:
12.根据权利要求1或2所述的系统,其特征在于,所述对话应用程序被进一步配置为:用户通过访问网页的方式调用所述对话应用程序。
13.根据权利要求1或2所述的系统,其特征在于,所述天然药材专域知识库被配置为包含天然药材系统命名、结构化且标准化的天然药材知识、天然药材术语、天然药材关系集合和天然药材相关文本,其中,
14.根据权利要求13所述的系统,其特征在于,
15.根据权利要求13所述的系统,其特征在于,所述天然药材专域知识库被进一步配置为:将所述天然药材知识存储为由多个切片数据组成的切片数据集,并将各个切片数据对应的第一向量嵌入表示存储到向量数据库中,并且其中各个切片数据关联有对应的共指主词;
16.根据权利要求13所述的系统,其特征在于,所述天然药材专域知识库被进一步配置为:预先定义用于全文搜索的索引字段,将所述天然药材专域知识存储为具有各个索引字段的倒排索引的可搜索文档;
17.根据权利要求16所述的系统,其特征在于,所述搜索引擎被进一步配置为,在采用全文搜索对所述天然药材专域知识库进行信息检索的情况下: