基于医学同义词在线编辑检索系统的制作方法

文档序号:20189465发布日期:2020-03-27 19:30阅读:636来源:国知局
基于医学同义词在线编辑检索系统的制作方法

本发明涉及的是一种信息处理领域的技术,具体涉及一种迭代自更新的医学同义词在线编辑检索系统。



背景技术:

现有的人工智能在上面提到的图像分类、语音识别、知识问答、人机对弈、无人驾驶等领域都有不错的发展。而医疗领域,国内外的企业也有尝试和研究,诸如ibm的waston项目。但是在中国如果想发展借助人工智能的技术发展到医学领域,首先面临的问题就是医学非结构化文本的处理和知识关系的提取问题。这个问题加上中文本身语言的复杂性使得各种工作的开展遇到的非常大的阻力。

具体来说,人工智能在医学领域的发展需要建立在一个正确的范围广的中文医学知识库的基础上,而在中文医学同义词这个领域,受限于中文语言的复杂性和医学词汇的专业性以及中西医观点的异同,在推进中文医学同义词的标准化和利用中文医学同义词的方便性和准确性上缺乏准确好用的工具支持和内容支持。



技术实现要素:

本发明针对现有技术存在的上述不足,提出一种基于医学同义词在线编辑检索系统,满足人工智能在医疗领域上会遇到的中文医学知识、名字、实体的同义词和近义词的需要和检索,从而进行更进一步的分析和研究。开发者则可以通过api的形式,快速的获取一个集合的所有实体或者名词的同义词和近义词,进行快速分析和后续使用。过设计的迭代检索整合算法,用户可以通过网站和api接口的方式进行对医学同义词的检索编辑和整合。对于一般用户,可以采用网站浏览的形式,简单直观的看到一个医学名词相关的同义词和近义词,显著提升了工作效率和降低了人工筛查同义词的工作量,并提升了整体词库的准确性。

本发明是通过以下技术方案实现的:

本发明包括:同义词整合模块、数据库模块和服务器模块,其中:同义词整合模块与服务器模块相连并批量传输检索结果信息,同时提供针对开发人员定制的外部接口,数据库模块与同义词整合模块相连保存同义词整合模块提取的同义词信息也能传输检索的同义词信息,服务器模块与同义词整合模块相连并发起信息检索的请求和接受同义词整合模块传来的信息。

技术效果

与现有技术相比,本发明提供了带有自动整合和扩充中文医学同义词的一个中文医学同义词的服务器架构;由此产生技术效果包括:

1.在添加或者编辑医学同义词条的时候能够从知识源中自动获取其相关的所有医学同义词。省去了传统医学同义词库构建人工对添加词汇的扩充和归类工作。

2.同义词整合模块将上一步获取的同义词和整个同义词库进行整合,对已有的同义词库进行订正和合并。这一步可以自动连结之前同义词库没能发现的联系,对研究过程接下来的构建知识库关系-实体的过程意义重大,同时也能提升同义词库的精度和准度。

附图说明

图1为本发明系统示意图;

图2为实施例应用场景示意图;

图3至图5为实施例效果示意图。

具体实施方式

如图1所示,为本实施例涉及一种用到网络爬虫、web技术,使用elasticsearch非关系型数据库的迭代自更新的医学同义词在线编辑检索系统,包括:同义词整合模块、数据库模块和服务器模块,其中:同义词整合模块与服务器模块相连并批量传输检索结果信息,同时提供针对开发人员定制的外部接口,数据库模块与同义词整合模块相连保存同义词整合模块提取的同义词信息也能传输检索的同义词信息,服务器模块与同义词整合模块相连并发起信息检索的请求和接受同义词整合模块传来的信息。

所述的同义词整合模块从开源知识库中检索和整合添加或编辑后的单个医学词的全部同义词,并在判断各个词条之间是否冲突后进行词条合并,该模块包括:同义词提取单元、同义词整合单元和同义词缓冲单元,其中:同义词提取单元从已有的医学中心词和多个开源知识库提取医学相关的词条提取和整合得到医学同义词表;同义词整合单元针对日常业务的增删改查的情形,同步实现对本身的同义词库的词条进行动态调整,保证词条不因为业务修改部分词条而导致同义词库出现重复或者错误;同义词缓冲单元对同义词任务进行定期缓存以防止高频网络攻击和污染词库。

所述的数据库模块包括:同义词curd接口、同义词批量查询单元、restful接口和同义词评分单元,其中:同义词curd接口对基本的同义词增删改查,供开发者使用的同义词批量查询单元与同义词整合模块相连并发起批量查询的请求,批量查询的restful接口与同义词检索模块相连通过get/post等方式发起请求并接受传输的同义词信息,用于检索结果时候的评分排序的同义词评分单元与数据库模块相连根据检索词对输出结果进行评分排序然后传输给同义词整合模块信息,对于查询和检索内容有一定特征的医学领域同义词,特化改进的一个同义词评分工具。

所述的服务器模块包括:基于flask框架的服务器和基于bootstrap框架的交互单元,其中:基于flask框架的服务器与数据库模块和同义词模块的交互并对整个医学同义词在线编辑检索平台的日常业务及数据的维护;基于bootstrap框架的交互单元作为服务器的前端架构用于显示样式以及和用户进行交互的界面并传输用户信息给flask服务器。

经过具体实际实验,在ubuntu16的服务器配置并启动的的具体环境设置下,以正常参数启动医学同义词在线检索编辑系统,以搜索aids为例,对于最初构建的同义词库,搜索结果如图3所示。

而作为工作人员注意到检索结果的第二个词条和第一个词条表示的意思应该一样,这个时候只需在第一个词条aids里添加”hiv/aids”同义词,即可得到如图4所示结果。

之前的词条”hiv/aids”已经消失,而”aids”词条包括的内容也发生了变化,这是本系统的迭代自更新产生的结果,在已有的词条进行添加和编辑的时候,它会从网络上爬取筛选编辑词或添加词的同义词并对整个同义词库进行整合、更新已有的同义词库,并返回结果,可以在详情页里得到如图5所示结果:添加的”hiv/aids”词条已经添加进原本的”aids”词条,并且包含了根据该词在网络上的新的同义词。

与现有技术相比,当发生编辑或添加同义词操作后,本系统能够自动爬取整合网路上的相关的同义词资源并将其进行迭代更新和整合,一是减少了人工合并的成本,而是提升了该同义词库的准确性和可靠性,并保留了这个知识库的可拓展性,使得其能够不断更新更加准确。为智慧医疗领域的研究和发展提供了一个可靠的帮助。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1