一种基于贝叶斯文本分类模型的辅助挂号方法

文档序号:6550082阅读:595来源:国知局
一种基于贝叶斯文本分类模型的辅助挂号方法
【专利摘要】本发明提出一种基于贝叶斯文本分类算法的辅助挂号方法,该方法包括:获取症状主诉文本数据并对数据进行预处理;将预处理后的数据利用贝叶斯文本分类算法进行训练;再对训练完毕的挂号辅助分类模型进行评估,最后将性能达到要求的模型应用于网络预约辅助挂号中。其中,利用贝叶斯理论训练的过程中,针对症状主诉数据的特点,从两方面进行了优化,一方面是利用核心症状词表在计算向量权重时赋予绝对权重,另一方面是利用疾病大类和特点,采用分层的贝叶斯模型进行训练。本发明通过训练症状主诉文本数据,获得挂号辅助分类模型,在疾病咨询和挂号咨询等典型场景下,提高了针对患者输入的处理能力。
【专利说明】一种基于贝叶斯文本分类模型的辅助挂号方法
【技术领域】
[0001]本发明涉及一种基于贝叶斯文本分类模型的辅助挂号方法【背景技术】
[0002]随着计算机软硬件性能的不断提升,人们更加期望计算机能够提供更加智能的人机交互方式,特别是在网络预约和用户自助挂号方面,通过对医疗领域文本数据的挖掘,可以辅助网络用户自助挂号,提高门诊效率。这种机器自动化辅助挂号功能的实现,底层都需要有文本挖掘技术的支持,文本挖掘技术的优劣,直接决定了系统性能的高低,也决定了人机交互效果的好坏。
[0003]要实现辅助挂号功能,核心是一个基于患者症状主诉文本数据的分类模型,要建立这个模型,首先要对获得的文本数据进行预处理,然后预处理后的数据用向量空间模型进行表示,再进行特征抽取,选出具有代表性的特征词,最后用朴素贝叶斯分类理论训练,获得辅助挂号模型。
[0004]目前,贝叶斯文本分类技术通常应用于web文本分类,判断网页内容属于哪一大类,这部分技术已经相对成熟,能够很好地完成网页信息的自动分类,然而,这一成熟的技术在医疗领域的应用很少,随着各大医院文本数据剧烈增涨,急需一些成熟的文本挖掘技术对这部分数据进行处理,获取有用的信息和知识。
[0005]贝叶斯理论有着坚实的概率论和数据统计基础,假设c = Ic1, c2,...,cn}是η个不同类别的集合,给定一个未知类别属性的样本Α,Ρ㈧是A的先验概率,P(Ci)是Ci的先验概率。P(AlCi)是假设类别Ci成立时样本A发生的概率,而我们需要的是给定一个训练样本A时Ci成立的后延概率,即P(Ci |Α)。由贝叶斯公式可得:
【权利要求】
1.一种基于贝叶斯文本分类模型的挂号辅助方法,包括: 对获得的症状主诉文本数据进行预处理; 根据预处理后的数据,训练获得挂号辅助模型; 对得到的挂号辅助分类模型进行评估; 将评估达到要求的模型应用到网络预约挂号系统中进行辅助挂号; 其中,挂号辅助模型是利用贝叶斯文本分类算法训练获得,并根据症状主诉文本数据特征进行了优化。
2.根据权利要求1所述的方法,其中对获得的症状主诉文本数据进行预处理步骤还包括: 中文分词和去停用词,其中中文分词利用症状词表,针对症状主诉文本数据对分词器性能进行优化;去停用词则利用针对疾病主诉文本数据建立的常见停用词表,去掉不具有辨别力的词。
3.根据权利 要求1所述的方法,其中根据预处理后的数据,训练获得挂号辅助模型还包括: 根据改进的tf-1df公式对每种疾病向量关键词赋予权重; 根据疾病典型症状词表,为每种疾病的典型症状词赋予绝对权重; 利用分层的贝叶斯算法对加权文本向量进行训练。
4.根据权利要求1所述的方法,对得到的挂号辅助模型进行评估还包括:利用准确率、召回率和F值评价指标和3-折交叉验证的方法建立评估模型,对该模型性能进行评估。
5.根据权利要求1所述的将评估达到要求的挂号辅助模型应用到挂号系统中进行辅助挂号还包括,根据患者输入的主诉症状数据,推荐其对证的专科专家,指导其就医。
6.根据权利要求5所述的模型应用,还包括: 对患者输入的主诉症状进行分词,去停用词,根据症状词表和停用词表抽取具有鉴别力的关键词,并建立关键词向量,再根据keyword表给向量中的词赋予权重,最后根据贝叶斯概率模型,计算各类疾病的概率,获取概率最大的前5条疾病列表,再进行专科专家匹配。
7.根据权利要求3所述的分层贝叶斯算法还包括: 利用疾病大类和疾病所属科室将分类过程划分层次,即先推荐挂号科室和疾病大类,如果仍具有辨别力,再进一步对证的专科专家,如果不具有辨别力,则仅返回疾病大类和科室,不再做进一步分类。
【文档编号】G06F19/00GK104021302SQ201410273989
【公开日】2014年9月3日 申请日期:2014年6月18日 优先权日:2014年6月18日
【发明者】崔晓艳, 王枞, 徐冉, 韩旭, 古恒 申请人:北京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1