一种仿真文本病历的生成方法及系统与流程

文档序号:16260105发布日期:2018-12-14 21:26阅读:来源:国知局

技术特征:

技术总结
一种仿真文本病历的生成方法及系统,采用原始病历生成正样本,生成器每次循环以上一次循环输出的词向量和疾病标签向量为输入,输出新的词向量,重复多次生成由多个词向量组成的句子。每生成一个词向量,以已生成词向量序列为初始状态,重复运行生成器采样,生成多个句子,判别器对所有句子的奖励值取平均值,作为该次的词向量的奖励值,根据得到的句子和词向量的奖励值更新生成器,如此反复直至收敛。收敛的生成器生成负样本,与正样本组成混合病历数据集,以疾病标签向量和词向量序列为输入,得到每一病历来自真实病历的概率,更新判别器,如此反复直至收敛。本发明避免涉及病人隐私,仿真文本病历可辅助其它机器学习任务,方便对该疾病的研究。

技术研发人员:张学工;关嘉麒;闾海荣
受保护的技术使用者:清华大学
技术研发日:2018.06.12
技术公布日:2018.12.14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1