一种中文手术操作信息的自动编码方法及系统的制作方法_2

文档序号:9350055阅读:来源:国知局
>[0067] 假定分类术语具有一一对应的标准术语,假定分类术语的编码为其对应的标准术 语的编码。根据ICD-9-CM-3的规定,若该特定型治疗手段针对的疾病为发病部位的非恶性 肿瘤,则假定分类术语对应的标准术语为发病部位的病损切除术;若该特定型治疗手段针 对的疾病为发病部位的恶性肿瘤且不需要做器官移植,则假定分类术语对应的标准术语为 发病部位的全切除术;若该特定型治疗手段针对的疾病为发病部位的恶性肿瘤且未做器官 移植不适合全切,则假定分类术语对应的标准术语为发病部位的部分切除术。
[0068] 本实施例中,还可以实时修订假定分类术语库,例如,增加新的假定分类术语,或 删除已有的假定分类术语,以使假定分类术语库更符合ICD-9-CM-3编码的需要。
[0069] 例如,表2所示为假定分类术语库包含的部分假定分类术语及其对应的标准术语 和编码。
[0070] 表 2
[0072] 如表2所示,特定型治疗手段"肝癌根治术"针对的疾病为肝部的恶性肿瘤且不适 合做器官移植,则对应的标准术语为"肝部分切除术"。
[0073] 再如表2所示,特定型治疗手段"肝囊肿切除术"针对的疾病为肝部的非恶性肿 瘤,则对应的标准术语为"肝病损切除术"。
[0074] 再如表2所示,特定型治疗手段"胃癌切除术"针对的疾病为胃部的恶性肿瘤且需 要做器官移植,则对应的标准术语为"根治性胃切除术"。
[0075] 实施例二
[0076] 如图4所示,为一种具体的中文手术操作信息的自动编码方法,包括:
[0077] 步骤S301,输入中文手术操作信息。
[0078] 步骤S302,对中文手术操作信息进行自然语言处理,得到一个或多个待编码名称。
[0079] 步骤S303,基于预先建立的标准术语库、扩充术语库和多编码术语库,查找与待编 码名称相匹配的标准术语、扩充术语或多编码术语,并将匹配成功的标准术语、扩充术语或 多编码术语的编码,确定为待编码名称的编码。
[0080] 本实施例是在示例性方法中增加了多编码术语库,该多编码术语库包括若干多编 码术语及其编码。
[0081] 多编码术语为特定型手术操作类型;特定型手术操作类型执行的前提是另一种手 术操作类型;特定型手术操作类型及另一种手术操作类型为标准术语或扩充术语;
[0082] 多编码术语的编码为特定型手术操作类型的编码及另一种手术操作类型的编码 的组合。
[0083] 实际临床中,如果医生书写了一个手术操作名称,该手术操作执行的前提是另一 个手术操作,那么该手术操作名称就属于多编码术语。
[0084] 本实施例中,还可以实时修订多编码术语库,例如,增加新的多编码术语,或删除 已有的多编码术语,以使多编码术语库更符合ICD-9-CM-3编码的需要。
[0085] 例如,表3所示为多编码术语库包含的部分多编码术语及其对应的标准术语和编 码。
[0086] 表 3
[0087]
[0088] 实施例三
[0089] 如图5所示,为一种具体的中文手术操作信息的自动编码方法,包括:
[0090] 步骤S401,输入中文手术操作信息。
[0091] 步骤S402,对中文手术操作信息进行自然语言处理,得到一个或多个待编码名称。
[0092] 步骤S403,基于预先建立的合并术语库,对待编码名称进行预处理。
[0093] 合并术语库包括若干合并术语及其编码;其中,合并术语为国际疾病分类ICD规 定的可以替代至少两个同时出现的其他标准术语的单个标准术语;至少两个同时出现的其 他标准术语为该合并术语的合并对象;合并术语库还包括每一个合并术语的全部合并对 象。其中,合并术语不同于其对应的任意一个合并对象。
[0094] 临床上医生可能会在一个病案中书写多个手术操作名称,根据I⑶-9-CM-3的规 定,这些手术操作名称可以归为一个手术操作名称,即以上多个手术操作名称实际为一个 手术操作名称的多个步骤。
[0095] 本实施例中,还可以实时修订合并术语库,例如,增加新的合并术语,或删除已有 的合并术语,或修改合并对象,以使合并术语库更符合ICD-9-CM-3编码的需要。
[0096] 表4为合并术语库包括的一项合并术语及其编码以及全部合并对象。
[0097]表 4
[0100] 步骤S403具体为:判断一个或多个待编码名称中,是否包含任意一个或多个合并 术语的全部合并对象,若包含,则将任意一个或多个合并术语的全部合并对象替换成对应 的合并术语。
[0101] 步骤S404,基于预先建立的标准术语库和扩充术语库,查找与待编码名称相匹配 的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为待编码名称 的编码。
[0102] 实施例四
[0103] 如图6所示,为一种具体的中文手术操作信息的自动编码方法,包括:
[0104] 步骤S501,输入中文手术操作信息。
[0105] 步骤S502,对中文手术操作信息进行自然语言处理,得到一个或多个待编码名称。
[0106] 步骤S503,基于预先建立的省略术语库,对待编码名称进行预处理。
[0107] 省略术语库包括若干省略术语及其编码;其中,省略术语为ICD-9-CM-3规定的可 以替代至少两个同时出现的标准术语的单个标准术语;省略术语是至少两个同时出现的标 准术语中的一个;至少两个同时出现的标准术语为该省略术语的省略对象;省略术语库还 包括每一个省略术语的全部省略对象;
[0108] 病案中当某些手术操作名称同时出现时,有的手术操作是其他手术操作的先行手 术,根据ICD-9-CM-3的规定,其中一些对应的手术操作名称无需编码。
[0109] 本实施例中,还可以实时修订省略术语库,例如,增加新的省略术语,或删除已有 的省略术语,或修改省略对象,以使省略术语库库更符合ICD-9-CM-3编码的需要。
[0110] 表5为省略术语库包括的一项省略术语及其编码以及全部省略对象。
[0111]表 5
[0113] 步骤S503具体为:判断一个或多个待编码名称中,是否包含任意一个或多个省略 术语的全部省略对象,若包含,则将任意一个或多个省略术语的全部省略对象替换成对应 的省略术语。
[0114] 步骤S504,基于预先建立的标准术语库和扩充术语库,查找与待编码名称相匹配 的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为待编码名称 的编码。
[0115] 实施例五
[0116] 如图7所示,为一种具体的中文手术操作信息的自动编码方法,包括:
[0117] 步骤S601,输入中文手术操作信息。
[0118] 步骤S602,对中文手术操作信息进行自然语言处理,得到一个或多个待编码名称。
[0119] 步骤S603,基于预先建立的标准术语库和扩充术语库,查找与待编码名称相匹配 的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为待编码名称 的编码。
[0120] 该完成了查找与待编码名称相匹配的标准术语或扩充术语这一过程,该过程中有 可能查找不到待编码名称相匹配的标准术语或扩充术语。这是因为本体词典中的本体(不 论是标准术语还是扩充术语)均是手术操作名称相关的词语,然而实际的中文手术操作信 息中往往会涉及医疗领域的多种概念,不仅仅是手术操作名称,还可能涉及疾病名称(例 如"胸骨骨折链枷胸")、药品名称(例如"西替利嗪")、医疗耗材名称(例如"弹性假牙 龈")等,但本发明只是对手术操作名称的编码,因此,若中文手术操作信息中出现了疾病名 称、药品名称、医疗耗材名称等,本发明可以选择对其不予编码。另外,实际的中文手术操 作信息还可能包括一些虽然是表示手术操作信息,但却并不能确定具体对应于何种手术操 作名称的词语,例如有些不符合ICD-9-CM-3分类体系,不能确定其具体对应的手术操作名 称。例如"磨削术",虽然表示手术操作名称,但其概念太泛,无法确定具体是什么部位消磨 术,是面部磨削术、颧骨磨削术还是激光磨削术;再比如,"变性术"虽然表示手术操作名称, 但具体是男变女性尿道移位成形术还是男变女性阴道再造术也无法确定。
[0121] 考虑到以上问题,本发明示例性方法还预先设定一无编码术语库,该无编码术语 库包括若干无编码术语。这些无编码术语包括:预设的用于表示手术操作信息、但无法确定 手术操作名称的词语;预设的疾病名称;预设的药品名称;以及预设的医疗耗材名称。
[0122] 例如,表6所示为无编码术语词典包括的部分无编码术语。
[0123] 表 6
[0124]
[0125] 步骤S604,将未确定编码的待编码名称与无编码术语库中的无编码术语进行匹 配,若匹配成功,则执行预设的处理步骤以表示不对该未确定编码的待编码名称进行编码, 若匹配失败,则将该未确定编码的待编码名称发送至人工处理平台进行人工处理。
[0126] 其中,对于未查找到相匹配的标准术语或扩充术语的待编码名称,若能查找到相 匹配的无编码术语,则说明其属于表示手术操作信息但无法确定手术操作名称的词语、疾 病名称、药品名称、医疗耗材名称中的一种,不予编码,而对于不能查找到相匹配的无编码 术语的待编码名称,说明其不属于上述类型,对于这类待编码名称,本实施例将其发送给人 工处理平台,由人工继续处理,具体处理过程,本发明对其不作限定。
[0127] 实施例六
[0128] 如图8所示,为适用于本发明示例性方法的一种对中文手术操作信息进行自然语 言处理以得到待编码名称的【具体实施方式】,包括:
[0129] 步骤S71,对中文手术操作信息字符串进行预处理,得到预处理后的中文手术操作 信息字符串。
[0130] 该步骤的目的是将中文手术操作信息字符串中的字符转换成统一的编码格式,以 便后续处理。
[0131] 可选地,该步骤可以按照如下具体方式实施:对中文手术操作信息字符串中的非 汉字进行格式归一化处理(例如,将中文手术操作信息字符串中的符号全部转换为半角格 式或全部转换为全角格式,将其中的英文字母全部转换为大写格式或小写格式);并删除 中文手术操作信息字符串中的非医学术语。其中非医学术语由一预先建立的非医学术语词 典提供,且非医学术语为起备注作用的词语、短语或描述性语句(例如"开检查"、"补急诊记 账"、"床位费超标自费"、"超过一个月加收,不足一个月按月收"、"儿科加收"等)。
[0132] 步骤S72,基于预先建立的本体词典、方位词典、等级词典,将预处理后的中文手术 操作信息字符串切分成若干第一类型子字符串和/或第二类型子字符串。
[0133] 其中,第一类型子字符串能够与本体词典中的本体直接匹配,第二类型子字符串 不能够与本体词典中的本体直接匹配。切分出的第一类型子字符串和第二类型子字符串具 有独立语义,即所表示的手术操作项目信息不受其之前或之后的字符影响。
[0134] 本体词典包括前述标准术语库和扩充术语库,如表1所示,具体包括若干本体
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1