一种调度命令的自动解析方法

文档序号:9667480阅读:541来源:国知局
一种调度命令的自动解析方法
【技术领域】
[0001]本发明涉及一种解析方法,尤其涉及一种调度命令的解析方法。
【背景技术】
[0002]机车行驶过程中,如果遇到线路或者其它方面的突发事件,为了保证运输秩序的正常运转,及时处理所辖区段内的突发情况,列车调度员代表铁道部或路局面向基层运输站段下达的调度命令,而调度命令是使用语言描述的包含很多无用信息的句子,机车无法直接识别。

【发明内容】

[0003]本发明要解决的技术问题在于提供一种将调度命令中的信息解析出来的方法,以解决现有技术存在的问题。
[0004]本发明采用以下技术方案:
一种调度命令的自动解析方法,包括:
在数据库中存储用户预先设置的相近词对照数据库和关键词/字数据库;
获取调度命令;
根据相近词对照数据库对调度命令中的相近词进行标准化;
根据关键词/字数据库对已经标准化的调度命令中的关键词/字进行提取,获取关键词所对应的调度信息,完成解析。
[0005]所述在数据库中还存储有用户预先设置的无用字数据库;
所述获取调度命令后,根据无用字数据库对调度命令进行清洗,然后再根据相近词对照数据库对清洗过的调度命令中的相近词进行标准化。
[0006]所述用户预先设置的相近词对照数据库包括多个相近词数据库和与每个相近词数据库中的相近词对应的标准词;
所述根据相近词对照数据库对去除无用字的调度命令中的相近词进行标准化是指:按照预先设定的分词规则对调度命令进行分词,遍历调度命令每一句中的所有单词,并依次与每个相近词数据库中的词进行对比查找出调度命令中的所有相近词,并将同一个相近词数据库中的相近词替换为与之对应的标准词。
[0007]所述数据库中还存储有用户预先设置的多个关键词/字组对照数据库,所述关键词/字组对照数据库包括关键词/字组数据库和与该关键词/字组数据库对应的调度命令所属业务类型。
[0008]所述根据关键词/句数据库对已经标准化的调度命令中的关键字进行提取以后,获取从一个调度命令中提取出的多个关键词或关键字,将这些关键词或关键字依次与每个关键词/字组对照数据库中的数据对比,获取匹配度最高的关键词/字组对照数据库,确定调度命令所属的业务类型,对不属于本业务类型的关键词进行去除,获取最终需要的关键
Tr] ο
[0009]本发明的有益效果:本发明可以将调度命令中所含有的关键信息快速准确的解析出来,形成仅包含关键信息并可以被机车识别的调度信息,方便后续对调度信息的处理。
【附图说明】
[0010]图1为本发明的实现流程图。
【具体实施方式】
[0011]如图1所示,本发明提供一种调度命令的自动解析方法,首先,用户需要收集历年发布的各种业务类型的调度命令,从调度命令中提取与各种业务类型的调度命令相关的关键字或者关键词,同时需要收集调度命令语句中出现的无用字,例如语气词或者“的” “了”等无用字,还需要收集调度命令中不规范的用词,即有标准词的多个代表同个意思的相近词,然后在计算机数据库中创建无用字数据库、相近词对照数据库和关键词/字数据库,作为对调度命令进行解析的依据。
[0012]具体对调度命令进行解析时,首先获取调度命令;然后可以先对调度命令按照标点进行分句;
遍历每一个分句中的字,与无用字数据库进行对比,如果句子中包含无用字数据库中的无用字,将句子中的无用字进行删除,达到对调度命令进行清洗的目的;当然,也可以在计算机的数据库中创建无用词数据库,对无用字进行清洗后,通过预先设定的分词规则的对语句进行分词,这种分词规则可以选择现有的对文本进行分词的方法,,使用无用词数据库中的无用词对调度命令进行清洗。
[0013]对清洗过的调度命令,则是对调度命令的各分词再次进行遍历,分词规则使用现有的分词规则进行,将调度命令中的各个分词和相近词对照数据库中的词进行对比,查找出调度命令中的所有相近词,并对调度命令中的相近词进行标准化;此过程中,用户预先设置的相近词对照数据库包括多个相近词数据库和与每个相近词数据库中的相近词对应的标准词,当在调度命令中查找到与某个相近词对照数据库中的某个词相同的词,那么将调度命令中的这个词替换为与该词所在的相近词对照数据库对应的标准词,方便对调度命令的统一。
[0014]替换完相近词的标准词后,再次对调度命令的各词或字进行遍历,并将调度命令中的每个词或字关键词/字数据库对比,假如遇到与关键词/字数据库中的词相同的词,提取出作为调度命令的关键词,获取只包含关键字的调度命令,完成解析。
[0015]实际实施过程中,通常可以从一个调度命令中提取出多个关键词或者字,而对于调度命令所述的业务类型来说,多个关键词对应于一个业务类型,因此,数据库中还应存储用户预先设置的关键词/字组对照数据库,关键词/字组对照数据库包括关键词/字组数据库和与该关键词/字组数据库对应的调度命令所属业务类型,这些关键词/字组数据库中的关键词或者关键字按照用户预设的顺序进行排序,当获取了调度命令的多个关键字后,与多个关键词/字组数据库中的词或者字进行对比,包含调度命令的多个关键字最多的关键词/字组数据库所对应的业务类型,为本次调度命令所代表的数据类型,然后根据关键词或者关键字所对应的顺序进行重新排序,获取重新排序后的关键词所对应的调度信息,完成解析。
[0016]或者在存储关键词/字数据库时,将数据进行分组存储,每组代表一个业务类型的关键字或者关键词。当获取关键词或者关键字后,关键词或者关键字所对应的信息即为需要解析出的调度信息,通常调度信息为字母或者数字,它根据关键词所属的类型进行不同方式的提取,例如对于含有“2015年12月12日”句子的调度命令,它的关键词为“年、月、日”,此时需要根据数据库中预存的关键字所属类型判断它属于一个日期类型,因此此时需要判断它的前面或者后面的数字或者汉字哪个是具体的年月日的日期,将数字的日期提取出来存储为不含有汉字的日期格式,如果是汉字形式的日期,如“二零一五年十二月十二日”,那么需要将汉字解析为数字日期存储。而对于不含数字或字母的调度命令中的语句,需要关联到它所属的LKJ基础数据的数据库中获取关键词所对应的数字或者字母编号,例如调度命令中的语句为“京九线,起始公里表A,终止公里标B,限速C”,此种类型的调度命令中,因为调度员通常仅仅告知线名,因此获取关键词“京九线”以后,根据数据库对应关系判断它属于一个线路,需要关联到LKJ基础数据的数据库中获取关键词所对应的线号,将线号提取出来作为做为最终解析出来的信息。
【主权项】
1.一种调度命令的自动解析方法,其特征在于,包括: 在数据库中存储用户预先设置的相近词对照数据库和关键词/字数据库; 获取调度命令; 根据相近词对照数据库对调度命令中的相近词进行标准化; 根据关键词/字数据库对已经标准化的调度命令中的关键词/字进行提取,获取关键词所对应的调度信息,完成解析。2.根据权利要求1所述的一种调度命令的自动解析方法,其特征在于: 所述在数据库中还存储有用户预先设置的无用字数据库; 所述获取调度命令后,根据无用字数据库对调度命令进行清洗,然后再根据相近词对照数据库对清洗过的调度命令中的相近词进行标准化。3.根据权利要求1所述的一种调度命令的自动解析方法,其特征在于: 所述用户预先设置的相近词对照数据库包括多个相近词数据库和与每个相近词数据库中的相近词对应的标准词; 所述根据相近词对照数据库对去除无用字的调度命令中的相近词进行标准化是指:按照预先设定的分词规则对调度命令进行分词,遍历调度命令每一句中的所有单词,并依次与每个相近词数据库中的词进行对比查找出调度命令中的所有相近词,并将同一个相近词数据库中的相近词替换为与之对应的标准词。4.根据权利要求1所述的一种调度命令的自动解析方法,其特征在于:所述数据库中还存储有用户预先设置的多个关键词/字组对照数据库,所述关键词/字组对照数据库包括关键词/字组数据库和与该关键词/字组数据库对应的调度命令所属业务类型。5.根据权利要求1或4所述的一种调度命令的自动解析方法,其特征在于:所述根据关键词/句数据库对已经标准化的调度命令中的关键字进行提取以后,获取从一个调度命令中提取出的多个关键词或关键字,将这些关键词或关键字依次与每个关键词/字组对照数据库中的数据对比,获取匹配度最高的关键词/字组对照数据库,确定调度命令所属的业务类型,对不属于本业务类型的关键词进行去除,获取最终需要的关键词。
【专利摘要】一种调度命令的自动解析方法,包括:在数据库中存储用户预先设置的相近词对照数据库和关键词/字数据库;获取调度命令;根据相近词对照数据库对调度命令中的相近词进行标准化;根据关键词/字数据库对已经标准化的调度命令中的关键词/字进行提取,获取关键词所对应的调度信息,完成解析。本发明可以将调度命令中所含有的关键信息快速准确的解析出来,形成仅包含关键信息并可以被机车识别的调度信息,方便后续对调度信息的处理。
【IPC分类】G06F17/30
【公开号】CN105426531
【申请号】CN201510950254
【发明人】李辰煊, 李志民, 宋社平
【申请人】河南思维自动化设备股份有限公司
【公开日】2016年3月23日
【申请日】2015年12月18日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1