一种基于神经网络的路况信息提取方法与流程

文档序号:19947113发布日期:2020-02-18 09:37阅读:420来源:国知局
一种基于神经网络的路况信息提取方法与流程
本发明涉及一种基于神经网络的路况信息提取方法,属于智能语义、语音识别领域。
背景技术
:随着经济发展,城市车辆增多,城市交通拥堵的问题日益严重,市民出行时对良好的交通道路规划需求迫切,而道路交通信息的采集是其重要基础。道路交通信息采集主要分为交通流信息的采集及交通事件的采集。前者的采集方法主要有浮动车交通信息采集、视频监控系统、基于微波、雷达等感应器的采集系统、通过移动app等方式搜集客户出行信息等,时效性及准确性已经达到较高的水平。但后者的采集涉及到道路上的交通事故、道路施工、交通管制、自然灾害等各种情况,具有突发性、多样性、复杂性等特点,难以通过机器来采集。目前的采集方式主要是通过用户上报采集。据统计,2016年实时交通动态事件采集中有80%以上来自于用户上报。此外还可以通过网络爬虫(交管局网站、微博)、交通广播语音转译获取的文本信息进行提取。对于结构化的文本,机器已经可自行处理。对于非结构化(多为口语化)的文本,如语音识别数据,微博文本数据等,需要进行语义理解提取出正确的地点描述信息、事件类型、发生时间等。近年来深度神经网络及其相关技术在图像处理、语音识别和自然语言处理等方面迅猛发展。对路况信息文本作信息提取,是一个复杂的自然语言处理问题。深度神经网络中的gru(gatedrecurrentunit)和attention机制在一系列自然语言处理任务,包括中文分词、文本分类、命名实体识别、实体关系抽取、词向量表示等任务的应用极大的提高了相关任务的指标。本发明在路况信息提取系统中应用了上述深度神经网络技术。非结构化的文本数据具有口语描述方式复杂多样、多条路况信息的地点描述和事件描述混杂、需要结合外部地理信息理解等。过去从这样的文本中提取信息的方法主要有使用人工构建规则库或传统机器学习方法,如svm等。它们均需要大量专家参与构建规则或特征库,成本高昂;这些特征与城市、说话人、季节、特定场景等联系紧密,拓展性差;模型的准确率较高,但路况提取的召回率较低。技术实现要素:针对现有技术存在的问题,本发明采用简单特征与神经网络结合的方法,减少了人工构造特征的数量和复杂程度。本发明为解决上述问题,采用了如下技术方案:一种基于神经网络的路况信息提取方法,包括以下步骤:i.整个系统的输入为一段文本,其中或包含路况信息,或不包含路况信息,输出为结构化后的路况信息;ii.针对输入的文本信息使用关键词、规则和svm结合来进行分类,分类标准为是否带有有效的路况信息,只处理包含路况信息的文本;iii.利用已有的地理位置信息及路况事件信息库提取出文本中的poi和event,形成完整地点信息候选对<poi1,poi2>和地点信息-路况信息候选对<poi,event>;iv.将上述候选对通过神经网络模型、人工规则、引入外部信息结合的方式判断其关系,形成完整的路况事件信息。所述步骤ⅳ具体判断步骤如下:a.对文本进行分词,分词需要引入人工构建的关键词库,关键词指口语中对路段信息匹配、事件信息匹配具有关键意义的词;b.通过神经网络进行路段信息匹配、事件信息匹配。所述步骤b神经网络进行匹配步骤如下:b1:为给定的两个实体poi-poi、poi-event及其所在的上下文,判断其关系,如果两实体为poi,则判断其是否构成同一路况事件的地点描述,即两实体是road-start,start-end或无关的关系;如果两实体为poi和event,则判断其是否构成一条路况事件,即两实体是有关或无关的关系;b2:将上下文中的词用经过对大规模文本预训练得到的词表示,预训练得到的词用wordembedding表示;预训练的文本包括wiki百科及搜集到的路况信息标注文本,待预测的实体用poi、event替代,同时引入地点类型、事件类型两特征表示待预测的实体,将具有相同意义的特殊词使用统一词向量代替;b3:根据词和实体在上下文中的相对位置作位置编码,即positionencoding;b4:对文本及实体做预处理,将一些简单的上下文的特征也作为模型输入;b5:将wordembedding、positionencoding连接为输入向量;b6:使用bidirectionalgruencoder将输入向量序列进行编码得到上下文表示向量;b7:使用attention机制对编码后的上下文表示向量进行加权;b8:将加权后的上下文表示向量与人工构建的上下文特征相连;b9:使用全连接网络进行实体关系分类。通过本发明技术方案的实施,减少了人工构造特征的数量和复杂程度,例如现有技术对北京、上海、深圳、沈阳等四个主要城市进行人工设计特征,需要约30人天,采取本发明的方法则完全避免了这些人力成本,同时在拓展时不需要引入新特征和处理特征之间的矛盾,降低了模型维护成本,增强了模型拓展性;在准确率和精心特征工程的传统机器学习相比略微提升的前提下,召回率得到了大幅提升,约提升15%左右。附图说明图1系统总流程图;图2关系判断模型具体流程。具体实施方式相关符合和术语说明:i.poi:地点词,包括地理描述由road(道路名)、start(路段起点)、end(路段终点)3类poi构成;ii.event:交通事件描述;iii.当实体对为poi-poi时,有道路-起点(road-start)、起点-终点(start-end)、无关三类关系;如果两对关系分别为road-start和start-end的实体对的起点为同一地点,则认为它们构成road-start-end的关系;iv.当实体对为poi-event时,有地点-事件有关、地点-事件无关两类关系。根据附图所示,对本发明的具体实施方案进行详细描述:一种基于神经网络的路况信息提取方法,主要包括如下实施步骤:v.整个系统的输入为一段文本,其中或包含路况信息,或不包含路况信息,输出为结构化后的路况信息;vi.针对输入的文本信息使用关键词、规则和svm三个综合来进行分类,分类标准为是否带有有效的路况信息,只处理包含路况信息的文本;该步骤主要为了解决误报的问题,如语音翻译错误导致文本中带有地点信息、事件信息造成的误报;vii.利用已有的地理位置信息及路况事件信息库提取出文本中的poi和event,形成完整地点信息候选对<poi1,poi2>和地点信息-路况信息候选对<poi,event>;viii.将上述候选对通过神经网络模型、人工规则、引入外部信息结合的方式判断其关系,形成完整的路况事件信息:a.对文本进行分词,分词需要引入人工构建的关键词库,关键词指口语中对路段信息匹配、事件信息匹配具有关键意义的词,如分隔词、否定词等;b.通过附图2神经网络进行路段信息匹配、事件信息匹配:b1:为给定两个实体poi-poi或poi-event及其所在的上下文,判断其关系,如果两实体为poi,则判断其是否构成同一路况事件的地点描述,即两实体是road-start,start-end或无关的关系;如果两实体为poi和event,则判断其是否构成一条路况事件,即两实体是有关或无关的关系;b2:将上下文中的词用经过对大规模文本预训练得到的词即wordembedding表示;所述预训练的文本包括wiki百科及搜集到的路况信息标注文本,待预测的实体(地点词和事件)用poi、event替代,同时引入地点类型、事件类型两特征表示待预测的实体,将具有相同意义的特殊词使用统一词向量代替,如实体之间表示路段起终点关系的“到”、“至”、“排队到”、“队尾在”;实体后表示道路、节点的“路口”、“岗亭”、“红绿灯”等,这样做是为了解决因简俗称等原因导致的未登录词问题;b3:根据词和实体在上下文中的相对位置作位置编码,即positionencoding;b4:对文本及实体做预处理,将一些简单的上下文的特征也作为模型输入;如根据地图节点获得两地理描述实体间是否为道路节点、实体间的距离、实体的位置顺序关系、实体间地点和事件数量、实体间是否有分隔词等不需要复杂设计的特征;b5:将wordembedding、positionencoding连接为输入向量;b6:使用bidirectionalgruencoder将输入向量序列进行编码得到上下文表示向量;b7:使用attention机制对编码后的上下文表示向量进行加权;b8:将加权后的上下文表示向量与人工构建的上下文特征相连;b9:使用全连接网络进行实体关系分类。结合附图1所示,其实施步骤流程如下:1)系统输入为一段文本,输出为结构化的路况信息;2)经过一个分类模型判断是否包含路况,若不包含路况则直接结束,不进行提取;3)使用已有poi信息库和event信息库提取文本中的poi和event;4)将poi、event形成若干关系候选对<实体1,实体2,上下文>;5)使用基于神经网络的关系模型判断候选对关系:若实体1,实体2均为poi,则判断start-end,road-start还是无关;若实体1为poi,实体2位event,则判断地点-路况关系为有关还是无关;6)将有关的候选对关联,形成完整的路况信息;7)输出结构化的路况信息<地点,事件>。结合附图2所示,其实施流程是:1)输入为<实体1,实体2,上下文>的关系候选对;2)上下文进行中文分词;3)将词使用预训练的词向量表示;4)对具有特殊含义的词作预处理;5)根据词在上下文中的相对位置,对每个词进行位置编码,形成位置向量;6)将词向量和位置向量连接为神经网络的输入向量;7)使用双向gru(bi-gru)和attention机制生成上下文的表示;8)将特征信息(如两个poi在地图上是否有交点)等与上下文表示想结合形成关系对的最终表示;9)使用一个全连接神经网络对关系对的最终表示进行分类;10)输出分类结果。通过本发明的技术方案实施,带来如下技术效果:1)除了需要外部引入的信息外,相比传统方法,基于神经网络的模型不需要再引入复杂的规则或特征库,降低了成本。基于规则和传统机器学习使用到的典型特征包括但不局限于下面的特征:本发明将所需特征减少到仅使用下列基础特征:1两poi是否为节点2两poi的距离3两poi间的poi数量4两poi间的event数量5poi类型2)若需要在城市、数据源等方面拓展,只需要搜集新的训练数据对模型进行训练即可,杜绝了新旧规则特征的冲突和维护问题,增强了拓展性;3)在实际生产场景中验证,本发明的系统在保证和其他方法准确率相近的前提下,可以较大幅度的提高路况信息提取的召回率,提升约15%。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1