一种基于语音语义理解的交通电台路况信息播报系统的制作方法

文档序号:11833796阅读:482来源:国知局
一种基于语音语义理解的交通电台路况信息播报系统的制作方法与工艺

本发明涉及信息处理与自然语言处理领域,特别是涉及一种基于语音语义理解的交通电台路况信息播报系统。



背景技术:

自动化是指机器设备、系统或过程(生产、管理过程)在没有人或较少人的直接参与下,按照人的要求,经过自动检测、信息处理、分析判断、操纵控制,实现预期的目标的过程。智能化:是指由现代通信与信息技术、计算机网络技术、行业技术、智能控制技术汇集而成的针对某一个方面的应用。

随着网络技术和自然语言处理技术的不断发展,人们都习惯于利用各种即时通讯软件来交流,通过这些媒介可以及时得到自己想要的信息,其中,微信就是一个很不错的即时通信工具,通过这些工具人们可以克服空间上交流障碍,足不出户便可得到实时信息,如新闻信息、路况信息等通过这样的方式,在传播消息方面,可以实时把消息传达给用户,解决了传统信息传递的滞后性等缺点。为人们的生活带来了很大程度的便利。

随着社会的发展,私家车的数量越来越多,交通拥堵问题已经成为各大中小型城市所面临的重大问题。所以,路况分析和实时路况信息播报、对未来道路的拥堵情况预测已经成为出租车司机、私家车车主、出行者选择路线的重要根据。

本系统在排解大城市道路拥堵促进道路畅通等有关方面有重要作用;对各级政府部门减少人力、物力的资金投入、缓解交通压力、净化环境、降低雾霾、促进社会发展等方面具有积极意义。本智能信息播报系统,融合智能化、自动化、人性化设计,方便广播电台播报的同时,可以实现多种渠道的播报功能,如微信智能问答等,让用户获取准确的交通路况信息,以有效的利用公路资源,缓解大众的出行状况。



技术实现要素:

为了让使用者更加便捷的获得交通路况的数据,本发明提出了一种基于语音语义理解的交通电台路况信息播报系统,方便了交通电台主持人播报信息标记和地图控制,方便了使用者的路况查询和历史数据查询。

本发明提出的一种基于语音语义理解的交通电台路况信息播报系统,包括基于语音识别的播报信息标记与地图控制子系统,该子系统包括语音识别模块、信息处理模块和信息显示模块,该子系统用于用户通过语音输入的方式进行播报信息标记和地图控制;

语音识别模块用于对用户输入的语音信息进行识别并输出识别结果;

信息显示模块为具有人机交互界面的显示装置;

信息处理模块用于对语音识别模块输出的识别结果进行处理,具体包括以下步骤:

步骤A1:遍历语音识别模块输出的识别结果,检测是否具有地图控制命令,若有则转步骤A3,若无则进入步骤A2;

步骤A2:对语音识别模块输出的识别结果与当前人际交互界面显示内容做模糊匹配对比,找出用户语音输入对应道路的路况信息,并做跟读标记与播报标记处理;

步骤A3:进行地图控制命令预处理,检测地图控制命令的控制类型和控制参数,将控制命令发送到地图端进行相关控制。

本发明的一种基于语音语义理解的交通电台路况信息播报系统,还包括智能问路子系统,该系统用于识别用户输入信息并进行所查询路况的信息反馈;该系统包含有暂存数据库,用于记录各用户ID的暂存信息;

该系统中信息处理的方法具体包括以下步骤:

步骤B1:通过微信平台提交问路请求;

步骤B2:记录用户ID,并对问路请求信息进行处理和信息提取,所提取的信息包括路名、地名、方向;地名映射到路名;

步骤B3:如果所提取的信息中没有路名和方向,并执行步骤B1请求用户通过微信平台进行问路请求的信息补全;如果所提取的信息中包含路名,但不包含方向,则执行步骤B4;如果所提取的信息中包含方向,但不包含地名,则执行步骤B5;如果所提取的信息中包含路名、地名、方向,则执行步骤B6;

步骤B4:检索对应用户ID的暂存信息,如果暂存信息中包含方向则执行步骤B6,若不包含方向则将所提取的信息加入暂存数据库,并执行步骤B1请求用户通过微信平台进行问路请求的信息补全;

步骤B5:检索对应用户ID的暂存信息,如果暂存信息中含有地名则执行步骤B6,若不包含地名则将所提取的信息加入暂存数据库,并执行步骤B1请求用户通过微信平台进行问路请求的信息补全;

步骤B6:依据对应用户ID所提取的信息和暂存信息,进行最新交通路况数据的检索,并根据文字模版生成自然语言回复用户。

本发明的一种基于语音语义理解的交通电台路况信息播报系统,还包括可视化历史数据查询子系统,该系统用于查询道路的历史时段的路况并进行可视化展示,具体方法包括以下步骤:

步骤C1:输入查询信息,并对输入的查询信息进行预处理,提取路名、查询时间段

提取路名为多个时,若其中一条以其他两条为起始点,则判断为非起始端的道路为待查询道路;否则多个道路均为待查询道路;

当待查询道路为多个时,针对每个待查询道路分别执行以下步骤;

步骤C2:将步骤C1中获得的待查询道路的路名与标准路名表进行模糊匹配,并通过映射表检索出查询路名与路链号;

步骤C3:使用步骤C2获得的路链号的信息,提取路链号对应的存储ID作为索引,利用索引去数据库中检索所查询时间段的历史数据;

步骤C4:将查询得到的历史数据按路链号分类,按时间顺序拼接,并通过折线图的方式进行历史数据的可视化展示。

其中,基于语音识别的播报信息标记与地图控制子系统还包括用户词典模块,该模块用于存储常用词和供语音识别模块对所识别出语音信息进行匹配,所述的常用词包括常用的控制命令关键词、北京市路名。

其中,步骤B2中提取的路名为多个时,若其中一条以其他两条为起始点,则判断为非起始端的道路为待查询道路;否则多个道路均为待查询道路;

当待查询道路为多个时,针对每个待查询道路分别执行步骤B3。

其中,步骤A1中通过控制命令检测决策树检测是否具有地图控制命令,所述控制命令检测决策树的主要控制节点如下:

待识别字符串长度小于n;

是否含有命令关键词库(Command dictionary)中的关键词,且其匹配率大于阈值β;

与控制参数词典中的关键字或路名词典中的路名的匹配率是否大于阈值θ。

其中,步骤A2中模糊匹配的方法为对人际交互界面显示内容按历史播报顺序加权模糊匹配,其公式如下所示:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>L</mi> <mi>i</mi> <mi>n</mi> <mi>e</mi> <mo>|</mo> <mi>H</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mi>o</mi> <mi>r</mi> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mfrac> <mrow> <msub> <mi>T</mi> <mrow> <mi>n</mi> <mi>o</mi> <mi>w</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>T</mi> <mrow> <mi>b</mi> <mi>r</mi> <mi>o</mi> <mi>a</mi> <mi>d</mi> <mi>c</mi> <mi>a</mi> <mi>s</mi> <mi>t</mi> </mrow> </msub> </mrow> <msub> <mi>T</mi> <mi>P</mi> </msub> </mfrac> </mrow> </msup> <mo>&times;</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>VRR</mi> <mi>i</mi> </msub> </mrow> </munder> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>VRR</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>L</mi> <mi>i</mi> <mi>n</mi> <mi>e</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>V</mi> <mi>R</mi> <mi>R</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中Tnow、Tbroadcast分别为现在的时间和对应历史播报记录播出的时间,以分钟为单位,Tp为时间系数;count()为计数函数,VRR为语音识别结果集。

其中,步骤A3中通过控制类型和控制参数检测决策树检测控制类型和控制参数,

所述控制类型和控制参数检测决策树的主要控制节点如下:

待识别字符串长度小于n;

是否含有命令关键词库(Command dictionary)中的关键词,且其匹配率大于阈值β';

与控制参数词典中的关键字或路名词典中的路名的匹配率是否大于阈值θ'。

其中,阈值β、θ、β'、θ'的确定方法为:使用信息增益率,选择最优分类阈值,公式如下所示:

<mrow> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>1</mn> <mo>-</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msubsup> <mi>p</mi> <mi>i</mi> <mn>2</mn> </msubsup> </mrow>

<mrow> <msub> <mi>Gini</mi> <mi>A</mi> </msub> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>D</mi> <mo>|</mo> </mrow> </mfrac> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mn>2</mn> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>D</mi> <mo>|</mo> </mrow> </mfrac> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow>

ΔGini(A)=Gini(D)-GiniA(D)

其中pi为在假设给定分类阈值的条件下D中元素属于命令关键词或者控制参数的概率,使用|Ci,D|/|D|估计;D1、D2分别为在给定阈值下样本空间分成的两类样本集。

本发明提出的一种基于语音语义理解的交通电台路况信息播报系统,包含了基于语音识别的播报信息标记与地图控制子系统、智能问路子系统、可视化历史数据查询子系统,实现了交通电台主持人通过语音的方式进行播报信息标记和地图控制,方便了使用者的路况查询和历史数据查询。

附图说明

图1:本发明总体系统组成框架示意图;

图2:基于语音识别的播报信息标记与地图控制子系统信息处理流程示意图;

图3:智能问路子系统信息处理流程示意图。

图4:可视化历史数据查询子系统信息处理流程示意图。

具体实施方式

为了使得本发明的优点、技术方案、发明目的更加明白清楚,下面结合实例和附图,对本发明进行更进一步分详尽说明。其中,此处所用的具体实施实例仅仅用于解释本发明,并不用于限定本发明。

为了实现本发明方法,实施例考虑到处理步骤以及涉及的用户数量和资源数量,如果在单机实现应该最好保证处理器16核,内存不小于32GB,可以采用任何语言编写,本例使用java语言实现。

本实施例的一种基于语音语义理解的交通电台路况信息播报系统,采用最优的方案进行详细描述,本实施例的系统如图1所示包括其特征在于,包括基于语音识别的播报信息标记与地图控制子系统、智能问路子系统、可视化历史数据查询子系统。

1、基于语音识别的播报信息标记与地图控制子系统,包括语音识别模块、信息处理模块和信息显示模块,该子系统用于用户通过语音输入的方式进行播报信息标记和地图控制;

语音识别模块用于对用户输入的语音信息进行识别并输出识别结果;

信息显示模块为具有人机交互界面的显示装置;

信息处理模块用于对语音识别模块输出的识别结果进行处理,如图2所示,具体包括以下步骤:

步骤A1:遍历语音识别模块输出的识别结果,检测是否具有地图控制命令,若有则转步骤A3,若无则进入步骤A2;

步骤A2:对语音识别模块输出的识别结果与当前人际交互界面显示内容做模糊匹配对比,找出用户语音输入对应道路的路况信息,并做跟读标记与播报标记处理;

步骤A3:进行地图控制命令预处理,检测地图控制命令的控制类型和控制参数,将控制命令发送到地图端进行相关控制。

本实施例中,语音识别方法采用科大讯飞语音识别开放平台。

本实施例中,基于语音识别的播报信息标记与地图控制子系统还包括用户词典模块,该模块用于存储常用词和供语音识别模块对所识别出语音信息进行匹配,所述的常用词包括常用的控制命令关键词、北京市路名。

本实施例中,步骤A1中通过控制命令检测决策树检测是否具有地图控制命令,所述控制命令检测决策树的主要控制节点如下:

待识别字符串长度小于n;

是否含有命令关键词库(Command dictionary)中的关键词,且其匹配率大于阈值β;

与控制参数词典中的关键字或路名词典中的路名的匹配率是否大于阈值θ。

本实施例中,步骤A2中模糊匹配的方法为对人际交互界面显示内容按历史播报顺序加权模糊匹配,其公式如公式(1)所示:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>L</mi> <mi>i</mi> <mi>n</mi> <mi>e</mi> <mo>|</mo> <mi>H</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mi>o</mi> <mi>r</mi> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mfrac> <mrow> <msub> <mi>T</mi> <mrow> <mi>n</mi> <mi>o</mi> <mi>w</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>T</mi> <mrow> <mi>b</mi> <mi>r</mi> <mi>o</mi> <mi>a</mi> <mi>d</mi> <mi>c</mi> <mi>a</mi> <mi>s</mi> <mi>t</mi> </mrow> </msub> </mrow> <msub> <mi>T</mi> <mi>P</mi> </msub> </mfrac> </mrow> </msup> <mo>&times;</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>VRR</mi> <mi>i</mi> </msub> </mrow> </munder> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>VRR</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>L</mi> <mi>i</mi> <mi>n</mi> <mi>e</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>V</mi> <mi>R</mi> <mi>R</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中Tnow,Tbroadcast分别为现在的时间和对应历史播报记录播出的时间,以分钟为单位,Tp为时间系数;count()为计数函数,VRR为语音识别结果集。

本实施例中,步骤A3中通过控制类型和控制参数检测决策树检测控制类型和控制参数,

所述控制类型和控制参数检测决策树的主要控制节点如下:

待识别字符串长度小于n;

是否含有命令关键词库(Command dictionary)中的关键词,且其匹配率大于阈值β';

与控制参数词典中的关键字或路名词典中的路名的匹配率是否大于阈值θ'。

本实施例中,阈值β、θ、β'、θ'的确定方法为:使用信息增益率,选择最优分类阈值,公式如公式(2)、(3)、(4)所示:

<mrow> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>1</mn> <mo>-</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msubsup> <mi>p</mi> <mi>i</mi> <mn>2</mn> </msubsup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>Gini</mi> <mi>A</mi> </msub> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>D</mi> <mo>|</mo> </mrow> </mfrac> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mn>2</mn> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>D</mi> <mo>|</mo> </mrow> </mfrac> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

ΔGini(A)=Gini(D)-GiniA(D) (4)

其中pi为在假设给定分类阈值的条件下D中元素属于命令关键词或者控制参数的概率,使用|Ci,D|/|D|估计;D1,D2分别为在给定阈值下样本空间分成的两类样本集。

2、智能问路子系统,用于识别用户输入信息并进行所查询路况的信息反馈,;该系统包含有暂存数据库,用于记录各用户ID的暂存信息;

如图3所示,该系统中信息处理的方法具体包括以下步骤:

步骤B1:通过微信平台提交问路请求;

步骤B2:记录用户ID,并对问路请求信息进行处理和信息提取,所提取的信息包括路名、地名、方向;并将地名映射到路名;

步骤B3:如果所提取的信息中没有路名和方向,并执行步骤B1请求用户通过微信平台进行问路请求的信息补全;如果所提取的信息中包含路名,但不包含方向,则执行步骤B4;如果所提取的信息中包含方向,但不包含地名,则执行步骤B5;如果所提取的信息中包含路名、地名、方向,则执行步骤B6;

该步骤中的问路请求是微信用户向智能问路子系统发出的语音或文字请求,系统识别用户要询问的路名及方向等信息,如果不全,即缺少路名和/或地名和/或方向信息,系统会根据识别情况生成语音或文字信息向用户进行询问,用户的同样用语音或文字在微信平台回答即可,系统会识别里面的相关信息。

步骤B4:检索对应用户ID的暂存信息,如果暂存信息中包含方向则执行步骤B6,若不包含方向则将所提取的信息加入暂存数据库,并执行步骤B1请求用户通过微信平台进行问路请求的信息补全;

步骤B5:检索对应用户ID的暂存信息,如果暂存信息中含有地名则执行步骤B6,若不包含地名则将所提取的信息加入暂存数据库,并执行步骤B1请求用户通过微信平台进行问路请求的信息补全;

步骤B6:依据对应用户ID所提取的信息和暂存信息,进行最新交通路况数据的检索,并根据文字模版生成自然语言回复用户。

本实施例中,步骤B2中提取的路名为多个时,若其中一条以其他两条为起始点,则判断为非起始端的道路为待查询道路;否则多个道路均为待查询道路;

当待查询道路为多个时,针对每个待查询道路分别执行步骤B3。

本实施例中,步骤B2中对问路请求信息进行处理和信息提取的方法为:采用分词系统对问路请求进行分词和词性标注,并且提取路名、地名、方向。若微信平台提交问路请求为语音信息,则需要先进行语音识别后再通过分词系统进行处理和提取。

3、可视化历史数据查询子系统,用于查询道路的历史时段的路况并进行可视化展示,如图4所示,具体方法包括以下步骤:

步骤C1:输入查询信息,并对输入的查询信息进行预处理,提取路名、查询时间段

提取路名为多个时,若其中一条以其他两条为起始点,则判断为非起始端的道路为待查询道路;否则多个道路均为待查询道路;

当待查询道路为多个时,针对每个待查询道路分别执行以下步骤;

步骤C2:将步骤C1中获得的待查询道路的路名与标准路名表进行模糊匹配,并通过映射表检索出查询路名与路链号;

步骤C3:使用步骤C2获得的路链号的信息,提取路链号对应的存储ID作为索引,利用索引去数据库中检索所查询时间段的历史数据;

步骤C4:将查询得到的历史数据按路链号分类,按时间顺序拼接,并通过折线图的方式进行历史数据的可视化展示。

本实施例中,由于数据量巨大,在存储历史数据的时候,将路况信息按小时分为24个数据表,对应的存储信息数据库由24张表构成,对应每天24小时,每个表记录对应的一小时内的路况情况数据。采用该设计主要是由于数据量大,对历史数据进行挖掘时数据库效率较低,为了降低数据库长度,便于数据分时间端分析,以及利于并行处理,因此按照每天24小时,将数据库设计为24张表,每个表记录每天本小时的数据,系统使用最新数据只需要通过当前时间找到其对应的数据表,然后读取最新的数据。因此在本实施例的步骤C4中采用分表查询方法,依据查询时间段信息从不同数据表中进行多表检索与数据融合。

本实施例还设计了基于路况信息的播报规则,根据用户收听情况及遗忘状况,信息传播广度,将不同等级路况信息限定不同播出频率,其特征在于:一级信息3分钟内播报第一次,10分钟内播报第二次;二级信息10分钟内播报一次;三级信息15分钟内播报一次。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1