一种基于语义识别的语音搜索船舶动态的方法及系统与流程

文档序号:32343132发布日期:2022-11-26 10:27阅读:44来源:国知局
一种基于语义识别的语音搜索船舶动态的方法及系统与流程

1.本发明涉及船舶语音交互技术领域,特别是一种基于语义识别的语音搜索船舶动态的方法及系统。


背景技术:

2.近年来,以语音为代表的人工智能相关技术渐趋成熟,语音技术被广泛地应用在游戏娱乐、在线教育、商业客服、物联网远程控制等领域。随着航运业数字化智能化的快速发展,基于语音的各种智能应用,成为引领航运业向数字化智能化转型的排头兵。专利cn110600007a将语音技术与船舶定位融合,实现了一种基于语音的船舶识别定位系统及方法。专利cn110780745a实现了语音技术在船舶控制人机交互的应用。相关发明虽实现了一定程度的智能化,但其本质都是通过第三方语音技术进行语音采集和语音识别,再将识别的文本结果转换为执行指令。在这个过程中,语音采集、识别技术本身已非常成熟,恰恰是行业特征最明显、设计和实现要求更高的语义识别,或称意图识别环节,并未详细说明,因此相关发明结果仅支持简单的命令控制、特定属性如船位查询,远不能满足航运数字化和智能化场景的复杂需求。


技术实现要素:

3.为了解决通过语音搜索船舶动态的交互过程只能进行简单的命令控制,不能进行智能化的语义识别转换的问题,提供了一种基于语义识别的语音搜索船舶动态的方法及系统,从语音识别结果出发,结合航运数据特征设计一套通用语义模型,将意图识别的结果转换成内容输出,或转换成指令进行控制,实现多种场景意图识别。同时也可以针对各行业特征对语义模型进行设计,提供一种基于语义识别的语音搜索方法,搭建一套跨行业的语音识别智能应用系统。
4.一种基于语义识别的语音搜索船舶动态的方法,所述具体步骤如下:
5.s1:基于关系型数据库原理进行船舶动态的语义模型设计,所述语义模型包括包含基础元数据的数据模型、定义数据模型之间关系的关系模型、定义元数据常量描述的常量模型以及定义了语义模型支持的变量种类及变量取值方式的变量模型。
6.s2:对语音数据进行语义意图识别:首先构建知识库,基于所述知识库对语音识别结果纠错、再通过应用路由划分应用空间、在应用空间内对所述语音识别结果纠错后的数据与所述语义模型匹配进行意图识别,再对所述纠错后的数据进行参数提取、利用意图识别和参数提取的结果进行知识库更新。
7.s3:意图转换和调用:将s2的结果进行意图转换并根据意图转换的结果进行内容输出,或转换成指令进行控制。
8.所述数据模型的设计方法为将基础数据fm_code、港口基础数据fm_port、船舶静态数据fm_vessel、船舶动态数据vessel_status和船舶事件数据vessel_event预置在数据模型中。
9.所述关系模型的设计方法为基于所述数据模型中数据间的关系预置在关系模型中。
10.所述数据间的关系包括船舶静态数据和船舶动态数据的关系、船舶静态数据和船舶事件数据的关系、港口和船舶动态的关系。
11.所述常量模型的设计方法为将数据模型中的常量数据预置在常量模型中,所述常量信息包括船舶名称、港口名称、船舶mmsi编号、港口代码信息。
12.所述变量模型的设计方法为将船舶的静态属性、动态属性、事件属性变量预置在变量模型中。
13.所述语义意图识别的步骤为:
14.s1:基于知识库针对语音识别结果纠错,包括识别结果本身纠错和专业术语纠错。
15.s2:通过应用路由划分应用空间:在语音识别结果纠错后通过应用路由支持的调用端输入模式或自动识别模式进行应用空间划分。
16.s3:在应用空间内利用所述语义模型对语音数据进行意图识别和参数提取,意图识别包含一级分类识别和二级分类识别,所述一级分类包括将意图分为内容检索和指令控制,二级分类为对内容检索和指令控制的再分类。
17.s31:进行一级分类识别。
18.s32:在一级分类下进行二级分类识别,使语音数据匹配一个或多个二级分类。
19.s33:对匹配到的二级分类进行参数提取,再针对参数提取进行打分,输出打分最高的二级意图。
20.s4:保存语音数据识别结果的原句式,通过机器学习或人工干预对现有知识库进行更新。
21.所述自动识别基于知识库的句式匹配和关键字匹配结果打分排名实现。
22.所述参数提取通过查询语义模型确认常量、变量以及数据关系。
23.所述意图转换的方法为:
24.s1:判断意图一级分类为内容检索类意图或指令控制类意图。
25.s2:对于内容检索类意图,确认内容特征,通过变量模型完成输出匹配和完成本地数据库的检索,通过代理服务将请求转发到第三方完成第三方数据的检索。
26.s3:对于指令控制类意图,确定调用地址,完成本地调用或远程调用。
27.一种基于语义识别的语音搜索船舶动态的系统,包括:纠错单元、知识库单元、建立语义模型的语义模型设计单元、对纠错单元纠错后的数据、利用知识库单元的句式和关键词、以及利用数据模型设计单元的语义模型进行处理的应用空间单元和输出管理客户端。
28.所述纠错单元包括移动语音进行纠错的移动语音纠错模块和对智能硬件语音进行纠错的智能硬件语音纠错模块。
29.所述语义模型设计单元的语义模型包括包含基础元数据的数据模型、定义数据模型之间关系的关系模型、定义元数据常量描述的常量模型以及定义语义模型支持的变量种类及变量取值方式的变量模型。
30.所述应用空间单元包括对纠错后的数据进行一级分类识别和二级分类识别的业务分类模块、以及对业务分类模块分类后的数据进行意图识别的意图识别模块和进行参数
提取的提取参数模块,以及对意图进行内容输出和指令控制的执行模块。
31.所述输出管理客户端将所述执行模块的内容输出和指令控制情况显示在屏幕上。
32.一种基于语义识别的语音搜索的方法,所述具体步骤如下:
33.s1:基于关系型数据库原理进行船舶动态的语义模型设计,所述语义模型包括包含基础元数据的数据模型、定义数据模型之间关系的关系模型、定义元数据常量描述的常量模型以及定义了语义模型支持的变量种类及变量取值方式的变量模型。
34.s2:对语音数据进行语义意图识别:首先构建知识库,基于所述知识库对语音识别结果纠错、再通过应用路由划分应用空间、在应用空间内对所述语音识别结果纠错后的数据与所述语义模型匹配进行意图识别,再对所述纠错后的数据进行参数提取、利用意图识别和参数提取的结果进行知识库更新。
35.s3:意图转换和调用:将s2的结果进行意图转换并根据意图转换的结果进行内容输出,或转换成指令进行控制。
36.一种基于语义识别的语音搜索的方法中所述语义意图识别的步骤为:
37.s1:基于知识库针对语音识别结果纠错,包括识别结果本身纠错和专业术语纠错。
38.s2:通过应用路由划分应用空间:在语音识别结果纠错后通过应用路由支持的调用端输入模式或自动识别模式进行应用空间划分。
39.s3:在应用空间内利用所述语义模型对语音数据进行意图识别和参数提取,意图识别包含一级分类识别和二级分类识别,所述一级分类包括将意图分为内容检索和指令控制,二级分类为对内容检索和指令控制的再分类。
40.s31:进行一级分类识别。
41.s32:在一级分类下进行二级分类识别,使语音数据匹配一个或多个二级分类。
42.s33:对匹配到的二级分类进行参数提取,再针对参数提取进行打分,输出打分最高的二级意图。
43.s4:保存语音数据识别结果的原句式,通过机器学习或人工干预对现有知识库进行更新。
44.本发明的有益效果是根据航运数据特征,提出了一种基于语义识别的语音搜索船舶动态的方法。通过定义一套通用的语义模型,直接从语音识别的结果出发,对其进行语义模型设计、语义意图识别和意图转换,实现了多场景的意图识别,可将意图转换成内容输出或远程指令,同时对知识库进行更新,提高语义识别的准确性。相对于现有技术的简单指令识别,极大了提高了系统的扩展性和智能性。
45.同时提出了一种基于语义识别的语音搜索的方法,搭建一套跨行业的语音识别智能应用系统。可以针对不同的行业特征,进行语义模型设计、意图识别和意图转换。实现语音识别系统的智能数据交互。在基于微信小程序的移动智能应用、基于柜式硬件的智能交互系统、基于便携式硬件的智能交互系统等方向都有广泛的应用空间。
附图说明
46.图1语义模型设计示意图。
47.图2意图识别流程图。
48.图3意图分类及参数提取流程图。
49.图4一种基于语义识别的语音搜索船舶动态的系统结构图。
具体实施方式
50.以下结合附图对本发明的原理和特征进行描述。
51.实施例一:语义模型设计。
52.如图1所示,本方法的语义模型基于关系型数据库原理设计,包含数据模型、关系模型、常量模型、变量模型四个部分。数据模型是基础的元数据模型,数据模型之间的关系通过关系模型定义,常量模型定义了元数据的常量描述,变量模型则定义了语义模型支持的变量范围及取值方式。
53.1.数据模型dom
54.元数据模型dom,支持独立空间、自定义分组、以及完整的自定义视图替换。元数据模型dom存储的数据,可以是任意实体业务对象,或自定义的逻辑视图,本方法结合航运数据应用场景,将基础数据fm_code、港口基础数据fm_port、船舶静态数据fm_vessel、船舶动态数据vessel_status、船舶事件数据vessel_event等实体和视图预置在数据模型中。
55.2.关系模型domr
56.关系模型domr,用来定义两个dom的关系及匹配条件,所有基于er关系定义的dom关系,都能在domr中得到支持,譬如多种连接方式,如左连接、右连接、外连接等。本方法结合航运数据应用场景,将船舶静态数据和船舶动态数据的关系、船舶静态数据和船舶事件数据的关系、港口和船舶动态的关系,以及其他dom中数据模型存在的关系预置在关系模型中。
57.3.常量模型domc
58.常量模型domc,用来定义数据模型dom对象的常量信息。常量模型在设计上,支持任意检索主体的常量定义,同时可以将这些常量的简称、别名一起定义,以支持多种常量检索。本方法结合航运数据应用场景,将船舶、港口的名称信息作为常量预置在常量模型中。常量模型的核心元素是常量名key及常量值val、val_ext,常量值val以及val_ext用来匹配语音输入的常量信息,key则用来锁定常量对象。譬如语音输入“船舶中远海运荷花的当前吃水”,模型可根据船名常量“中远海运荷花”来锁定船舶实体对象,进而匹配到相关变量信息。
59.4.变量模型domv
60.变量模型domv,用来定义数据模型dom对象的变量信息。变量模型在设计上,支持任意检索主体的变量定义,这些变量定义可以是实体业务对象的属性,也可以是逻辑视图属性。变量模型的核心元素是变量名key及变量描述val、val_ext,key用来定义如何取值,val以及val_ext则用来匹配语音输入的检索目标。本方法结合航运数据应用场景,将船舶的静态属性、动态属性、事件属性等变量预置在变量模型中。
61.实施例二:意图识别。
62.如图2所示,本方法中的意图识别流程,主要包括语音结果纠错、应用路由、应用空间内的意图识别及参数提取、知识库更新几个步骤。
63.在进行意图识别之前可进行语音关键字训练。将船舶名称的常量库提供到第三方语音识别系统进行训练,以提高船舶名称的识别率,操作过程可参照第三方平台说明,对识
别要求不高的应用,也可以忽略本步骤。
64.1.语音识别结果纠错
65.语音识别技术相对成熟,但是结果仍需要结合业务场景进行纠错或矫正。纠错分两种情况,一种是识别结果本身是错误的,如“船舶”被识别成“传播”、“途经巴拿马”被识别成“途径巴拿马”;另一种是专业术语的统一,如将“箱号”统一成“集装箱号”、“船长”统一成“船舶长度”。纠错对最终结果的准确性影响很大,但实现相对简单,本方法通过知识库的专业词库替换完成。
66.2.应用路由
67.多应用空间划分,不仅可以最小化底层知识库,提高识别准确率,还可以实现不同应用场景的意图识别需求。譬如可将船舶相关应用与港口的相关应用进行切分,也可将航运业务应用于办公应用切分,模型在支持上并无差异。语音识别结果纠错后,应用路由模块完成对应用空间的选择。应用路由的选择,支持调用端输入和自动识别两种模式。调用端输入模式,由调用端指定应用空间。自动识别模式是系统自动判断应用空间,基于知识库及正则匹配技术实现,具体通过子知识库的句式匹配和关键字匹配结果打分排名实现。
68.3.意图识别及参数提取
69.意图识别及参数提取,在特定的应用空间下完成,意图识别的第一步是意图一级分类识别,第二步是子类识别器选择,也叫二级分类,最后一步是参数提取,整个过程如图3所示。
70.本方法设计的意图分两大类,一类是内容检索,另一类是指令控制。内容检索可以是本地内容检索,如船舶静态信息、船舶动态数据、船舶事件等,也可以是远程内容请求,如通过调用第三方服务查询气象、新闻、音乐等。指令控制同内容检索一样,也可分为本地和远程两种调用控制。如“地图放大到14级”、“调节舱内温度”、“打开视频监控”、“关闭预警窗口”等。由于两类意图的区别很明显,通过关键字及句式匹配即可实现。
71.以内容检索一级意图为例,本方法会进一步完成二级分类识别,如船舶类、港口类、新闻类等。譬如“中远海运荷花的当前吃水”、“青岛港的气象情况”、“来一条最新的航运新闻”分别是船舶、港口和新闻播报类意图。二级分类的识别方法,通过知识库的意图句式正则匹配实现,如输入内容匹配到多个二级分类,模型先对每一个子分类进行参数提取,再针对参数提取进行打分,最终结果以句式、参数提取打分最高的二级意图为准。
72.支持二级意图识别的配置句式二级意图识别器样例。
73.^(?!(箱号|集装箱号|集装箱箱号|船舶|港口))(.*)的?.*事件$
74.^(?!(箱号|集装箱号|集装箱箱号|船舶|港口))(.*)的?[船|轮]舶?$
[0075]
^(?!(箱号|集装箱号|集装箱箱号|船舶|港口)).*(?《!(船舶?|新闻|事件))$
[0076]
参数提取是意图识别模块最后一步,其结果决定了后续输出的准确性。以“中远海运荷花的当前吃水”为例,参数提取模块需要识别到常量船名“中远海运荷花”以及变量“吃水”。基于本方法定义的常量模型,通过关系型数据库的查询功能,可快速识别目标常量对象。基于变量模型,同样可快速识别出变量key,最后结合常量对象、关系模型和变量key完成变量结果的识别。
[0077]
提取参数样例。
[0078]
^(?:正在|在|位于|)(.+)(?:海区|海域|区域)(?:锚泊|抛锚|锚地|锚地抛锚|锚
地停留|处于锚泊状态)的(.*)[船|轮]舶?$
[0079]
^(?:正在|在|位于|)(.+)(?:海区|海域|区域)航行的(.*)[船|轮]舶?$
[0080]
^(?:正在|在|位于|)(.+)(?:海区|海域|区域)靠泊的(.*)[船|轮]舶?$
[0081]
^(?:正在|在|位于|)(.+)(?:锚泊|抛锚|锚地|锚地抛锚|锚地停留|处于锚泊状态)的(.*)[船|轮]舶?$
[0082]
^途(?:经|径)(.+)(?:开往|驶往|到|出发开往|出发驶往|出发到|目的地是|去)(.+)的(.*)[船|轮]舶?$
[0083]
^途(?:经|径)(.+)[从自]{1}(.+)(?:开往|驶往|到|出发开往|出发驶往|出发到|目的地是|去)(.+)的(.*)[船|轮]舶?$
[0084]
4.知识库更新
[0085]
本方案的知识库从结构模型上又可分为通用知识库和业务子库,从功能上分为句式库和关键字库,其中关键字库又分为常量库和变量库。本方法完成意图识别及提取参数后,相关输入的原句式会被单独保存下来,通过机器学习结合人工干预的方式,完成对常量模型、变量模型,通用知识库及业务子库的进一步完善。句式被抽象后,增量更新到现有的句式库,提高一级分类和二级分类意图的支持范围及命中率。
[0086]
实施例三:意图转换。
[0087]
完成意图识别及提取参数后,将输出按照一级意图分类进行转换。针对内容检索类意图,先确定内容特征,如本地数据库的检索,可直接通过变量模型完成输出匹配;如三方数据检索,可通过代理服务将请求转发到第三方。针对指令控制类意图,同样先确定调用地址,分别完成本地调用和远程调用。
[0088]
实施例四:一种基于语义识别的语音搜索船舶动态的系统。
[0089]
如图4所示,基于通用语义模型、多场景意图识别及意图转换,结合第三方语音识别技术,本方法构建了一种基于语义识别的语音搜索船舶动态的系统,该系统包括:纠错单元、知识库单元、对常量模型、变量模型和关系模型进行数据模型设计的数据模型设计单元、对纠错单元纠错后的数据、利用知识库单元的句式和关键词、以及利用数据模型设计单元的数据模型进行处理的应用空间单元和输出管理客户端。
[0090]
所述纠错单元包括移动语音纠错模块和智能硬件语音纠错模块。
[0091]
所述应用空间单元包括对纠错后的数据进行一级分类识别和二级分类识别的业务分类模块、以及对业务分类模块分类后的数据进行意图识别的识别意图模块和进行参数提取的提取参数模块,以及对意图进行内容输出和指令控制的执行模块。
[0092]
所述输出管理客户端将所述执行模块的内容输出和指令控制情况显示在屏幕上。
[0093]
该系统支持移动语音输入、智能硬件语音输入,通过知识库及语义模型,实现意图识别及参数提取,最后再进行意图转换。从功能上,本系统支持语音搜索船舶静态信息、动态信息、港口业务信息、船舶事件;支持播报新闻、天气;支持控制监控屏幕的地图缩放。同时,扩展知识库及句式,可轻松实现其他领域的智能业务,如oa搜索员工信息等。
[0094]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明。凡是属于本发明的技术方案所引申出的显而易见的变化或变动,仍处于本发明的范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1