有限状态机的地址解析方法及装置的制造方法_2

文档序号:9865489阅读:来源:国知局
iness,比如海淀区五道口。
[0043] 为了针对上述情况设计对应的高层状态机,采用预设的语法规则描述对应的地址 结构具体如下:
[0044] city->district->business;
[0045] city->business;
[0046] district->business〇
[0047] 运样就完成了状态机的地址结构的高层设计。
[0048] 由此可见,在实际情况中,状态机地址结构的设计很可能根据需求而产生变化。针 对表1,如果需要在地址结构中加入省份的解析,那么对本技术而言,只需要在资源字典中 配置省份类型的资源,然后在状态机的高层设计中增加一些描述语言即可,比如
[0049] province-〉city-〉district-〉business。
[0050] 由此可见,运样便能完成自动构建状态机的任务,运种方式可W极大的面对实际 情况中的各种变更,也将极大的简化任务,提高处理效率。
[0051] 步骤102,通过所述语法规则的解释程序将所述地址结构翻译成状态机框架,并根 据所述状态机框架构建第一状态机。
[0052] 具体地,需要通过语法规则的解释程序对上述的语法规则进行解释,将上述描述 的地址结构翻译成状态机框架。其中,所述状态机框架包括:每个地址类型的分割标签;与 每个分割标签对应的开始标识、中间过程标识W及结束标识,W及状态机中的起始节点和 终止节点。
[0053] 为了更加清楚的说明解释程序对上述语法规则的翻译过程,继续W表1为例,翻译 过来的状态机在本发明中如下:
[0化4] 0 1 s1:a;rt city+s1:a;rt;
[0055] 1 2 city+core city+end;
[0056] 2 3 start district+start;
[0化7] 3 4 district+core district+end;
[0058] 4 5 start business+start;
[0059] 5 6 business+core business+end;
[0060] 2 4 <邱3〉<6口3〉。
[0061 ]其中,+sta;rt表示某项分割标签开始,+core表示该标签的中间过程,运项标签是 抽象的,因为在最后的合成时,+core会跟具体的词典中的实例结合展开,+end表示该项标 签的结束,<eps>表示空边。前面的数字编号分别表示起始节点和终止节点,每一行边是状 态机的一条边,运是真实的状态机的设计方式。
[0062] 由此可见,手工设计运样的状态机是非常复杂的,真实的数据例子远比当前举例 说明的复杂,对手工设计进行更改非常耗费时间和精力,本实施例是从解释程序转换过来 的状态机属于最终要构建的状态机的框架,大大提高了构建效率。
[0063] 进而,根据解释程序根据地址结构翻译成的状态机框架构建第一状态机,在本发 明中也称为高层状态机(即本发明中设及的第一状态机)。图2为第一状态机的结构图,为了 后续表述方便,将第一状态机记为FST1。
[0064] 由此可见,在对高层的状态机进行设计时,只需要按照一些事先规定好的语法规 则进行书写,运相当于在人更方便的描述语言和构建工具之间加了一层解释程序,而运层 解释程序负责将人更容易编写的设计语言转换为构建工具识别的描述语言。运样,状态机 的设计将可W用更加简洁的规则语言的描述。
[0065] 步骤103,根据所述资源字典中与每个地址类型对应的地址资源,构建与每个地址 类型对应的第二状态机,并将所有的第二状态机合并加环构建第Ξ状态机。
[0066] 具体地,首先,根据资源字典中与每个地址类型对应的地址资源,构建与每个地址 类型对应的第二状态机。
[0067] 然后,将所有的第二状态机合并加环构建第Ξ状态机。
[0068] 为了更加清楚的说明如何根据资源字典中与每个地址类型对应的地址资源,构建 与每个地址类型对应的第二状态机,继续W表1为例解释说明如下:
[0069] 根据资源字典中Ξ个地址类型分别对应的地址资源,分别构建与每个地址类型对 应的状态机(即本发明中设及的第二状态机)。
[0070] 首先,将与city地址类型对应的资源展开进行构图,图3为城市地址类型的第二状 态机的结构图,为了后续描述方便,将与城市类型对应的第二状态机记为FST2。参见图3,其 中S tar t表示该项C i ty的开始,一直到C i ty+cor e结束。
[0071] 接着,将与distirct地址类型对应的资源展开进行构图,图4为区地址类型的第二 状态机的结构图,为了后续描述方便,将与区地址类型对应的第二状态机记为FST3。参见图 4,其中start表示该项distirct的开始,一直到distirct+core结束。
[0072] 接着,将与business地址类型对应的资源展开进行构图,图5为商圈地址类型的第 二状态机的结构图,为了后续描述方便,将与商圈地址类型对应的第二状态机记为FST4。参 见图5,其中start表示该项business的开始,一直到business+core结束。
[0073] 进而,将FST2,FST3,FST4进行合并(即在多个第二状态机之间执行并操作),加环 (首尾相连),得到第Ξ状态机,图6为第Ξ状态机的结构图,为了后续描述方便,将第Ξ状态 机记为FS巧。
[0074] 步骤104,将所述第一状态机和所述第Ξ状态机合并构建第四状态机,W便解码器 应用所述第四状态机进行地址解码。
[0075] 具体地,将所述第一状态机和所述第Ξ状态机合并构建第四状态机,并将第四状 态机置于解码器中。
[0076] 继续参见上述实施例,将FS巧与FST1进行合成,得到最终的状态机(即本发明设及 的第四状态机)。其中,图7为第四状态机的结构图,为了后续描述方便,将第四状态机记为 FST6〇
[0077] 进而,当解码器接收到待进行解析的地址信息时,应用第四状态机对地址信息进 行地址解码。
[0078] 本申请实施例的有限状态机的地址解析方法,根据预配的资源字典中的多个地址 类型,采用预设的语法规则描述需要解析的地址结构;通过所述语法规则的解释程序将所 述地址结构翻译成状态机框架,并根据所述状态机框架构建第一状态机;根据所述资源字 典中与每个地址类型对应的地址资源,构建与每个地址类型对应的第二状态机,并将所有 的第二状态机合并加环构建第Ξ状态机;将所述第一状态机和所述第Ξ状态机合并构建第 四状态机,W便解码器应用所述第四状态机进行地址解码。由此,实现了通过规则语言和解 释程序自动构建地址解析状态机,并且随着拓扑结构的变化适应调整状态机结构,提高了 地址解析的灵活性,可扩展性,W及通用性。
[0079] 进一步地,为了提高解码的准确性,针对步骤101具体包括:
[0080] 采用预设的语法规则描述需要解析的地址结构,W及与地址结构对应的权重信 息;
[0081] 针对步骤102具体包括:
[0082] 通过所述语法规则的解释程序将所述地址结构和所述权重信息,翻译成携带地址 权重的状态机框架,并根据所述状态机框架构建携带地址权重的第一状态机。
[0083] 具体地,在上述的地址解析状态机的构图过程中,预先通过语法规则设置地址权 重,进而设计带权重的状态机来进行切分决策,W便当解码器解码选择权重分数和最大的 作为解码结果。
[0084] 为了更加清楚的说明上述过程,通过图8所示实施例说明如下:
[0085] 图8为样例状态机的结构图,为了后续描述方便,将样例状态机记为WFST1。
[0086] 参见图8,作为一个例子,假设city字典有城市A,business字典有商圈名B,AB。将 地址解析的状态机
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1