实体名称识别的制作方法_3

文档序号:9454207阅读:来源:国知局
用到扩展实体目录116中的规范名称的集合以生成语音扩展的目录122。在特定示例中,语音扩展器120可以为规范名称“WINGG PUB”的生成“W1-NGOPUB”和“W1-GOPUB”的语音表示以及为规范名称“W PUB”生成“DUB-BUL-UOPUB”的语音表示。
[0048]过程200可以包括选择特定地理区域和特定实体类型(240)。例如,实体类型地理定位器130可以选择与实体相关联的每个不同对的地理区域和实体类型。在特定示例中,实体类型地理定位器130可以选择“SPRINGFIELD”和“RESTAURANTS”对。
[0049]过程200可以包括从目录中选择(i)具有与特定实体类型匹配的实体类型,并且
(ii)具有与特定地理区域匹配的地理位置的实体(250)。例如,实体类型地理定位器130可以基于特定实体类型和特定地理区域来过滤语音扩展的目录122。在特定示例中,实体类型地理定位器130可以过滤语音扩展的目录122以标识针对位于地理区域“SPRINGFIELD”中且实体类型为“RESTAURANT”的实体的全部条目。
[0050]过程200可以包括为所选择的条目的每个条目,在实体类型特定的、地理定位的实体数据库中生成记录(260),其中,对于所选择的条目的每一个,该条目至少指示(i)所选择的实体的参考名称,(?)针对所选择的条目的规范名称的集合中的每个规范名称的相应的语音表示。例如,实体类型地理定位器130可以访问语音扩展目录122以生成实体类型特定的、地理定位的实体数据库132。在特定示例中,实体类型地理定位器130可以为位于地理区域“SPRINGFIELD”中且实体类型为“RESTAURANT”的实体生成实体类型特定的、地理定位的实体数据库132。
[0051]过程200可以包括接收包括(i)指示特定实体类型的第一词语,和(ii)指示实体名称的第二词语的话语(270)。例如,自动语音识别器160可以接收来自用户150的话语152。该话语152可以以由例如麦克风的声电转换器产生的声学特征的形式由自动语音识别器160接收。在特定示例中,自动语音识别器160可以接收“NAVIGATE TO WPUB”的话语。
[0052]过程200可以包括获得第二词语的语音表示(280)。例如,转录验证器180可以通过将一种或多种发音规则用于到名称词语,来由生成自动语音识别器160输出的候选转录170中的名称词语的语音表示。在特定示例中,转录验证器180可以为名称词语“WPUB”生成“DUB-BUL-UOPUB”的语音表示。
[0053]过程200可以包括确定第二词语的语音表示匹配于与特定实体相关联的规范名称的集合中的特定规范名称的特定语音表示(290)。例如,转录验证器180可以确定候选转录170中的名称词语的语音表示匹配于存储在实体类型特定的、地理定位的实体数据库132中的实体的特定语音表示。在特定示例中,转录验证器180可以基于确定话语152和该实体之间的98%的匹配得分大于90%的预定阈值来确定所生成的语音表示“DUB-BUL-UOPUB”匹配于存储在实体“WINGG PUB”的实体类型特定的、地理定位的实体数据库132中的特定语音表示“DUB-BUL-UOPUB”。
[0054]转录验证器180可以基于确定生成的语音表示“DUB-BUL-UOPUB”与存储的特定语音表示“DUB-BUL-UOPUB”之间为零的语音距离,基于存在针对实体的许多评论确定实体“WINGG PUB”很受欢迎,确定实体“WINGG PUB”距离如由来自用户设备的全球定位系统信息指示的用户当前位置不足2英里,以及确定指示该实体的特定语音表示“DUB-BUL-UOPUB”很好地对应于话语152的声学特征较好,来确定98%的匹配得分。
[0055]过程200可以包括响应于确定第二词语的语音表示匹配于与特定实体相关联的规范名称的集合中的特定规范名称的特定语音表示,将与该特定实体相关联的参考名称作为第二词语的转录(292)。例如,转录验证器180可以通过利用与匹配的特定语音表示相关联的实体的参考名称替换候选转录170中的名称词语来生成经验证的转录190。在特定示例中,转录验证器180可以通过利用参考名称“WINGG PUB”替换候选转录“NAVIGATE TO WPUB”中的名称词语“W PUB”来生成经验证的转录“NAVIGATE TO WINGG PUB”。
[0056]本说明书中所描述的主题、功能操作和过程的实施例可以被实施在数字电路、有形嵌入的计算机软件或者固件、包括本说明书中公开的结构和他们的结构等价体的计算机硬件中,或者他们的一个或多个的组合中。本说明书中所描述的主题的实施例可以被实施为一个或多个计算机程序,即编码在有形非易失性程序载体上的由数据处理装置执行或者控制数据处理装置的操作的计算机程序指令的一个或多个模块。备选地或者附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光,或者被生成以编码用于向由数据处理装置执行的合适的接收器装置传输的信息的电磁信号。计算机存储介质可以是机器可读的存储器设备、机器可读的存储器衬底、随机或者串行访问存储器设备、或者他们的一个或多个的组合。
[0057]术语“数据处理装置”包含用于处理数据的所有种类的装置、设备和机器,包括示例方式的可编程处理器、计算机、或者多个处理器或者计算机。该装置可以包括专用逻辑电路,例如FPGA(现场可编程门阵列)或者AISC(专用集成电路)。该装置也可以包括除了硬件之外的创建所讨论的计算机程序的运行环境的代码,例如构建处理器固件、协议栈、数据库管理系统、操作系统、或者它们的一个或多个的组合的代码。
[0058]计算机程序(也被称为或者被描述为程序、软件、软件应用、模块、软件模块、脚本或者代码)可以以任意形式的编程语言编写,包括编译的或者解译型语言,或者说明性或者程序性语言,并且他可以以任意形式被部署,包括作为独立的程序或者作为模块、部件、子例程,或者其他适于在计算环境中使用的单元。计算机程序可以,但不必,对应于文件系统中的文件。程序可以被存储于保存其他程序或者数据的文件中(例如,存储在标记语言文档中的一个或多个脚本),专用于所讨论的程序的独立文件中,或者多个协同文件中(例如,存储一个或多个模块、子程序,或者代码的部分的文件)。计算机程序可以被部署以执行在一个计算机或位于同一地点或者跨越多个地点且经由通信网络互连的多个计算机上执行。
[0059]本说明书中描述的过程和逻辑流可以由执行一个或多个计算机程序以通过对输入数据进行操作和生成输出来执行功能的一个或多个可编程计算机执行。过程和逻辑流也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如FPGA(现场可编程门阵列)或者AISC(专用集成电路)。
[0060]适于执行计算机程序的计算机包括通过示例的方式可以基于通用的或者专用微处理器或者二者、或者任何其他类型的中央处理单元。通常,中央处理单元会从只读存储器或者随机访问存储器或者二者接收指令和数据。计算机的基本元件是执行或者实行指令的中央处理单元和存储指令和数据的一个或多个存储器设备。通常,计算机也包括,或者被可操作地耦合以从中接收数据或者向其传输数据,或者二者的一个或多个存储数据的大容量存储设备,例如,磁的、磁光盘,或者光盘。然而,计算机不是必须具有这些设备。此外,计算机可以被嵌入另一个设备,例如,移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器,或者便携式存储设备(例如,通用串行总线(USB)闪存盘),这里仅举几个例子。
[0061]适于存储计算机程序指令和数据的计算机可读介质包括非易失性存储区、介质和存储器设备,包括示例方式的半导体存储器设备,例如EPROM、EEPR0M,和闪存存储器设备;磁盘,例如内置硬盘或者可移动磁盘;磁光盘,和⑶-ROM以及DVD-ROM盘。处理器和存储器可以由入专用逻辑电路填充或者被嵌入专用逻辑电路。
[0062]为了提供与用户的交互,本说明书中描述的主题的实施例可以被实施在具有用于向用户显示信息的例如CRT(阴极射线管)或者LCD(液晶显示)监视器的的显示设备以及键盘和例如鼠标或者轨迹球的用户可以向计算机提供输入的指点设备。其他种类的设备也可以被用于提供与用户的交互,例如,提供给用户的反馈可以使任何形式的传感反馈,例如视觉反馈、听觉反馈或者触觉反馈;来自用户的输入可以以包括声音、语音、或者触觉输入的任何形式被接收。此外,计算机可以通过向用户使用的设备发送文档和接收来自该设备的文档来与用户进行交互,例如,通过响应于从web浏览器接收的请求,向用户的客户端设备上的web浏览器发送网页。
[0063]本说明书描述的主题的实施例可以被实施在包括例如数据服务器的后台部件,或者包括例如应用服务器的中间件部件,或者包括例如具有用户可以通过其与本说明书描述的主题的实现交互的图形用户接口或者Web浏览器的客户端计算机的前台部件,或者上述后台、中间件或者前台部件的任意组合的计算机系统中。系统的部件可以由例如通信网络的任何形式或者介质的数字数据通信互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”),例如因特网。
[0064]计算机系统可以包括客户端和服务器。客户端和服务器通常相互远离且典型地通过通信网络进行交互。客户端和服务器的关系凭借运行于各个计算机上且相互具有客户端-服务器关系的计算机程序而呈现。
[0065]尽管本说明书包括许多特定的实施细节,其不应当被解释为所要求保护的范围的限制,而是作为对于特定实施例的特定特征的描述。本说明
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1