实体名称识别的制作方法

文档序号:9454207阅读:448来源:国知局
实体名称识别的制作方法
【专利说明】实体名称识别
[0001]相关串请的交叉引用
[0002]本申请要求2015年3月15日提交的美国申请序列号61/013,585和2014年6月18日提交的美国临时申请序列号62/013,585的权益,这些申请通过引用并入。
技术领域
[0003]本公开内容总体上涉及语音识别,并且根据一个示例实现方式,涉及识别话语中的专有名称。
【背景技术】
[0004]语音命令可以包括专有名称。例如,用户可以说“Navigate to Pete’s PizzaPalace restaurant”,以便请求自然语言处理系统提供到名称为“Pete’s Pizza Palace”的餐厅的方向。

【发明内容】

[0005]—些语音命令包括可能很难使用常规语音识别器来准确地转录的专有名称。例如,无论用户说的多么清楚,常规语音识别器可能将语音命令“Navigate to CITYZENrestaurant in Washington DC”车专录为“Navigate to CITYZEN restaurant in WashingtonDC”。这样的转录可能导致自然语言处理系统输出错误的或者无意义的结果。
[0006]考虑到来自该示例语音命令的正确转录的词语“restaurant”和“Washington”,并且考虑到对应于专有名称的语音命令的部分的语音转录“Sl-tee-O-ze-en”,本说明书中所描述的增强型自然语言处理系统可以通过利用实体名称“CityZen”替换不准确的转录的专有名称“citizen”,来准确地转录语音命令的该部分,该实体名称“CityZen”:(i)匹配“restaurant”实体类型,(ii)与“Washington DC”位置相关联,(iii)与匹配对应于专有名称的语音命令的部分的语音转录的语音表示预关联。如本说明书中所使用的,“实体”可以指代任何人、地点、对象、事件,或者概念。
[0007]在一些方面,本说明书中描述的主题可以被实施为方法,该方法可以包括接收话语的动作,该话语包括(i)指示特定实体类型的第一词语和(ii)指示实体名称的第二词语。附加的动作包括获得第二词语的语音表示和确定第二词语的语音表示与关联于特定实体的规范名称集中的特定的规范名称的特定语音表示匹配。进一步动作包括将与特定实体相关联的参考名称输出为第二词语的转录。
[0008]其他版本包括对应的系统、装置和被配置为被编码在计算机存储设备上、执行该方法的动作的计算机程序。
[0009]这些和其他版本可以每个可选择地包括一个或多个以下特征。例如,在一些实施方式中,对于一个或多个实体中的每一个实体,获得实体的规范名称集中的每个规范名称的语音表示包括:通过将一个或多个发音规则应用到每个规范名称来生成针对每个规范名称的语音表示。
[0010]在一些方面,确定第二词语的语音表示与关联于特定实体的规范名称集中的特定规范名称的特定语音表示匹配包括:基于第二词语的语音表示与特定语音表示之间的距离确定匹配得分,并且确定该匹配得分满足预定的阈值匹配得分。
[0011]在某些方面,动作包括确定话语的候选转录,该候选转录包括对应于第一词语的类型词语和对应于第二词语的名称词语。附加动作包括确定对应于话语的地理位置并且确定该名称词语:(i)与对应于类型词语的实体类型的实体的参考名称不匹配,(ii)与位于匹配地理位置的地理位置的实体的参考名称不匹配,其中确定第二词语的语音表示与关联于特定实体的规范名称集中的特定规范名称的特定语音表示匹配响应于确定该名称词语:
(i)与对应于类型词语的实体类型的实体的参考名称不匹配,(ii)与位于匹配地理位置的地理位置的实体的参考名称不匹配。
[0012]在一些实施方式中,确定对应于话语的地理位置包括:确定候选转录中对应于地理位置的词语。在一些方面,确定对应于话语的地理位置包括:确定话语被说出的位置。在某些方面,获得第二词语的语音表述:包括通过一将种或多种发音规则应用到名称词语来生成该第二词语的语音表示。在一些实施方式中,参考名称包括官方名称,规范名称包括官方名称或者非官方名称。在一些方面,词语包括人、地点、对象、时间或者概念中的至少一项。
[0013]本说明书所描述的主题的一个或多个实施方式的细节在下文的附图和描述中被阐述。本主题的其他潜在的特征、方面和优点将从、附图和权利要求中变得清楚。
【附图说明】
[0014]图1是用于识别语音中的实体名称的示例系统的框图。
[0015]图2是用于识别语音中的实体名称的示例过程的流程图。
[0016]各个图中的相同参考符号指示相同元件。
【具体实施方式】
[0017]图1是用于识别语音中的实体名称的示例系统100的框图。通常,系统100包括列出各种实体的实体目录112、存储与各种实体的属性(包括参考实体名称、备选实体名称、与特定实体相关联的位置)有关的实体-关系模型的知识库114。系统100还包括使用知识库114来标识与存储在实体目录112中的实体相关联的其他规范实体名称的实体名称扩展器110、和从扩展的实体目录116生成语音扩展的目录122的语音扩展器120。系统100进一步包括生成实体类型特定的、地理定位的实体数据库132的实体类型地理定位器130、生成来自用户150的话语152的候选转录170的自动语音识别器160、和利用特定实例类型、地理定位的实体数据库132来验证候选转录170并且输出验证的转录190的转录验证器 180。
[0018]更加详细地,实体目录112可以是包括实体记录的数据库。例如,实体目录112可以是特定区域的商业的黄页类型的列表。每条记录可以对应特定的实体,并包括:(i)参考名字,(?)地理位置以及(iii)针对特定实体的一个或多个实体类型。例如,实体目录112可以包括具有参考名字“TINPOT DINER”、位于“100MAIN ST, SPRINGFIELD, MO”并且实体类型为“RESTAURANT”的实体记录。
[0019]参考名字可以是实体的官方的或者依法登记的名字。例如,餐厅可以被命名为“TINPOT DINER”,即使该餐厅更通俗地由其他名称(诸如“TIN DINER”、“TP DINER”,或者“TINPOT RESTAURANT”)而被熟知。地理位置可以由例如街道地址或者经玮度坐标或者二者指示。
[0020]知识库114可以是包括指示实体的参考名称与实体的规范名称之间的关联的信息和其他一些事项的实体-关系数据库。规范名称可以是实体可以由其引用的名称。例如,知识库114可以指示具有参考名称“TINPOT DINER”的实体与规范名称“TIN DINER”、“TPDINER”和“TINPOT RESTAURANT”相关联。知识库114可以从例如社交网络信息、评论服务、网站和聚合的用户查询等各种信息中生成。
[0021]实体名称扩展器110可以访问实体目录112中的记录和知识库114中的信息以生成扩展的实体目录116。扩展的实体目录116可以包括对应于实体目录112中的记录、具有指示每个实体的一个或多个规范名称的集合的附加信息的记录,其中每个实体的一个或多个规范名称的集合包括实体的参考名称。
[0022]实体名称扩展器110可以通过访问实体目录112中的每条记录、并且对于每条记录,将由知识库114指示的规范名称识别为与记录的参考名称相关联,来生成扩展的实体目录116。例如,实体名称扩展器110可以访问具有参考名称“TINPOT DINER”的实体的记录,确定知识库114指示具有参考名称“TINPOT DINER”的实体与规范名称“TIN DINER”、“TP DINER”和“TINPOT RESTAURANT”相关联,并且在扩展的实体目录116中生成记录,该记录指示:(i)实体目录112中具有参考名称“TINPOT DINER”的实体的记录中的信息和(ii)规范名称 “TIN DINER”、“TP DINER” 和 “TINPOT RESTAURANT” 的集合。
[0023]语音扩展器120可以访问扩展的实体目录116中的记录以生成语音扩展目录122。语音扩展目录122可以包括对应于扩展的实体目录116中的记录的、具有指示规范名称的可能的语音表示的附加信息的记录。
[0024]语音扩展器120可以访问扩展的实体目录116中的每条记录,并且对于记录中的每个参考名称和每个规范名称,生成一个或多个语音表示。例如,语音扩展器120可以访问扩展的实体目录116中针对实体“TINPOT DINER”的记录,访问参考名称“TINPOT DINER”,为“TINPOT”的正确识别的语音表示生成语音表示“T1-EN-PA-ATOD1-NAH”,为将“TINPOT”的错误识别如“TIN PORT”的语音表示生成附加的语音表示“T1-EN-PO-OTOD1-NAH”,访问规范名称 “ T RESTAURANT ”,并生成语音表示 “ TE-EEORE_ST_OR_ANT ”。
[0025]语音扩展器120可以通过应用定义单词的可能发音的一个或多个规则来生成语音表示。例如,语音扩展器120可以应用定义“Ρ0Τ”可能被发音为“PA-AT”的规则并且应用定义“Ρ0Τ”被可能发音为“Ρ0-0Τ”的规则。
[0026]实体类型地理定位器130可以访问语音扩展的目录122中的记录以生成至少一个实体类型特定的、地理定位的实体数据库132。该实体类型特定的、地理定位的实体数据库1
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1