命名实体的识别方法及装置的制造方法_4

文档序号:9506169阅读:来源:国知局
饭店西餐厅”,对应的词序列为“南苑饭店西餐厅”,由于A jP “厅”是对应词序列的最后一个字符,因此,“厅”是当前候选命名实体“南苑饭店西餐厅”的右边界。
[0196]如图8所示的装置用于实现上述如图4所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
[0197]上述命名实体的识别装置实施例,通过提供一种根据输入的词序列确定当前候选命名实体的左边界和右边界的方式,为从信息中识别出命名实体提供了条件。
[0198]图9是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图9所示,在上述图8所示实施例的基础上,该第一确定子模块531还可包括:第一对象确定单元5313、第一计算单元5314、第二计算单元5315和左边界确定单元5316。
[0199]第一对象确定单元5313被配置为若第一判断确定单元5311确定当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中当前候选命名实体的第一个字符之前的词确定为第一对象,将第一对象之前的词确定为第二对象。
[0200]如果&不是对应词序列的第一个字符,则从A JP A t中选择一个作为左边界。其中,Α^..Α^..ΑΧ*输入的词序列中独立的词,Α Α+Γ'?;:为在Α ;之前的一个词,A bAb+1--*At j为在At之前的一个词。
[0201]在该实施例中,将A人+1..^痛定为第一对象,将AbAbV"At:确定为第二对象。
[0202]假设,当前候选命名实体为“南苑饭店西餐厅”,对应的词序列为“在南苑饭店西餐厅”,由于~即“南”不是对应词序列的第一个字符,因此,需要从“晚上”和“在”中选择一个作为左边界。
[0203]第一计算单元5314被配置为计算第一对象确定单元5313确定出的第一对象之后出现命名实体的概率,并将计算结果确定为第一概率。
[0204]计算第一概率p (NEq/A人+1..^:),其中,p (NEq/A人+1...~ ^ 表示 A人+1..^ i的后面出现命名实体NEq的概率,其中,NE q的取值可以包括:NAME,ORG, L0C等。
[0205]第二计算单元5315被配置为计算第一对象确定单元5313确定出的第二对象之后出现命名实体的概率,并将计算结果确定为第二概率。
[0206]计算第二概率p(NEq/AbAb+1-At J,其中,AbAb+1-At:为在 At2前的一个词。p (NE q/AbAb+r**At i)表示在AbAb+1-At:的后面出现命名实体NE q的概率。
[0207]左边界确定单元5316被配置为若第一计算单元5314计算出的第一概率大于第二计算单元5315计算出的第二概率,则确定当前候选命名实体的第一个字符为左边界,若第一概率小于第二概率,则确定第一对象的第一个字符为左边界。
[0208]若ρ (ΝΕ,/ΑΛ.Γ-Α, i) >p (NEq/AbAb+1*"At J,则Ai是当前候选命名实体的左边界,反之,At是当前候选命名实体的左边界。
[0209]继续上例进行描述,假设“在”之后出现命名实体的概率大于“晚上”之后出现命名实体的概率,则确定“南”是当前候选命名实体“南苑饭店西餐厅”的左边界。
[0210]如图9所示的装置用于实现上述如图4所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
[0211]上述命名实体的识别装置实施例,通过提供另一种根据输入的词序列确定当前候选命名实体的左边界的方式,从而为从信息中识别出命名实体提供了条件。
[0212]图10是根据一示例性实施例示出的另一种命名实体的识别装置的框图,如图10所示,在上述图8所示实施例的基础上,该第一确定子模块531还可包括:第二对象确定单元5317、第三计算单元5318、第四计算单元5319和右边界确定单元5310。
[0213]第二对象确定单元5317被配置为若第二判断确定单元5312确定当前候选命名实体的最后一个字符不是对应词序列的最后一个字符,则将对应词序列中当前候选命名实体的最后一个字符之后的词确定为第三对象,将对应词序列的最后一个字符之后的词符确定为第四对象。
[0214]在该实施例中,如果Aj不是对应词序列的最后一个字符,则从A」和A k中选择一个作为右边界。其中,A/..、…输入的词序列中为一个独立的词。厶^人+^大为在^之后的一个词,Ak+1Ak+2...An为在A 后的一个词。
[0215]假设,当前候选命名实体为“南苑饭店”,对应的词序列为“南苑饭店西餐厅”,由于八,即“店”不是对应词序列的最后一个字符,因此,需要从“店”和“厅”中选择一个作为右边界。其中,A]+1A]+2*"A?*“西餐厅”,Ak+1AkV"An为“碰面”。
[0216]第三计算单元5318被配置为计算命名实体之后出现第二对象确定单元5317确定的第三对象的概率,并将计算结果确定为第三概率。
[0217]计算第三概率p (Aj+1Aj+2-An/NEq),其中,p (Aj+1Aj+2-An/NEq)表示命名实体 NEq的后面出现Aj+1Aj+2...Α?^概率。
[0218]第四计算单元5319被配置为计算命名实体之后出现第二对象确定单元5317确定的第四对象的概率,并将计算结果确定为第四概率。
[0219]计算第四概率?(\+入+2..大/%),其中,?撕+认1^2..411/陬0表示命名实体NEq的后面出现Ak+1Ak+2...六?的概率。
[0220]右边界确定单元5310被配置为若第三计算单元5318计算出的第三概率大于第四计算单元5319计算出的第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若第三概率小于第四概率,则将对应词序列的最后一个字符确定为右边界。
[0221]若p (Aj+1Aj+2…A?/NEq) >p (Ak+1Ak+2...An/NEq),则确定为右边界,反之,确定 A k为右边界。
[0222]假设在该实施例中,命名实体NEq的后面出现“西餐厅”的概率小于命名实体NEq的后面出现“碰面”的概率,则确定“厅”是当前候选命名实体“南苑饭店西餐厅”的右边界。
[0223]如图10所示的装置用于实现上述如图4所示的方法流程,涉及到的相关内容描述相同,此处不赘述。
[0224]上述命名实体的识别装置实施例,通过提供另一种根据输入的词序列确定当前候选命名实体的右边界的方式,从而为从信息中识别出命名实体提供了条件。
[0225]关于上述实施例中的装置,其中各个模块、子模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0226]图11是根据一示例性实施例示出的一种适用于命名实体的识别装置的框图。例如,装置1100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0227]参照图11,装置1100可以包括以下一个或多个组件:处理组件1102,存储器1104,电源组件1106,多媒体组件1108,音频组件1110,输入/输出(I/O)的接口 1112,传感器组件1114,以及通信组件1116。
[0228]处理组件1102通常控制装置1100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1102可以包括一个或多个模块,便于处理组件1102和其他组件之间的交互。例如,处理部件1102可以包括多媒体模块,以方便多媒体组件1108和处理组件1102之间的交互。
[0229]存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPR0M),可擦除可编程只读存储器(EPR0M),可编程只读存储器(PR0M),只读存储器(R0M),磁存储器,快闪存储器,磁盘或光盘。
[0230]电力组件1106为装置1100的各种组件提供电力。电力组件1106可以包括电源管理系统,一个或多个电源,及其他与为装置1100生成、管理和分配电力相关联的组件。
[0231]多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1108包括一个前置摄像头和/或后置摄像头。当设备1100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0232]音频组件1110被配置为输出和/或输入音频信号。例如,音频组件1110包括一个麦克风(MIC),当装置1100处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中,音频组件1110还包括一个扬声器,用于输出音频信号。
[0233]I/O接口 1112为处理组件1102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0234]传感器组件1114包括一个或多个传感器,用于为装置1100提供各个方面的状态评估。例如,传感器组件1114可以检测到设备1100的打开/关闭状态,组件的相对定位,
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1