命名实体的识别方法及装置的制造方法_5

文档序号:9506169阅读:来源:国知局
例如所述组件为装置1100的显示器和小键盘,传感器组件1114还可以检测装置1100或装置1100 —个组件的位置改变,用户与装置1100接触的存在或不存在,装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器,如CMOS或(XD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0235]通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
[0236]在示例性实施例中,装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSH))、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0237]在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1104,上述指令可由装置1100的处理器1120执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是R0M、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
[0238]本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0239]应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1.一种命名实体的识别方法,其特征在于,所述方法包括: 记录用户在输入信息时输入的词序列; 根据条件随机场CRF识别出所述信息中的候选命名实体; 根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体。2.根据权利要求1所述的命名实体的识别方法,其特征在于,所述方法还包括: 在所述识别出所述信息中的命名实体之后,采用预设的实体标签对所述信息中的命名实体进行标注; 发送标注后的信息,以便接收端对所述标注后的信息进行还原;所述信息包括短信息。3.根据权利要求1所述的命名实体的识别方法,其特征在于,所述方法还包括: 在所述识别出所述信息中的命名实体之后,根据所述命名实体生成提醒记录或进行预设的业务操作,所述预设的业务操作包括导航操作。4.根据权利要求1所述的命名实体的识别方法,其特征在于,所述根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体,包括: 根据所述词序列确定每个候选命名实体的左边界和右边界; 根据所述每个候选命名实体的左边界和右边界确定所述信息中的命名实体。5.根据权利要求4所述的命名实体的识别方法,其特征在于,所述根据所述词序列确定每个候选命名实体的左边界和右边界,包括: 判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符,若为对应词序列的第一个字符,则确定所述当前候选命名实体的第一个字符为左边界; 判断当前候选命名实体的最后一个字符是否为所述对应词序列的最后一个字符,若为所述对应词序列的最后一个字符,则确定所述当前候选命名实体的最后一个字符为右边界。6.根据权利要求5所述的命名实体的识别方法,其特征在于,所述方法还包括: 若当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中所述当前候选命名实体的第一个字符之前的词确定为第一对象,将所述第一对象之前的词确定为第二对象; 计算所述第一对象之后出现命名实体的概率,并将计算结果确定为第一概率; 计算所述第二对象之后出现命名实体的概率,并将计算结果确定为第二概率; 若所述第一概率大于所述第二概率,则确定所述当前候选命名实体的第一个字符为左边界,若所述第一概率小于所述第二概率,则确定所述第一对象的第一个字符为左边界。7.根据权利要求5所述的命名实体的识别方法,其特征在于,所述方法还包括: 若当前候选命名实体的最后一个字符不是所述对应词序列的最后一个字符,则将对应词序列中所述当前候选命名实体的最后一个字符之后的词确定为第三对象,将所述对应词序列的最后一个字符之后的词符确定为第四对象; 计算命名实体之后出现所述第三对象的概率,并将计算结果确定为第三概率; 计算命名实体之后出现所述第四对象的概率,并将计算结果确定为第四概率; 若所述第三概率大于所述第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若所述第三概率小于所述第四概率,则将所述对应词序列的最后一个字符确定为右边界。8.—种命名实体的识别装置,其特征在于,所述装置包括: 记录模块,被配置为记录用户在输入信息时输入的词序列; 识别模块,被配置为根据条件随机场CRF识别出所述信息中的候选命名实体; 校正模块,被配置为根据所述记录模块记录的所述词序列对所述识别模块识别出的所述候选命名实体进行校正,以识别出所述信息中的命名实体。9.根据权利要求8所述的命名实体的识别装置,其特征在于,所述装置还包括: 标注模块,被配置为在所述校正模块识别出所述信息中的命名实体之后,采用预设的实体标签对所述信息中的命名实体进行标注; 发送模块,被配置为发送所述标注模块标注后的信息,以便接收端对所述标注后的信息进行还原;所述信息包括短信息。10.根据权利要求8所述的命名实体的识别装置,其特征在于,所述装置还包括: 生成操作模块,被配置为在所述校正模块识别出所述信息中的命名实体之后,根据所述命名实体生成提醒记录或进行预设的业务操作,所述预设的业务操作包括导航操作。11.根据权利要求9所述的命名实体的识别装置,其特征在于,所述校正模块,包括: 第一确定子模块,被配置为根据所述词序列确定每个候选命名实体的左边界和右边界; 第二确定子模块,被配置为根据所述每个候选命名实体的左边界和右边界确定所述信息中的命名实体。12.根据权利要求11所述的命名实体的识别装置,其特征在于,所述第一确定子模块包括: 第一判断确定单元,被配置为判断当前候选命名实体的第一个字符是否为对应词序列的第一个字符,若为对应词序列的第一个字符,则确定所述当前候选命名实体的第一个字符为左边界; 第二判断确定单元,被配置为判断当前候选命名实体的最后一个字符是否为所述对应词序列的最后一个字符,若为所述对应词序列的最后一个字符,则确定所述当前候选命名实体的最后一个字符为右边界。13.根据权利要求12所述的命名实体的识别装置,其特征在于,所述第一确定子模块还包括: 第一对象确定单元,被配置为若所述第一判断确定单元确定当前候选命名实体的第一个字符不是对应词序列的第一个字符,则将对应词序列中所述当前候选命名实体的第一个字符之前的词确定为第一对象,将所述第一对象之前的词确定为第二对象; 第一计算单元,被配置为计算所述第一对象确定单元确定出的所述第一对象之后出现命名实体的概率,并将计算结果确定为第一概率; 第二计算单元,被配置为计算所述第一对象确定单元确定出的所述第二对象之后出现命名实体的概率,并将计算结果确定为第二概率; 左边界确定单元,被配置为若所述第一计算单元计算出的所述第一概率大于所述第二计算单元计算出的所述第二概率,则确定所述当前候选命名实体的第一个字符为左边界,若所述第一概率小于所述第二概率,则确定所述第一对象的第一个字符为左边界。14.根据权利要求12所述的命名实体的识别装置,其特征在于,所述第一确定子模块还包括: 第二对象确定单元,被配置为若所述第二判断确定单元确定当前候选命名实体的最后一个字符不是所述对应词序列的最后一个字符,则将对应词序列中所述当前候选命名实体的最后一个字符之后的词确定为第三对象,将所述对应词序列的最后一个字符之后的词符确定为第四对象; 第三计算单元,被配置为计算命名实体之后出现所述第二对象确定单元确定的所述第三对象的概率,并将计算结果确定为第三概率; 第四计算单元,被配置为计算命名实体之后出现所述第二对象确定单元确定的所述第四对象的概率,并将计算结果确定为第四概率; 右边界确定单元,被配置为若所述第三计算单元计算出的所述第三概率大于所述第四计算单元计算出的所述第四概率,则将当前候选命名实体的最后一个字符确定为右边界,若所述第三概率小于所述第四概率,则将所述对应词序列的最后一个字符确定为右边界。15.—种命名实体的识别装置,其特征在于,包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为: 记录用户在输入信息时输入的词序列; 根据条件随机场CRF识别出所述信息中的候选命名实体; 根据记录的所述词序列对所述候选命名实体进行校正,以识别出所述信息中的命名实体。
【专利摘要】本公开是关于一种命名实体的识别方法及装置,其中,命名实体的识别方法包括:记录用户在输入信息时输入的词序列;根据条件随机场CRF识别出信息中的候选命名实体;根据记录的词序列对候选命名实体进行校正,以识别出信息中的命名实体。本公开实施例,根据记录的词序列对候选命名实体进行校正,不仅能够从信息中自动识别出命名实体,而且识别的准确率高、消耗的资源少。
【IPC分类】G06F17/27
【公开号】CN105260360
【申请号】CN201510708580
【发明人】汪平仄, 张涛, 陈志军
【申请人】小米科技有限责任公司
【公开日】2016年1月20日
【申请日】2015年10月27日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1