一种省略恢复方法及问答系统的制作方法_3

文档序号:9616247阅读:来源:国知局
(多少,它)=0.29 ;
[0081]其次,在“多少钱”之前的η = 3个句子中,提取3个句子中的所有名词“小明”(cl=小明)、“Iphone手机”(c2 = Iphone手机),并将cl、c2分别作为候选名词;也就是说,针对同一个wl,其候选代词存在有两种,候选名词存在有两种,通过两两组合得到,针对wl (wl =多少)这个词,一共存在有4个即候选对,分别是:(wl, tl, cl)=(多少、他、小明)、(wl, tl, c2)=(多少、他、Iphone 手机)、(wl, t2, cl)=(多少、它、小明)、(wl, t2,c2)=(多少、它、Iphone手机);通过分类器计算出每一个候选对的概率,分别是f (wl, tl,cl) = 0.7、f (wl, tl, c2) = 0.46、f (wl, t2, cl) = 0.55、f (wl, t2, c2) = 0.85 ;
[0082]通过训练而得到al、a2均为1时,
[0083]在取候选对(wl,tl, cl)=(多少、他、小明)时,与该候选对对应的第一概率f (wl, tl) = f (多少,他)=0.32、第二概率 f (wl, tl, cl) = f (多少、他、小明)=0.7,将这两个概率代入至公式(1),得到Score(l) = 0.32+0.7 = 1.02 ;
[0084]在取候选对(wl, tl, c2)=(多少、他、Iphone手机)时,与该候选对对应的第一概率f(wl,tl) =f (多少,他)=0.32、第二概率f(wl,tl, c2) = 0.46,将这两个概率代入至公式(1),得到 Score (2) = 0.32+0.46 = 0.76 ;
[0085]在取候选对(wl,t2,cl)=(多少、它、小明)时,与该候选对对应的第一概率f (wl, t2) = f (多少,它)=0.29、第二概率 f (wl, t2, cl) = f (多少、它、小明)=0.55,将这两个概率代入至公式(1),得到Score (3) = 0.29+0.55 = 0.84 ;
[0086]在取候选对(wl,t2,c2)=(多少、它、Iphone手机),与该候选对对应的第一概率f(wl,t2) =f(多少,它)=0.29、第二概率f(wl,t2,c2) = 0.85,将这两个概率代入至公式(1),得到 Score (4) = 0.29+0.85 = 1.14;
[0087]最后,在得到的Score⑴?Score⑷中,选取最大值Score (4),与最大值Score (4)对应的候选对为(wl,t2,c2)=(多少、它、Iphone手机),即针对“多少”这个词(wl =多少),最终所确定出的“多少”前面的候选代词为“它”,候选名词为“Iphone手机”,并用“Iphone手机”替换掉“它”,恢复“多少钱”为“Iphone手机多少钱”,针对该问题,问答系统输出答案“Iphone手机4999”。
[0088]基于上述省略恢复的方法,本发明实施例还提供了一种问答系统;图3为本发明实施例的问答系统的组成示意图;如图3所示,所述系统包括:第一获取单元301、第一确定单元302、第二确定单元303、第三确定单元304 ;其中,
[0089]第一获取单元301,用于在对话中句子有缺省词时,获取所述缺省词的候选代词以及候选名词;
[0090]第一确定单元302,用于依据所述候选代词及所述候选名词,确定所述缺省词的候选对;
[0091]第二确定单元303,用于确定第一概率和第二概率,所述第一概率用于表示所述候选代词作为所述缺省词的概率,所述第二概率用于表示所述候选对中所述候选名词替换为相应候选代词的概率;
[0092]第三确定单元304,用于依据所述第一概率和所述第二概率,确定所述候选对中的候选名词为所述缺省词。
[0093]如图3所示,所述系统还包括:第二获取单元305、第一建立单元306 ;
[0094]其中,
[0095]所述第二获取单元305,用于获取模型系数;
[0096]所述第一建立单元306,用于依据所述第一概率、第二概率及所述模型系数,建立联合模型;
[0097]相应的,所述第三确定单元304,用于在所述至少一个候选对中,选取使所建立的联合模型的目标分值取得最大值的候选对;确定所选取的候选对中的候选名词为所述缺省
ο
[0098]其中,所述联合模型的表达式及其各参量的含义如前所述,这里不再赘述。
[0099]如图3所示,所述系统还包括:第一划分单元307,用于对所述句子进行词的划分,形成至少两个词;
[0100]相应的,所述第一获取单元301,用于确定所述至少两个词中的一个词在该词的位置之前存在有缺省词时,利用分类器获取用于替代该缺省词的至少一个候选代词、及每个候选代词作为该缺省词的概率,确定所述概率为第一概率;在所述对话的句子之前的η个句子中,提取所出现的所有名词,并将所提取的名词作为所述候选名词;其中,η为预先设置的正整数。
[0101]所述第二确定单元303,还用于将所述缺省词的所有候选代词与所有候选名词分别进行两两组合,形成针对所述缺省词的至少一个候选对;在确定所述缺省词的至少一个候选对时,利用分类器获取到每一个候选对中的候选名词将相应候选代词替换掉的概率,确定所述概率为第二概率。
[0102]如图3所示,所述系统还包括:第一选取单元308 ;
[0103]所述第一选取单元308,用于将与每一个候选对相对应的第一概率与第二概率代入至所述联合模型,得到所述联合模型的至少一个概率值;选取使所述联合模型取得最大概率值的候选对;
[0104]相应的,所述第三确定单元304,用于确定使所述联合模型取得最大概率值的候选对中的候选名词为缺省词,添加所述候选名词至所述句子的相应位置,以恢复所述当前句子的完整性。
[0105]在实际应用中,所述第一获取单元301、第一确定单元302、第二确定单元303、第三确定单元304、第二获取单元305、第一建立单元306、第一划分单元307及第一选取单兀308均可由中央处理单兀(CPU, Central Processing Unit)、或数字信号处理(DSP,Digital Signal Processor)、或微处理器(MPU,Micro Processor Unit)、或现场可编程门阵列(FPGA, Field Programmable Gate Array)等来实现;所述 CPU、DSP、MPU、FPGA 均可内直于问答系统中。
[0106]本领域技术人员应当理解,图3中所示的问答系统中的各处理单元的实现功能可参照前述省略恢复方法的相关描述而理解。本领域技术人员应当理解,图3所示的问答系统中各处理单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
[0107]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0108]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1