推送信息的生成方法及装置与流程

文档序号:18739975发布日期:2019-09-21 01:39阅读:来源:国知局

技术特征:

1.一种推送信息的生成方法,所述方法包括:

获取针对待推送目标通过自然语言进行描述的描述信息;

将所述描述信息拆分为多个字符单元,并确定各个字符单元分别对应的各个字符向量,所述各个字符向量按照所述多个字符单元的排列顺序形成向量序列;

利用预先训练的编码解码网络处理所述向量序列,以得到至少一个不超过预定长度的字符序列;

基于所得到的各个字符序列为所述待推送目标确定推送信息。

2.根据权利要求1所述的方法,其中,所述字符单元包括以下中的一项:

单个文字、至少一个文字形成的词汇、具有独立意义的字符串。

3.根据权利要求1所述的方法,其中,所述多个字符单元包括第一字符单元;

所述确定各个字符单元分别对应的各个字符向量包括:

查询所述第一字符单元对应的独热表示的第一数字ID;

将所述第一数字ID输入预先训练的字符向量模型,并根据所述字符向量模型的输出结果确定所述第一字符单元对应的字符向量。

4.根据权利要求1所述的方法,其中,所述编码解码网络包括编码神经网络和解码神经网络;

所述利用预先训练的编码解码网络处理所述向量序列包括:

通过所述编码神经网络将所述向量序列转换成语义向量;

通过所述解码神经网络为所述语义向量预测至少一个字符序列。

5.根据权利要求4所述的方法,其中,所述编码神经网络或所述解码神经网络分别为循环神经网络、双向循环神经网络、门控循环单元、长短期记忆模型中的一个。

6.根据权利要求4所述的方法,其中,所述通过所述解码神经网络为所述语义向量预测至少一个字符序列包括:

根据所述语义向量和序列开始标识,通过所述解码神经网络的神经元在第一时刻预测预定个数的首字符;

根据所述语义向量和第t-1时刻已预测到的字符或字符序列,通过所述解码神经网络的神经元在第t时刻预测预定个数的当前字符序列,其中,t为大于1的自然数。

7.根据权利要求4所述的方法,其中,所述编码解码网络通过以下方式训练:

将分别与多个推送目标对应的各个序列对作为训练样本,其中,各个序列对分别对应一个源序列和一个目标序列,源序列是相应推送目标的描述信息对应的向量序列,目标序列是与相应推送目标对应的字符序列或者数字ID序列;

将各个序列对中的源序列作为所述编码神经网络的输入,将前面添加一个序列开始标识后的目标序列输入所述解码神经网络,根据所述解码神经网络的输出结果与在后面添加一个序列结束标识的目标序列的对比,调整所述编码解码网络的模型参数。

8.根据权利要求1所述的方法,其中,所述基于所得到的各个字符序列为所述待推送目标确定推送信息包括:

通过预先训练的语言模型,预测各个字符序列分别作为句子出现的各个概率;

按照各个概率选择满足以下条件之一的字符序列,作为待推送目标的推送信息:属于预定数量概率最大的字符序列、概率超过预设概率阈值。

9.根据权利要求1所述的方法,其中,所述描述信息通过光学字符识别方式从针对所述待推送目标的图片中获取。

10.一种推送信息的生成装置,所述装置包括:

获取单元,配置为获取针对待推送目标通过自然语言进行描述的描述信息;

预处理单元,配置为将所述描述信息拆分为多个字符单元,并确定各个字符单元分别对应的各个字符向量,所述各个字符向量按照所述多个字符单元的排列顺序形成向量序列;

预测单元,配置为利用预先训练的编码解码网络处理所述向量序列,以得到至少一个不超过预定长度的字符序列;

确定单元,配置为基于所得到的各个字符序列为所述待推送目标确定推送信息。

11.根据权利要求10所述的装置,其中,所述字符单元包括以下中的一项:

单个文字、至少一个文字形成的词汇、具有独立意义的字符串。

12.根据权利要求10所述的装置,其中,所述多个字符单元包括第一字符单元;

所述预处理单元进一步配置为:

查询所述第一字符单元对应的独热表示的第一数字ID;

将所述第一数字ID输入预先训练的字符向量模型,从而根据所述字符向量模型的输出结果确定所述第一字符单元对应的字符向量。

13.根据权利要求10所述的装置,其中,所述编码解码网络包括编码神经网络和解码神经网络;

所述预测单元进一步配置为:

通过所述编码神经网络将所述向量序列转换成语义向量;

通过所述解码神经网络为所述语义向量预测至少一个字符序列。

14.根据权利要求13所述的装置,其中,所述编码神经网络或所述解码神经网络分别为循环神经网络、双向循环神经网络、门控循环单元、长短期记忆模型中的一个。

15.根据权利要求13所述的装置,其中,所述预测单元还配置为:

根据所述语义向量和序列开始标识,通过所述解码神经网络的神经元在第一时刻预测预定个数的第一个字符;

根据所述语义向量和第t-1时刻已预测到的字符或字符序列,通过所述解码神经网络的神经元在第t时刻预测预定个数的当前字符序列,其中,t为大于1的自然数。

16.根据权利要求13所述的装置,其中,所述装置还包括训练单元,配置为通过以下方式训练所述编码解码网络:

将分别与多个推送目标对应的各个序列对作为训练样本,其中,各个序列对分别对应一个源序列和一个目标序列,源序列是相应推送目标的描述信息对应的向量序列,目标序列是与相应推送目标对应的字符序列或者数字ID序列;

将各个序列对中的源序列作为所述编码神经网络的输入,将前面添加一个序列开始标识后的目标序列输入所述解码神经网络,根据所述解码神经网络的输出结果与在后面添加一个序列结束标识的目标序列的对比,调整所述编码解码网络的模型参数。

17.根据权利要求10所述的装置,其中,所述确定单元还配置为:

通过预先训练的语言模型,预测各个字符序列分别作为句子出现的各个概率;

按照各个概率选择满足以下条件之一的字符序列,作为待推送目标的推送信息:属于预定数量概率最大的字符序列、概率超过预设概率阈值。

18.根据权利要求10所述的装置,其中,所述装置还包括识别单元,配置为:

通过光学字符识别方式从针对所述待推送目标的图片中获取所述描述信息。

19.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。

20.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1