一种词向量的生成方法和装置与流程

文档序号:12063652阅读:来源:国知局
技术总结
本发明实施例公开了一种词向量的生成方法,所述方法包括:对获取到的第一训练分词集进行word2vec处理,得到第一训练分词集中每个训练分词的词向量;接收新分词;获取新分词的训练文本,对新分词的训练文本进行分词处理,得到新分词的训练分词,利用新分词和新分词的训练分词组成第二训练分词集;对第二训练分词集进行word2vec处理,得到第二训练分词集中每个训练分词的词向量;根据第一训练分词集中每个训练分词的词向量和第二训练分词集中每个训练分词的词向量,确定出新分词加入至第一训练分词集中的词向量。本发明实施例还同时公开了一种词向量的生成装置。本发明实施例旨在避免新分词加入时重新训练所需的运算量,缩短了新分词加入时生成词向量的时间。

技术研发人员:姬晨;王凯;张淑燕
受保护的技术使用者:努比亚技术有限公司
文档号码:201611229275
技术研发日:2016.12.27
技术公布日:2017.05.24

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1