一种写作方法、装置及存储介质与流程

文档序号:27977628发布日期:2021-12-15 01:15阅读:来源:国知局

技术特征:
1.一种写作方法,其特征在于,包括:获取写作任务,所述写作任务包括文章标题;根据所述文章标题,生成写作目录及与写作目录对应的列表内容;将所述列表内容作为所述预先训练好的写作模型的输入,得到一组编码数组;采用包含语料字符的字典对所述编码数组进行解码,得到与所述写作目录对应的分段落文章。2.如权利要求1所述的写作方法,其特征在于,所述根据所述文章标题,生成写作目录及与写作目录对应的列表内容,包括:提取所述文章标题的关键字;从目录库中调取与所述关键字相关性排名前n位的目录作为待选择目录以供用户选择,并将用户选择目录作为所述写作目录;对所述写作目录拆分得到所述列表内容。3.如权利要求1所述的写作方法,其特征在于,所述采用包含语料字符的字典对所述编码数组进行解码,得到与所述写作目录对应的分段落文章,包括:对所述编码数据进行归一化还原,得到还原后的整数数组;采用所述包含语料字符的字典对所述整数数组进行解码,得到对应的段落文本;将所述段落文本按照所述写作目录进行拼接,得到所述分段落文章。4.如权利要求1

3任一项所述的写作方法,其特征在于,所述写作模型采用gpt

2模型,所述gpt

2模型包括第一全连接层和基干网络,基干网络包括多层结构相同的transformer结构层,基干网络后接第一全连接层,所述transformer结构层包括依次连接的第二全连接网络层、自注意力层、第三全连接网络层和前馈神经网络层。5.如权利要求4所述的写作方法,其特征在于,在所述将所述列表内容作为所述预先训练好的写作模型的输入,得到一组编码数组之前,还包括:收集公文类素材,构建训练样本数据;利用训练样本数据对所述写作模型进行训练,得到所述训练好的写作模型。6.如权利要求5所述的写作方法,其特征在于,所述收集公文类素材,构建训练样本数据,包括:将所述公文类素材切割为多篇文本语料;遍历所有的所述文本语料,生成包含语料字符的字典;采用berttokenizer结合所述包含语料字符的字典对所述所有的文本语料进行编码,生成样本数组;对所述样本数组进行归一化处理,得到样本编码数组,构建得到所述训练样本数据。7.如权利要求5所述的写作方法,其特征在于,所述利用训练样本数据对所述写作模型进行训练时,采用adam函数作为优化算法,采用的损失函数如下公式:l1(u)=∑
i
logp(u
i
|u
i

k
,...,u
i
‑1;θ)其中,u=[u1,...,u
n
]表示给定的句子,θ为模型参数,表示出现u的概率,i为编码数组的下标,取值范围为[1,数组长度],k为预先设定的上下文窗口大小。8.如权利要求7所述的写作方法,其特征在于,所述利用训练样本数据对所述写作模型进行训练,确定所述写作模型的参数为:文本生成选词个数top

k值,且取值范围为[1,字典
长度],概率过滤器参数top

p大于零,生成温度大于零。9.一种写作装置,其特征在于,包括:任务获取模块、目录生成模块、编码模块和文章生成模块,其中:任务获取模块用于获取写作任务,所述写作任务包括文章标题;目录生成模块用于根据所述文章标题,生成写作目录及与写作目录对应的列表内容;编码模块用于将所述列表内容作为所述预先训练好的写作模型的输入,得到一组编码数组;文章生成模块用于采用包含语料字符的字典对所述编码数组进行解码,得到与所述写作目录对应的分段落文章。10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1

8任一项所述的写作方法。

技术总结
本发明公开了一种写作方法、装置及存储介质,属于信息处理技术领域,包括:获取写作任务,所述写作任务包括文章标题;根据所述文章标题,生成写作目录及与写作目录对应的列表内容;将所述列表内容作为所述预先训练好的写作模型的输入,得到一组编码数组;采用包含语料字符的字典对所述编码数组进行解码,得到与所述写作目录对应的分段落文章。本发明可生成分段落文章,且生成的文章灵活性强,适用于公文类文章写作。类文章写作。类文章写作。


技术研发人员:王康 冯海洪 毛德平
受保护的技术使用者:安徽咪鼠科技有限公司
技术研发日:2021.09.14
技术公布日:2021/12/14
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1