一种辅助写作系统及方法与流程

文档序号:12863808阅读:193来源:国知局
一种辅助写作系统及方法与流程

本发明涉及辅助领域,尤其涉及一种辅助写作系统及方法。



背景技术:

当今社会手机、平板电脑取代了电视、纸媒成为人们主要的获取信息方式,这要归功于移动互联网时代的蓬勃发展,其最大特点是海量的信息聚集在各类信息流平台中。以微博、微信、今日头条、百度百家等为首的自媒体平台,自身的文章产量很小,甚至不生产文章,完全依靠大量的入驻写手、组织、机构发文,这些写手、机构按照行业、兴趣、侧重点等聚集了丰富而精彩的信息。

而巨量的文章为读者提供了近乎无穷尽的选择,但是对于文章的生产者来说是一种巨大的挑战。写作、发文的门槛降低了,但是从海量文章中脱颖而出的难度越来越大,为此各平台也建立标准,只有符合一定要求的才会得到平台的推荐,从而大大提升了用户阅读量以及作者自身的关注度。

因此,目前亟需一种技术以帮助作者提高其作品质量,也以提升其被平台推荐的机率。



技术实现要素:

有鉴于此,本申请提供一种辅助写作系统及方法,通过分析用户提交的文章,评判文章的“质量”,并提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。本申请提供的一种辅助写作系统,包括:

数据存储模块,用于存储现有的不同类型样本文章的文章标题、内容及文章语义特征数据模型;

文章获取模块,用于获取待测评的文章,并提取所述待测评文章的标题及内容;

特征提取模块,用于提取所述待测评的样本文章的文章语义特征数据模型;

相似性分析模块,用于将待测评文章的文章标题、内容及文章语义特征数据模型与数据存储模块中存储的不同类型样本文章的文章标题、内容及文章语义特征数据模型进行相似性对比分析,获取相似度值;

文章测评模块,用于根据所述相似度值对所述待测评文章的进行测评打分,并提供修改建议。

由上,通过分析用户提交的文章,评判文章的“质量”,并提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。

优选地,所述文章测评模块还用于:推荐相关文章以供用户参考。

优选地,所述系统,还包括:

信息流抓取模块,用于对现有的媒体平台的信息流进行定时爬取,并将爬取的文章存储到所述数据存储模块,以形成按时间版本存储的语料库;

信息流聚合模块,用于将所述语料库中的文章按照指定的聚类标准聚合,获取聚合后的不同类别的文章,并将其存储到数据存储模块。

由上,通过定时抓取现有的不同的媒体平台的文章,例如,针对不同时间段的热门度/关注度超过设定值的信息进行爬取,并对其进行聚类分析,有利于后续将其与带测评的文章进行比对,评判文章的“质量”,并作者提供建议及参考。

优选地,所述特征提取模块还用于:

提取所述语料库中的样本文章的文章语义特征数据模型并将其存储到数据存储模块中。

优选地,所述相似性分析模块还用于对语料库中的不同样本文章之间的文章语义特征数据模型的进行相似性对比分析,并将分析结果提供给所述信息流聚合模块。

由上,有利于为对样本文章的聚类提供相似度参考。

优选地,所述相似性分析模块还用于将待测评文章的文章语义特征数据模型、文章标题及内容与数据存储模块中存储的聚合后样本文章集合中的样本文章语义特征数据模型、文章标题及内容的进行相似性对比分析。

优选地,所述数据存储模块还用于:存储用户信息和用户使用日志;其中,所述数据存储模块存储的数据按日进行备份,按指定时间进行历史清理。

优选地,所述文章获取模块还用于自动将已提交的待测评的文章的标题、内容提取后生成系统需要的标准格式文本;

所述文章获取模块还用于记录并显示用户的上传及浏览的文章的记录。

优选地,所述测评结果包括:对于文章标题的评价、对于文章内容的评价、对于文章整体的测评分数;

所述修改建议包括:建议文章标题中添加的关键词、建议标题的造句方式、建议文章内容中增加或减少的信息点要素、建议文章中的段落的安排及造句方式。

其中,所述对于文章标题的评价包括:标题中包含的关键字的热度的评价,标题的造句方式的可读性的评价;

对于文章内容的评价包括但不限于:文章内容的信息量密度和丰富度的评价、文章中的段落的安排及造句方式的评价。

本申请还提供一种基于前述系统的辅助写作方法,包括步骤:

a、获取用于与待测评文章比对用的评测比对文章语料库:

a1、对现有的媒体平台的信息流进行定时爬取,并将爬取的文章存储到所述数据存储模块,以形成按时间版本存储的语料库,并存储;

a2、将所述语料库中的样本文章中出现的所有词语分隔提取,获取每篇文章的文章语义特征数据模型并将其存储。

a3、对语料库中的不同样本文章之间的文章语义特征数据模型进行相似性对比分析,获取分析结果,并存储;

a4、根据所述相似性分析模块的分析结果将所述语料库中的样本文章按照聚类标准聚合,并将聚合结果存储;

b、基于步骤a中获取的语料库对待测评的文章测评:

b1、将待测评的文章标题、内容自动提取后生成系统需要的标准格式文本;

b2、将待测评文章的标题和内容中出现的词语分隔提取,获取所述待测评的文章的文章语义特征数据模型;

b3、将待测评文章的标题、内容、文章语义特征数据模型与数据存储模块中存储的聚类后的样本文章集合中的样本文章标题、内容、文章语义特征数据模型进行相似性对比分析,获取相似度值;

b4、根据所述相似度值对待测评文章的进行测评打分,并提供修改建议以及推荐相关文章以供用户参考。

综上所述,本申请提供的一种辅助写作系统及方法,定时获取的现有的媒体平台的文章信息,据此分析用户提交的文章,评判用户提交的文章的“质量”,并提出修改建议,以及推荐相关文章以供用户参考,有利于提高作者的作品质量,从而提升被平台推荐的机率。

附图说明

图1为本申请实施例的语料库获取子系统的示意图;

图2为本申请实施例的文章测评子系统的示意图;

图3为本申请实施例的一种辅助写作方法的示意图。

具体实施方式

下面将结合本申请实施例中的附图对本申请进行说明。

实施例一

有鉴于此,本申请提供一种辅助写作系统及方法,通过分析用户提交的文章,评判文章的“质量”,以及提出修改建议,有利于提高作者的作品质量,从而提升被平台推荐的机率。

本实施例提供一种辅助写作系统,包括:语料库获取子系统及文章测评子系统。其中,语料库获取子系统用于获取与待测评的文章比对的评测比对文章语料库,如图1所述,语料库获取子系统包括:

信息流抓取模块,用于对现有的媒体平台(包括主流自媒体平台,微博、论坛等)的信息流进行定时爬取,并将爬取的文章(包括文章标题及内容)存储到所述数据存储模块,以形成按时间版本存储的语料库;另外,其也可以按一定算法、策略的进行爬取,例如,针对不同时间段的热门度/关注度超过设定值的信息进行爬取。

特征提取模块,用于将所述语料库中的文章中出现的所有词语分隔提取,获取每篇文章的文章语义特征数据模型并将其存储到数据存储模块中。

相似性分析模块,用于对语料库中的不同文章之间的文章语义特征数据模型的进行相似性对比分析,获取分析结果。例如,假设有3篇文章:a、b、c,将3篇文章的文章语义特征数据模型进行相似性对比,获取两两相似性对比的相似度,并记录。例如a、b的相似度为90%,b、c的相似度为20%,a、c的相似度为30%。

信息流聚合模块,用于根据所述相似性分析模块的分析结果将所述语料库中的文章按照聚类标准聚合,并将聚合结果存储到数据存储模块。此处的聚类标准可以是但不限于样本文章的类型,例如,按照读者年龄划分的文章类型(儿童、青少年、中年、老年)、按照性别划分的文章类型、按照读者的角色划分的文章类型(学生、白领、海归、公务员、教师、家长等等)。聚合结果是不同的类别的文章的归类聚合。

数据存储模块,用于存储现有的不同类型文章的文章语义特征数据模型,以及存储用户信息和用户使用日志;其中,所述数据存储模块存储的数据按日进行备份,按指定时间进行历史清理;其中,不同类型的文章可以是但不限于按照读者年龄划分的文章类型(儿童、青少年、中年、老年)、按照性别划分的文章类型、按照读者的角色划分的文章类型(学生、白领、海归、公务员、教师、家长、农民工、快递员等)。

其中,如图2所示,文章测评子系统,包括:

文章获取模块,用于获取待测评的文章;即用户通过该模块提交待测评的文章。所述文章提交模块还用于在待测评文章提交后自动提取待测评的文章中的标题、内容生成系统需要的标准格式文本,目前支持的文档为word文档(doc和docx)。所述文章提交模块还用于记录并显示用户的上传及浏览的文章的记录。

特征提取模块,用于将待测评文章的标题和内容中出现的词语分隔提取,获取所述待测评的文章的文章语义特征数据模型。其中,该特征提取模块与语料库获取子系统中的特征提取模块可以是同一模块。

相似性分析模块,用于将待测评文章的文章语义特征数据模型、文章标题、内容与数据存储模块中存储的现有的不同类型的样本文章的文章语义特征数据模型、文章标题、内容进行相似性对比分析。例如,将待测评文章的文章语义特征数据模型与前述的数据存储模块中的存储的语料库的不同类型的聚类后的文章集合中样本文章的语义特征数据模型、文章标题、内容对比分析,获取其相似度值。其中,该特征提取模块与语料库获取子系统中的特征提取模块可以是同一模块。

文章测评模块,用于根据所述相似性分析模块的分析结果(各个相似度值)对待测评文章的进行加权求和获取测评打分,并提供修改建议以及推荐相关文章以供用户参考。例如将评分最高的文章推荐给用户。

其中,所述测评结果包括但不限于:对于文章标题的评价、对于文章内容的评价、对于文章整体的测评分数;其中,所述对于文章标题的评价包括但不限于:标题中包含的关键字的热度的评价,标题的造句方式的可读性的评价;对于文章内容的评价包括但不限于:文章内容的信息量密度和丰富度的评价、文章内容中包含的信息点要素的内容及多少的评价、文章中的段落的安排及造句方式的评价。

所述修改建议包括:建议文章标题中添加的关键词、建议标题的造句方式、建议文章内容中增加或减少的信息点要素、建议文章中的段落的安排及造句方式。

其中,用户可以通过注册窗口进行注册该系统;以及通过登录窗口进行登录该系统;或者在未注册未登录的情况下免费试用该系统。

实施例二

如图3所示,本申请还提供一种基于上述辅助写作系统的辅助写作方法,包括:

a、获取用于与待测评文章比对用的评测比对文章语料库(该语料库包括以下步骤a1-a4中获取的内容):

a1、对现有的媒体平台(包括主流自媒体平台,微博、论坛等)的信息流进行定时爬取,并将爬取的样本文章存储到所述数据存储模块,以形成按时间版本存储的语料库,并存储。

a2、将所述语料库中的样本文章中出现的所有词语分隔提取,获取每篇文章的文章语义特征数据模型并将其存储。

a3、对语料库中的不同样本文章之间的文章语义特征数据模型的进行相似性对比分析,获取分析结果(例如相似度值),并存储。

a4、根据所述相似性分析模块的分析结果将所述语料库中的样本文章按照指定的聚类标准聚合,并将聚合结果存储;

b、基于步骤a中获取的语料库对待测评的文章测评;

b1、将待测评的文章标题、内容自动提取后生成系统需要的标准格式文本;例如,word格式文本(doc和docx)。

b2、将待测评文章的标题和内容中出现的词语分隔提取,获取所述待测评的文章的文章语义特征数据模型。

b3、将待测评文章的文章语义特征数据模型、文章标题及内容与数据存储模块中存储的语料库的不同类型的样本文章的文章语义特征数据模型、文章标题及内容进行相似性对比分析,获取分析结果。

b4、根据所述分析结果对待测评文章的进行测评打分,并提供修改建议以及推荐相关文章以供用户参考。例如将评分最高的文章推荐给用户。

其中,所述测评结果包括但不限于:对于文章标题的评价、对于文章内容的评价、对于文章整体的测评分数;其中,所述对于文章标题的评价包括:标题中包含的关键字的热度的评价,标题的造句方式的可读性的评价;对于文章内容的评价包括:文章内容的信息量密度和丰富度的评价、文章内容中包含的信息点要素的内容及多少的评价、文章中的段落的安排及造句方式的评价。

所述修改建议包括:建议文章标题中添加的关键词、建议标题的造句方式、建议文章内容中增加或减少的信息点要素、建议文章中的段落的安排及造句方式。

综上所述,本申请提供的一种基于人工智能技术的辅助写作系统及方法,定时获取的现有的媒体平台的文章信息,据此分析用户提交的文章,评判用户提交的文章的“质量”,并提出修改建议,以及推荐相关文章以供用户参考,有利于提高作者的作品质量,从而提升被平台推荐的机率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1