基于人工智能的文章生成方法及装置、设备与可读介质与流程

文档序号:11230433阅读:248来源:国知局
基于人工智能的文章生成方法及装置、设备与可读介质与流程

【技术领域】

本发明涉及计算机应用技术领域,尤其涉及一种基于人工智能的文章生成方法及装置、设备与可读介质。



背景技术:

人工智能(artificialintelligence;ai),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

随着网络科技的发展和智能电子设备的普及,各种网络媒体迅速崛起,受到越来越多的用户的青睐。这样,用户可以随时随地使用智能的电子设备浏览电子版的新闻,了解最新资讯信息。

现有技术中的网络媒体中的新闻资讯通常包括有时效性内容的文章和非时效内容的文章。其中时效性内容的文章为当前时间段内发生的,仅适用于这段时间的新闻资讯,过了这段时间,这个时效性新闻由于具有较强的时效性,时效性内容无法被再次拿来使用。而非时效性内容的文章不带有任何时效性,例如可以包括一些历史资料或电视剧的分析、一些社会现象的分析以及一些时效性新闻资讯的分析或延展阅读等等新闻资讯,这些新闻资讯的很多内容不带有时效性,可以在任何时候被再次拿来使用。现有技术中的所有新闻资讯均由网站工作人员通过撰写并编辑生成。

由于现有技术的所有新闻资讯的生成均需要通过网站工作人员通过撰写并编辑生成,导致新闻资讯的文章生成效率较低。



技术实现要素:

本发明提供了一种基于人工智能的文章生成方法及装置、设备与可读介质,用于提高新闻资讯的文章的生成效率。

本发明提供一种基于人工智能的文章生成方法,所述方法包括:

通过监控访问热点,获取新闻主题;

根据所述新闻主题从新闻资源库中获取对应的摘要;

根据所述新闻主题从预先生成的切片段落库中获取对应的多个段落切片;

根据所述新闻主题对应的摘要和所述新闻主题对应的多个段落切片,生成所述新闻主题对应的文章。

进一步可选地,如上所述的方法中,根据所述新闻主题从预先生成的切片段落库中获取对应的段落切片之前,还包括:

从文档内容库中检测出非时效性内容的文章;

对所述非时效性内容的文章进行切片,得到多个段落切片;

提取各所述段落切片的标签;

将多个所述段落切片按照各所述段落切片的标签和对应的所述段落切片的对应关系存储,生成切片段落库。

进一步可选地,如上所述的方法中,根据所述新闻主题从预先生成的切片段落库中获取对应的多个段落切片,具体包括:

根据所述新闻主题从所述切片段落库中获取与所述新闻主题对应的所述段落切片的标签;

根据所述段落切片的标签与所述段落切片的对应关系,从所述切片段落库中获取所述段落切片的标签对应的多个所述段落切片。

进一步可选地,如上所述的方法中,根据所述新闻主题对应的摘要和所述新闻主题对应的多个段落切片,生成所述新闻主题对应的文章,具体包括:

计算所述新闻主题对应的摘要和所述新闻主题对应的多个所述段落切片中各所述段落切片的文本相似度;

根据各所述段落切片的文本相似度,从多个所述段落切片中获取文本相似度最高的至少一个所述段落切片;

将所述新闻主题与至少一个所述段落切片进行拼接,生成所述新闻主题对应的初始文章;

对所述新闻主题对应的初始文章进行质量提升处理,得到所述新闻主题对应的文章。

进一步可选地,如上所述的方法中,对所述新闻主题对应的初始文章进行质量提升处理,得到所述新闻主题对应的文章,具体包括如下至少一种:

将所述新闻主题对应的初始文章进行内容去重;

删除所述新闻主题对应的初始文章中的不能够在新闻中显示的隐晦词语;

根据润色语句库对所述新闻主题对应的初始文章中的语句进行润色;和

根据所述新闻主题对应的评价属性库对所述新闻主题对应的初始文章中相应的属性进行更新。

本发明还提供一种基于人工智能的文章生成装置,所述装置包括:

新闻主题获取模块,用于通过监控访问热点,获取新闻主题;

摘要获取模块,用于根据所述新闻主题从新闻资源库中获取对应的摘要;

段落切片获取模块,用于根据所述新闻主题从预先生成的切片段落库中获取对应的多个段落切片;

生成模块,用于根据所述新闻主题对应的摘要和所述新闻主题对应的多个段落切片,生成所述新闻主题对应的文章。

进一步可选地,如上所述的装置中,所述装置还包括检测模块、切片模块和提取模块;

所述检测模块,用于从文档内容库中检测出非时效性内容的文章;

所述切片模块,用于对所述非时效性内容的文章进行切片,得到多个段落切片;

所述提取模块,用于提取各所述段落切片的标签;

所述生成模块,还用于将多个所述段落切片按照各所述段落切片的标签和对应的所述段落切片的对应关系存储,生成切片段落库。

进一步可选地,如上所述的装置中,所述段落切片获取模块,具体用于:

根据所述新闻主题从所述切片段落库中获取与所述新闻主题对应的所述段落切片的标签;

根据所述段落切片的标签与所述段落切片的对应关系,从所述切片段落库中获取所述段落切片的标签对应的多个所述段落切片。

进一步可选地,如上所述的装置中,所述生成模块,具体用于:

计算所述新闻主题对应的摘要和所述新闻主题对应的多个所述段落切片中各所述段落切片的文本相似度;

根据各所述段落切片的文本相似度,从多个所述段落切片中获取文本相似度最高的至少一个所述段落切片;

将所述新闻主题与至少一个所述段落切片进行拼接,生成所述新闻主题对应的初始文章;

对所述新闻主题对应的初始文章进行质量提升处理,得到所述新闻主题对应的文章。

进一步可选地,如上所述的装置中,所述生成模块,具体用于执行如下至少一种:

将所述新闻主题对应的初始文章进行内容去重;

删除所述新闻主题对应的初始文章中的不能够在新闻中显示的隐晦词语;

根据润色语句库对所述新闻主题对应的初始文章中的语句进行润色;和

根据所述新闻主题对应的评价属性库对所述新闻主题对应的初始文章中相应的属性进行更新。

本发明还提供一种计算机设备,所述设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的基于人工智能的文章生成方法。

本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的基于人工智能的文章生成方法。

本发明的基于人工智能的文章生成方法及装置、设备与可读介质,通过监控访问热点,获取新闻主题;根据新闻主题从新闻资源库中获取对应的摘要;根据新闻主题从预先生成的切片段落库中获取对应的段落切片;根据新闻主题对应的摘要和新闻主题对应的段落切片,生成新闻主题对应的文章。本发明的技术方案,通过利用已有优质内容处理成的切片段落库,在用户产生对应的新闻需求时,进行重组合后重发布,避免写作的重复劳动,能够大大缩短文章的生成时间,进而大大地提高文章的生成效率;而且本发明中,文章的生成过程完全机器化,避免人工重复劳动,从而能够极大地节省文章生成过程的人力成本。

【附图说明】

图1为本发明的基于人工智能的文章生成方法实施例的流程图。

图2为本发明的基于人工智能的文章生成方法的示例图。

图3为本发明的基于人工智能的文章生成装置实施例一的结构图。

图4为本发明的基于人工智能的文章生成装置实施例二的结构图。

图5为本发明的计算机设备实施例的结构图。

图6为本发明提供的一种计算机设备的示例图。

【具体实施方式】

为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。

图1为本发明的基于人工智能的文章生成方法实施例的流程图。如图1所示,本实施例的基于人工智能的文章生成方法,具体可以包括如下步骤:

100、通过监控访问热点,获取新闻主题;

101、根据新闻主题从新闻资源库中获取对应的摘要;

102、根据新闻主题从预先生成的切片段落库中获取对应的多个段落切片;

103、根据新闻主题对应的摘要和新闻主题对应的多个段落切片,生成新闻主题对应的文章。

本实施例的基于人工智能的文章生成方法的执行主体为基于人工智能的文章生成装置,该基于人工智能的文章生成装置可以为一电子的实体装置,也可以为采用软件集成的装置。

本实施例中,该基于人工智能的文章生成装置可以通过监控访问热点,获取新闻主题。例如,具体可以通过监控搜索网站的搜索日志,获取搜索频率较高、搜索热度较高的新闻点作为访问热点。或者也可以通过监控用户对feed流的浏览日志,从中获取热度较高的新闻点作为访问热点;或者还可以监控各网站中用户定制的个性化push,获取用户定制的热度较高的新闻点作为访问热点等等。然后根据访问热点,获取对应的新闻主题。本实施例的访问热点也可以称为用户关注度(attention),即用户关注较高的点。然后基于人工智能的文章生成装置可以使用attention请求时效性新闻接口,获取当前时期该attention对应的新闻主题。例如,本实施例的新闻主题为根据当前访问热点衍生的新闻,例如对当前访问热点进行分析的新闻主题,或者根据当前访问热点所衍生的延展阅读。例如对于当前访问热点为“a明星与b明星传出离婚绯闻”,获取对应的新闻主题可以为《a明星与b明星传出离婚绯闻,关于离婚财产分割问题的思考》;再例如在每年的诺贝尔奖揭晓的时候,“诺贝尔奖”会成为这一时期的访问热点,此时可以获取的新闻主题可以为《诺贝尔奖再揭晓,你可知道诺贝尔奖的历史吗?》。按照每一种访问热点,均可以产生相关的种种新闻主题,例如基于人工智能的文章生成装置中也可以预设多种根据访问热点生成对应的新闻主题的模板,在监测获取到访问热点之后,可以根据存储的多个生成对应的新闻主题的模板,生成对应的新闻主题,或者也可以采用其他方式根据访问热点生成对应的新闻主题,在此不再一一举例赘述。

然后在网站的新闻资源库中可以获取到该新闻主题对应的摘要。需要说明的是,新闻资源库中可以包括各种新闻主题的摘要信息,本实施例的基于人工智能的文章生成装置和新闻资源库可以为属于同一网站或者合作网站,这样,基于人工智能的文章生成装置可以访问新闻资源库,并从中获取当前的新闻主题的摘要信息。

本实施例的切片段落库为预先根据非时效性性内容文章生成的;且该切片段落库可以选取已经验证过阅读体验数据良好的资源作为备选,保证用户阅读的内容都是被先验确认高质量的。由于新闻主题是根据访问热点获取的,因此本实施例中,从切片段落库中获取与该新闻主题内容相关的多个段落切片,作为该新闻主题对应的多个段落切片的过程,可以理解为根据访问热点唤醒的切片段落库,并从切片段落库中获取该新闻主题对应的多个段落切片。最后,分别根据获取的新闻主题对应的摘要和新闻主题对应的多个段落切片,生成新闻主题对应的文章;将以新闻主题作为文章的标题、以新闻主题对应的摘要作为文章的摘要、并以新闻主题对应的多个段落切片作为文章的正文,从而生成该新闻主题对应的文章。另外,本实施例生成的文章中还可以包括本次编辑进来的新的内容。但是由于从切片段落库中获取对应的段落切片,已经大大地提高了文章的编写效率。

本实施例的基于人工智能的文章生成方法,通过监控访问热点,获取新闻主题;根据新闻主题从新闻资源库中获取对应的摘要;根据新闻主题从预先生成的切片段落库中获取对应的段落切片;根据新闻主题对应的摘要和新闻主题对应的段落切片,生成新闻主题对应的文章。本实施例的技术方案,通过利用已有优质内容处理成的切片段落库,在用户产生对应的新闻需求时,进行重组合后重发布,避免写作的重复劳动,能够大大缩短文章的生成时间,进而大大地提高文章的生成效率;而且本实施例中,文章的生成过程完全机器化,避免人工重复劳动,从而能够极大地节省文章生成过程的人力成本。

而且,传统新闻有效内容需要重复写作完成,重复性工作较多,对时效性信息反馈也不够及时,往往热点事件发生一段时间后,才会陆续产出分析或者延展阅读;而本实施例的技术方案中可以循环利用已有优质内容生成文章,能够大大缩短文章的生成时间,从而实现根据用户关注度自动唤醒并翻新文章,保证第一时间提供给用户有价值的分析或者扩展阅读。

进一步可选地,在上述实施例的技术方案的基础上,其中步骤102“根据新闻主题从预先生成的切片段落库中获取对应的多个段落切片”之前,还可以包括如下步骤:

(a1)从文档内容库中检测出非时效性内容的文章;

由于很多优质的非时效性文章写作后在传播一次以后很容易就此沉寂,但这类内容对时效性本身并不是很敏感,完全可以反复利用。本实施例便将这将这部分非时效性内容的文章进行整理,生成切片段落库。

本实施例的文档内容库用于存储网站中的各种时效性文章和非时效性文章。也就是说,网站中的时效性文章和非时效性文章一经发布之后,不会被立马删除,而是存储在文档内容库中,以在需要的时候再调取。本实施例中可以实时对文档内容库中新加入的文章进行检测,判断该文章为时效性内容的文章还是非时效性内容的文章。或者也可以定期对这一段时间内加入至文档内容库中的文章进行检测,判断新加入的每一文章为时效性内容的文章还是非时效性内容的文章;并获取非时效性内容的文章。具体地,在检测某文章为时效性内容的文章还是非时效性内容的文章时,具体可以根据时间元素来检测,例如当文章中包括“x月x日最新报道”、“x点x分发回的报道”之类的明显的时间字眼的,均认为该文章为时效性内容的文章。另外,还可以根据时效性内容的文章中通常会携带的特征文本“最新”、“第一时间”等,来确定该文章为时效性内容的文章。也就是说,可以建立不满足时效性内容的文章的各种正则条件,或者建立时效性内容的文章的特征文本库,检测时可以根据建立的正则条件和/或特征文本框,从中滤出非时效性内容的文章。

(a2)对非时效性内容的文章进行切片,得到多个段落切片;

(a3)提取各段落切片的标签;

(a4)将多个段落切片按照各段落切片的标签和对应的段落切片的对应关系存储,生成切片段落库。

本实施例中,获取到非时效性内容的文章之后,对于每一个非时效性内容的文章,可以对非时效性内容的文章进行切片,得到多个段落切片。在具体切片时,是以段落为最小切片单元,若段落与段落之间具有承接语料,可以根据段落之间的承接语料,确定这两个相邻段落是否应该在一个段落切片中,还是应该分布在不同的段落切片中。例如对于某段落的开头的承接语料为“也就是说”、“具体地”、“而且”等明显能够看出来本段络的内容与上一段络内容为同一主题,此时可以将当前段落和上一段落划在同一段落切片中。另外,还可以通过检测上下连续两个段落中文本的重复度。因为若下一段落用于解释上一段落的内容,或者和上一段落围绕同一主题展开的描述时,上下两段落的文本的重复度会较高。此时可以通过检测上下两段落的文本的重复度,并判断文本的重复度是否达到预设重复度阈值,若达到,则认为上下两段落可以划分在同一段落切片中。实际应用中,上述两种方式可以分开单独使用,也可以结合起来一起来使用,先通过段落之间的承接语料判断这两个段落是否应该划分在同一段落切片中,若相邻两段落之间的承接语料确定需要将两个段落划分在同一段落切片,则将两个段落划分在同一段落切片;否则相邻两段落之间没有承接语料,则进一步判断上下两段落之间的文本重复度,若判断文本的重复度达到预设重复度阈值,则将上下两段落划分在同一段落切片中;否则将上下两段落划分在不同段落切片中。以此类推可以对一篇文章的每个段落进行检测,从而实现对非时效性内容的文章进行切片,得到多个段落切片。实际应用中,也可以采用其他方式对文章进行切片,在此不再一一举例赘述。

然后,提取各段落切片的标签,例如某段落切片是介绍离婚的财产分割事宜,该段落切片的标签可以标识为财产分割。某段落切片是介绍离婚的孩子抚养问题,该段落切片的标签可以标识为小孩抚养。然后可以将该段落切片和对应的标签按照对应关系存储,生成切片段落库;以便于在后续需要从切片段落库中获取段落切片时,可以根据标签及时获取。另外,在存储段落切片时,还可以按照段落切片、标签以及标题来存储,这样,在下次使用时,需要引入该段落切片的出处时,还可以获取该段落切片的原来的标题。

此时进一步可选地,在上述实施例的技术方案的基础上,其中步骤102“根据新闻主题从预先生成的切片段落库中获取对应的多个段落切片”,具体可以包括:

(b1)根据新闻主题从切片段落库中获取与新闻主题对应的段落切片的标签;

(b2)根据段落切片的标签与段落切片的对应关系,从切片段落库中获取段落切片的标签对应的多个段落切片。

本实施例中的新闻主题为类似于标题的文章题目,切片段落库中的标签为段落切片的文本特征,用来概括段落切片的内容。具体地,可以根据新闻主题从切片段落库中获取与该新闻主题相似度非常高的标签。例如可以通过计算新闻主题与切片的相关性,例如对于新闻主题中携带“关于离婚财产分割问题的思考”与标签为“离婚财产分割”的相关性非常高,将与新闻主题的相关性数值达到相关性预设阈值的标签,作为该新闻主题对应的标签。由于切片段落库中的段落切片是按照段落切片与标签的对应关系存储,获取到新闻主题对应的标签之后,便可以从切片段落库中,根据标签与段落切片之间的对应关系,获取该标签对应的多个段落切片,作为与该新闻主题对应的多个段落切片。

此时进一步可选地,在上述实施例的技术方案的基础上,其中步骤103“根据新闻主题对应的摘要和新闻主题对应的段落切片,生成新闻主题对应的文章”,具体可以包括:

(c1)计算新闻主题对应的摘要和新闻主题对应的多个段落切片中各段落切片的文本相似度;

(c2)根据各段落切片的文本相似度,从多个段落切片中获取文本相似度最高的至少一个段落切片;

(c3)将新闻主题与至少一个段落切片进行拼接,生成新闻主题对应的初始文章;

(c4)对新闻主题对应的初始文章进行质量提升处理,得到新闻主题对应的文章。

本实施例中的段落切片为生成文章的最小单元。但是在获取到新闻主题对应的多个段落切片未必都是与获取的新闻主题的摘要紧扣的。因此,本实施例中,可以先计算新闻主题对应的摘要和新闻主题对应的每个段落切片的文本相似度;然后根据多个段落切片的文本相似度的大小,从多个段落切片中获取文本相似度最高的至少一个段落切片。例如,可以根据实际需求,获取1-3个文本相似度最高的段落切片。

然后将新闻主题与至少一个段落切片进行拼接,生成新闻主题对应的初始文章。其中至少一个段落切片包括两个或者两个以上段落切片时,在拼接时,也需要注意段落之间的衔接性。例如可以采用承接语料来将两个段落切片衔接起来。其中承接语料可以预先采集的一些具有承上启下作用,用于连接两个段落的语料,例如可以将多个承接语料存储在一个承接语料库中,使用时从承接语料库中选择一个承接语料,连接两个段落切片。或者还可以采用人工干预的方式,将选择的承接语料和所使用在的两个段落切片显示给编辑人员,以供编辑人员查看该承接语料是否合适。若不合适,可以由编辑人员通过人机接口模块输入一个承接语料。或者直接向编辑人员显示承接语料库中的承接语料以及所使用在的两个段落切片,由编辑人员选择一个恰当的承接语料,使用在这两个段落切片中后一个段落的开头,以衔接这两个段落切片。

最后对拼接得到的该新闻主题对应的初始文章进行质量提升处理,得到新闻主题对应的文章。

例如,进一步可选地,在上述实施例的技术方案的基础上,其中步骤c3“对新闻主题对应的初始文章进行质量提升处理,得到新闻主题对应的文章”,具体可以包括如下至少一种:

(d1)将新闻主题对应的初始文章进行内容去重;

例如,若初始文章中,各段落切片之间重复内容较多,可以进行去重检测,去掉重复内容,提升文章的质量。

(d2)删除新闻主题对应的初始文章中的不能够在新闻中显示的隐晦词语;

由于得到的初始文章是对切片段落库中的段落切片进行翻新处理得到,而切片段落库中的段落切片是对一些已经发布过的非时效性内容的文章进行切分得到的,均属于过去的内容。而在非时效性内容的文章发布时,文章中的某些词语可能可以随便使用,而在当前翻新时,有些词语可能属于敏感性词语,需要隐晦处理。所以,本实施例中,在提升文章质量处理时,还需要删除当前时期内、新闻主题对应的初始文章中的不能够在新闻中显示的隐晦词语,以避免文章带来不良的影响,增加文章的可读性和关注度。

(d3)根据润色语句库对新闻主题对应的初始文章中的语句进行润色;和

本实施例中的润色语句库中可以存储一些可读性比较好、用户使用频率较高的语句。具体可以对初始文章中的每个语句进行语义分析,获取与润色语句库中的语义相同的语句,然后利用润色语句库中语义相同的语句替换初始文章中语义相同的语句,从而实现对初始文章中的语句进行润色。

(d4)根据新闻主题对应的评价属性库对新闻主题对应的初始文章中相应的属性进行更新。

同理,拼接的初始文章中段落切片中记录的评价属性可能为历史时期的评价属性,而当前时期的评价属性可能已经发生更新,此时可以根据新闻主题对应的评价属性库对新闻主题对应的初始文章中相应的属性进行更新。例如,对于新闻主题为《a明星与b明星传出离婚绯闻,关于离婚财产分割问题的思考》中,其中会简介a明星和b明星,若根据切片段落库中的a明星的段落切片中评价该a明星为演员;而当前时期该a明星已经成功拍摄电影,成为导演,也成功发专辑,称为歌星;此时a明星的评价属性库中可以存储有该a明星的标签为演员、导员以及歌星。而初始文章中记录的a明星的评价属性为演员。此时可以根据评价属性库中对应的内容更新该a明星的评价属性。另外,评价属性库中不仅仅存储人物的评价属性,还可以存储其它很多评价属性信息,例如若婚姻法修改一些规定,可以在评价属性库中备注,以在对初始文章进行质量提升时更新处理,提升生成的文章的质量。

实际应用中,上述四种质量提升处理方式可以根据实际需求来结合使用。

另外,本实施例的基于人工智能的文章生成方法在生成文章时,也可以由编辑人员编辑一部分内容,再按照上述实施例的方式生成文章的其它部分,最后拼接合成文章。其中编辑人员编辑的内容中可以携带有时效性内容。例如图2为本发明的基于人工智能的文章生成方法的示例图。如图2所示,为一个关于抢火车票的新闻主题的文章,可能每年春节前夕,抢火车票都会成为那一时期的一个访问热点,图2所生成的文章的主题即为根据当时的热点生成的新闻。该新闻的文章的正文包括翻新区和原始内容切片。翻新区为本次新闻主题的文章发布前刚编辑的,原始内容切片可以为根据本实施例的基于人工智能的文章生成方法从切片段落库中获取的。最后将标题、翻新区和原始内容切片拼接在一起,便构成新闻的文章;最后再加上新闻的发布时间、编辑人员以及其它新闻属性信息,便可以发布。

本实施例的基于人工智能的文章生成方法,通过采用上述技术方案,通过利用已有优质内容处理成的切片段落库,在用户产生对应的新闻需求时,进行重组合后重发布,避免写作的重复劳动,能够大大缩短文章的生成时间,进而大大地提高文章的生成效率;而且本实施例中,文章的生成过程完全机器化,避免人工重复劳动,从而能够极大地节省文章生成过程的人力成本。而且,与传统新闻有效内容的反馈也不够及时相比,能够大大缩短文章的生成时间,保证热点发生后的第一时间能够提供给用户有价值的分析或者扩展阅读。

图3为本发明的基于人工智能的文章生成装置实施例一的结构图。如图3所示,本实施例的基于人工智能的文章生成装置,具体可以包括:新闻主题获取模块10、摘要获取模块11、段落切片获取模块12和生成模块13。

其中新闻主题获取模块10用于通过监控访问热点,获取新闻主题;摘要获取模块11用于根据新闻主题获取模块10获取的新闻主题从新闻资源库中获取对应的摘要;段落切片获取模块12用于根据新闻主题获取模块10获取的新闻主题从预先生成的切片段落库中获取对应的多个段落切片;生成模块13用于根据摘要获取模块11获取的新闻主题对应的摘要和段落切片获取模块12获取的新闻主题对应的多个段落切片,生成新闻主题对应的文章。

本实施例的基于人工智能的文章生成装置,通过采用上述模块实现文章生成的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。

图4为本发明的基于人工智能的文章生成装置实施例二的结构图。如图4所示,本实施例的基于人工智能的文章生成装置,在上述图3所示实施例的技术方案的基础上,进一步更加详细地描述本发明的技术方案。

如图4所示,本实施例的基于人工智能的文章生成装置,还包括检测模块14、切片模块15和提取模块16;

其中检测模块14用于从文档内容库中检测出非时效性内容的文章;

切片模块15用于对检测模块14检测出的非时效性内容的文章进行切片,得到多个段落切片;

提取模块16用于提取切片模块15切片得到的各段落切片的标签;

生成模块13还用于将切片模块15切片得到的多个段落切片按照提取模块16提取的各段落切片的标签和对应的段落切片的对应关系存储,生成切片段落库。

进一步可选地,本实施例的基于人工智能的文章生成装置中,段落切片获取模块12具体用于:

根据新闻主题从切片段落库中获取与新闻主题对应的段落切片的标签;

根据段落切片的标签与段落切片的对应关系,从切片段落库中获取段落切片的标签对应的多个段落切片。

进一步可选地,本实施例的基于人工智能的文章生成装置中,生成模块13具体用于:

计算新闻主题对应的摘要和新闻主题对应的多个段落切片中各段落切片的文本相似度;

根据各段落切片的文本相似度,从多个段落切片中获取文本相似度最高的至少一个段落切片;

将新闻主题与至少一个段落切片进行拼接,生成新闻主题对应的初始文章;

对新闻主题对应的初始文章进行质量提升处理,得到新闻主题对应的文章。

进一步可选地,本实施例的基于人工智能的文章生成装置中,生成模块13具体用于执行如下至少一种:

将新闻主题对应的初始文章进行内容去重;

删除新闻主题对应的初始文章中的不能够在新闻中显示的隐晦词语;

根据润色语句库对新闻主题对应的初始文章中的语句进行润色;和

根据新闻主题对应的评价属性库对新闻主题对应的初始文章中相应的属性进行更新。

本实施例的基于人工智能的文章生成装置,通过采用上述模块实现文章生成的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。

图5为本发明的计算机设备实施例的结构图。如图5所示,本实施例的计算机设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上实施例的基于人工智能的文章生成方法。图5所示实施例中以包括多个处理器30为例。

例如,图6为本发明提供的一种计算机设备的示例图。图6示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图6显示的计算机设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。

总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图4各实施例的功能。

具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图4各实施例中的功能和/或方法。

计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信,和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22a进行。并且,计算机设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的基于人工智能的文章生成方法。

本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的基于人工智能的文章生成方法。

本实施例的计算机可读介质可以包括上述图6所示实施例中的系统存储器28a中的ram30a、和/或高速缓存存储器32a、和/或存储系统34a。

随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。

本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1