一种人工智能模式下的网站编辑器文章录入方法及系统与流程

文档序号:12063811阅读:588来源:国知局
一种人工智能模式下的网站编辑器文章录入方法及系统与流程

本发明涉及网站编辑器技术领域,尤其是涉及一种人工智能模式下的网站编辑器文章录入方法及系统。



背景技术:

如今,通过互联网获取信息已经成为人们获取信息的重要方式,很多企业、单位、个人都拥有自己的网站,各种类别、用途的网站多种多样,在网站维护人员维护、更新网站的时候,往往需要用到网站编辑器,用以编辑发布到网站上的文章。

使用网站编辑器编辑内容时,往往需要输入文字和插入图片,形成图文并茂的文章发布到网站上,当需要把纸质文稿的内容发布到网站上时,一般采取手动打字录入文字到网站编辑器里,然后在网上人工查找符合主题的图片插入文字中,但是,手动打字输入文字和网上人工查找符合主题的图片都比较耗时耗力、速度较慢,这样一来,网站维护人员的工作量往往比较大。



技术实现要素:

本发明的目的在于克服上述技术不足,提出一种人工智能模式下的网站编辑器文章录入方法及系统,解决现有技术中录入纸质文稿的内容和录入配图耗时耗力、速度较慢的技术问题。

一种人工智能模式下的网站编辑器文章录入方法,其中,包括:

S1、使用摄像头对纸质文稿进行扫描,生成所述纸质文稿的扫描文件;

S2、对所述扫描文件进行OCR文字图片识别,获取与所述扫描文件内容对应的文字和图片;

S3、将获取的文字和图片录入网站编辑器;

S4、当所述网站编辑器录入文字后,录入的文字形成文档,利用自动分词技术计算出所述文档的主题;

S5、以所述文档的主题为关键词,在网络图片库中进行关键词搜索,得到符合搜索条件的限缩的网络图片库,利用爬虫技术采集所述限缩的网络图片库中的图片;

S6、根据需要,选择采集的部分图片,录入到所述网站编辑器。

一种人工智能模式下的网站编辑器文章录入系统,其中,包括:

扫描模块:用于使用摄像头对纸质文稿进行扫描,生成所述纸质文稿的扫描文件;

OCR识别模块:用于对所述扫描文件进行OCR文字图片识别,获取与所述扫描文件内容对应的文字和图片;

第一录入模块:用于将获取的文字和图片录入网站编辑器;

主题计算模块:用于当所述网站编辑器录入文字后,录入的文字形成文档,然后利用自动分词技术计算出所述文档的主题;

采集图片模块:用于以所述文档的主题为关键词,在网络图片库中进行关键词搜索,得到符合搜索条件的限缩的网络图片库,利用爬虫技术采集所述限缩的网络图片库中的图片;

第二录入模块:用于根据需要,选择采集的部分图片,录入到所述网站编辑器。

与现有技术相比,本发明的有益效果包括:通过摄像头扫描纸质文稿,形成扫描文件,然后对扫描文件进行OCR文字图片识别,识别后获取的文字和图片录入网站编辑器,与手动打字输入文字相比,实现了纸质文稿的快速录入;计算录入的文字内容的主题,自动在网上搜索主题有关的图片,并采用爬虫技术采集搜索到的图片,再从采集到的图片中挑选部分图片录入网站编辑器,与人工搜索符合主题的图片相比,实现了配图的快速录入。

附图说明

图1是本发明提供的一种人工智能模式下的网站编辑器文章录入方法流程图;

图2是本发明提供的一种人工智能模式下的网站编辑器文章录入系统结构框图。

附图中:1、人工智能模式下的网站编辑器文章录入系统,11、扫描模块,12、OCR识别模块,13、第一录入模块,14、主题计算模块,15、采集图片模块,16、第二录入模块

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1,一种人工智能模式下的网站编辑器文章录入方法,其中,包括:

S1、使用摄像头对纸质文稿进行扫描,生成纸质文稿的扫描文件;

S2、对扫描文件进行OCR文字图片识别,获取与扫描文件内容对应的文字和图片;

S3、将获取的文字和图片录入网站编辑器;

S4、当网站编辑器录入文字后,录入的文字形成文档,利用自动分词技术计算出文档的主题;

S5、以文档的主题为关键词,在网络图片库中进行关键词搜索,得到符合搜索条件的限缩的网络图片库,利用爬虫技术采集限缩的网络图片库中的图片;

S6、根据需要,选择采集的部分图片,录入到网站编辑器。

本发明所述的人工智能模式下的网站编辑器文章录入方法中,步骤S1包括:

网站编辑器调用PC端或移动端的摄像头对纸质文稿进行扫描,摄像头与网站编辑器进行数据传输;

网站编辑器安装于PC端,可以调用PC端的摄像头,移动端通过扫描网站编辑器提供的二维码与PC端的网站编辑器连接,网站编辑器此时也可以调用移动端摄像头。

本发明所述的人工智能模式下的网站编辑器文章录入方法中,步骤S4包括:

文档的主题为一个或多个。

本发明所述的人工智能模式下的网站编辑器文章录入方法中,步骤S5包括:

爬虫程序首先获取经搜索操作后的网络页面的源代码,然后过滤出源代码中的图片地址,根据过滤出来的图片地址下载符合主题的网络图片库中的图片。

本发明所述的人工智能模式下的网站编辑器文章录入方法中,步骤S6包括:

S5中采集到的都是符合主题的图片,在S5采集到的图片中人工选择最为合适的图片,点击选择的图片,图片就被录入到网站编辑器中。

如图2,一种人工智能模式下的网站编辑器文章录入系统1,其中,包括:

扫描模块11:用于使用摄像头对纸质文稿进行扫描,生成纸质文稿的扫描文件;

OCR识别模块12:用于对扫描文件进行OCR文字图片识别,获取与扫描文件内容对应的文字和图片;

第一录入模块13:用于将获取的文字和图片录入网站编辑器;

主题计算模块14:用于当网站编辑器录入文字后,录入的文字形成文档,然后利用自动分词技术计算出文档的主题;

采集图片模块15:用于以文档的主题为关键词,在网络图片库中进行关键词搜索,得到符合搜索条件的限缩的网络图片库,利用爬虫技术采集限缩的网络图片库中的图片;

第二录入模块16:用于根据需要,选择采集的部分图片,录入到网站编辑器。

本发明所述的人工智能模式下的网站编辑器文章录入系统1中,扫描模块11:

网站编辑器调用PC端或移动端的摄像头对纸质文稿进行扫描,摄像头与网站编辑器进行数据传输。

本发明所述的人工智能模式下的网站编辑器文章录入系统1中,主题计算模块14:

文档的主题为一个或多个。

本发明所述的人工智能模式下的网站编辑器文章录入系统1中,采集图片模块15:

爬虫程序首先获取目标网页的源代码,过滤出源代码中的图片地址,根据过滤出来的图片地址下载限缩的网络图片库中的图片。

本发明所述的人工智能模式下的网站编辑器文章录入方法及系统在使用时,利用摄像头对纸质文稿进行扫描,生成纸质文稿的扫描文件;对扫描文件进行OCR文字图片识别,获取与扫描文件内容对应的文字和图片;将获取的文字和图片录入网站编辑器;当网站编辑器录入文字后,录入的文字形成文档,利用自动分词技术计算出文档的主题;以文档的主题为关键词,在网络图片库中进行关键词搜索,得到符合搜索条件的限缩的网络图片库,利用爬虫技术采集限缩的网络图片库中的图片;根据需要,选择采集的部分图片,录入到网站编辑器,由此,纸质文稿内容和符合主题的图片快速录入到网站编辑器里。

与现有技术相比,本发明的有益效果包括:通过摄像头扫描纸质文稿,形成扫描文件,然后对扫描文件进行OCR文字图片识别,识别后获取的文字和图片录入网站编辑器,与手动打字输入文字相比,实现了纸质文稿的快速录入;计算录入的文字内容的主题,自动在网上搜索主题有关的图片,并采用爬虫技术采集搜索到的图片,再从采集到的图片中挑选部分图片录入网站编辑器,与人工搜索符合主题的图片相比,实现了配图的快速录入。

以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1