一种基于pdf反解的新闻管理发布方法及装置的制造方法

文档序号:9687404阅读:946来源:国知局
一种基于pdf反解的新闻管理发布方法及装置的制造方法
【技术领域】
[0001]本发明涉及网络媒体新闻管理发布技术领域,特别是涉及一种基于PDF反解的新闻管理发布方法及装置。
【背景技术】
[0002]在传统新闻行业,主要产品为纸质媒体新闻,针对的是通过严格审校的新闻,主要采用纸质报纸平台进行新闻发布。而对于近些年新兴的网络媒体平台,如微博,微信等网络媒体平台,由于其更加灵活以及互动性强等特点,正在被越来越多的人接受。
[0003]因此,越来越多的报业机构也陆续开通了自己的新型网络媒体平台,而多数小中型报业机构通过新型网络媒体平台发布新闻只能是由工作人员的手动录入和发布。
[0004]另外,由于新闻行业的严肃性,就要求对外发布的新闻必须经过编辑和审核之后才能正式对外发布。由工作人员手动录入及发布无疑需要花费更大的时间和人力成本,同时增加了所发布的新闻内容的出错几率以及不确定性。传统报业没有完全针对传统和多媒体的生产流程,多数新闻素材库只是针对新闻采集和编辑,不提供发布功能。

【发明内容】

[0005]针对上述由工作人员手动录入及发布无疑需要花费更大的时间和人力成本,同时增加了所发布的新闻内容的出错几率以及不确定性的问题,本发明提供了一种基于PDF反解的新闻管理发布方法及装置。
[0006]第一方面,本发明提供一种基于PDF反解的新闻管理发布方法,包括:
[0007]获取报刊PDF文件,并将所述PDF文件进行反解,得到与所述报刊PDF文件对应的多个新闻素材;
[0008]将所述多个新闻素材按照是否属于同一条新闻进行分类;
[0009]针对每一条新闻建立一个素材数据库,将属于该条新闻的所述新闻素材存储到所述素材数据库中;
[0010]若需要发布所述报刊PDF文件中的一条新闻,则将该条新闻对应的素材数据库中的新闻素材发布到网络媒体平台。
[0011]进一步地,所述方法还包括:
[0012]针对每一条新闻建立一个信息数据库,收集网络媒体平台中针对该条新闻对应的评论信息和转发信息,并将所述评论信息和所述转发信息存储到该条新闻对应的信息数据库中。
[0013]进一步地,所述将所述PDF文件进行反解,得到与所述报刊PDF文件对应的多个新闻素材的步骤,包括:
[0014]将所述PDF文件进行反解,得到与所述报刊PDF文件对应的多个新闻素材;
[0015]将所述文字素材转化成xml格式的文字素材,将所述图片素材转化为jpg格式的图片素材。
[0016]进一步地,所述将所述文字素材转化成xml格式的文字素材的步骤,包括:
[0017]将所述文字素材转化成xml格式的文字素材,并按照预设加密规则对所述xml格式的文字素材加密。
[0018]进一步地,所述若需要发布所述报刊PDF文件中的一条新闻,将该条新闻对应的素材数据库中的新闻素材发布到网络媒体平台,包括:
[0019]若需要发布所述报刊PDF文件中的一条新闻,将该条新闻对应的素材库中的新闻素材按照所述网络媒体平台的要求进行排版编辑;
[0020]将排版编辑后的新闻素材发布到所述网络媒体平台。
[0021]另一方面,本发明还提供一种基于PDF反解的新闻管理发布装置,包括:
[0022]反解模快,用于获取报刊PDF文件,并将所述PDF文件进行反解,得到与所述报刊PDF文件对应的多个新闻素材;
[0023]分类模块,用于将所述多个新闻素材按照是否属于同一条新闻进行分类;
[0024]存储模块,用于针对每一条新闻建立一个素材数据库,将属于该条新闻的所述新闻素材存储到所述素材数据库中;
[0025]发布模块,用于若需要发布所述报刊PDF文件中的一条新闻,则将该条新闻对应的素材数据库中的新闻素材发布到网络媒体平台。
[0026]进一步地,所述装置还包括:
[0027]信息收集模块,用于针对每一条新闻建立一个信息数据库,收集网络媒体平台中针对该条新闻对应的评论信息和转发信息,并将所述评论信息和所述转发信息存储到该条新闻对应的信息数据库中。
[0028]进一步地,所述反解模块具体用于:
[0029]获取报刊PDF文件,并将所述PDF文件进行反解,得到与所述报刊PDF文件对应的多个新闻素材;
[0030]将所述文字素材转化成xml格式的文字素材,将所述图片素材转化为jpg格式的图片素材。
[0031]进一步地,所述反解模块还用于:
[0032]将所述文字素材转化成xml格式的文字素材,并按照预设加密规则对所述xml格式的文字素材加密。
[0033]进一步地,所述发布模块具体用于:
[0034]若需要发布所述报刊PDF文件中的一条新闻,将该条新闻对应的素材库中的新闻素材按照所述网络媒体平台的要求进行排版编辑;
[0035]将排版编辑后的新闻素材发布到所述网络媒体平台。
[0036]本发明提供的一种基于PDF反解的新闻管理发布方法及装置,通过采用经过编辑和审核之后的报刊PDF文件进行反解得到新闻素材,进行分类存储之后发布到网络媒体平台上。可以将传统报业的纸质新闻媒体产品进行二次拓展和延伸,在已经审核校验通过的基础上将见报的新闻快速发布到网络媒体平台上,不但保证了所发布新闻的严肃性,同时也节省了大量时间和人力成本。
【附图说明】
[0037]通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
[0038]图1是本发明一个实施例中一种基于PDF反解的新闻管理发布方法的流程示意图;
[0039]图2是本发明一个实施例中一种基于PDF反解的新闻管理发布装置的结构示意图;
[0040]图3是本实施例中一个报刊PDF文件的部分示意图。
【具体实施方式】
[0041 ] 现结合附图和实施例对本发明技术方案作进一步详细阐述。
[0042]图1示出了本实施例中一种基于PDF反解的新闻管理发布方法的流程示意图,如图1所示,本实施例提供的一种基于PDF反解的新闻管理发布方法,包括:
[0043]S1,获取报刊PDF文件,并将所述PDF文件进行反解,得到与所述报刊PDF文件对应的多个新闻素材。
[0044]本实施例中所获取的报刊PDF文件即为经过编辑和审核之后决定印刷出版的报刊文件,采用该PDF文件既节省了发布到网络媒体平台的新闻的编辑和审核程序,又不影响原有报刊的生产流程。例如,现有报刊生产流程是首先采集新闻,然后整理撰写编辑,并进行初步审核,审核通过之后则进行排版编辑,最后进行最终审核,审核通过后形成最终的报刊PDF文件,交由印刷厂进行印刷出版。
[0045]举例来说,对于一份完整的报刊,应该包括不同的版面,在头版还包括该报刊的名称、刊号、报社名称、日期以及本期的主要内容等。对所述PDF文件进行反解,具体为将全部页面的新闻模块进行分解,得到多个相应的文字素材和图片素材。其中文字素材部分包括新闻标题、副标题、正文、引图信息、日期以及栏目等内容;对于图像素材则包含了该图片的大小、作者以及所对应的新闻标题等内容。
[0046]如图3所示,以《中国知识产权报》头版为例,对该PDF文件进行反解之后将会得到6条新闻所对应的新闻素材,其中一条新闻素材中还包含了一张图片素材。
[0047]在具体实施例中,可将上述文字素材转化为xml格式的文字素材,将所述图片素材转化为jpg格式的图片素材。同时为了保密防止新闻信息泄露可以通过预设的加密规则对所述xml格式的文字素材进行加密。
[0048]S2,将所述多个新闻素材按照是否属于同一条新闻进行分类;
[0049]S3,针对每一条新闻建立一个素材数据库,将属于该条新闻的所述新闻素材存储到所述素材数据库中;
[0050]S4,若需要发布所述报刊PDF文件中的一条新闻,则将该条新闻对应的素材数据库中的新闻素材发布到网络媒体平台。
[0051]举例来说,对于得到的新闻标题、副标题、正文、引图信息、日期以及栏目等文字素材以及图像素材,可
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1