一种信息同步更新的方法及系统与流程

文档序号:11134018阅读:355来源:国知局
一种信息同步更新的方法及系统与制造工艺

本发明涉及网络信息发布领域,尤其涉及一种信息同步更新的方法及系统。



背景技术:

对于新闻媒体人,其使用的每个信息发布平台都是一个独立信息发布系统。媒体人撰写的一条新闻在某一平台上发布后,其需要将其分享到其他多个平台上时,十分麻烦,因为每个媒体信息发布系统都存在不同的格式要求、广告插入、乱码,所以在不同的媒体信息发布系统发布时,都要重新调整格式,并将广告、乱码等问题排除才能发布。如何能够省去这些麻烦,是当前的重要问题。



技术实现要素:

本发明的目的是通过以下技术方案实现的。

本发明提出了一种在网络设备端进行信息同步更新的方法,其包括以下步骤:

确定用于获取数据信息的配置参数;

基于所述配置参数获取相对应信息发布平台的信息内容;

将获取的信息内容同步到目标信息发布平台。

其中,所述用于获取数据信息的配置参数存储在配置参数数据库之中。

其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤具体包括:

调用配置参数数据库中的用于获取数据信息的配置参数;

基于配置参数生成获取数据信息的任务指令信息;

根据任务指令信息获取相对应信息发布平台的信息内容,其中,所述信息内容包括网页的源码信息和/或对应的多媒体文件。

其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤之后还包括:

对获取的数据信息进行预处理;

将经过预处理的数据信息存储至信息发布数据库。

其中,所述对获取的数据信息进行预处理包括下列一项或多项::

对获取的网页中的进行对递进式网页库进行去重;

对网页进行重新排版;

对网页广告信息进行过滤;

对所述获取的数据信息添加广告或评论功能的网页代码;

获取所述数据信息的分类和/或标签,并赋相关的分类或标签信息;

对GBK编码的汉字自动校验和纠错。

其中,所述将获取的信息内容同步到目标信息发布平台步骤具体包括:

调用配置参数数据库中的用于获取数据信息的配置参数;

基于配置参数生成发布数据信息的任务指令信息;

根据任务指令信息从信息发布数据库调取经过预处理的待发布数据信息;

将经过预处理的待发布数据信息发送至目标信息发布平台进行发布。

本发明还提出了一种在在用户设备端进行信息同步更新的方法,其包括以下步骤:

设置用于获取数据信息的配置参数;

将用于获取数据信息的配置参数发送至网络设备端。

其中,所述设置用于获取数据信息的配置参数步骤具体包括:

设置数据信息的来源;

确定获取数据信息的接口;

对获取已有信息发布平台的信息内容的授权;

设置获取数据信息的时间点、频率;

设置获取到数据信息后生成适于目标信息发布平台的内容格式模板。

其中,所述对获取已发布信息发布平台的信息内容的授权步骤具体包括:将已有的信息发布平台的验证信息与授权密钥进行配对。

本发明还提出了一种信息同步更新的系统,其包括用户设备端和网络设备端,其特征在于:

所述用户设备端包括:

设置模块,用于设置用于获取数据信息的配置参数;

发送模块,用于将用于获取数据信息的配置参数发送至网络设备端;

所述网络设备端包括:

配置数据库模块,用于存储所述用户设备端发送的设置信息;

数据获取模块,用于根据用户指令获取指定平台的信息内容;

数据预处理模块,用于对获取的信息内容进行预处理;

信息发布数据库,用于存储经过预处理的信息内容;

信息内容发送模块,用于将经过预处理的信息内容发送至目标信息发布平台。

本发明为媒体人提供了一种统一的信息发布系统,通过该系统可以将媒体人在某一个平台上的已有信息自动同步到其他信息发布平台,从而缩减的信息发布的时间,为信息化提供了更加便利的方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

附图1示出了根据本发明实施方式的信息同步更新的系统原理图;

附图2示出了根据本发明实施方式的在网络设备端进行信息同步更新的方法流程图

附图3示出了根据本发明实施方式的一种在在用户设备端进行信息同步更新的方法流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

根据本发明的实施方式,提出一种信息同步更新的系统,如附图1所示,其包括用户设备端和网络设备端,其特征在于:

所述用户设备端包括:

设置模块,用于设置用于获取数据信息的配置参数;

发送模块,用于将用于获取数据信息的配置参数发送至网络设备端;

所述网络设备端包括:

配置数据库模块,用于存储所述用户设备端发送的设置信息;

数据获取模块,用于根据用户指令获取指定平台的信息内容;

数据预处理模块,用于对获取的信息内容进行预处理;

信息发布数据库,用于存储经过预处理的信息内容;

信息内容发送模块,用于将经过预处理的信息内容发送至目标信息发布平台。

如图2所示,本发明还提出了一种在网络设备端进行信息同步更新的方法,其包括以下步骤:

确定用于获取数据信息的配置参数;

基于所述配置参数获取相对应信息发布平台的信息内容;

将获取的信息内容同步到目标信息发布平台。

所述确定用于获取数据信息的配置参数包括授权与该信息同步更新系统帐号的绑定。用户已有的内容发布平台的帐号,可以是目前常用的微博帐号、微信公众帐号以及其他可以通过网络进行信息发布的平台。

在某一实施例中,通过复制需要同步的内容的链接,例如URL地址等到指定的位置。

在某一实施例中,可以复制相应的网页内容到指定位置。

其中,所述用于获取数据信息的配置参数存储在配置参数数据库之中。

其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤具体包括:

调用配置参数数据库中的用于获取数据信息的配置参数;

基于配置参数生成获取数据信息的任务指令信息;

根据任务指令信息获取相对应信息发布平台的信息内容,其中,所述信息内容包括网页的源码信息和/或对应的多媒体文件。

其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤之后还包括:

对获取的数据信息进行预处理;

将经过预处理的数据信息存储至信息发布数据库。

其中,所述对获取的数据信息进行预处理包括如下一项或多项:

对获取的网页中的进行对递进式网页库进行去重;

对网页进行重新排版;

对网页广告信息进行过滤;所述过滤可以预先设置过滤条件;

对所述获取的数据信息添加广告或评论功能的网页代码;通过添加所述代码,可以使获取的信息具备发布广告和进行评论的功能;

获取所述数据信息的分类和/或标签,并赋于相关的分类或标签信息;通过对所述数据信息赋予分类或标签信息,可以使得将要发布的信息具有更高的区分度和有效的索引;

对GBK编码的汉字自动校验和纠错。

本领域技术人员明了,本申请的上述多项预处理操作可以根据实际需要选择一项或多项,各项之间可以设置操作时序关系,在此不再详细描述。

其中,对获取的网页中的进行对递进式网页库进行去重包括:

从新获取的网页中提取多个特征字段;

将每个新获取网页与内部网页库中的所有网页进行比较,当新获取网页的每个特征字段都与内部网页库中的一个网页的一个特征字段相同时,判断该新获取网页与内部网页库中的该网页重复,删除该新获取网页;

当该新获取网页与内部网页库中的所有网页都不重复时,将每个新获取网页的网址与外部网页库中的所有网页的网址进行比较,如果有相同现象,则以该新获取网页替代外部网页库中的相同网址的网页;

如果不存在相同的现象,将每个新获取网页与外部网页库中的所有网页进行比较,当新获取网页的每个特征字段都与外部网页库中的一个网页的一个特征字段相同时,判断该新获取网页与外部网页库中的该网页重复;

将该新获取网页的特征字段数量设为a,将外部网页库中与之重复的网页的特征字段数量设为b;当a<b,则删除该新获取网页;当a≥b,则以该新获取网页替代外部网页库中与之重复的网页。

其中对网页进行重新排版,包括:

获取网页的页面代码;

保存该网页的上下文和用户会话;

对网页代码进行标签过滤,去除代码,所述对网页代码进行标签过滤包括删除表单Table标签,删除区隔标记div标签,删除层叠样式表CSS;

对网页代码进行补充处理,添加代码;

加载上述保存的上下文和用户会话;

将处理后的网页代码加载,并重新生成网页。

在某一实施例中,使用正则表达式对网页代码进行标签过滤,去除不需要的部分代码;正则表达式(英文:Regular Expression)在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具裡,正則表达式通常被用来检索和/或替换那些符合某个模式的文本内容。

其中,对GBK编码的汉字自动校验和纠错包括:

1)从获取的中文文本的头部开始,依次遍历文本,判断文本的GBK编码中连续的两个字节,是否满足条件:第一个字节属于0x81-0xFE,第二个字节属于0x40-0xFE,如果满足该条件,则将这两个字节记录到校验字符串中;如果不满足该条件,则将第二个字节设定为后续遍历的起点;

2)重复步骤1),依次遍历后续文本,直到校验字符串的长度达到预先设定的字节数时,转到步骤3);

3)将两个计数器count_1和count_2的初始值设为0,判断校验字符串中的各个汉字是否属于高频汉字,如果是,则将count_1的数值加1;如果不是,则再判断该汉字是否在GB2312标准的BOA1至F7FE字符范围内,如果不在该字符范围内,则将count_2的数值加1;

4)计算校验字符串的乱码程度:charnum=count_2-count_1;

5)判断步骤4)得到的charnum数值,若charnum<3,则认为校验字符串编码正常,转到步骤8);若charnum≥3,则认为校验字符串编码有错误,转到步骤6);

6)去除校验字符串的第一个和最后一个字节,按照步骤3),统计count_1和count_2的数值,计算纠错尝试后的乱码程度charnum_new;

7)比较charnum和charnum_new的数值大小,若charnum-charnum_new>8,则纠错成功,输出纠错后的文本;若4<charnum-charnum_new≤8,则以该校验字符串后续的第一个字节为遍历起点,重复步骤1)至7),判断下一个校验字符串是否满足4<charnum-charnum_new≤8,如果满足,则纠错成功,输出纠错后的文本;

8)对后续字符串依照步骤1)至7)进行遍历,直至遍历完该中文文本的全部字符。

其中,所述将获取的信息内容同步到目标信息发布平台步骤具体包括:

调用配置参数数据库中的用于获取数据信息的配置参数;

基于配置参数生成发布数据信息的任务指令信息;

根据任务指令信息从信息发布数据库调取经过预处理的待发布数据信息;

将经过预处理的待发布数据信息发送至目标信息发布平台进行发布。

如图3所示,本发明还提出了一种在在用户设备端进行信息同步更新的方法,其包括以下步骤:

设置用于获取数据信息的配置参数;

将用于获取数据信息的配置参数发送至网络设备端。

用户通过用户设备端登录该信息同步更新系统。所述用户设备端包括移动电话、笔记本、PDA等无线智能设备。

其中,所述设置用于获取数据信息的配置参数步骤具体包括:

设置数据信息的来源;

确定获取数据信息的接口;

对获取已有信息发布平台的信息内容的授权;

设置获取数据信息的时间点、频率;

设置获取到数据信息后生成适于目标信息发布平台的内容格式模板。

数据信息获取的时间点指在某一天或某一时间段的固定时间点进行数据获取的时间。

频率指在某一设定时间内进行多少次信息的自动获取。

其中,所述对获取已发布信息发布平台的信息内容的授权步骤具体包括:将已有的信息发布平台的验证信息与授权密钥进行配对。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1