一种数据处理方法及装置的制造方法

文档序号:9249329阅读:228来源:国知局
一种数据处理方法及装置的制造方法
【技术领域】
[0001]本发明的实施方式涉及数据处理技术领域,更具体地,本发明的实施方式涉及一种数据处理方法及装置。
【背景技术】
[0002]本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着互联网技术的普及,很多用户习惯于使用一些网络服务或网络空间来记录自己的生活、工作等情况,例如用户可以通过博客来记录日常生活。
[0004]同时,用户有将上传到网络的数据内容(例如文字、图像等)进行导出并编辑排版处理的需求,例如将博客内容集结成书。目前,现有技术中已经出现了一些将网络数据内容进行导出的方案,例如读取某一数据源的地址,将该数据源中保存的全部数据内容进行导出,之后可以采用人工方式对所导出的数据内容进行所需要的处理。

【发明内容】

[0005]但是,现有技术的数据处理方式,需要将数据源中的全部数据内容进行导出后,用户再根据实际需求人工对所导出的数据内容进行编辑、筛选、排版等处理,当用户仅需要数据内容中的特定部分,而数据内容的数量又非常多时,则需要花费大量的时间、人力来完成对数据内容的编辑等处理工作,例如,仅需要数据内容中的文字部分,则需要将大量导出的数据内容中的非文字部分进行删除,数据处理过程的速度及效率极为低下。
[0006]因此在现有技术中将网络数据进行导出后的数据处理过程,是非常令人烦恼的过程。
[0007]为此,非常需要一种改进的数据处理方案,以使提高数据处理的速度及效率。
[0008]在本上下文中,本发明的实施方式期望提供一种数据处理方法及装置。
[0009]在本发明实施方式的第一方面中,提供了一种数据处理方法,包括:从数据源读取网页文件;在所述网页文件中进行查找以生成特定数据内容;对所述特定数据内容进行导出。
[0010]在本发明实施方式的第二方面中,提供了一种数据处理装置,包括:读取单元,用于从数据源读取网页文件;生成单元,用于在所述网页文件中进行查找以生成特定数据内容;导出单元,用于对所述特定数据内容进行导出。
[0011]根据本发明实施方式的数据处理方法和装置,可以从数据源中读取网页文件,先在网页文件中进行查找以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,所导出的内容即为处理后的数据内容,而无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。
【附图说明】
[0012]通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
[0013]图1示意性地示出了本发明实施方式可以在其中实施的应用场景;
[0014]图2示意性地示出了根据本发明一实施方式的数据处理方法的流程图;
[0015]图3示意性地示出了根据本发明一实施方式的数据处理装置的结构图。
[0016]在附图中,相同或对应的标号表不相同或对应的部分。
【具体实施方式】
[0017]下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0018]本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
[0019]根据本发明的实施方式,提出了一种数据处理的方法及装置。
[0020]此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
[0021]下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
[0022]发曰月概沐
[0023]本发明人发现,在现有技术中可以从网络中的单一数据源获取到网络数据内容并进行导出,针对所导出的网络数据内容可以使用文本编辑软件进行编辑、排版等处理。但是,当需要数据内容中的特定部分,数据内容数量又非常多时,则需要花费大量的时间、人力来完成对数据内容的编辑等处理工作。
[0024]针对以上问题,本发明的基本思想在于:从数据源中读取网页文件,该数据源可以为单一数据源也可以为多个数据源,通过从读取的网页文件中进行查找以生成所需要的特定数据内容,例如,在网页文件中查找文字部分和/或者图片部分以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,这样所导出的内容即为用户所需要的处理后的数据内容,而无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。
[0025]在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
[0026]应用场景总览
[0027]首先参考图1,图1是本发明的实施方式的一个示例性应用场景的框架示意图。其中,用户通过用户设备上的客户端102与提供数据记录的服务器101进行交互。本领域技术人员可以理解,图1所示的框架示意图仅是本发明的实施方式可以在其中得以实现的一个示例。本发明实施方式的适用范围不受到该框架任何方面的限制。例如,在另一个示例性应用场景中,提供数据记录的服务也可以是由客户端102自行提供的,用户也可以仅与用户设备上的客户端102进行交互。
[0028]需要注意的是,此处的用户设备可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如,W1-Fi, LAN、蜂窝、同轴电缆等)实现其上客户端102与服务器101交互的任何用户设备,包括但不限于:现有的、正在研发的或将来研发的智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。
[0029]还需要注意的是,此处的服务器101仅是现有的、正在研发的或将来研发的、能够向用户提供数据记录服务的设备的一个示例。本发明的实施方式在此方面不受任何限制。
[0030]基于图1所示的框架,客户端102可以从数据源读取网页文件;然后,客户端102在网页文件中进行查找以生成特定数据内容;再后,客户端102可以对特定数据内容进行
Q山寸出O
[0031]可以理解的是,本发明的应用场景中,虽然此处和下面将本发明实施方式的动作描述为由客户端102执行,但是这些动作也可以部分由客户端102执行、部分由服务器101执行。本发明在执行主体方面不受限制,只要执行了本发明实施方式所公开的动作即可。
[0032]示例性方法
[0033]下面结合图1的应用场景,参考图2来描述根据本发明示例性实施方式的用于数据处理的方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
[0034]参见图2,示出了本发明中数据处理方法一实施例的流程图,例如具体可以包括如下步骤:
[0035]步骤201:从数据源读取网页文件。
[0036]数据源可以为网络中的数据源,例如某一用户的博客地址即为一个数据源,所述数据源可以包括单个数据源或者多个不同的数据源,也就是说在本实施例中可以从单一数据源读取网页文件,也可以从多个不同的数据源同时读取网页文件。从多个不同的数据源同时读取网页文件,并进行后续步骤的处理,可以实现对多个不同的数据源内的特定数据内容一并进行导出,进一步提升数据处理的效率。
[0037]一个数据源可以对应一个或多个网页文件,网页文件可以为HTML(Hyper TextMarkup Language,超级文本标记语言)文件。例如,某一用户博客中的每一篇文章均可以在一个网页中显示,而每个网页可以对应于一个HTML文件,即通过读取用户的博客地址获得该博客地址目录下对应的多个HTML文件。
[0038]网页文件中可以包括数据内容类型的标签、数据内容或数据内容的文件地址等信息,数据内容类型的标签可以标识数据内容的类型,例如文本标签可以标识数据内容为文本,图片标签可以标识数据内容为图片,在同一网页文件中可以同时包括多个相同或不同类型的标签以及分别对应的数据内容,这样通过所读取的网页文件则可以获得该网页文件所对应的全部数据内容,数据内容包括但不限于文本、图片等内容。
[0039]在一些可能的实施方式中,在从数据源读取网页文件之前,还可以接收包括数据源路径的设置信息。
[0040]由
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1