一种面向浏览器的网页标注系统的制作方法

文档序号:6469187阅读:215来源:国知局
专利名称:一种面向浏览器的网页标注系统的制作方法
技术领域
本发明属于web网页技术领域,特别是涉及一种面向浏览器的网页标注系统。
背景技术
标注是指第三方对原文档创建和增加的数据。这些数据可以是笔记、符号、图片、 语音片断等。类似的标注概念还有"标注也可以称为做笔记,包括能被感知的视觉化和声 音化信息的输入、处理和输出,这些信息用不同的格式记载。"对Web页面标注就是对浏览 器中任意Web文档或选定的文档内容添加包括提示、解释、重点、体会、疑问、解答和评价等 外部备注信息或标记。网页标注,即对网页中的选定文本做标记,并添加标注内容。
标注根据其被标注的文档不同,分为纸质形式的标注和数字形式的标注两种。本 发明关注的是数字形式的标注。标注的主要作用是用来记忆、思考、阐释和共享。在标注的 描述方面,通常采用内容、形式和功能来描述。 数字形式的标注,也称电子标注,按照存储形式分为一是文本与标注数据不分离 的文档标注软件,如Adobe Acrobat, CajViewer, MS Word等;二是文本与标注数据分开存 储的网页标注软件,如Annotator, Annotea, Markup等。前一种存储形式完全模拟了纸质 标注的特点,是标注和原文本一体的形式。他人要查看标注时,需采用整本传阅的方式。后 一种分开存储的形式,主要针对网页进行标注,将原文档与标注分开存储于数据库中。这种 方式有利于信息在网上的直接共享。因此,国外的标注软件多采用分开存储的形式。
现有分开存储的页面标注技术主要有两种第一种为基于代理的标注技术。采用 这种标注方式中,标注被分开存储。客户端需安装代理服务器,由代理服务器将标注与网页 结合实现标注功能。因此这种标注技术的不足之处是客户端必须安装代理服务器,增加了 客户端的负担和普及的难度。第二种为基于增强浏览器的标注技术。增强浏览器是指浏览 器使用插件,以增强浏览器功能,如Netsc即e、 Mozilla Suite、 Mozilla Firefox和Opera 浏览器等。最常安装的外挂有Macromedia Flash播放器和Java运行时刻环境(JRE)等。 通过插件方式将网页内容与标注数据进行绑定,实现标注。主要功能包括(1)标注的创建、 修改、删除;(2)在线查看含有标注的文档;(3)标注的过滤、检索、共享。上述标注技术存在 的主要问题是(l)增强的浏览器方式与普通浏览器的结构和功能差异较大,需要专有技 术的支持,如Word插件、Adobe Acrobat等,是文档标注工具的应用延伸;(2)标注信息与 网页内容采用了外挂的显示方式,页内容的排版结构和呈现方式可能因插入标记而发生变 化;(3)标记信息与具体应用环境相关,不具有通用性,难以被其他工具复用和再加工。
国外针对IE浏览器开发的有IMarkup,Third voice等。Markup支持角色定义, 不同角色采用不同色彩字体显示,并提供检索和过滤功能。Third voice允许用户以"粘贴 笔记"的方式标注到网页。这些标注方式中,标注信息容易被当作垃圾广告而遭过滤。

发明内容
本发明目的在于针对现有技术的不足,提出一种面向通用浏览器的网页标注系
3
本发明的技术方案为由以下三个部分组成, (1)标注与标签模块,用于用户针对选中网页内容添加或编辑标注生成信息,标注 生成信息包括有元数据信息、标注信息和标签信息,所述元数据信息用于记载网页属性相 关信息、标注者相关信息和内容属性;所述标注信息包括标注内容和定位信息,定位信息是 定位与显示模块的定位依据;所述标签信息用于指定标注内容在浏览器所提供相应网页中 的呈现样式; (2)存储模块,标注与标签模块所得标注生成信息送入存储模块进行存储;
(3)定位与显示模块,用于根据选中网页内容,在浏览器所提供相应网页中定位显 示标注;所述显示标注采用文档内容内嵌方式实现,具体实现过程如下, 结合浏览器中的网页内容的统一地址,从标注与标签模块或存储模块中提取网页 内容相关的标注生成信息;获取浏览器底层的文档类型接口,并通过文档类型接口直接获 取网页内容;根据标注信息中的定位信息,搜索并获取网页内容中被标注及需显示的内容 信息;按标签信息所指定的呈现样式,生成显示标注信息中标注内容的HTML标记文本;用 该HTML标记文本替换被标注及需显示的内容信息,形成更新的、带有标注信息的网页文 档,并通过浏览器显示。 而且,标注与标签模块提供标签模版,按照标签模版分项记载元数据信息、标签信 息和标注信息。 而且,标注与标签模块为l项元数据信息和l项或以上标签信息建立关联,为标签 信息和标注信息建立一一对应关联。 而且,标注与标签模块提供基于浏览器的用户编辑界面,将"标注添加"和"检索与
管理"功能按钮通过插件方式嵌入在浏览器工具栏中,从而分别形成标注编辑工具栏和标
注检索工具栏;通过用户编辑界面支持实现添加过程、检索过程和管理过程, 所述添加过程为,用户点选"标注添加"功能按钮,浏览器中打开标注编辑工具
栏;用户从浏览器所提供网页中选中网页内容,在标注编辑工具栏中填写编辑元数据信息、
标注信息和标签信息,完成后在标注添加工具栏选择确认进行添加,填写内容存入存储模
块; 所述检索过程为,用户点选"检索与管理"功能按钮,浏览器中打开标注检索工具 栏,标注检索工具栏中提供查看方式的选择;用户在标注检索工具栏中选择查看方式;根 据查看方式从存储模块提取相关标注的记录,在浏览器中呈现包括检索所得记录的页面;
所述管理过程为,在完成检索过程后,用户从包括检索所得记录的页面中点选某 项记录;在浏览器中呈现包括该记录所对应标注的标注生成信息的页面,该页面中提供用 户可选管理操作,包括对该记录的修改、增加、删除和投票操作。 而且,所述添加过程中,用户从浏览器所提供网页中选中网页内容时,标注与标签 模块从网页中提取定位信息并自动填入标注编辑工具栏。 而且,所述定位信息包括选中网页内容所处相应网页的三类信息,即网页地址、网 页中处于选中网页内容前后的词组和HTML标签、网页中选中网页内容所含关键词出现频 度。 而且,所述存储模块采用数据库服务器、USB闪存或硬盘实现。
本发明是一种面向通用浏览器的网页标注系统,可以针对不同浏览器提供的网 页,实现标注的添加、编辑和查询等操作;不同于已有的标注技术,如基于代理和增强技术, 本标注技术采用文档内容内嵌技术,添加的标注成为网页文档的内容组成部分,不改变Web 页面的格式、文件结构或显示风格;标注生成信息脱离具体应用环境,可以被其他工具复 用、共享和再加工;标注生成信息可存储到存储服务器或相关硬件设备上。本发明可以广泛 应用到PDA、个人电脑、笔记本等设备上。


图1本发明的应用方式示意图; 图2本发明的使用过程示意图; 图3本发明实施例一的标签模版示意图; 图4本发明实施例二的标签实例图; 图5本发明实施例三的结构示意图。 所要实现的网页标注系统应用方式参见图l,浏览用户浏览网页,浏览过程中操作 标注工具对网页施加标注,标注相关信息被存入存储服务器或其它硬件,在浏览该网页时 再根据标注相关信息在网页上定位显示。可以设定权限,浏览用户登录存储服务器获得授 权后,才能进行标注操作。本发明所指"网页",指不包含加密或进行特殊控制功能(如禁止 拷贝、右键、左键选择等)的浏览器显示的文档。
本发明的技术方案为网页标注系统由以下三个部分组成, (1)标注与标签模块,用于用户针对选中网页内容添加或编辑元数据信息、标注信 息和标签信息,所述元数据信息用于记载网页属性相关信息和标注者相关信息;所述标注 信息包括标注内容和定位信息,定位信息是定位与显示模块的定位依据;所述标签信息用 于指定标注内容在浏览器所提供相应网页中的呈现样式; (2)存储模块,标注与标签模块所得元数据信息、标注信息和标签信息送入存储模 块进行存储; (3)定位与显示模块,用于根据选中网页内容,在浏览器所提供相应网页中定位显 示标注;所述显示标注的实现过程如下, 结合浏览器中的网页内容的统一地址,从标注与标签模块或存储模块中提取网页 内容相关的标注生成信息;获取浏览器底层的文档类型接口,并通过文档类型接口直接获 取网页内容;根据标注信息中的定位信息,搜索并获取网页内容中被标注及需显示的内容 信息;按标签信息所指定的呈现样式,生成显示标注信息中标注内容的HTML标记文本;用 该HTML标记文本替换被标注及需显示的内容信息,形成更新的、带有标注信息的网页文 档,并通过浏览器显示。可以利用本发明提供的网页标注系统分别单独实现添加标注和定 位显示两种过程。标注用户在网页中选中网页内容并添加标注,可以即时定位显示标注给 该用户看,也可以随同网页定位显示给其它浏览用户看。浏览用户用浏览器查看网页时,定 位与显示模块从浏览器中的网页内容搜索并获取的"其中被标注及需显示的内容信息",和 标注用户添加标注时选中网页内容对应。 —般来说,被标注的对象是网页文档对象,而标注的对象是图形对象。本发明提 供的标注显示方案不同于现有标注控件加载页面方式,添加的标注不会改变Web页面的格式、文件结构或显示样式。而是通过浏览器底层的文档类型接口 ,利用一段包含标签信息和 标注内容的HTML标记文本结构替换选中的Web内容信息。例如用Html标记文本"〈font color = #c6600>选中网页内容〈ahrefXimage》.jpg〈/image>〈/aX/font>,,替换"选中 网页内容"。通过文档内嵌的方法形成了标注内容的样式,如虚框、下划线等,因此不会改变 Web页面的原有布局。 为了便于系统化收集管理标注相关信息,即元数据信息、标注信息和标签信息,本 发明提出了进一步技术方案标注与标签模块提供标签模版,按照标签模版分项记载元数 据信息、标签信息和标注信息。参见附图3,本发明实施例一的信息模板是1个标签中分为 元数据信息、标签信息和标注信息,元数据信息包括创作者信息、网站信息;标签信息包括 标签样式、标签类型;标注信息包括定位信息和标注内容。具体实施时,可以在信息模板中 采用更细化的分项。参见附图4,本发明实施例二的1个标签实例中的元数据信息包括了 创作者、创作时间、网页标题、网页URL,如作者张创作,2008-7-21浏览标题为"网页标注系 统"、网页地址是httD:〃202. 114. 32. 1\index, htm网页;标签信息包括显示方式、字体颜 色、背景色、显示权限,可以通过下拉菜单方式显示标记的不同样式和语义;如标记符号是 虚框显示、字体颜色是红色、背景色为黄色以及显示权限为公开;标注信息包括定位信息、 标注类型、关键词、标注内容等,可以通过下拉菜单或文本框方式进行输入,如图中输入为 解释型标注、关键词是标注系统、标注内容是"标注系统是在编辑软件中……",定位信息是 Location(标注,注意,lO)。 1个标签实例可以采用表示计算机代码的1个文件的形式,代 码符合XML描述格式。 因为1个网页中可能存在多处标注,本发明的标注与标签模块为1项元数据信息 和1项或以上标签信息建立关联,为标签信息和标注信息建立一一对应关联。标签通过元 数据信息、标签信息和标注内容信息与网页内容关联进行定制和构建,可以采用实体概念 进行关联 元数据信息可以作为一个独立的实体,可根据不同的应用需求选择不同的元数 据集。例如Dublin Core定义十五项元数据,包括Title(标题)、Creator(创建者)、 Subject(主题)、Description(描述)、Publisher(出版者)、Contributor(贡献者)、 Date (日期)、Type (类型)、Format (格式)、Identifier (标识)、Source (源信息)、 Language (语言)、Relation (关联)、Coverage (范围)、Rights (权限)。此外,针对不同 应用环境,可能采用不同的元数据描述集进行元数据描述。元数据信息与标注信息密切相 关,其中,元数据信息体现与一篇"文档"的属性相关和标注者相关的信息描述,而标注信息 是对"文档"内容的标记、解释和提问等,通常一个元数据信息与一个或多个标注信息相关 联。 标签信息作为一个独立的实体,用于"标记"的不同显示方式。例如,采用插入文 字虚框方式进行标记,含义是标记的内容属于解释信息;文字下划线标记方式,表示标记的 内容是问题型标注。标签信息与元数据信息是多对一的关系,即一篇网页文档可以包含有 多个标签信息实例,仅有一个元数据信息实例。此外标签信息和标注信息是一对一的关系, 即一篇网页文档中,一个标签信息实例与一个标注信息实例严格一致对应。标签信息与标 注信息的关联关系是通过位置信息进行标记。 标注信息,作为一个独立的实体,用于标注的不同内容。优选实例中,标注信息包
6括关键词、标注内容、标注类型、定位信息等。标注类型包括解释型、问题型等。定位信息可以通过特征词汇加上必要的标签信息构成,所述特征词汇,就是将选中网页内容作为关键词进行词组管理。为了保证精确定位,一个标注的定位信息需要具有唯一性。本发明实施例的定位信息由三类信息组成(l)Web网页的地址信息,具有全球统一的地址;(2)Web网页中,用户所选中网页内容的前后词组和HTML标签,此处HTML标签是指网页中选中网页内容的用HTML语言编写的格式标记,并不是本发明为标注设定的标签信息,和定位显示时"按标签信息所指定呈现样式显示标注内容的HTML标记文本"语言相同但内容不同;(3)采用Web页面的关键词出现频度来进行标记,频度是指关键词出现频率是在该Web页面中出现的次数,标记位置为第几次。如三个信息中一个不符合,则标记的定位及信息失败,就不显示。此外,针对相同位置不同词语长度的标注、多人标注定位等问题,本发明采用最短优先原则和合并规则分别进行处理。 标注与标签模块主要作用就是提供标注工具,为了便于用户操作,本发明提出通过标注与标签模块提供与浏览器配合的用户编辑界面。具体来说,包括通过插件方式在浏览器中设置有"标注添加"功能按钮和"检索与管理"功能按钮,从而分别提供标注编辑工具栏和标注检索工具栏。具体设置方式可根据浏览器而定,例如应用于IE浏览器,可以根据IE浏览器习惯将"创建标注"按钮和"检索与管理"按钮添加到浏览器上方的"收藏夹"、"刷新"等按钮所在的快捷工具栏,点击按钮后,在浏览器的左方打开相应的标注编辑工具栏或标注检索工具栏的工具窗口 。 通过用户编辑界面可以方便地支持用户,实现添加过程、检索过程和管理过程
所述添加过程为,用户点选"标注添加"功能按钮,浏览器中打开标注编辑工具栏;用户从浏览器所提供网页中选中网页内容,在标注编辑工具栏中填写编辑元数据信息、标注信息和标签信息,完成后在标注添加工具栏选择进行添加,填写内容存入存储模块。标注编辑工具栏中呈现用以填写的项目与标签模板相应,部分项目可以自动获取填写。例如用户从浏览器所提供网页中选中网页内容时,标注与标签模块从网页中提取定位信息并自动填入标注编辑工具栏。 所述检索过程为,用户点选"检索与管理"功能按钮,浏览器中打开标注检索工具栏,标注检索工具栏中提供查看方式的选择;用户在标注检索工具栏中选择查看方式;根据查看方式从存储模块提取相关标注的记录,在浏览器中呈现包括检索所得记录的页面。标注检索工具栏可以向用户提供多种检索结构显示方式,例如全部显示、显示个人的标注以及以网页的形式查看标注等。 所述管理过程为,在完成检索过程后,用户从包括检索所得记录的页面中点选某项记录;在浏览器中呈现包括该记录所对应标注的标注生成信息的页面,该页面中提供用户可选管理操作,包括对该记录的修改、增加、删除和投票操作。可以详细呈现所有标注生成信息,也可以呈现标注内容的文本,或者只提供标注所处网页的链接。可以将管理过程和添加过程结合起来,在对某个标注选择修改操作后,用户点选"标注添加"功能按钮,浏览器中打开标注编辑工具栏,利用标注编辑工具栏直接对该标注的相关信息进行编辑修改。
本发明实施时,可由本领域技术人员采用软件技术结合硬件,根据本发明技术方案编程实现。标注与标签模块、定位与显示模块可以通过软件设置在用户的本地个人计算机或PDA等设备中;存储模块可以采用数据库软件技术设置在用户的本地个人计算机的硬盘中,或者为了便于共享标注资源而提供专用的数据库服务器作为存储服务器,或者为了便于移动管理采用USB闪存。参见附图5,具体实施时可以灵活进行模块化设计,例如将标注与标签模块分为标注模块、标签模块、用户界面模块分别进行构造,标注模块专门面向支持元数据信息和标注信息,标签模块专门面向标签信息,用户界面模块用于提供用户编辑界面。还有在定位与显示模块中专设一个用来以集合的方式对一个或多个用户标注的信息进行显示和定位的批处理模块,以提高处理效率。 本发明提供的网页标注系统特别适合于通过授权认证形式在网络中共享标注资源,一般包括两个基本使用方式页面标注和检索管理。附图2提供了使用过程的详细步骤以供参考。
其中页面标注过程如下 (1)用户打开浏览器,登录标注系统或通过注册后进入标注系统; (2)在浏览器环境中浏览任意的Web网页(如本地硬盘或网络存储所提供的web
网页); (3)在网络环境中选择需要标注的内容,如文本或图片等,即为选中网页内容;
(4)鼠标点击标注系统的"标注添加"功能按钮的图标,在弹出的标注编辑工具栏,按标签模板项目填写页面内容的元数据信息、标签信息和标注信息,确定后进行存储到标注存储服务器; (5)标注工具根据网页中选中网页内容的相关位置信息计算该标注信息的定位信息,并将定位信息存储到存储服务器; (6)标注内容、定位信息和标签样式通过定位与显示模块嵌入到Web网页文本对
应位置,在浏览器以标签样式显示在网页中,如虚框。 标注信息的检索与管理过程如下 (1)用户打开浏览器,登录标注系统或通过注册后进入标注系统; (2)鼠标点击标注系统的"检索与管理"功能按钮的图标,标注的相关信息以表格
形式显现,包括选择词、关键词、标注内容、类型、作者和标注时间等信息。
(3)用户可以对标注的相关信息进行必要的修订、删除等操作; (4)当用户以网页形式浏览标注内容时,在浏览器环境中将出现已经浏览过的
Web网页(如本地硬盘或网络存储所提供的web网页),并且显示个人标注相关信息或所有
人的标注相关信息。
权利要求
一种面向浏览器的网页标注系统,其特征在于由以下三个部分组成,(1)标注与标签模块,用于用户针对选中网页内容添加或编辑标注生成信息,标注生成信息包括有元数据信息、标注信息和标签信息,所述元数据信息用于记载网页属性相关信息、标注者相关信息和内容属性;所述标注信息包括标注内容和定位信息,定位信息是定位与显示模块的定位依据;所述标签信息用于指定标注内容在浏览器所提供相应网页中的呈现样式;(2)存储模块,标注与标签模块所得标注生成信息送入存储模块进行存储;(3)定位与显示模块,用于根据选中网页内容,在浏览器所提供相应网页中定位显示标注;所述显示标注采用文档内容内嵌方式实现,具体实现过程如下,结合浏览器中的网页内容的统一地址,从标注与标签模块或存储模块中提取网页内容相关的标注生成信息;获取浏览器底层的文档类型接口,并通过文档类型接口直接获取网页内容;根据标注信息中的定位信息,搜索并获取网页内容中被标注及需显示的内容信息;按标签信息所指定的呈现样式,生成显示标注信息中标注内容的HTML标记文本;用该HTML标记文本替换被标注及需显示的内容信息,形成更新的、带有标注信息的网页文档,并通过浏览器显示。
2. 用权利要求l所述网页标注系统,其特征在于标注与标签模块提供标签模版,按照 标签模版分项记载元数据信息、标签信息和标注信息。
3. 用权利要求1所述网页标注系统,其特征在于标注与标签模块为1项元数据信息 和1项或以上标签信息建立关联,为标签信息和标注信息建立一一对应关联。
4. 用权利要求1或2或3所述网页标注系统,其特征在于标注与标签模块提供基于浏览器的用户编辑界面,将"标注添加"和"检索与管理"功能按钮通过插件方式嵌入在浏 览器工具栏中,从而分别形成标注编辑工具栏和标注检索工具栏;通过用户编辑界面支持实现添加过程、检索过程和管理过程,所述添加过程为,用户点选"标注添加"功能按钮,浏览器中打开标注编辑工具栏;用户 从浏览器所提供网页中选中网页内容,在标注编辑工具栏中填写编辑元数据信息、标注信 息和标签信息,完成后在标注添加工具栏选择确认进行添加,填写内容存入存储模块;所述检索过程为,用户点选"检索与管理"功能按钮,浏览器中打开标注检索工具栏,标 注检索工具栏中提供查看方式的选择;用户在标注检索工具栏中选择查看方式;根据查看 方式从存储模块提取相关标注的记录,在浏览器中呈现包括检索所得记录的页面;所述管理过程为,在完成检索过程后,用户从包括检索所得记录的页面中点选某项记 录;在浏览器中呈现包括该记录所对应标注的标注生成信息的页面,该页面中提供用户可 选管理操作,包括对该记录的修改、增加、删除和投票操作。
5. 用权利要求4所述网页标注系统,其特征在于所述添加过程中,用户从浏览器所提 供网页中选中网页内容时,标注与标签模块从网页中提取定位信息并自动填入标注编辑工 具栏。
6. 用权利要求5所述网页标注系统,其特征在于所述定位信息包括选中网页内容所 处相应网页的三类信息,即网页地址、网页中处于选中网页内容前后的词组和HTML标签、 网页中选中网页内容所含关键词出现频度。
7. 用权利要求1或2或3所述网页标注系统,其特征在于所述存储模块采用数据库 服务器、USB闪存或硬盘实现。
全文摘要
面向浏览器的网页标注系统,由用于添加或编辑标注生成信息的标注与标签模块、存储模块、定位与显示模块组成。定位与显示模块用于在网页中定位显示标注,过程为获取浏览器底层的文档类型接口,并获取与选中网页内容相应的文本信息;生成按标签信息所指定呈现样式显示标注内容的HTML标记文本来替换文本信息,形成新的网页文档内容。本发明可以针对不同浏览器显示的网页实现各种标注操作;标注成为网页文档的内容组成部分,不改变Web页面的格式、文件结构或显示风格;存储的标注生成信息脱离具体应用环境,被其他工具复用、共享和再加工;标注生成信息可存储到存储服务器或相关硬件设备上。本发明可广泛应用到PDA、PC、笔记本等设备上。
文档编号G06F17/30GK101739415SQ20081019785
公开日2010年6月16日 申请日期2008年11月25日 优先权日2008年11月25日
发明者刘三女牙, 刘清堂, 李新, 杨宗凯, 赵刚, 黄涛 申请人:华中师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1