一种基于浏览记录的链接评分方法与流程

文档序号:11177370阅读:860来源:国知局
一种基于浏览记录的链接评分方法与流程

本发明涉及互联网链接评分领域,特别是一种基于浏览记录的链接评分方法。



背景技术:

现在,互联网已经基本普及,几乎每个人都会使用浏览器进行网络活动,而浏览器里留存了大量的历史记录,以及用户的使用习惯。那么这些数据为什么不能够利用起来呢?可以通过编写浏览器插件的方式,将用户在浏览器上的网络活动历史进行分析、整合,然后计算出用户对特定关键字、网站等的喜好程度。这样,就可以对用户以后浏览器页面内呈现的链接进行喜好程度评分。使用户在点击之前即可预估该链接的价值,从而避免打开无兴趣链接导致的时间、精力上的浪费。

当前的链接评分机制多为搜索引擎对自身检索结果的评分,而该评分主要是由搜索引擎厂商提供的网络评分服务,根据网民自发评分统计得出的结果,此种方式有以下不足:

1、依赖于特定的搜索引擎及网络服务

在百度上看到的链接评分,在360搜索、必应搜索等等服务中是不通用的,且不同的搜索引擎有自身的一套评分机制以及体现方式。比如,在必应搜索中,体现为officialsite的角标形式;在360搜索中,以小角标“v”的形式体现该链接的可信度,这些体验是相当不统一且高度依赖于特定网络服务的。

如果用户没有使用搜索引擎,只是打开了一个论坛的帖子列表,如何显示链接的评分呢?按照现有的技术,是无法解决这个问题的。

2、无法提供个性化评分建议

现有搜索引擎所提供的链接评分机制,仅仅是基于搜索引擎自身的数据运算所得的结果,并没有根据用户的浏览习惯去优化(当然可以根据用户的搜索历史去优化,但并不全面)。造成这个结果的原因是搜索引擎并不能完全地接触到用户的所有浏览记录。同时如果将用户的所有浏览记录交付于某个搜索引擎厂商,也是一种隐私方面的隐患。

相关术语:浏览器,即网页浏览器,指googlechrome、mozillafirefox、safari等支持第三方插件的浏览器。搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统,如百度、google等。localstorage,即现代浏览器所提供的本地数据存储接口。



技术实现要素:

本发明所要解决的技术问题是提供一种基于浏览记录的链接评分方法,将依赖于网络服务的评分机制本地化,放到用户的电脑上进行评分计算,便可以脱离对网络服务的依赖,使用户在任意网页上都可以看到对应的链接评分。

为解决上述技术问题,本发明采用的技术方案是:

一种基于浏览记录的链接评分方法,包括历史关键词提取及评分模块、实时关键词提取及评分模块、链接评分模块,具体如下:

历史关键词提取及评分模块

获取用户所有的浏览器历史记录;对浏览器历史记录的标题、链接进行中文、英文分词,并计算时间差得分;对分词后的关键词进行出现频次累加,累加值为上一步骤所计算的时间差得分,得出对应关键词分数;保存关键词及其分数至本地存储,供其他模块调用。

实时关键词提取及评分模块

获取用户当前浏览的页面信息,包括标题、内容、网址;对当前浏览页面的标题、内容、网址进行中文、英文分词;根据用户在对应网页上的停留时间,对关键字进行评分,停留时间越长,对应的关键字评分越高;将此关键字评分与“历史关键词提取及评分模块”中所保存的关键字评分进行累加合并;保存关键词及其分数至本地存储,供其他模块调用。

链接评分模块

获取用户当前浏览的页面中的所有链接以及对应的标题;对提获取到的链接及对应标题进行中文、英文分词,得出对应关键字;将对应链接的关键字应用到本地存储中进行评分检索;将对应链接中的关键字的评分求平均数;根据分数的大小对链接背景进行染色,高亮显示分数较高的链接。

进一步的,所述链接评分方法基于googlechrome、mozillafirefox或safari浏览器的插件机制。

进一步的,在对浏览器历史记录的标题、链接进行中文、英文分词时,分词方法包括使用自定义词典对文本进行逐个匹配、使用开源的分词方法或通过http请求的方式调用分词服务api。

进一步的,所述开源的分词方法包括node-segment、nodejieba、node-analyzer。

与现有技术相比,本发明的有益效果是:1)在使用了发明方法后,用户在打开任意网页时,均可以看到一目了然的链接评分结果;2)方便用户快速定位自己感兴趣的链接,决定下一步点击操作,此举大大节省了用户在链接选择方面的时间,提高了信息获取的效率。

附图说明

图1是本发明一种基于浏览记录的链接评分方法实现流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明的目的是要克服当前的链接评分服务的「高度网络服务依赖」以及「无法准确个性化评分」的缺陷。首先,将依赖于网络服务的评分机制本地化,放到用户的电脑上进行评分计算,便可以脱离对网络服务的依赖,使用户在任意网页上都可以看到对应的链接评分。其次,依据用户的浏览历史以及对浏览习惯的数据收集,便可以高度定制链接评分机制,使评分结果与用户的上网习惯息息相关,而不是像搜索引擎那样提供一个并无个性化适配的评分结果。

下面基于googlechrome的插件机制对本发明方法进行阐述,但对于mozillafirefox、safari等浏览器,实现方式大同小异,具体如下:

历史关键词提取及评分模块

1、使用googlechrome提供的chrome.historyapi,获取用户所有的浏览器历史记录。

实现代码片段如下:

2、对浏览器历史记录的「标题」、「链接」进行中文、英文分词,并计算时间差得分。

分词的方法有很多,包括使用自定义词典对文本进行逐个匹配、使用开源的分词解决方案(如:node-segment、nodejieba、node-analyzer等等)或通过http请求的方式调用分词服务api。时间差得分是以链接访问时的时间戳除以当前时间的时间戳所得的值,保存后用于接下来的分数计算。

3、对分词后的关键词进行出现频次累加,累加值为上一步所计算的时间差得分,得出对应关键词分数。

4、保存关键词及其分数至本地存储(localstorage),供其他模块调用。

实时关键词提取及评分模块

1、使用googlechrome提供的contentscripts机制获取用户当前浏览的页面信息:标题、内容、网址。

实现代码片段如下:

2、对当前浏览页面的「标题」、「内容」、「网址」进行中文、英文分词。

3、根据用户在对应网页上的停留时间,对关键字进行评分,停留时间越长,对应的关键字评分越高。当用户停留在网页上时,可以采用固定的时间差得分(timescore),如1分钟进行一次关键词提取与评分,这样就实现了用户在指定页面停留时间越长,得分越高的结果。

4、将此关键字评分与「历史关键词提取及评分模块」中所保存的关键字评分进行累加合并。

5、保存关键词及其分数至本地存储(localstorage),供其他模块调用。

链接评分模块

1、使用googlechrome提供的contentscripts机制获取用户当前浏览的页面中的所有链接以及对应的标题。

实现代码片段如下:

2、对提获取到的链接及对应标题进行中文、英文分词,得出对应关键字。

3、将对应链接的关键字,在本地存储(localstorage)中进行评分检索。

4、将对应链接中的关键字的评分求平均数。

5、根据分数的大小对链接背景进行染色,高亮显示分数较高(例如,分数高于当前页面所有链接的平均分)的链接。至此,用户便可以在任意网页中看到对应的高分链接,就更容易判断点击目标了。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1