一种基于深度阅读识别的电子文档阅读方法和系统与流程

文档序号:36095204发布日期:2023-11-18 15:35阅读:63来源:国知局
一种基于深度阅读识别的电子文档阅读方法和系统与流程

本发明属于数据处理,具体涉及一种基于深度阅读识别的电子文档阅读方法和系统。


背景技术:

1、随着电子科技的不断发展,人们越来越依赖显示屏幕进行各种日常生活,电子阅读也逐渐取代原有的纸质阅读,为人们提供更方便、快捷的阅读体验。为了满足用户的实际需求,在各个终端、学习平台、在线公共平台等均为用户提供电子版的文档或图书,以供人们随时通过电脑或移动终端进行快速查阅。

2、现有的电子文档阅读设备在分析用户的阅读数据时,还仅仅停留在记录用户的阅读时长和阅读页数上,尚且缺少对于用户深入阅读行为的分析。

3、并且,现有的电子文档阅读设备在用户关闭电子文档之后再打开时,会跳转到用户上次阅读的位置,但是在某些场景下,例如翻阅文献时,最后时段可能仅仅是草草浏览,关闭时停留的位置并非用户最关注的部分,重新打开时跳转到上次阅读的位置难以准确地体现用户的关注点,用户往往需要重新浏览整篇文献,导致时间和精力的浪费。


技术实现思路

1、为了解决现有技术存在的缺少对于用户深入阅读行为的分析,关闭电子文档之后再打开时跳转到用户上次阅读的位置,难以准确地体现用户的关注点,用户往往需要重新浏览整篇文献,导致时间和精力的浪费的技术问题,本发明提供一种基于深度阅读识别的电子文档阅读方法和系统。

2、第一方面

3、本发明提供了一种基于深度阅读识别的电子文档阅读方法,包括:

4、s101:获取电子文档的文本特征,文本特征包括:文本难度、文字拥挤程度、文字属性和低频文字比例;

5、s102:根据各个文本特征,计算电子文档在阅读时的注视影响系数ρ;

6、s103:获取读者阅读电子文档时的各个注视点的注视信息,注视信息包括:注视点持续时间、眼跳距离、眼跳纵向距离、眼跳方向和瞳孔直径;

7、s104:构建样本数据集,样本数据集包括各个注视点的特征向量x,x={x1,x2,x3,x4,x5},x1表示注视点持续时间,x2表示眼跳距离,x3表示眼跳纵向距离,x4表示眼跳方向,x5表示瞳孔直径;

8、s105:随机生成深阅读聚类中心点c1和浅阅读聚类中心点c2;

9、s106:根据当前注视点的特征向量,计算与各个聚类中心点的距离dij:

10、

11、其中,dij表示第i个注视点到第j个聚类中心点的距离,j=1或2,xik表示第i个注视点的第k个特征值,k=1,2,…,5;

12、s107:根据电子文档的注视影响系数ρ,计算当前注视点与各个聚类中心点的分类距离

13、

14、其中,表示第i个注视点到深阅读聚类中心点c1的分类距离,表示第i个注视点到深阅读聚类中心点c2的分类距离;

15、s108:将当前注视点划分到分类距离较小的聚类中,并更新深阅读聚类中心点c1和浅阅读聚类中心点c2;

16、s109:继续选取下一个注视点,重复s106和s108,直至完成所有注视点的聚类,得出深阅读片段和浅阅读片段;

17、s110:展示用户的深阅读时长;

18、s111:当读者关闭电子文档时,将深阅读片段中的最后一个注视点所在的阅读位置作为记忆位置并存储;

19、s112:当读者重新打开电子文档时,自动跳转到记忆位置。

20、第二方面

21、本发明提供了一种基于深度阅读识别的电子文档阅读系统,用于执行第一方面中的基于深度阅读识别的电子文档阅读方法。

22、与现有技术相比,本发明至少具有以下有益技术效果:

23、(1)在本发明中,通过分析读者在阅读电子文档时眼镜的注视点,根据注视点持续时间、眼跳距离、眼跳纵向距离、眼跳方向和瞳孔直径分析出读者在阅读过程中的深阅读片段和浅阅读片段,进而可以向用户展示深阅读时长,便于用户了解自身的阅读习惯。

24、(2)在本发明中,当读者关闭电子文档再重新打开时自动跳转到深阅读片段中的最后时刻,更加能够体现读者的实际关注点,无需重新浏览整篇文献,节省了读者的时间和精力。



技术特征:

1.一种基于深度阅读识别的电子文档阅读方法,其特征在于,包括:

2.根据权利要求1所述的基于深度阅读识别的电子文档阅读方法,其特征在于,所述s101具体包括:

3.根据权利要求1所述的基于深度阅读识别的电子文档阅读方法,其特征在于,所述s102具体包括:

4.根据权利要求3所述的基于深度阅读识别的电子文档阅读方法,其特征在于,所述s1022具体包括:

5.根据权利要求1所述的基于深度阅读识别的电子文档阅读方法,其特征在于,所述眼跳方向e的计算方式为:

6.根据权利要求1所述的基于深度阅读识别的电子文档阅读方法,其特征在于,还包括:

7.根据权利要求6所述的基于深度阅读识别的电子文档阅读方法,其特征在于,所述s114具体包括:

8.根据权利要求1所述的基于深度阅读识别的电子文档阅读方法,其特征在于,还包括:

9.根据权利要求8所述的基于深度阅读识别的电子文档阅读方法,其特征在于,所述s118具体包括:

10.一种基于深度阅读识别的电子文档阅读系统,其特征在于,用于执行权利要求1至9任一项所述的基于深度阅读识别的电子文档阅读方法。


技术总结
本发明公开了一种基于深度阅读识别的电子文档阅读方法和系统,属于数据处理技术领域,方法包括:获取电子文档的文本特征;根据各个文本特征,计算电子文档在阅读时的注视影响系数;获取读者阅读电子文档时的各个注视点的注视信息;构建样本数据集;根据当前注视点的特征向量,计算与各个聚类中心点的距离;根据电子文档的注视影响系数,计算当前注视点与各个聚类中心点的分类距离;将当前注视点划分到分类距离较小的聚类中,得出深阅读片段和浅阅读片段;展示用户的深阅读时长;当读者关闭电子文档时,将深阅读片段中的最后一个注视点所在的阅读位置作为记忆位置并存储;当读者重新打开电子文档时,自动跳转到记忆位置。

技术研发人员:曾力
受保护的技术使用者:杭州励普科技有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1