一种面向沉浸式阅读的阅读主题智能设置方法和装置与流程

文档序号:11276422阅读:226来源:国知局
一种面向沉浸式阅读的阅读主题智能设置方法和装置与流程

本发明涉及智能终端和人机交互领域,具体地说,本发明涉及一种面向沉浸式阅读的阅读主题智能设置方法和装置。



背景技术:

随着信息技术的发展,在计算机、手机、平板电脑等电子设备上阅读电子书已经和阅读纸质书一样成为人们获取知识和休闲娱乐的重要方式,并且也出现了专用的电子书阅读终端,如“kindle”和“汉王电纸书”。相对于纸质书,电子书的内容呈现方式更为丰富多彩,例如,可以设置阅读的字体、背景颜色或背景图片,还可以在用户阅读的同时播放背景音乐。当前,很多电子书阅读器都提供阅读主题设置功能,允许用户设置背景、字体以及其它显示格式,从而使用户获得个性化的阅读体验。目前的阅读主题设置大多数由用户手动完成,设置的主题主要反映了用户对背景图案、颜色、字体大小等的个人偏好,而与用户正在阅读的内容无关。

目前虽然已有一些根据阅读内容自动设置背景图片和音乐的技术,但其对阅读内容的分析和利用主要有两种方式:一是获取阅读内容的主题或类型(如“激烈”、“奔放”等),然后根据主题或类型设置背景图片或音乐。这种方法对阅读内容的理解较为粗略,无法实现对阅读中场景的分析,从而也很难达到沉浸式、身临其境的效果;另一种方法是在阅读内容中提取关键词,利用得到的关键词搜索或匹配背景图片或音乐。这种方法只基于零散的关键词而缺乏对场景整体的识别和分析,其所设置的背景可能与阅读内容中的场景并不吻合。例如,若阅读内容中出现“小花拎着一瓶‘草原’酒走在路上”的句子,这些方法可能会因为检测到“小花”、“草原”、“路”等关键词而切换到含有花和路的草原的图片,而事实上该内容对应的场景与草原和花都没有关系。

综上所述,现有技术无法很好地实现对用户阅读内容的场景分析,从而无法实现符合用户期望的对阅读主题的智能设置。



技术实现要素:

本发明的目的是提供一种能够克服上述技术问题的解决方案。

本发明提供了一种用于电子书的阅读主题设置方法,包括:步骤1,从用户阅读的电子书文本中的场景描述语句中获取阅读内容场景信息;步骤2,根据所述阅读内容场景信息设置阅读主题。

优选地,在步骤1中,所述场景描述语句是从用户当前阅读的电子书文本中自动提取的。

优选地,在步骤1中,所场景描述语句来源于与所述电子书文本对应的标注文件。

优选地,步骤1进一步包括:从所述场景描述语句中自动提取出对应的阅读内容场景信息。

优选地,步骤1进一步包括:从所述场景描述语句中人工标注出对应的阅读内容场景信息。

优选地,步骤1进一步包括:采用统计分类器从所述场景描述语句中提取出对应的阅读内容场景信息。

优选地,步骤2进一步包括:根据所述阅读内容场景信息设置所述阅读主题中的背景图片和/或背景音乐。

优选地,步骤1还包括:从用户的阅读环境中获取环境场景信息;所述步骤2还包括:根据所述阅读内容场景信息和所述环境场景信息设置所述阅读主题。

优选地,在步骤2中,所述环境场景信息包括:时间场景信息、光照场景信息、声音场景信息。

本发明还相应地提供了一种用于电子书的阅读主题设置装置,包括:用于从用户阅读的电子书文本中的场景描述语句中获取阅读内容场景信息的模块;用于根据所述阅读内容场景信息设置阅读主题的模块。

与现有技术相比,本发明提出的技术方案能够实现对用户阅读内容的场景分析;使阅读主题与阅读内容中的场景和用户所处的环境直接相关;从而使阅读氛围更有沉浸感,提升阅读体验。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要 使用的附图作简单地介绍,显而易见地,下面描述中的附图并不构成对于本发明的技术方案的限制。

图1是根据本发明的实施例的阅读主题设置方法的流程示意图;

图2是根据本发明的一个实施例的获取场景描述语句的方法的流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步地描述。

发明人经研究发现,相对于设置固定的阅读主题,事实上读者更希望能实现一种沉浸式的智能的阅读主题设置方式。在这种模式下,系统可以根据阅读内容中的场景自动切换主题,如当用户正在阅读的小说中人物正处于草原场景时,电子书阅读器的背景图片自动切换为草原的图片,同时还可以播放与草原相关的音乐,如果小说场景中还有关于风、云、雨、雪等的描写,在背景中也可以采用动画等技术呈现相应的效果;而当阅读内容中的场景切换时,如从草原进入村镇或城市,则电子书阅读器的主题(包括但不限于背景图片、音乐等)也随之相应变化,呈现与村镇或城市相关的内容。通过这种方式,可以营造一种身临其境的感觉,增强用户阅读的愉悦感,同时也有益于用户理解和记忆阅读的内容。

另一方面,要想营造一种舒适的、身临其境的阅读氛围,除了要考虑用户正在阅读的内容之外,有些情况下还需考虑用户本身所在的真实世界场景。例如,当用户在深夜较暗的环境中阅读时,一般不宜出现太过明亮的颜色和太过激烈的背景音乐。

图1示出了根据本发明的实施例的阅读主题设置方法的流程示意图。如图1所示,该方法一方面获取阅读内容中的场景描述语句,从场景描述语句中获取阅读内容场景信息;另一方面从环境场景数据中获取用户的阅读环境的场景信息。利用从阅读内容中提取的阅读内容场景信息和从环境场景数据中提取的环境场景信息共同确定背景图片、屏幕亮度、背景音乐等阅读主题,使该阅读主题与阅读内容中的场景和用户的环境场景直接相关。

现结合本发明的实施例,将该方法具体描述如下。

步骤102.检测用户当前阅读的电子书文本(以下简称为当前的电子书文本)中是否存在场景描述语句,如果有,则获取所述场景描述语句。

所述场景描述语句,是指书中,特别是文学类书中介绍人物所在的或故事发生的场景的描述性语句,如“转过山怀中,隐隐露出一带黄泥筑就矮墙,墙头皆用稻茎掩护。有几百株杏花,如喷火蒸霞一般。里面数楹茅屋。外面却是桑,榆,槿,柘,各色树稚新条,随其曲折,编就两溜青篱。篱外山坡之下,有一土井,旁有桔槔辘轳之属。下面分畦列亩,佳蔬菜花,漫然无际。”(出自曹雪芹《红楼梦》)。又如,“路边的田里长着碧绿的青麦子,整齐地随风摇曳。他们登上一段坡道,渐渐地看见了黄土台地和浅山夹着的湟水河滩。铁灰色的河滩上也有些棋盘般方正的绿麦地,一溜蹲成并排的一串花头巾在麦浪上蠕动。”(出自张承志《北方的河》)。

根据本发明的一个实施例,可以采用基于预先标注的方法获取当前的电子书文本中的场景描述语句,即提供一个与电子书文件对应的标注文件,在该标注文件中预先人工标注出该电子书文件中的所有场景描述语句,并提供该语句的位置信息,如对应的章节和页码等。在需要检测和获取场景描述语句时,读取该标注文件,如果标注文件中有场景描述语句,则获取相应的场景描述语句。

根据本发明的另一个实施例,可以采用基于文本分析自动提取的方法检测并获取当前的电子书文本中的场景描述语句,即系统自动分析正在阅读的电子书文本,自动检测并提取其中的场景描述语句。如图2所示,可以采用如下所述的基于统计分类器的场景描述语句检测和提取方法。

步骤102.1将当前阅读的电子书文本切分为词并标注词性,然后提取其中的名词。可采用现有的词语切分方法(例如,基于字符串匹配的分词方法、基于统计的分词方法,等)和词性标注方法(例如,基于隐马尔可夫模型、感知器、条件随机场等统计学习模型的词性标注方法)来进行对电子书文本的切分及词性标注。

步骤102.2采用一个滑动窗口,即按顺序每次取m个提取出的名词,构造特征向量。根据本发明的一个实施例,可以构造出形如[(w1,f1),(w2,f2),...,(wn,fn)]的特征向量,其中,w1,...,wn为汉语中所有的名词,由一个预先准备的词典给出;fi为wi(i=1,...,n)在当前滑动窗口中出现的频率,若未出现则为0。其中,m的取值原则是与现实文本中出现的场景描述语句中的名词的平均数量近似。根据本发明的实施例,优选地,m的取值范围可为5至20中的任一整数;进一步优选地,在本发明的一个实施例中,m为10。

步骤102.3采用预先训练的统计分类器对当前滑动窗口提取的特征向量进行分类,决定当前滑动窗口所对应的语句内容是否为场景描述语句。若是(例如,统计分类器判断当前滑动窗口提取的特征向量所对应的语句为场景描述语句的概率大于或等于预设的阈值),则进入步骤102.4;若否(例如,统计分类器判断当前滑动窗口提取的特征向量所对应的语句为场景描述语句的概率小于预设的阈值),则转入步骤102.2进行下一滑动窗口的处理。其中,统计分类器可采用现有的方法构建,如贝叶斯分类器、knn分类器、支持向量机(svm)等。其中,统计分类器的训练方法为:(1)收集大量电子书形成电子书文本库;(2)对电子书文本库中的文本进行与步骤102.1中相同的分词、词性标注、名词提取操作;(3)对电子书文本库中提取的名词进行与步骤102.2中相同的滑动窗口和特征向量提取操作;(4)人工标注每个滑动窗口对应的内容是否为场景描述语句(即,人工寻找窗口中的名词所在的句子,然后人工判断该句子是否在描述场景),是则为1,否则为0;(5)利用电子书文本库中所有滑动窗口提取的特征向量及其对应的是否为场景描述语句的标注信息训练统计分类器。

步骤102.4对于被统计分类器判定为其对应的语句是场景描述语句的滑动窗口,提取该滑动窗口对应的场景描述语句。方法为:找到该滑动窗口对应的文字(即以该滑动窗口中处于两端的名词为边界的电子书文本中的所有文字内容),调整该文字的前后边界,将其分别向前或向后扩展到最近的表示句子结束的标点符号(例如,句号、问号、感叹号等),使其包含完整的句子。通过提取完整的场景描述语句用于提取阅读内容场景信息,使得在后续步骤中能够比较全面的提取到当前电子书文本中的阅读内容场景信息,减少甚至防止信息的遗漏,保障所获取的阅读内容场景信息与电子书文本所表达的内容吻合。

优选地,可以进一步以当前的滑动窗口对应的文字为中心,通过适当扩展其文字边界的方式,确定包含场景描述语句的最优边界。根据本发明的一个实施例,可以根据当前电子书文本的原文顺序,将当前的滑动窗口对应的文字的前后边界的1至k个句子依次加入当前的滑动窗口中,即将所增加的句子中的名词并入当前的滑动窗口中,形成多个窗口,对每一个窗口采用与步骤102.3中相同的分类器分类方法,获取窗口内容对应为场景描述语句的概率,取概率最大的窗口对应的文字为最终获取的场景描述语句。其中,优选地,k的取值不宜过大;进一步地,根据本发明的实施 例,k的取值范围为1至3中的任一整数;进一步优选地,在一个实施例中,k的取值可为2。

步骤102.5如果相邻多个滑动窗口都被判定为其对应的文字是场景描述语句,则将这些滑动窗口中提取的所有场景描述语句通过取并集的方式进行合并,得到合并的场景描述语句。

应当注意的是,对电子书文本检测并提取场景描述语句的时机和所检测的电子书文本范围并非对于本发明的限制。根据本发明的实施例,使用电子书的文本时,可以一次性使用当前阅读的电子书的全部文本提取其中所有场景描述语句,也可只针对其一部分文本,如正在显示的页及其若干相邻页,或正在显示的文本所在的章节提取其中所有的场景描述语句。例如,在根据本发明的一个实施例中,当用户首次打开一本电子书时,使用该电子书的文本提取其中所有的场景描述语句;在另一个实施例中,当用户阅读至电子书的每一个新的章节时,使用该章节的文本提取场景描述语句;在又一个实施例中,在用户每次翻页时,使用正在显示的页的文本提取其中的场景描述语句。

步骤104.从场景描述语句中获取阅读内容场景信息

获取场景描述语句之后,即从所获取的场景阅读语句中获取阅读内容场景信息,并记录所获取的阅读内容场景信息以及其在电子书文本中的位置作为当前的电子书文本的阅读内容场景信息的获取结果。其中,所获取的阅读内容场景信息包含两部分:颜色描述信息和景物描述信息。其中,颜色描述信息为一组颜色词,用于指明阅读内容场景中的主要颜色;景物描述信息为一组对应景物的名词,用于指明阅读内容场景中有哪些物体。

根据本发明的一个实施例,可以采用基于人工标注的方法获取阅读内容场景信息,即提供一个与电子书文件对应的标注文件,在该标注文件中对获取的场景描述语句通过人工标注的方式标注出与其对应的阅读内容场景信息。其中,人工标注的具体示例,例如,在一个实施例中,对于场景描述语句“路边的田里长着碧绿的青麦子,整齐地随风摇曳。他们登上一段坡道,渐渐地看见了黄土台地和浅山夹着的湟水河滩。铁灰色的河滩上也有些棋盘般方正的绿麦地,一溜蹲成并排的一串花头巾在麦浪上蠕动。”,人工标注其颜色描述信息为:{土黄色,绿色,银灰色},景物描述信息为:{黄土地,河,湟水,河滩,山,麦地,麦苗,农妇,花头巾}。根据本发明的实施例,从获取的场景描述语句中基于人工标注的方法获取 对应的阅读内容场景信息的步骤所涉及的标注文件可以与前述步骤102中基于预先标注的方法的实施例所涉及的标注文件为同一文件。例如,根据本发明的一个实施例,可以提供一个与电子书文件对应的标注文件,在该标注文件中根据前述步骤102预先人工标注出该电子书文件中的所有场景描述语句,并进一步根据步骤104预先通过人工标注的方式,分别标注出与所有场景描述语句对应的阅读内容场景信息,并提供相应信息的位置信息,如对应的章节和页码等。在需要检测和获取阅读内容场景信息时,读取该标注文件,如果标注文件中有对应的阅读内容场景信息,则获取相应的阅读内容场景信息。

根据本发明的实施例,从获取的场景描述语句中基于人工标注的方法获取对应的阅读内容场景信息的步骤所涉及的标注文件可以与前述步骤102中基于预先标注的方法的实施例所涉及的标注文件为不同的文件。例如,根据本发明的一个实施例,基于适于在前述步骤102采用的任意一种方法所获得的场景描述语句在步骤104中被提供给特定的操作者(例如,阅读终端(例如,手机、平板电脑等)的使用者、与阅读终端通信的服务器端的服务提供人员,等等);进而该操作者通过如前所述的人工标注的方式提供一个标注了与获得的场景描述语句对应的阅读内容场景信息及其的位置信息(如对应的章节和页码等)的标注文件;读取该标注文件,如果标注文件中有对应的阅读内容场景信息,则获取相应的阅读内容场景信息。

根据本发明的另一个实施例,可以采用基于文本分析自动提取的方法获取阅读内容场景信息,即系统自动分析其获得的场景描述语句,提取其中的阅读内容场景信息。根据本发明的一个实施例,基于文本分析自动提取的方法如下:将场景描述语句分词并标注词性,然后提取其中的颜色词作为颜色描述信息,提取除颜色词外的其它名词作为景物描述信息。其中,颜色词的提取采用一个预先准备的包含所有颜色的词表,把场景描述语句中出现的包含在该词表中的词提取出来。例如,在一个实施例中,对于场景描述语句“路边的田里长着碧绿的青麦子,整齐地随风摇曳。他们登上一段坡道,渐渐地看见了黄土台地和浅山夹着的湟水河滩。铁灰色的河滩上也有些棋盘般方正的绿麦地,一溜蹲成并排的一串花头巾在麦浪上蠕动。”,基于文本分析自动提取的颜色描述信息为:{碧绿,青,灰色,绿},景物描述信息为:{路,田,麦子,风,坡道,黄土,台地,山,湟水, 河滩,棋盘,麦地,头巾,麦浪}。

步骤106.获取用户的阅读环境的场景信息(即环境场景信息)

根据本发明的实施例,在每次发生翻页操作时,获取用户的环境场景信息。其中,环境场景信息,是指与用户所处的真实环境相关的场景信息,包括:时间场景信息、光照场景信息、声音场景信息等。

根据本发明的实施例,时间场景信息对应一天中的不同时段,可根据实际情况和经验设定。例如,在根据本发明的一个实施例中,可将时间场景信息设定为:早晨(6:00-9:00)、白天(9:00-18:00)、晚上(18:00-23:00)、深夜及凌晨(23:00-6:00)。其中,时间可由阅读终端设备的时钟获取。

根据本发明的实施例,光照场景信息用于反映用户所处环境的光照强弱,可由阅读终端设备的光线传感器获取。其中,可将光线传感器获取的光强数据分为若干个等级。例如,在根据本发明的一个实施例中,可将光线传感器所获取的光强数据分为强、中、弱、极弱四个等级。

根据本发明的实施例,声音场景信息用于反映用户所处环境的背景声音的强弱,可由阅读终端设备的麦克风获取。根据本发明的一个实施例,可通过麦克风采集一段声音,提取该声音的平均能量特征,根据该特征的数值将背景声音分为若干个等级。例如,在一个实施例中,可根据所采集的声音的平均能量特征将背景声音的强度分为强、中、弱、极弱四个等级。

步骤108.结合所获取的阅读内容场景信息和环境场景信息,自动设置当前的阅读主题,包括:背景图片、背景音乐等。根据本发明的实施例,在每次翻页时,判断翻页后当前显示的页面包含的文字中是否包含有阅读内容场景信息,即检索与当前显示的页面文本所对应的阅读内容场景信息获取结果中是否存在相应的阅读内容场景信息。如果含有阅读内容场景信息,则进行阅读主题设置。

根据本发明的实施例,背景图片的设置方法为:利用阅读内容场景信息搜索得到候选背景图片;进一步地,利用环境场景信息对候选背景图片进行筛选,将筛选得到的图片设置为阅读背景。其中,利用阅读内容场景信息搜索得到候选背景图片时,可以利用通用的网络图片搜索引擎,也可以在专门创建的图片库中搜索。

根据本发明的一个实施例,利用通用的网络图片搜索引擎时,将颜色描述信息和景物描述信息中的所有词作为关键词输入网络图片搜索引擎,然后获取排在前n(优选地,n的参考取值范围为1至20中的任一整数) 位的搜索结果作为候选背景图片。

根据本发明的另一个实施例,在专门创建的图片库中搜索时,需预先创建一个图片库,并为其中的每张图片标注颜色信息和景物信息。其中,颜色信息为图片中的主要颜色,是颜色词的集合;景物信息为图片中的主要景物,是一组名词的集合。搜索时,把阅读内容场景信息和图片库中每张图片进行匹配,计算相似度。根据本发明的实施例,相似度sp的计算方法为:sp=scso,其中sc为颜色相似度,so为景物相似度。其中,计算颜色相似度时,将阅读内容场景信息中的颜色描述信息与图片标注中的颜色信息进行比较:设阅读内容场景信息中的颜色描述信息中有n1个颜色词,图片标注中的颜色信息中有n2个颜色词,两者中相同的颜色词有ns个,则sc=2ns/(n1+n2)。计算景物相似度时,将阅读内容场景信息中的景物描述信息与图片标注中的景物信息进行比较:设阅读内容场景信息中的景物描述信息中有m1个词,图片标注中的景物信息中有m2个颜色词,两者中相同的词有ms个,则so=2ms/(m1+m2)。将所有图片按相似度sp排序,并取排在前n位的搜索结果作为候选背景图片。

进一步地,得到候选背景图片后,可以利用环境场景信息对候选背景图片进行筛选。根据本发明的实施例,对候选背景图片进行筛选的方法为计算每一张候选背景图片的平均亮度,根据时间场景信息和光照场景选择平均亮度符合要求的m(优选地,m的参考取值为1至5中的任一整数)张作为背景图片。根据本发明的实施例,平均亮度的计算方法为:将彩色图片转换为灰度图像,然后将灰度图像中所有像素灰度的平均值作为图片的平均亮度。在一个实施例中,选择的规则可为:将所有候选背景图片按平均亮度按由低到高排序,如果时间场景信息为深夜或者光照场景为极弱,则选择平均亮度最低的m张图片;如果时间场景信息为早晨或晚上,或者光照场景为弱,则在平均亮度排序位于20-30%的候选背景图片中随机选择m张图片;如果光照场景为强,则选择平均亮度最高的m张图片;对于其他情况,在平均亮度排序位于40-60%的候选背景图片中随机选择m张图片。

在得到m张图片后,可以采用多种方法将这些图片设置为阅读背景。例如,可固定采用其中的一张;可以将m张图片都作为阅读背景并按照一定的时间间隔循环切换;也可以提示阅读终端的使用者自己在m张图片中选择一张或几张作为阅读背景。优选地,作为阅读背景时,为避免影响阅 读,图片可做适当的透明处理。

根据本发明的实施例,背景音乐的设置方法为:利用阅读内容场景信息搜索得到背景音乐并播放;进一步地,利用环境场景信息设置播放音量。其中,利用阅读内容场景信息搜索得到背景音乐时,可以利用通用的网络音乐搜索引擎,也可以在专门创建的音乐库中搜索。

根据本发明的一个实施例,利用通用的网络音乐搜索引擎时,将景物描述信息中所有词作为关键词输入网络音乐搜索引擎,然后获取排在前n’(优选地,n’的参考取值范围为1至20中的任一整数)位的搜索结果作为候选背景音乐。

根据本发明的另一个实施例,在专门创建的音乐库中搜索时,需预先创建一个音乐库,并为其中的每首音乐附加文本信息以作为对该音乐的检索依据。其中,文本信息可以是歌曲的歌词,也可以是对音乐内容的描述和介绍。搜索时,把阅读内容场景信息中的景物描述信息和音乐库中每首音乐的文本信息进行匹配,计算相似度。根据本发明的实施例,相似度sm计算方法为:sm=nm/nt,其中nt为阅读内容场景信息中的景物描述信息中的词的数目,nm为这些词中出现在一首音乐的文本信息中的词的数目。将所有音乐按相似度sm排序,并取排在前m’(m’的参考取值范围为1至5中的任一整数)位的搜索结果作为背景音乐。

在得到m’首音乐后,可以采用多种方法将这些音乐设置为阅读的背景音乐。例如,可固定采用其中的一首;可以将m’首音乐都作为背景音乐并按照顺序循环播放;也可以提示阅读终端的使用者自己在m’首音乐中选择一首或几首作为背景音乐。

进一步地,在背景音乐播放时,利用环境场景信息设置播放音量。根据本发明的实施例,设置播放音量的方法为:将播放的音量分类若干个等级,并根据环境场景信息中的声音场景信息中的等级设置播放音量的等级。在一个实施例中,播放的音量可分为强、中、弱、极弱四个等级,分别对应设备最大音量的80%,60%,40%和20%,声音场景信息也分为强、中、弱、极弱四个等级。该实施例中,播放音量的等级设定为与声音场景信息的等级相同。

以上所述仅为本发明示意性的具体实施方式,并非用以限定本发明的范围。任何本领域的技术人员,在不脱离本发明的精神和范围的前提下所作的等同变化、修改与结合,均应属于本发明要求保护的范围。本发明要 求的保护范围由所附的权利要求书及其等同界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1