确定阅读位置的方法、装置及设备与流程

文档序号：19930889发布日期：2020-02-14 22:00阅读：205来源：国知局

本发明涉及电子书技术，尤其涉及一种确定阅读位置的方法、装置及设备。

背景技术：

阅读能够使用户获得更多的知识，同时丰富用户的精神世界。因此，在互联网快速发展的生活中，仍然有大量的用户选择阅读书籍。

现有技术中读书的方式较多，例如阅读传统的纸质书籍，也可以阅读电子书。由于电子书可以存储在便携式电子设备中，如手机、电纸书等，相较于纸质书籍来说更便于携带。而纸质书籍相较于电子书能够带给用户更好的阅读体验，因此，一些用户在家时会选择观看纸质书。

发明人发现，根据阅读场合的不同，可能会存在着用户在不同场合通过不同方式阅读同一本书的需求。例如在家时阅读纸质书籍，而在外出时阅读电子书。而用户在阅读纸质书籍后再阅读电子书时，需要靠记忆寻找暂停阅读的段落，这就导致用户的阅读效率较低，造成阅读体验差的问题。

技术实现要素：

本发明提供一种确定阅读位置的方法、装置及设备，以解决现有技术中，用户在阅读纸质书籍后再阅读电子书时，需要靠记忆寻找暂停阅读的段落，导致用户的阅读效率较低，造成阅读体验差的问题。

本发明的第一个方面是提供一种确定阅读位置的方法，包括：

接收识别指令，并根据所述识别指令获取待识别书籍信息；

根据预设算法获取所述待识别书籍信息中包括的待识别字符；

根据所述待识别字符在电子书中确定目标页面。

本发明的另一个方面是提供一种确定阅读位置的装置，包括：

接收模块，用于接收识别指令，并根据所述识别指令获取待识别书籍信息；

字符确定模块，用于根据预设算法获取所述待识别书籍信息中包括的待识别字符；

页面确定模块，用于根据所述待识别字符在电子书中确定目标页面。

本发明的又一个方面是提供一种确定阅读位置的设备，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并配置为由所述处理器执行以实现如上述第一方面所述的确定阅读位置的方法。

本发明提供的确定阅读位置的方法、装置及设备的技术效果是：

本发明提供的确定阅读位置的方法、装置及设备，包括，接收识别指令，并根据识别指令获取待识别书籍信息；根据预设算法获取待识别书籍信息中包括的待识别字符；根据待识别字符在电子书中确定目标页面。本发明提供的确定阅读位置的方案中，能够根据待识别纸质书籍信息，确定与其对应的电子书位置，进而在用户阅读完纸质书籍后，再阅读同一本书的电子书时，能够通过对纸质书籍识别的方式在电子书中确定暂停阅读的位置，无需凭借记忆翻阅电子书，因此，本发明提供的方案能够提高用户的阅读效率，进而提高用户的阅读体验。

附图说明

图1为本发明一示例性实施例示出的确定阅读位置的方法的流程图；

图2为本发明另一示例性实施例示出的确定阅读位置的方法的流程图；

图3为本发明又一示例性实施例示出的确定阅读位置的方法的流程图；

图4为本发明一示例性实施例示出的判断是否能够根据待识别字符在电子书中确定目标页面的流程图；

图5为本发明另一示例性实施例示出的确定阅读位置的方法的流程图；

图6为本发明一示例性实施例示出的确定阅读位置的装置的结构图；

图7为本发明另一示例性实施例示出的确定阅读位置的装置的结构图。

具体实施方式

图1为本发明一示例性实施例示出的确定阅读位置的方法的流程图。

如图1所示，本实施例提供的确定阅读位置的方法包括：

步骤101，接收识别指令，并根据识别指令获取待识别书籍信息。

其中，可以由用于阅读电子书的用户终端执行本实施例提供的方法，如手机、计算机、平板电脑、电纸书等。可以由用户向用户终端发送识别指令，以使用户终端能够接收该识别指令。发送识别指令的方式可以有多种，例如可以是用户选择用户终端中识别纸质书籍的功能，也可以是用户选择用户终端中扫描的功能，还可以是用户通过语音方式输入识别指令，例如用户对着用户终端说出“扫描”、“扫描纸质书”、“录音”等口令，终端可以对语音口令进行识别，进而识别出该语音口令是否是识别指令。

具体的，识别指令的类型可以包括图像识别指令、语音识别指令。例如，可以在终端显示界面上显示图像识别以及语音识别的按钮，用户可以通过点击按钮的方式触发该识别指令。用户终端接收到识别指令后，可以根据识别指令获取待识别书籍信息。例如，用户输入的是图像识别指令，则用户终端开启获取图像的功能，若用户输入的是语音识别指令，则用户终端开启获取语音内容的功能，从而获取待识别书籍信息。

若用户输入的是图像识别指令，则可以通过拍照、扫描、上传图片等多种方式获取待识别书籍的图像信息。若用户输入的是语音识别指令，则可以通过录音、上传音频的方式获取待识别书籍的音频内容。

步骤102，根据预设算法获取待识别书籍信息中包括的待识别字符。

其中，可以根据不同的识别指令设置相应预设算法，例如，识别指令是图像识别指令时，则根据图像识别算法对待识别书籍信息进行处理，从而获取其中包括的待识别字符；若识别指令是语音识别指令，则根据语音识别算法对待识别书籍信息进行处理，从而获取其中包括的待识别字符。

步骤103，根据待识别字符在电子书中确定目标页面。

其中，可以按照待识别字符的位置关系，将待识别字符连接起来得到待识别语句，再在电子书中查找待识别语句，进而确定待识别字符所在的目标页面。另外，若确定待识别字符时，由于待识别书籍信息不够清晰，导致有一些待识别字符不清晰，则可以将该位置的待识别字符用空格替代。

进一步的，识别指令是图像识别指令时，由于获取的图像信息可能仅包括纸质书籍的一部分，例如图像信息是纸质书籍中间的一部分，图像信息中每行文字均比纸质书籍中的每行文字少。此时，本实施例还可以根据图像信息中待识别字符的位置关系，确定出每行待识别文字，再将每行待识别文字拼接起来，得到每行的待识别语句。终端可以在电子书中查找每行待识别语句，并将同时包括这些待识别语句的页面作为目标页面。若没有同时包括每行待识别语句的页面，则可以将包括待识别语句行数最多的页面作为目标页面。

实际应用时，识别指令是语音识别指令时，一般情况下用户录制的书籍信息都是连续的，因此，可以将获取的待识别字符连起来，形成语句，并基于语句在电子书中确定目标页面。

实际应用时，由于电子书与纸质书的排版不尽相同，有可能待识别书籍的图像信息跨越了电子书的多个页面，例如图像信息的内容在电子书的第二页和第三页，此时，本实施例还可以将页码最靠前的页面作为目标页面。另外，还可以在终端中显示获取的图像信息，并在其中标注各部分纸质书的版本信息的页面信息。例如，可以框选图像信息中的一部分，并标注该部分在电子书的第二页，框选图像信息中的另一部分，标注该部分在电子书的第三页。用户可以操作终端，选择其中一部分，终端将用户选择的部分对应的页面作为目标页面。

还可以在确定待识别字符时，剔除其中包括的标点符号，在电子书中确定目标页面时，也剔除电子书中的标点符号，仅根据待识别书籍信息中的待识别字符以及电子书中的文字信息确定目标页面。

在确定目标页面后，本实施例提供的方法还包括：跳转到电子书的目标页面。以使用户能够继续阅读书籍。

本实施例提供的方法用于在电子书中确定纸质书籍中的阅读位置，该方法由存储有本实施例提供的方法的设备执行，其中，该装置通常以硬件和/或软件的方式来实现。

本实施例提供的确定阅读位置的方法，包括，接收识别指令，并根据识别指令获取待识别书籍信息；根据预设算法获取待识别书籍信息中包括的待识别字符；根据待识别字符在电子书中确定目标页面。本实施例提供的确定阅读位置的方案中，能够根据待识别纸质书籍的信息，确定与其对应的电子书位置，进而在用户阅读完纸质书籍后，再阅读同一本书的电子书时，能够通过对纸质书籍识别的方式在电子书中确定暂停阅读的位置，无需凭借记忆翻阅电子书，因此，本实施例提供的方案能够提高用户的阅读效率，进而提高用户的阅读体验。

图2为本发明另一示例性实施例示出的确定阅读位置的方法的流程图。

如图2所示，本实施例提供的确定阅读位置的方法，包括：

步骤201，接收图像识别指令，并根据图像识别指令获取待识别书籍的图像信息。

其中，用户终端接收到图像识别指令后，可以获取待识别书籍的图像信息。

在一种实施方式中，用户终端可以在接收图像识别指令后开启终端的摄像模组，用户可以移动终端，从而使摄像模组对准待识别书籍，此时，终端可以获取待识别书籍的图像信息。其中，当终端的摄像模组对准书籍后，可以由用户操作终端，触发终端的拍照功能，也就是使终端对待识别书籍进行拍照，进而得到图像信息。还可以在终端的摄像模组开启后，由终端对摄像模组获取的图形进行扫描，并判断图像信息中是否包括文字信息，若是，则对获取的图像信息进行处理。那么当摄像模组对准书籍后，终端检测到通过摄像模组获取的图像信息中包括文字信息，则自动对当前获取的图像信息进行处理。在这种实时方式中，图像识别指令可以是拍照、扫描等。

在另一种实施方式中，还可以由用户上传图片，使终端获取待识别书籍的图像信息。用户终端在接收图像识别指令后，开启终端的相册功能。用户可以在相册中选择提前拍摄的书籍图片，终端对该书籍图片进行处理，获取其中的图像信息。在这种实施方式中，图像识别指令可以是上传图片、打开相册等。

图3为本发明又一示例性实施例示出的确定阅读位置的方法的流程图。如图3所示，步骤201中的根据图像识别指令获取待识别书籍的图像信息可以进一步包括：

步骤2011，根据图像识别指令开启摄像模组，并通过摄像模组获取图像。

其中，终端接收图像识别指令后，可以开启终端的摄像模组。摄像模组是指终端设置的用于获取图像的模块组件。终端可以通过摄像模组获取图像。

具体的，终端向摄像模组发送开启指令，进而开启摄像模组。

进一步的，当开启摄像模组后，获取的图像是摄像模组对准的图像。用户可以移动终端，使摄像模组对准待识别的纸质书籍。

步骤2012，接收用于在图像中选择位置的选择指令，并根据选择指令确定待识别书籍的图像信息。

进一步的，可以在终端的屏幕中显示选择控件，用户可以发送操作该选择控件的指令，从而使选择控件能够选择图像信息中的一部分，并将选择控件选择的部分作为待识别书籍的图像信息。

实际应用时，可以获取用户操作触摸屏时的触摸轨迹，根据触摸轨迹确定选择控件的位置和/或大小。

其中，用户在操作选择控件时，可以通过触摸终端屏幕的方式操作选择控件。终端可以检测用户触摸屏幕的位置以及触摸轨迹的移动方向，并根据触摸轨迹确定选择控件的位置和/或大小。例如，用户可以选中选择控件的一端，并移动手指，则可以调整选择控件这一端点的位置，还可以选中整个选择控件，并移动手指，则可以移动整个选择控件的位置。

具体的，选择控件可以以多种形式显示在终端中，如文字框、下划线等。

进一步的，可以将选择控件在图像中选择的部分确定为待识别书籍的图像信息。例如，若选择控件为文字框，则将文字框中选择的内容作为需要识别的图像信息，若选择控件为下划线，则可以将下划线对应的内容作为需要识别的图像信息。

实际应用时，由于摄像模组获取的图像包含的内容可能较多，例如获取的图像中包括书籍两页的内容，此时，若直接对图像进行处理，存在着计算量大的问题，且内容较多，对其识别的准确率会下降，因此，可以通过用户的操作，选择其中的一部分内容作为待识别书籍的图像信息，从而使识别的准确度更高，还能够提高识别速度。

步骤202，在图像信息中获取预设阈值数量的待识别字符。

其中，可以预先设置阈值，并在图像信息中获取阈值数量的待识别字符。例如，可以设置预设阈值为20、30等，可以根据实际需求对预设阈值的大小进行设置。

具体的，可以根据预设阈值，获取待识别的字符。

进一步的，可以随机在图像信息中获取预设阈值个待识别字符，例如可以在图像的左上角、右上角等位置随机选取待识别字符，直到字符数量达到预设阈值为止。也可以在图像信息中获取连续的待识别字符，例如，可以从图像信息左上角第一个出现的字符开始获取，直到获取了预设阈值个待识别字符为止；还可以判断图像中一个段落开始的起始位置，从该段落的起始位置开始获取待识别字符。

步骤203，判断是否能够根据待识别字符在电子书中确定目标页面。

进一步的，可以对获取的待识别字符进行处理，并判断是否能够根据这些字符确定目标页面。如果能，则执行步骤204，若不能，则继续执行步骤202，直到获取能够确定目标页面的待识别字体为止。

若能够根据获取的待识别字符确定目标页面，则执行步骤204，否则，继续在图像信息中获取预设阈值数量的待识别字符。这一次获取的待识别字符与上一次获取的待识别字符可以完全不同，也可以部分不同。可以在上一次获取的字符之后的部分，继续获取预设阈值的字符，此时，可以认为这一次获取的字符与上一次获取的字符完全不同。还可以在上一次获取的字符之后的部分，再获取n个字符，并剔除第一次获取的待识别字符的前n个字符，由剩余的字符以及新获取的n个字符共同执行步骤205。例如，预设阈值为20，则第一次获取了20个字符，根据这20个字符无法确定目标页面，则再次获取5个字符，并根据第一次获取的后15个字符以及新获取的5个字符，执行步骤205。

步骤204，根据待识别字符在电子书中确定目标页面。

步骤204与步骤103的具体原理和实现方式类似，此处不再赘述。

图4为本发明一示例性实施例示出的判断是否能够根据待识别字符在电子书中确定目标页面的流程图。

如图4所示，步骤203进一步的包括：

步骤2031，根据待识别字符确定字符轮廓。

可以采用图像识别方法，初步确定待识别字符的轮廓形状，而不需要对待识别字符进行精准的判断。

步骤2032，判断字符轮廓中否包括预设字符轮廓。

其中，可以预先设置字符轮廓，该字符轮廓包括但不限于章节号。例如“第一章”、“第一节”中的“第、章”、“第、节”等。该字符轮廓还可以是特殊字体、大小的轮廓，例如有些书籍中章节的字体和大小与正文是不同的。

具体的，可以通过比对的方式，确定待识别字符的轮廓形状是否包括预设字符轮廓。

若包括，则执行步骤2033，判断能够根据待识别字符在电子书中确定目标页面。进而根据该字符轮廓对应的待识别字符确定出目标页面，具体可以对该字符轮廓对应的待识别字符进行精准识别。

若不包括，则执行步骤2034，对待识别字符进行光学字符识别，确定待识别字符对应的文字。

实际应用时，可以对待识别字符进行光学字符识别(ocr)，确定待识别字符对应的文字。如通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字，形成通过识别软件将图像中的文字转换成文本格式。

步骤2035，判断电子书中是否包括待识别字符对应的文字。

可以遍历电子书中的文字，并与确定的待识别字符对应的文字进行比对，若包括，从而判断电子书中是否包括文字。可以根据确定的文字生成待识别语句，该待识别语句可以是一句也可以是多句，例如每行文字均为单独的一个待识别语句，在电子书中查找待识别语句，根据查找结果确定电子书中是否包括确定的文字。例如，待识别字符对应的文字包括“有时还用喇叭筒喊口号或向下撒传单”，则在电子书中查找是否包括这段语句。

若是，则执行步骤2033；若否，则执行步骤2036，判断不能够根据待识别字符在电子书中确定目标页面。

参考图2，若执行步骤2033，则继续执行步骤204。若执行步骤2036，则继续执行步骤202。

其中，若用户的阅读位置处恰好有预设的字符轮廓，则可以根据该字符轮廓快速定位阅读位置。若不包括字符轮廓，则可以仅对满足预设阈值的几个字符进行ocr识别，由于需要识别的字符数量少，从而字符间的干扰因素减少，使得识别精准度、识别效率都较高，进而能够提高终端的处理速度。

图5为本发明另一示例性实施例示出的确定阅读位置的方法的流程图。

如图5所示，本实施例提供的确定阅读位置的方法，包括：

步骤501，接收语音识别指令，并根据所述语音识别指令获取待识别书籍的语音内容。

其中，用户终端接收到语音识别指令后，可以获取待识别书籍的语音内容。

在一种实时方式中，用户终端可以在接收到语音识别指令后开启录音功能，并获取获取语音内容；在另一种实施方式中，还可以由用户上传录音，使终端获取待识别书籍的语音内容。用户终端在接收识别指令后，开启终端的存储音频内容的文件夹，用户可以在已由的音频中选择任一个音频，终端对该音频进行处理，获取其中的语音内容。

步骤502，获取语音内容中包括的文字信息，并根据文字信息的清晰度在文字信息中确定待识别字符。

具体的，获取到语音内容后，可以根据语音识别算法确定语音内容中包括的文字信息，在识别过程中可以采用孤立词识别、关键词识别、连续语音识别中任何一种方式。

进一步的，由于获取的获取待识别书籍的语音内容可能存在不清晰的情况，在这种情况下，还可以剔除不清晰的文字，仅保留清晰、确定的文字内容，对于不清晰的字符，可以使用空格代替。

步骤503，根据待识别字符在电子书中确定目标页面。

步骤503与步骤103的具体原理和实现方式类似。

当采用关键词识别的方式对语音内容进行处理时，得到待识别字符为非连续的语句，在这种情况下，可以将包含关键词的电子书页面确定为目标页面。

图6为本发明一示例性实施例示出的确定阅读位置的装置的结构图。

如图6所示，本实施例提供的确定阅读位置的装置，包括：

接收模块61，用于接收识别指令，并根据所述识别指令获取待识别书籍信息；

字符确定模块62，用于根据预设算法在所述待识别书籍信息中包括的待识别字符；

页面确定模块63，用于根据所述待识别字符在电子书中确定目标页面。

接收模块61、字符确定模块62与页面确定模块63依次连接。

本实施例提供的确定阅读位置的装置，包括接收模块，用于接收识别指令，并根据识别指令获取待识别书籍信息；字符确定模块，用于根据预设算法获取待识别信息中包括的待识别字符；页面确定模块，用于根据待识别字符在电子书中确定目标页面。本实施例提供的确定阅读位置的方案中，能够根据待识别纸质书籍信息，确定与其对应的电子书位置，进而在用户阅读完纸质书籍后，再阅读同一本书的电子书时，能够通过对纸质书籍识别的方式在电子书中确定暂停阅读的位置，无需凭借记忆翻阅电子书，因此，本实施例提供的方案能够提高用户的阅读效率，进而提高用户的阅读体验。

本实施例提供的确定阅读位置的装置的具体原理和实现方式均与图1所示的实施例类似，此处不再赘述。

图7为本发明另一示例性实施例示出的确定阅读位置的装置的结构图。

如图7所示，在上述实施例的基础上，本实施例提供的确定阅读位置的装置中，可选的，所述识别指令包括：图像识别指令；

所述接收模块61包括：

图像识别单元611，用于根据所述图像识别指令获取待识别书籍的图像信息。

可选的，所述字符确定模块62，包括：

第一获取单元621，用于在所述图像信息中获取预设阈值数量的所述待识别字符；

判断单元622，用于判断是否能够根据所述待识别字符在所述电子书中确定目标页面；

若是，则所述页面确定模块63执行根据所述待识别字符确定电子书的目标页面的步骤；

若否，则所述第一获取单元621继续执行在所述图像信息中获取预设阈值数量的所述待识别字符的步骤。

其中，第一获取单元621与判断单元622连接。

可选的，所述判断单元622具体用于：

对所述待识别字符进行光学字符识别，确定所述待识别字符对应的文字；

判断所述电子书中是否包括所述文字；

若是，则判断能够根据所述待识别字符在所述电子书中确定目标页面，否则，判断不能够根据所述待识别字符在所述电子书中确定目标页面。

可选的，所述字符确定模块62，还包括：

轮廓确定单元623，用于根据所述待识别字符确定字符轮廓；

所述判断单元622还用于判断所述字符轮廓中是否包括预设特殊字符轮廓，若是，则所述判断单元622判断能够根据所述待识别字符在所述电子书中确定目标页面；否则，所述判断单元622执行对所述待识别字符进行光学字符识别的步骤。

其中，轮廓确定单元623与获取单元621、判断单元622分别连接。

可选的，所述接收模块61，包括：

开启单元612，用于根据所述识别指令开启摄像模组，并通过摄像模组获取图像；

接收单元613，用于接收用于在所述图像中选择位置的选择指令；

确定单元614，用于根据所述选择指令确定所述待识别书籍的图像信息。

其中，开启单元611、接收单元612与确定单元613依次连接。

可选的，所述接收单元612具体用于：

获取用户操作触摸屏时的触摸轨迹，根据所述触摸轨迹确定选择控件的位置和/或大小；

相应的，所述确定单元具体用于：将所述选择控件在所述图像中选择的部分确定为所述待识别书籍的图像信息。

其中，若用户的阅读位置处恰好有预设的特殊字符轮廓，则可以根据该特殊字符轮廓快速定位阅读位置。若不包括特殊字符轮廓，则可以仅对满足预设阈值的几个字符进行ocr识别，由于需要识别的字符数量少，从而字符间的干扰因素减少，使得识别精准度、识别效率都较高，进而能够提高终端的处理速度。

可选的，所述识别指令包括：语音识别指令；

相应的，所述接收模块61包括：

语音识别单元615，用于根据所述语音识别指令获取待识别书籍的语音内容。

可选的，所述字符确定模块62，包括：

第二获取单元624，用于获取所述语音内容中包括的文字信息，并根据所述文字信息的清晰度在所述文字信息中确定所述待识别字符。

本实施例提供的确定阅读位置装置的具体原理和实现方式均与图2-5所示的实施例类似，此处不再赘述。

本实施例还提供一种确定阅读位置的设备，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并配置为由所述处理器执行以实现如上所述的任一种方法。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘晓洁
技术所有人：广州阿里巴巴文学信息技术有限公司
我是此专利的发明人

上一篇：主觉式验光装置及主觉式验光程序的制作方法
上一篇：一种热可逆交联橡胶及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。