一种智能听书方法及智能听书设备与流程

文档序号：17477259发布日期：2019-04-20 06:12阅读：915来源：国知局

本发明听书设备领域，具体涉及一种智能听书控制方法，智能听书设备及系统。

背景技术：

随着科技进步和电子设备的兴起，对于书本知识的吸取方式越来越多样化，例如电子书和听书等。但是即使电子书的兴起仍然不能取代庞大的纸质书本市场，大多数书本还是以纸质书本作为主要的销售量。并且即使电子书阅读起来更加方便快捷，其阅读的体验依然没有纸质书本的阅读感觉要好，所以纸质书本依然是大多数人吸取知识的渠道，是生活中不可缺少的一部分。

现有的电子设备的听书都是以电子设备为载体，书本的内容以及音频信息都在电子设备中，用户输入书本信息去查找相关的音频信息。对于一些拿到纸质书本，又想听其中音频信息的用户并不那么方便智能。因此，需要提供一种设备能够根据用户拿到的纸质书本快速播放与其相关的音频信息的设备。这对于公共场合如书店等对纸质书本的推销具有较大的推进作用。

技术实现要素：

针对现有技术的不足，本发明提供一种能够根据纸质书籍封面快速播放与其相关音频信息的智能听书方法及智能听书设备。

本发明提供一种智能听书方法，包括如下步骤：

a)获取书本影像；

b)根据所述书本影像的特定信息识别书本信息；

c)匹配与识别得到的书本信息相关的音频和/或视频；

d)播放所述音频和/或视频。

优选地，所述书本影像的特定信息包括书名、作者、出版商的一个或多个。

优选地，过设备终端获取书本影像，所述设备终端将所述书本影像传输至远端服务器，所述远端服务器根据所述书本影像的特定信息识别书本信息，并将与识别得到的书本信息相匹配的音频和/或视频发送至所述设备终端。

优选地，通过设备终端获取书本影像，所述设备终端将所述书本影像传输至远端服务器，所述远端服务器根据所述书本影像的特定信息识别书本信息，并将与识别得到的书本信息发送至所述设备终端，设备终端匹配与书本信息相关的音频和/或视频并进行播放。

优选地，通过设备终端获取书本影像，所述设备终端将所述书本影像传输至远端服务器，所述远端服务器根据所述书本影像的特定信息识别书本信息，并将与识别得到的书本信息发送至所述设备终端，设备终端本地匹配与书本信息相关的音频和/或视频，

当匹配值大于或等于预设值时，播放匹配的音频和/或视频；

当匹配值小于预设值时，远端服务器将识别得到的书本信息在线匹配相关的音频和/或视频，并将相匹配的音频和/或视频发送至所述设备终端

本发明还提供一种智能听书设备，包括：

影像单元，用于获取书本影像；

识别单元或通讯单元，所述识别单元用于根据所述书本影像的特定信息识别书本信息；所述通讯单元用于将所述书本影像传送至远端服务器进行识别以得到书本信息，以及获取远端服务器识别得到的书本信息。

播放单元，用于播放与识别的书本信息相匹配的音频和/或视频。

优选地，所述通讯单元还用于从所述远端服务器获得与识别得到的书本信息相匹配的音频和/或视频

优选地，还包括用于放置书本放置平台，所述放置平台设置于所述影像单元的下方。

优选地，还包括存储单元，所述存储单元用于存储与书本相关联的音频和/或视频。

优选地，所述远端服务器包括easydl平台。

本发明提供的智能听书方法及智能听书设备能够根据纸质书籍封面快速播放与其相关音频信息。

附图说明

通过附图中所示的本发明优选实施例更具体说明，本发明上述及其它目的、特征和优势将变得更加清晰。在全部附图中相同的附图标记指示相同的部分，且并未刻意按实际尺寸等比例缩放绘制附图，重点在于示出本的主旨。

图1为本发明实施例提供的智能听书系统的流程示意图。

图2为本发明实施例提供的智能听书设备的控制方法流程图。

具体实施方式

下面结合具体实施例对本发明技术方案作进一步的详细描述，以使本领域的技术人员可以更好的理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

参考图1-2，本发明实施例本发明提供一种智能听书方法，包括如下步骤：

101、获取书本影像；通过拍照等方式获取书本影像，书本影像可以是外封、内封、书脊、封底或者扉页的照片。

102、根据书本影像的特定信息识别书本信息；例如根据书本影像中包含的出书本名称信息、出版社信息、作者信息和版本信息，判断是哪一本书，得到书本信息。

103、匹配与识别得到的书本信息相关的音频和/或视频；在数据库中匹配与书本信息相关的音频和/或视频，本实施例中所指的数据库可以是是存储单元15也可以是在线数据库22。

104、播放音频和/或视频。

本发明实施例提供的智能听书控制方法能够根据书本影像快速识别出书本信息，并且播放与书本信息匹配的音频/或视频。例如在书店等场所，常常会有一些需要出售的纸质书本陈列，用户可能拿到纸质书本后比较喜欢其的封面以及书本的质感，想要进一步了解书本内容却又没有时间翻阅的时候，可以采用本实施例的智能听书控制方法快速播放相关的音频信息。使得用户能够不翻阅书本便可了解与书本相关的内容。

在优选实施例中，书本影像的特定信息包括书名、作者、出版商的一个或多个。

在优选实施例中，通过设备终端获取书本影像，设备终端上设有用于拍照的摄像头。拍摄得到书本影像后，设备终端的控制中心将书本影像传输至远端服务器2进行识别，本实施例中的远端服务器2采用easydl平台21进行识别。easydl平台21在对书本影像识别之前先进行识别训练。具体训练方法为：

采集本书本的封面图片，每本书采集20-100张不同角度和光照下的封面图片，上传到easydl平台21做图像分类训练。

训练完成模型，对模型进行测试，调整数据和模型。

对模型进行反复的训练和测试达到一定的准确率，然后将设备终端接入训练完成的api接口。

本实施例中，匹配相关音频和/或视频的步骤可由设备终端执行或是远端服务器2执行，设备终端设有存储单元15，用于储存相关储音频和/或视频。远端服务器2识别得到的书本信息发送回设备终端，然后设备终端将书本信息与存储单元15中预存的相关的音频和/或视频进行匹配。匹配到合适的音频和/或视频则设备终端直接播放。

或者，可以不设置存储单元15，远端服务器2中还设有在线数据库22，识别平台将识别得到的书本信息与在线数据库22中的音频和/或视频进行匹配，匹配的音频和/或视频再发送至设备终端进行播放。

或者，远端服务器2识别得到书本信息后，先反馈回设备终端，设备终端将书本信息与存储单元15中预存的音频和/或视频进行匹配，当匹配值大于预设值时，则直接播放；当匹配值小于预设值时，向远端服务器2发送匹配指示，则远端服务器2在线匹配与书本信息相关的音频和/或视频，然后将匹配的音频和/或视频发送回设备终端进行播放。

本实施例中设备终端播放后的音频和/或视频将会存储到本地数据中，直接在存储单元15中匹配音频和/或视频，能够实现更加快速的播放。同时，设备终端上还设置有用于外部的将音频和/或视频储存于存储单元15中的usb接口。本实施例的智能听书设备1可用于放置在机场、高铁站等公共场所。因为这些场所的一些书籍可能针对性较强，或者没有广泛的公开，可能在线数据很难搜索到较为相关的音频信息，此时需要用户先通过usb接口将音频信息预存到存储单元15中。实现更加精准快速的匹配和播放。

另一方面，由于存储单元15的数据有限，不能提供更大数据的匹配，因此，当存储单元15中无法实现较好的匹配时，由在线数据库22进行匹配。能够使得书本信息的匹配更加全面。

本发明还提供一种智能听书设备1，包括：

影像单元11，用于获取书本影像；如摄像装置等可获取影像的摄像设备，摄像设备的摄像头朝向台面，用于拍摄书本封面的书本影像。例如8百万像素摄像头。

识别单元和/或通讯单元13。识别单元用于根据书本影像的特定信息识别书本信息；通讯单元13用于将所述书本影像传送至远端服务器2进行识别以得到书本信息，以及获取远端服务器2识别得到的书本信息。本实施例的智能听书设备1可以通过识别单元进行识别也可以通过远端服务器2进行识别。或者是当识别单元识别的准确率小于预设值时，再有远端服务器2进行二次识别，保证识别更加准确。

播放单元14，用于播放与识别的书本信息相匹配的音频和/或视频。播放单元14可以是音响、扬声器、耳机或者显示屏播放。

处理器12，用于向各个单元发送指令，指示各个单元的工作。

在优选实施例中，还包括用于放置书本放置平台，放置平台设置于影像单元11的下方。用户将书本放置在放置平台上，影像单便可获取书本影像。

在优选实施例中，还包括存储单元15，存储单元15用于存储与书本相关联的音频和/或视频。智能听书设备1播放过后的音频和/或视频均可以存储于存储单元15中，便于下一次能够快速播放该音频信息。同时，本实施例的智能听书设备1可用于放置在机场、高铁站等公共场所。因为这些场所的一些书籍可能针对性较强，或者没有广泛的公开，可能在线数据很难搜索到较为相关的音频信息，此时需要用户先将与书本相关联的音频和/或视频预存到存储单元15中。实现更加精准快速的匹配和播放。

在优选实施例中，通讯单元13还用于从所述远端服务器2获得与识别得到的书本信息相匹配的音频和/或视频。为书本信息提供更多的匹配数据，实现智能听书设备1可用于多种不同的领域。

在优选实施例中，通讯单元13接收远端服务器2识别得到的书本信息，然后将书本信息与存储单元15中预存的音频和/或视频进行匹配，当匹配值大于或等于预设值时，则直接播放。当匹配值小于预设值时，则远端服务器2在线进行匹配，通讯单元13接受远端服务器2匹配得到的音频和/或视频。

在优选实施例中，远端服务器2包括easydl平台21。easydl平台21在对书本影像识别之前先进行识别训练。具体训练方法为：

采集本书本的封面图片，每本书采集20-100张不同角度和光照下的封面图片，上传到easydl平台21做图像分类训练。

训练完成模型，对模型进行测试，调整数据和模型。

对模型进行反复的训练和测试达到一定的准确率，然后将设备终端接入训练完成的api接口。

在优选实施例中，播放单元14还包括显示屏，显示屏为触摸屏，可用于控制音频和/或视频的播放/暂停，和音量大小等。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈子恬;陈新准
技术所有人：广州绿桦环保科技有限公司
我是此专利的发明人

上一篇：一种M6与M10螺栓快速转换接头的制作方法
上一篇：一种LCD装针产品自动裁切装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。