一种页面内容朗读方法和装置制造方法

文档序号：7997801阅读：204来源：国知局

一种页面内容朗读方法和装置制造方法
【专利摘要】本发明公开了一种页面内容朗读方法和装置：获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。本发明所述方案具有广泛适用性，并能够降低实现成本。
【专利说明】一种页面内容朗读方法和装置

【技术领域】
[0001]本发明涉及网络技术，特别涉及一种页面内容朗读方法和装置。

【背景技术】
[0002]为方便用户获取页面内容，现有技术中提出了一种页面内容朗读技术，即当用户需要浏览某一页面内容时，可由系统将该页面内容为用户朗读出来，这样，用户即可通过收听的方式而不是浏览的方式方便地获取到页面内容。
[0003]在某些场景下，如用户开车不方便操控手机的场景下，上述技术将非常实用。
[0004]现有页面朗读技术主要有以下两种实现方式:
[0005]I)用户在自身的终端如手机上安装专门的小说朗读软件，用户可浏览该软件所能提供的任一小说的页面内容,并且,可针对任一页面内容发出朗读请求,相应地,该软件将该页面内容为用户朗读出来；
[0006]2)针对不同的页面内容，分别通过真人录制的方式生成对应的朗读材料，并存储，当接收到用户针对任一页面内容的朗读请求时，播放对应的朗读材料。
[0007]但是，上述两种方式在实际应用中均会存在一定的问题，如:
[0008]对于方式1)，在页面内容上有很大的局限性，即仅适用于小说，不能实现对于其它页面内容，如新闻、论坛、杂志等的朗读，适用范围有限；
[0009]对于方式2)，由于实际应用中会涉及到各式各样的页面内容，如果均进行真人录制，将需要很高的实现成本，包括人力成本和存储成本等。

【发明内容】

[0010]有鉴于此，本发明提供了一种页面内容朗读方法和装置，可以对不同类型的网页内容进行朗读且不用提前进行真人录制，具有广泛适用性，并能够降低实现成本。
[0011]一种页面内容朗读方法，包括:
[0012]获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求；
[0013]如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；
[0014]如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0015]一种页面内容朗读装置，包括:获取模块和朗读模块；
[0016]所述获取模块，用于获取用户请求浏览的页面内容，并发送给所述朗读模块；
[0017]所述朗读模块，用于确定页面内容的格式是否符合预定要求；
[0018]如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；
[0019]如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0020]可见，采用本发明所述方案，获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求，如果是，则可直接将页面内容展示给用户，否则，可将页面内容转换为符合预定要求的格式，并展示给用户，当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容为用户朗读出来；相比于现有方式1)，本发明所述方案可适用于任意页面内容，即不再局限于小说，对其它页面内容如新闻、论坛、杂志等均适用，从而扩大了本发明所述方案的适用范围，即本发明所述方案具有广泛适用性；相比于现有方式2)，本发明所述方案无需进行真人录制，从而降低了实现成本，包括人力成本和存储成本等。

【专利附图】

【附图说明】
[0021]图1为本发明页面内容朗读装置的运行环境示意图。
[0022]图2为本发明页面内容朗读方法实施例的流程图。
[0023]图3为本发明页面内容朗读方法较佳实施例的流程图。
[0024]图4为本发明页面内容朗读装置实施例的组成结构示意图。

【具体实施方式】
[0025]针对现有技术中存在的技术问题，本发明中提出一种改进后的页面内容朗读方案，采用文本到语音的合成(TTS，Text To Speech)技术与页面正文抽取技术相结合的实现方式。
[0026]其中，TTS技术又称为语音合成技术，是一种将文本转化为语音的技术，即将文本按字或词分解为音素，并通过查询语音库得到不同音素对应的语音，通过扬声器等播放出来，所播放出来的声音采用真人普通话作为标准发音，朗读速度可达到3?4个汉字/秒，使用户可以听到清晰悦耳的音质和连贯流畅的语调。
[0027]页面正文抽取技术是指当用户通过浏览器客户端对某一页面内容发出浏览请求后，由后台服务器对该页面内容进行过滤和标记，将广告等用户不感兴趣的内容进行滤除，并对正文内容的头尾进行标记，而后由浏览器客户端根据后台服务器所作的标记，将正文内各展不给用户。
[0028]图1为本发明页面内容朗读装置的运行环境示意图。该页面内容朗读装置可置于浏览器客户端内，如图1所示，该浏览器客户端可包括:人机交互电路11、通信电路12、存储器13、音频电路14和处理器15等。
[0029]其中，人机交互电路11可用于进行人机交互，如接收用户的请求，将用户所请求的页面内容展示给用户等；通信电路12可用于与服务器进行信息交互，如从服务器中获取用户请求的页面内容等；存储器13可用于存储上述页面内容朗读装置所对应的程序指令，并存储从服务器获取到的页面内容以及经过各种处理后的页面内容等；音频电路14可用于播放所朗读的页面内容等；处理器15可用于控制其它各部分(如存储器13中所存储的页面内容朗读装置的程序指令)进行工作，并执行页面内容的格式转换和页面内容的朗读等功能。
[0030]为了使本发明的技术方案更加清楚、明白，以下参照附图并举实施例，对本发明所述方案作进一步地详细说明。
[0031]图2为本发明页面内容朗读方法实施例的流程图。该方法应用于浏览器客户端中。如图2所示，该方法包括以下步骤:
[0032]步骤21:获取用户请求浏览的页面内容。
[0033]如何获取为现有技术，在此不再赘述。
[0034]步骤22:确定页面内容的格式是否符合预定要求，如果是，则执行步骤23，否则，执行步骤24。
[0035]在实际应用中，当接收到用户针对任一页面内容的浏览请求时，可首先确定页面内容是否为进行页面正文抽取后的页面内容，并可根据确定结果的不同，后续采用不同的处理方式，即如果确定页面内容为进行页面正文抽取后的页面内容，则执行步骤23，否则，执行步骤24。
[0036]步骤23:将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0037]如果步骤22中确定出页面内容为进行页面正文抽取后的页面内容，则本步骤中，可直接将页面内容展示给用户，并可在展示的同时，在展示界面的菜单中显示一个“朗读”按钮，当确定用户点击该按钮后，即可认为用户发出了朗读请求，相应地，可利用TTS技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0038]步骤24:在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0039]具体而言，浏览器客户端首先将页面内容发送给后台服务器，由后台服务器对页面内容进行页面正文抽取，并接收后台服务器返回的处理后的页面内容，展示给用户。在展示的同时，在展示界面的菜单中显示一个“朗读”按钮，当确定用户点击该按钮后，即可利用TTS技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0040]另外，为方便用户定位当前朗读的位置，便于在听和看之间进行顺利切换，本发明所述方案中还提出，在朗读的同时，可将朗读完的文字以卡拉OK跟读模式进行标示。
[0041]具体来说，可在接收到用户的朗读请求之前，通过对标点符号的判断等，对所展示的页面内容进行分句处理，从而得到一个个的句子；相应地，在对所展示的页面内容进行朗读的同时，每朗读完一个句子，则将句子进行标示。
[0042]如何进行标示，本实施例不作限制。
[0043]如，假设正常情况下，所展示的页面内容中的文字均为黑色，那么，可在每朗读完一个句子后，将该句子中的文字显示为蓝色，这样，用户即可方便直观地了解到当前朗读到的位置。
[0044]基于上述介绍，图3为本发明页面内容朗读方法较佳实施例的流程图。如图3所示，包括以下步骤:
[0045]步骤31:获取用户请求浏览的页面内容。
[0046]步骤32:确定页面内容是否为进行页面正文抽取后的页面内容，如果是，则执行步骤33，否则，执行步骤34。
[0047]步骤33:将页面内容展示给用户，之后执行步骤35。
[0048]步骤34:将页面内容发送给后台服务器进行页面正文抽取，接收后台服务器返回的处理后的页面内容，展示给用户，之后执行步骤35。
[0049]步骤35:当接收到用户的朗读请求时，利用TTS技术将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0050]步骤36:在朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示。
[0051]本发明同时公开了一种页面内容朗读装置。
[0052]图4为本发明页面内容朗读装置实施例的组成结构示意图。如图4所示,包括:获取模块41和朗读模块42 ；
[0053]获取模块41，用于获取用户请求浏览的页面内容，并发送给朗读模块42 ；
[0054]朗读模块42，用于确定页面内容的格式是否符合预定要求；
[0055]如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；
[0056]如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0057]其中，
[0058]朗读模块42可具体包括:展示单元421和朗读单元422 ；
[0059]展示单元421，用于确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，通知朗读单元422执行朗读功能；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，通知朗读单元422执行朗读功能；
[0060]朗读单元422，用于将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0061]具体地，
[0062]展示单元421确定页面内容是否为进行页面正文抽取后的页面内容，如果是，则确定页面内容的格式符合预定要求，否则，确定不符合预定要求，将页面内容发送给后台服务器进行页面正文抽取，并接收后台服务器返回的处理后的页面内容。
[0063]朗读单元422利用TTS技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
[0064]另外，
[0065]展示单元421可进一步用于，在朗读单元422朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示。
[0066]展示单元421还可进一步用于，在将页面内容转换为符合预定要求的格式之后，在接收到用户的朗读请求之前，对所展示的页面内容进行分句处理；
[0067]相应地,朗读单元422每朗读完一个句子，展示单元421则将该句子进行标示。
[0068]以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。
【权利要求】
1.一种页面内容朗读方法，其特征在于，包括: 获取用户请求浏览的页面内容，并确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式,并将处理后的页面内容朗读出来。
2.根据权利要求1所述的方法，其特征在于，所述确定页面内容的格式是否符合预定要求的步骤包括:确定页面内容是否为进行页面正文抽取后的页面内容，如果是，则确定页面内容的格式符合预定要求，否则，确定不符合预定要求。
3.根据权利要求1所述的方法，其特征在于，所述将页面内容转换为符合预定要求的格式，展示给用户的步骤包括:对页面内容进行页面正文抽取，将抽取出的内容展示给用户。
4.根据权利要求1所述的方法，其特征在于，所述将页面内容处理成适合朗读的形式是通过文本到语音的合成技术来实现。
5.根据权利要求1、2、3或4所述的方法，其特征在于，该方法进一步包括:在朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示。
6.根据权利要求5所述的方法，其特征在于，所述在将页面内容转换为符合预定要求的格式之后，在接收到用户的朗读请求之前，进一步包括:对所展示的页面内容进行分句处理；所述在朗读的同时，将朗读完的文字以卡拉OK跟读模式进行标示的步骤包括:每朗读完一个句子，则将该句子进行标示。
7.一种页面内容朗读装置，其特征在于，包括:获取模块和朗读模块；所述获取模块，用于获取用户请求浏览的页面内容，并发送给所述朗读模块；所述朗读模块，用于确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，将页面内容处理成适合朗读的形式,并将处理后的页面内容朗读出来。
8.根据权利要求7所述的装置，其特征在于，所述朗读模块中包括:展示单元和朗读单元; 所述展示单元，用于确定页面内容的格式是否符合预定要求；如果是，则将页面内容展示给用户，并在当接收到用户的朗读请求时，通知所述朗读单元执行朗读功能；如果否，则在将页面内容转换为符合预定要求的格式后，展示给用户，并在当接收到用户的朗读请求时，通知所述朗读单元执行朗读功能；所述朗读单元，用于将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
9.根据权利要求8所述的装置，其特征在于，所述展示单元确定页面内容是否为进行页面正文抽取后的页面内容，如果是，则确定页面内容的格式符合预定要求，否则，确定不符合预定要求，将页面内容发送给后台服务器进行页面正文抽取，并接收所述后台服务器返回的处理后的页面内容。
10.根据权利要求8所述的装置，其特征在于，所述朗读单元利用文本到语音的合成技术，将页面内容处理成适合朗读的形式，并将处理后的页面内容朗读出来。
【文档编号】H04L29/08GK104078038SQ201310104807
【公开日】2014年10月1日申请日期:2013年3月28日优先权日:2013年3月28日
【发明者】张凯, 胡博, 唐廷勇, 刘人方, 王智培, 周睿奕, 王曦, 谢郑凯, 贺柏森, 黄英, 李未, 冯诚, 杨惠姣, 刘玉磊申请人:腾讯科技（深圳）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张凯;胡博;唐廷勇;刘人方;王智培;周睿奕;王曦;谢郑凯;贺柏森;黄英;李未;冯诚;杨惠姣;刘玉磊
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：触摸屏移动终端及其识别来电接听命令的方法和装置制造方法
上一篇：一种数据通信方法、装置及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。