一种基于语音技术的盲人互联网系统的制作方法

文档序号:2649789阅读:291来源:国知局
专利名称:一种基于语音技术的盲人互联网系统的制作方法
技术领域
本发明涉及一种基于语音技术的盲人互联网系统,属于计算机与网络技术应用领 域。
背景技术
我国现有盲人500多万,每年新出现的盲人大约有45万,低视力患者135万,换算 下来平均一分钟就会新出现1个盲人,3个低视力患者。且这一数字还将持续增长,到2020 年我国视力残疾人数将为目前的4倍。盲人在我们的社会中是一个很大的群体,是一个必 须关注的群体。在互联网高度发达的今天,人们更多的时候是通过网络来及时快速地获取 各种所需资讯的。目前有以下帮助盲人上网的软件和系统(1)读屏软件是专为盲人或视力有障碍的人设计的屏幕朗读软件,目前国内有阳 光读屏、永德读屏和晨光读屏、争渡读屏等,盲人经过学习训练,通过数字键盘的切换操作, 以及大键盘上的几个功能键的切换,进行查找和处理文件,对网页进行导航浏览、编辑和收 发电子邮件等。但是,此类读屏软件,只能机械的把可视化的网页上面的文字顺序朗读出 来,其朗读内容是未经筛选的。而可视化的网页在视觉看来是有条理的,但在顺序朗读的方 式下,其朗读内容的逻辑性通常是有所欠缺的,其准确、迅速获取新闻资讯的效果也并非十 分理想。(2)专门为盲人开发计算机系统。如清华大学开发的“北极光”计算机系统,能够 获取和分析需要反馈的屏幕信息,通过语音合成平台将其内容朗读出来。用户也可以采用 盲文输入法进行输入,输入结果可转换为汉字文本形式。当然,这类盲人计算机软件和系 统,对系统配置要求较高,占用资源多,价格比较昂贵。(3)盲人手机是应用较多的盲人数字化产品。如三星公司的“Touch Messenger" 盲人手机,是一款触摸手机,主要是为方便盲人收发短信。通过在手机的上方设置固定的按 键,让盲人按照盲文点的方式,去选择对应的按键,以此来发送短信。该手机功能单一,只能 用作通信,且价格也相当昂贵。(4)盲人专用PDA (Personal Digital Assistant,个人数字助理,也被称为掌上电 脑)。它最早出现在国外,通过盲人专用按键输入,通过语音合成或点显器输出信息,能无线 上网。但是此类设备价格都相当昂贵,预售价为5000美元,且只支持英文,不支持汉语,不 适合我国盲人使用。

发明内容
本发明要解决的技术问题克服现有技术的不足,提供是一种价格相对低廉、符合 盲人使用特点、易于学习和掌握的基于语音技术的盲人互联网系统。本发明采用的技术方案一种基于语音技术的盲人互联网系统,包括新闻实时 更新系统、新闻收听系统、电子书收听系统、语音百科系统和语音博客系统,其中新闻收听系统支持让盲人顺序收听和栏目收听新闻方式,并通过关键字搜索和相关新闻搜索关注自己感兴趣的新闻;所述顺序收听新闻方式实现在盲人没有明确目标的 情况下,通过默认顺序收听新闻方式来执行;所述栏目收听新闻模式实现播报盲人所选栏 目的新闻;关键字搜索是根据用户指令实现对新闻的检索,检索按照标题、关键字、相关新 闻进行;相关新闻搜索指得到当前新闻的相关新闻;所有的新闻均来自于服务器的新闻自 动下载和更新系统得到的新闻数据库;电子书收听系统访问本地和服务器上的电子书数据库,通过语音合成技术输出 语音供盲人收听;对于服务器端的电子书数据,客户端可以在线连接访问,也可以下载到本 地,供以后使用收听;语音百科系统通过语音识别引擎识别用户要查询的关键词,再通过浏览器控件 向百科网站服务器提交查询,并接收处理返回的网页内容;语音博客系统用语音实现基本的博客系统的功能,通过登陆后,使用语音命令实 现发表博文,收听博文,对其他用户的博文发表评论;并且对用户进行管理以及提供相应的 语音提示帮助;所述博客系统包括五个功能模块,即用户管理模块、发文管理模块、博文朗 读模块、回复管理模块和帮助模块;所述用户管理模块实现对语音博客系统中的用户进行 管理,具体包括对进入系统界面的用户进行身份识别,对未注册的用户进行语音注册提示, 并进行功能介绍;对已注册的用户提供各种服务;当用户退出语音博客系统时,对用户进 行注销;所述发文管理模块实现发表博文,包括当语音博客系统接收到用户的发文请求时, 首先提示用户进行主题录制,然后提示用户进行内容录制,之后等待用户录制完毕口令;收 到口令后请用户等待审核,审核通过后,将文章进行分类送交博文朗读模块供其他用户收 听,并通知用户文章已经录制成功;审核未通过,将通知用户录制失败,并给出原因;所述 博文朗读模块实现收听其他用户的博文,具体包括当接收到用户的服务请求时,提示用户 最近更新的消息或博文,然后提示用户进行服务类型选择,用户选择完成后,对所选服务中 的新闻、文章标题进行逐条语音播报供用户进一步选择,待用户再次选择完成后,对所选新 闻或文章进行详细语音播报,当未完成语音播报就接收到用户新的服务要求时,立即转向 新的服务,当完成了语音播报而仍未接到用户新的服务要求时,询问用户是否进行回复,若 回复则转向回复模块,否则自动返回上一级服务;所述回复管理模块实现评论其他用户的 博文,具体包括当接收到用户的服务请求时,提示用户直接进行语音回复,并等待用户的回 复完毕口令;当收到用户的回复完毕时,对用户的回复进行审核,审核通过后,将回复保存; 审核未通过,将通知用户回复失败,并给出原因,然后自动返回到上一级服务;所述帮助模 块实现帮助用户熟悉系统的功能及用法,具体包括对不了解系统功能的用户进行帮助,当 收到用户的服务请求时,提示提示用户进行帮助类型选择,用户选择后系统进行服务,当未 完成语音播报就接收到用户新的服务要求时,立即转向新的服务,当完成了语音播报而仍 未接到用户新的服务要求时,自动返回上一级服务。所述服务器端的新闻自动下载和更新系统的实现过程为从一个或若干初始网页 的URL开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找 下一个网页,这样循环下去,直到达到一定的条件为止,把这些网页都抓取下来,然后对这 些网页对应的所有新闻各要素进行分析及提取,保存在服务器的数据库中,每隔一段时间 重新下载一次,实现系统数据的实时更新。本发明与现有技术相比具有的有益效果在于
1、本发明语音互联网的概念,使得盲人和视力低下者也能借助语音互联网随时随 地了解和感受外部世界。2、本发明充分考虑盲人的特点,运用网络爬虫技术对现有互联网信息展示方式进 行改造,构建了一个可以语音播报方式展示信息的盲人互联网数据库,从而方便为盲人提 供语音资讯服务。3、本发明提出语音博客的新设想,基于语音技术通过有效地控制建立了适合盲人 使用的网上交流平台。4、本发明基于语音识别技术,并通过浏览器控件,实现了盲人通过互联网获取知 识的便捷方式——“语音百科”。5、本发明对系统配置的要求不高,不需要屏幕,有占用资源少,价格便宜,易于推


图1为本发明的系统组成示意图;图2为本发明的服务器端的新自动下载和更新系统的实现流程图;图3为本发明的本发明的服务器端的新自动下载和更新系统中新闻下载实现过 程;图4为本发明的新闻收听系统实现流程图;图5为本发明的新闻收听系统中的新闻查询子系统实现流程图;图6为本发明的电子书收听系统实现流程图;图7为本发明的语音百科系统流程图;图8为本发明的语音博客系统的模块组成框图;图9为本发明的语音博客系统的实现流程图。
具体实施例方式如图1所示,本发明包括服务器端和客户应用端,其中服务器端到底包括新闻自 动下载和更新模块以及新闻数据库、电子书数据库、博客数据库;客户端应用系统包括新闻 收听系统、电子书收听系统、语音百科系统和语音博客系统。如图2所示,服务器端新闻自动下载和更新系统通过从Sina新闻网首页和五个新 闻栏目(国内新闻,国际新闻,社会新闻,财经新闻和体育新闻)首页的URL开始,读取网页 的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一层网页,这样循环 下去,直到下载三层的新闻网页,最后对其对应的所有新闻各要素进行分析及提取,保存在 服务器的数据库中。每隔一段时间(可设置)重新下载一次,实现系统数据的实时更新。如图3所示,服务器端的新闻自动下载和更新系统中的新闻下载过程共分为5个 部分,分别抽取国内新闻,国际新闻,社会新闻,财经新闻,体育新闻的内容。对于每个部分 的新闻下载过程是类似的,有一个公共队列和下载新闻页面程序。下载页面用到两个主要 的操作,一个是从各类新闻首页获取链接,另一个则是对于具体的新闻页提取相应的新闻 信息,其中后者对于各类新闻页均可适用。首先初始化队列创建一个队列,初始化爬虫国 内新闻地址得到相应的链接url都进到该队列。下载新闻首先读取队列中的一个元素(即
6url),通过这个url下载对应的新闻页面,并通过分析页面的标签特征提取出新闻的各要 素(如新闻标题,新闻摘要,新闻正文,发表时间,相关新闻等)。如果该新闻存在相关新闻 的话,就把这些相关新闻的url加入到队列中。然后判断队列是否为空,若为空,则结束此 栏目新闻的下载,否则,读取队列中第一个链接,下载对应新闻,就这样循环下去,直到队列 为空。新闻下载完毕。如图4所示,首先,通过“开始读新闻”命令进入新闻收听系统,系统会通过语音 合成把内置的说明文档合成语音返回给用户,主要目的是给用户语音提示以及相关使用说 明。用户也可以通过语音控制操作来实现系统设置。系统默认的读新闻模式是顺序朗读, 也可通过语音控制操作改变现有模式,进入其他模式(栏目点播,新闻搜索)。若想收听当 前新闻的相关新闻,直接语音输入“相关新闻”即可。不管在那种模式下,用户都可通过收 听的新闻标题,找到自己感兴趣的新闻并了解其详细内容。如图5所示,进入新闻收听系统后,首先进行初始化,并通过语音提示用户是否初 始化成功,系统监听程序通过监听用户的语音输入命令,根据命令进行判断进入哪种收听 新闻模式,即资讯查询模式。查询方面的核心内容主要有普通查询功能,制定查询功能。普 通查询是指用户操作程序过程中,按一定顺序浏览咨询内容时,程序所做出的查询操作。特 定查询功能是指程序根据资讯之间的相关程度智能查询相互关联的新闻内容的查询操作, 以及进行同类型新闻的搜索的查询操作。最后系统整理查询,并通过语音合成程序把资讯 信息朗读出来。监听程序一直运行,监听用户语音输入,重复以上过程。如图6所示,电子书收听系统首先通过访问本地和服务器上的电子书数据,然后 语音提示电子书的所有类别,如果用户有感兴趣的可直接语音输入该类别的名字,然后,系 统语音提示该类别目录下存在的电子书,用户同样通过电子书名发出语音命令,系统通过 语音合成程序把电子书中的文字合成语音返回给用户。在收听电子书的过程中,用户可以 通过语音控制操作使当然收听状态暂停、继续、停止等操作。当用户发出“结束”命令时,电 子书收听系统停止工作,退出运行状态。对于服务器上的电子书数据,客户端可以在线连接 访问,也可以下载到本地,供以后使用收听。如图7所示,进入语音百科系统,首先启动系统监听程序,一旦监听到有语音输 入关键词,系统就会打开百度百科首页,获取填写关键字的form表单,将监听到的语音输 入关键词转换成文字,并把该文字填入到form表单中,提交表单,返回相应关键词搜索 结果,最后通过分析页面标签信息得到“百度名片”项的信息。到此,一次语音百科搜索 过程结束。系统通过使用WebBrowser控件对Document属性操作网页内容。该属性包 括一个HtmlDocument对象,其作用是向当前页提供对HTML文档对象模型的托管访问。 HtmlDocument表示一个文档树,其子级是HtmlElement类的实例。对HtmlElement对象表 示的FORM标记进行操作进而获得百度百科中输入框的指针。然后将存储的内容传入到该 指针所指的INPUT区域。再通过HtmlElement对象操作FORM标记,完成提交表单操作。最 后清空存储内容。如图8所示,本发明的语音博客系统主要有五个功能模块用户管理模块、发文 管理模块、博文朗读模块、回复管理模块和帮助模块。用户管理模块系统对进入界面的用 户进行身份识别,对未注册的用户进行语音注册提示,并进行功能介绍;对已注册的用户提 供各种服务。当用户退出系统时,对用户进行注销。发文管理模块当接收到用户的发文请求时,首先提示用户进行主题录制,然后提示用户进行内容录制,之后等待用户录制完毕口 令;收到口令后请用户等待审核,审核通过后,将文章进行分类送交博文朗读模块供其他用 户收听,并通知用户文章已经录制成功;审核未通过,将通知用户录制失败,并给出原因。博 文朗读模块当接收到用户的服务请求时,提示用户最近更新的消息或博文,然后提示用户 进行服务类型选择,用户选择完成后,系统对所选服务中的新闻、文章标题进行逐条语音播 报供用户进一步选择,待用户再次选择完成后,对所选新闻或文章进行详细语音播报,当未 完成语音播报就接收到用户新的服务要求时,立即转向新的服务,当完成了语音播报而仍 未接到用户新的服务要求时,询问用户是否进行回复,若回复则转向回复模块,否则自动返 回上一级服务。回复管理当接收到用户的服务请求时,提示用户直接进行语音回复,并等 待用户的回复完毕口令;当收到用户的回复完毕时,对用户的回复进行审核,审核通过后, 将回复保存;审核未通过,将通知用户回复失败,并给出原因。然后自动返回到上一级服务。 帮助模块对不了解系统功能的用户进行帮助。当收到用户的服务请求时,提示提示用户进 行帮助类型选择,用户选择后系统进行服务,当未完成语音播报就接收到用户新的服务要 求时,立即转向新的服务,当完成了语音播报而仍未接到用户新的服务要求时,自动返回上 一级服务。如图9所示,本发明的语音博客系统具体实现流程图,其中博文朗读过程当接收 到用户的服务请求时,提示用户最近更新的消息或博文,然后提示用户进行服务类型选择, 用户选择完成后,系统对所选服务中的新闻、文章标题进行逐条语音播报供用户进一步选 择,待用户再次选择完成后,对所选新闻或文章进行详细语音播报,当未完成语音播报就接 收到用户新的服务要求时,立即转向新的服务,当完成了语音播报而仍未接到用户新的服 务要求时,询问用户是否进行回复,若回复则转向回复模块,否则自动返回上一级服务。回 复管理过程当接收到用户的服务请求时,提示用户直接进行语音回复,并等待用户的回复 完毕口令;当收到用户的回复完毕时,对用户的回复进行审核,审核通过后,将回复保存; 审核未通过,将通知用户回复失败,并给出原因,然后自动返回到上一级服务。以上详细叙述了本发明的实现过程,未详细描述部分属于本领域公知技术。
8
权利要求
1.一种基于语音技术的盲人互联网系统,其特征在于包括服务器端的新闻自动下载和 更新系统及客户端的应用系统;所述服务器端的新闻自动下载和更新系统实时进行新闻下 载,保存在服务器中,并实现实时更新;所述客户端的应用系统包括新闻收听系统、电子书 收听系统、语音百科系统和语音博客系统,其中新闻收听系统支持让盲人顺序收听和栏目收听新闻方式,并通过关键字搜索和相关 新闻搜索关注自己感兴趣的新闻;所述顺序收听新闻方式实现在盲人没有明确目标的情况 下,通过默认顺序收听新闻方式来执行;所述栏目收听新闻模式实现播报盲人所选栏目的 新闻;关键字搜索是根据用户指令实现对新闻的检索,检索按照标题、关键字、相关新闻进 行;相关新闻搜索指得到当前新闻的相关新闻;所有的新闻均来自于服务器的新闻自动下 载和更新系统得到的新闻数据库;电子书收听系统访问本地和服务器上的电子书数据库,通过语音合成技术输出语音 供盲人收听;对于服务器端的电子书数据,客户端可以在线连接访问,也可以下载到本地, 供以后使用收听;语音百科系统通过语音识别引擎识别用户要查询的关键词,再通过浏览器控件向百 科网站服务器提交查询,并接收处理返回的网页内容;语音博客系统用语音实现基本的博客系统的功能,通过登陆后,使用语音命令实现 发表博文,收听博文,对其他用户的博文发表评论;并且对用户进行管理以及提供相应的语 音提示帮助;所述博客系统包括五个功能模块,即用户管理模块、发文管理模块、博文朗读 模块、回复管理模块和帮助模块;所述用户管理模块实现对语音博客系统中的用户进行管 理,具体包括对进入系统界面的用户进行身份识别,对未注册的用户进行语音注册提示,并 进行功能介绍;对已注册的用户提供各种服务;当用户退出语音博客系统时,对用户进行 注销;所述发文管理模块实现发表博文,包括当语音博客系统接收到用户的发文请求时,首 先提示用户进行主题录制,然后提示用户进行内容录制,之后等待用户录制完毕口令;收到 口令后请用户等待审核,审核通过后,将文章进行分类送交博文朗读模块供其他用户收听, 并通知用户文章已经录制成功;审核未通过,将通知用户录制失败,并给出原因;所述博文 朗读模块实现收听其他用户的博文,具体包括当接收到用户的服务请求时,提示用户最近 更新的消息或博文,然后提示用户进行服务类型选择,用户选择完成后,对所选服务中的新 闻、文章标题进行逐条语音播报供用户进一步选择,待用户再次选择完成后,对所选新闻或 文章进行详细语音播报,当未完成语音播报就接收到用户新的服务要求时,立即转向新的 服务,当完成了语音播报而仍未接到用户新的服务要求时,询问用户是否进行回复,若回复 则转向回复模块,否则自动返回上一级服务;所述回复管理模块实现评论其他用户的博文, 具体包括当接收到用户的服务请求时,提示用户直接进行语音回复,并等待用户的回复完 毕口令;当收到用户的回复完毕时,对用户的回复进行审核,审核通过后,将回复保存;审 核未通过,将通知用户回复失败,并给出原因,然后自动返回到上一级服务;所述帮助模块 实现帮助用户熟悉系统的功能及用法,具体包括对不了解系统功能的用户进行帮助,当收 到用户的服务请求时,提示提示用户进行帮助类型选择,用户选择后系统进行服务,当未完 成语音播报就接收到用户新的服务要求时,立即转向新的服务,当完成了语音播报而仍未 接到用户新的服务要求时,自动返回上一级服务。
2.根据权利要求1所述的基于语音技术的盲人互联网系统,其特征在于所述服务器端的新闻自动下载和更新系统的实现过程为从一个或若干初始网页的URL开始,读取网 页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样循 环下去,直到达到一定的条件为止,把这些网页都抓取下来,然后对这些网页对应的所有新 闻各要素进行分析及提取,保存在服务器的数据库中,每隔一段时间重新下载一次,实现系 统数据的实时更新。
全文摘要
一种适用于盲人上网的系统,包括服务器新闻自动下载系统和客户端应用系统。服务器端系统可以实现实时进行新闻下载,保存在服务器中,实现实时更新。客户端系统可以通过语音识别和合成对盲人的语音输入做出相应的响应,并语音输出。针对盲人的特殊情况,本系统实现了互联网三大核心功能,即获得资讯,学习知识,相互交流。使用本发明可以让盲人有效的通过互联网收听新闻,收听电子书,查询百科名词,发表和收听博文等。其中,新闻收听系统支持让盲人顺序收听、栏目收听新闻,并可以通过关键字搜索和相关新闻搜索关注自己感兴趣的新闻。
文档编号G09B21/04GK102117317SQ201010622560
公开日2011年7月6日 申请日期2010年12月28日 优先权日2010年12月28日
发明者吴锡欣, 宋友, 张野, 徐扶天, 李曼, 潘成伟, 黄坚 申请人:北京盈科成章科技有限公司, 北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1