可语音控制的扫描仪的制作方法

文档序号:7881292阅读:302来源:国知局
专利名称:可语音控制的扫描仪的制作方法
技术领域
本实用新型涉及扫描仪领域,且特别是关于一种可语音控制的扫描仪。
背景技术
扫描仪是一种影像捕获装置,可将纸质文本的影像转换为计算机可以显示、编辑、储存和输出的数字格式,如JPEG、JPG、TIFF、MTIFF、或PDF等格式。扫描仪的应用范围很广泛,例如将美术图形和照片扫描结合到文件中;将印刷文字扫描输入到文字处理软件中,避免再重新打字;将传真文件扫描输入到数据库软件或文字处理软件中储存;以及在多媒体中加入影像等等。随着办公环境中互联网络的流行和普及,扫描仪成为了一种在网络中共享的影像处理装置,即成为了网络扫描仪。早期的扫描仪由扫描头、控制电路和机械部件组成,采取 逐行扫描的工作方式,得到的数字信号以点阵的形式保存,再使用文件编辑软件将影像信号编辑成标准格式的文本进行储存。目前的扫描仪仍是一种计算机外围设备,仅作为图像的捕获和输入装置,其产生的影像必须通过计算机进行显示、编辑、存储和输出。扫描仪对照片、文本页面、图纸、美术图画、照相底片、菲林软片都可以进行扫描处理,甚至纺织品、标牌面板、印制板样品等三维对象也可作为扫描对象,扫描仪获取它们的原始线条、图形、文字、照片、平面实物等信息并转换成数字格式,再通过计算机转换成可以编辑的格式和形式。就目前而言,扫描仪大致经历了四个阶段的发展在1984年前后,第一代平板式扫描仪的面世,第一代扫描仪的功能局限于仅扫描黑白文字和简单黑白线条图形,且对简单图形和文字的输入速度和输出速度都比较慢,分辨率也较低,装置体积较大,使用不方便;但扫描仪在问世后便拥有广泛的市场应用价值和市场前景;1986年推出的第二代扫描仪在第一代扫描仪的基础上增加了黑白灰阶的功能,可以扫描具有灰阶变化的黑白图像,使得扫描的黑白图像在图像文件输出时富有层次感,图像更加真实;1989年推出的第三代扫描仪使扫描设备进入了彩色时代,彩色扫描仪能够扫描彩色印刷品和彩色照片,并输出彩色图片格式给计算机进行编辑处理;随着其他办公设备的发展和普及,1996年出现的第四代扫描仪,将扫描仪与打印机、传真机整合,使扫描仪兼具有了一些复印、传真、打印的功能,但仍作为计算机的外围设备,其各项功能必须借助计算机才能完成。在现有技术中,网络扫描仪仅仅是图像捕获和图像输出工具,功能单一,远远不能满足现代办公过程的对网络扫描仪的方便快捷、智能化控制的要求。在通讯领域,语音识别设备从输入的语音信号提取诸如频率特征等特征信息,用以识别输入的语音命令,在例如AT&T公司公开的一种话音命令控制和校验的系统中,其直接对话音信号进行处理和识别,这样的语音识别和控制系统在例如蜂窝式电话中的应用是成熟的,但尚未发现有一种语音控制技术用于扫描仪上,使扫描仪的智能控制成为一种可能。
实用新型内容针对现有技术存在的缺陷,本实用新型提供的扫描仪能够通过一组件实现语音的采集、处理和识别,并基于识别的结果执行对应的控制指令,使用户可通过语音命令控制扫描仪的执行各种操作。为实现上述目的,本实用新型的技术方案是一种可语音控制的扫描仪,包括扫描模块单元和处理器,其特征在于,还包括语音采集单元,用于将一外部的语音指令转换为模拟电信号;语音处理单元,用于处理所接收到的模拟电信号;语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系;·[0013]语音识别单元,分别与所述语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至所述处理器,所述处理器根据该识别结果对应的数字信号控制该扫描仪的具体运行。进一步地,前述的语音采集单元为一麦克风。进一步地,前述语音处理单元包括一 AD转换单元和降噪单元。进一步地,前述语音指令存储器为一非易失性随机访问存储器。进一步地,前述扫描仪还包括网络连接单元,将该扫描仪接入网络。进一步地,前述扫描仪还包括文档转换单元,该文档转化单元将扫描模块单元扫描生成的扫描文件转换成打印机可识别的文件格式。由以上本实用新型提供的技术方案可见,本实用新型提供的可语音控制的扫描仪,其上设置了语音采集、处理和识别单元,使得扫描仪具备了语音控制功能,用户可以通过语言直接控制扫描仪执行多种操作,提供良好的人机互动,给用户的日常扫描发送工作带来便利,满足用户全方位的使用扫描仪的需求。

图I为本实用新型实施例的扫描仪的示意图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。如图I所示,根据本实用新型的第一实施例,可语音控制的扫描仪的包括语音采集单元101、语音处理单元102、语音识别单元103、语音指令存储器104、和处理器105、扫描模块单元110和网络连接单元120。语音采集单元101,用于将一外部的语音指令转换为模拟电信号,本实施例中,该语音采集单元101为一麦克风,可以让用户在一定距离范围内发出声音指令,通过麦克风采集用户的声音指令,并转换成模拟电信号,该模拟电信号传输至语音处理单元102。语音处理单元102,用于处理所接收到的模拟电信号。该语音处理单元102包括一AD转换单元和降噪单元,用于对所接收到的模拟电信号进行模数转换,然后进行降噪处理,例如利用基于谱相减算法的降噪单元进行降噪处理,该处理后的数字信号发送至语音识别单元104。[0025]语音指令存储器103,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系。本实施例中,该语音指令存储器103优选为一个非易失性随机访问存储器(NVRAM),例如SD卡以及CF卡、SONY记忆棒等其他类型的闪存扩展存储卡。语音识别可基于讲话者相关识别模式或讲话者无关系识别模式。讲话者相关识别模式是指在执行识别之前预先存储和登记一个或多个用户的语音,并且将外界输入语音的模型与所存储的语音的模型进行比较,以执行语音识别。讲话者无关系识别模式是指在识别操作之前无需预先登记和存储用户的语音,而是收集未指定讲话者的语音以便研究统计模型,并且利用所研究的统计模型来执行识别,这样,消除了每一个讲话者的个人特征,采用每个讲话者之间的共同特征进行有利地识别。本实施例中,基于讲话者相关识别模式,语音指令存储器103内预先录制存储了 至少一个用户的多个语音控制指令,并存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系(一一对应映射关系)。语音识别单元104分别与语音处理单元102和语音指令存储器103连接,用于识别语音指令,并将识别结果发送至处理器105,处理器105根据该识别结果对应的数字信号控制该扫描仪的具体运行。用户可通过扫描仪上的按键来启动扫描仪的语音控制模式,该按键可以是扫描仪上的一个已有功能按键,例如双面打印时的继续键位,短按后将完成双面打印时的继续打印操作,长按后将触发其第二功能键位,启动语音控制模式。在另外的实施例中,基于讲话者无关系识别模式,语音指令存储器103内预先存储了经过研究的多个语音控制指令的统计模型特征,该统计模型特征对应于多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系。因此,在用户发出语音指令后,经过语音处理单元102的数据处理,语音识别单元104提取语音数据中的模型特征,并与语音指令存储器103中的多个语音控制指令的统计模型特征进行比较,执行语音识别,并基于识别结果扫描仪执行对应的操作。本实施例中,用户可在一定的距离范围内对扫描仪发出语音指令,例如“份数设定”、“时间显示”、“黑白扫描”等语音指令,语音采集单元101接收到用户发出的语音指令后,经过语音处理单元102的模数转换、降噪处理后,发送至语音识别单元104进行识别处理,并识别结果发送至处理器105,处理器105基于识别结果对应的数字信号控制该扫描仪执行所对应的控制指令。前述的语音采集单元101、语音处理单元102、语音识别单元103、语音指令存储器104、和处理器105可以是分立的元件,或者是集成在一起的。扫描模块单元110内具有光学成像模块等扫描仪通用部件,用于对待扫描文件(如文档、图片、照片、胶片、幻灯片等载有一定数据信息的载体)进行扫描而捕获影像信息,生成一扫描文件,扫描仪还包括转换单元(未示出),在处理器105的控制下,转换单元对所生成的扫描文件进行数据处理,使其转换为打印机可识别和直接打印的文件格式。处理器105,控制扫描仪的整体操作。特别地,处理器控制扫描仪的操作以便根据本实用新型,通过语音采集单元、语音处理单元、语音识别单元和语音指令存储器,执行语音识别,并基于识别的结果,控制该扫描仪执行所对应的控制指令。[0035]网络连接单元120,用于将扫描仪连接至网络中,例如通过一无线网络收发装置,将扫描仪接入网络中。有利地,这里的网络是指因特网,也可以是局域网(LAN)、电话线路网络之类的内部网。综上所述,本实施例的可语音控制的扫描仪,其设置了语音采集、处理和识别单元,使得扫描仪具备了语音控制功能,用户可以通过语言直接控制扫描仪执行多种操作,提供良好的人机互动,给用户的日常扫描发送工作带来便利,满足用户全方位的使用扫描仪的需求。以上说明书与附图仅为对本实用新型的解释和说明,不以任何形式对本实用新型构成限制和限定,本实用新型的范围以权利要求书为准,一切不超出本 实用新型宗旨的显而易见的修改、变换和替代方案均在本实用新型范围内。
权利要求1.一种可语音控制的扫描仪,包括扫描模块单元和处理器,其特征在于,还包括 语音采集单元,用于将一外部的语音指令转换为模拟电信号; 语音处理单元,用于处理所接收到的 模拟电信号; 语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系; 语音识别单元,分别与所述语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至所述处理器,所述处理器根据该识别结果对应的数字信号控制该扫描仪的具体运行。
2.如权利要求I所述的可语音控制的扫描仪,其特征在于,所述语音采集单元为一麦克风。
3.如权利要求I所述的可语音控制的扫描仪,其特征在于,所述语音处理单元包括一AD转换单元和降噪单元。
4.如权利要求I所述的可语音控制的扫描仪,其特征在于,所述语音指令存储器为一非易失性随机访问存储器。
5.如权利要求I所述的可语音控制的扫描仪,其特征在于,所述扫描仪还包括网络连接单元,将该扫描仪接入网络。
6.如权利要求I所述的可语音控制的扫描仪,其特征在于,所述扫描仪还包括文档转换单元,该文档转化单元将所述扫描模块单元扫描生成的扫描文件转换成打印机可识别的文件格式。
专利摘要本实用新型提供一种可语音控制的扫描仪,包括扫描模块单元和处理器,还包括语音采集单元,用于将一外部的语音指令转换为模拟电信号;语音处理单元,用于处理所接收到的模拟电信号;语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系;语音识别单元,分别与语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至处理器,处理器根据该识别结果对应的数字信号控制该扫描仪的具体运行。扫描仪具备了语音控制功能,用户可通过语言直接控制扫描仪执行多种操作,提供良好的人机互动,给用户的日常扫描发送工作带来便利,满足用户全方位的使用需求。
文档编号H04N1/04GK202798910SQ20122048215
公开日2013年3月13日 申请日期2012年9月20日 优先权日2012年9月20日
发明者王渤渤, 吴海娟, 孔佳琛, 许热 申请人:艾塔斯科技(镇江)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1