一种面向语音识别的抗噪音频传输的装置的制作方法

文档序号:20195393发布日期:2020-03-27 20:06阅读:423来源:国知局
一种面向语音识别的抗噪音频传输的装置的制作方法

本发明包含系统和装置两部分,首先涉及人工智能成熟技术的软件集成,尤其涉及语音实时转写、语音文件转写等分析引擎;其次涉及一种智能音频传输前置装置,尤其涉及一种面向语音识别的抗噪音频传输前置装置。本发明属于软件开发、人工智能、电器控制等技术领域。



背景技术:

记者在新闻创作过程中离不开录音素材整理工作。面对采访过程中收集的大量宝贵录音素材,从中去粗取精,提炼新闻灵感与线索,需要进行反复回放录音、核查信息等整理工作。同时,部分单位每天都会开展大大小小的各类会议,在会议过程中,大多需要把会议的组织情况和具体内容记录下来,形成会议记录。部分重要会议需要记载、传达会议情况和议定事项,整理为会议纪要。

为了降低采访素材或会议记录音频整理同事的工作强度和难度,提升工作效率和工作成果的准确性,研发一套支持多语种的录音转写调听工具迫在眉睫。该工具须实现对录音数据的整理功能,同时支持将录音识别结果与时间帧对齐与联动,并可以让用户自由编辑与下载识别结果。同时,在实际应用中,手机录音功能除了会将电视机的声音采集进去,还会把手机周围的杂声拾取进去,影响语音服务的识别转写服务,因此设计一种能够实现音频传输的前置装置非常必要。



技术实现要素:

针对记者编辑用户日常处理新闻录音与会议记录等素材时重复劳动多等问题,本发明将人工智能成熟技术进行软件集成,在记者站报道指挥客户端研发嵌入了语音转文字功能的装置,该装置能够实现采访过程中实时转写,也能够实现数小时采访录音分钟级的高效转写,同时还支持转写出的文字逐帧修改与一键建稿等新闻创作功能。

针对手机录音中普遍存在的环境噪声等问题,本发明提供了一种面向语音识别的抗噪音频传输前置装置,其实现方式结构简单、使用方便灵活,使原本只能通过手机放置在音箱旁边录音的方式具备抗噪传输的功能。

本发明采用的技术方案是:

针对hdmi数字电视,该装置包含三个组合模块,分别是hdmi一转二分配器模块、hdmi音视频分离模块和音频信号转接处理模块。使用hdmi一转二分配器模块对原始hdmi信号进行复制,一路信号传输到视频播放设备,如电视、显示等,进行正常的节目放映观看,另一路信号通过hdmi音视频分离模块中,分离出音频信号,接入音频信号转接处理模块,通过音频信号转接处理模块对输出到移动客户端的信号进行语音转写文字等后续处理。

针对模拟电话或者ip数字电话,使用4p4c端口,将音讯盒子模块通过并联的方式接入电话手柄的4芯线中。电话手柄的4芯线分别定义为麦克风信号、地线a、扬声器信号和地线b,对模拟电话和扬声器信号中包含了对话机麦克风的信号回馈,所以直接通过音讯盒子模块获取双方音频信号。而对ip数字电话,需要通过两条电路线路分别对麦克风和扬声器信号进行截取,然后接入移动客户端进行后续处理。

音讯盒子模块作用是将音源设备发生的扬声器信号ss转变成能够被移动设备的trrs接口识别的麦克风信号sm。移动设备trrs端接收驻极体麦克风产生的sm信号需要使用其内置的放大电路对驻极体咪头进行驱动,因音讯盒子模块进行的工作是模拟麦克风信号,为了消除接收端的驱动电流对ss的干扰,模块中使用2组有极电容c2、c1过滤掉来自驱动端的驱动电流。同时,移动设备trrs端会对接入的设备进行检测,以判断设备为trs型(耳机)或trrs型(耳麦),并且部分移动设备会对接入设备进行阻抗匹配,因此模块中使用电阻r3使得模块可以被正确识别为麦克风。在模块的使用场景中,接入的扬声器声道信号通过第一级电阻r1对信号进行初步的衰减,并通过下拉电阻r2保持电位和输入端一致,信号通过电容,过滤掉来自接收端可能存在的直流量,然后通过下拉电阻r4保持电位一致,通过电阻r3与移动端trrs接口进行阻抗匹配,并作为麦克风信号输入到移动端中进行处理。若是多声道信号,包括立体声信号输入、数字电话手柄端接入,则增加相应数目的电路通道,通过尾部r3电阻,接入移动端。

对于单条信号线路,信号电流,设输出电压为um,输入信号电压为us信号电势差可为模块对于整体输入信号的功率衰减为

与传统的录音装置相比较,本发明具有如下技术效果:

1、与记者站报道指挥客户端有效集成,在语音转写技术与新闻采编业务间找到了结合点,可进一步提升新闻生产、日常办公流程的工作效率。

2、在转写数字信号电视的音频时,可以在电视正常播放且不受现场说话声干扰的影响,将电视信号中的音频进行拾取。

3、在截取电话话柄的麦克风和扬声器信号后滤波衰减,通过线缆连接手机的语音转写文字服务,直接将通话内容转写成文字。

附图说明

图1是本发明涉及的软硬件流程图。

图2是报道指挥客户端音讯功能流程图。

图3是电视版音讯盒子使用装配图。

图4是座机版音讯盒子使用装配图。

图5是电视版盒子电路。

图6是座机版盒子电路。

具体实施方式

本发明主要由两部分组成:一是基于报道指挥客户端的语音转文字功能的装置,它基于国际领先的多语种语音识别技术,结合采编场景定制研发而成;二是利用3d打印技术,开发出的一款面向语音识别的音频传输硬件装置,可消除由外界杂音导致的噪声问题。

音频传输硬件装置具体实现以下三种情景下的语音转写功能作为音频的传输装置:

1.电视信号的音频采集识别转写。针对从hdmi信号源获取电视当前播放的频道,进行音频信号的拾取,通过“音讯”服务实时识别音频转为文字。

2.手机、平板电脑等移动终端中视频、音频信号的采集识别转写。当一部手机在播放一个视频或一段音频的时候,能够做到拾取该手机中的音频信号,传入到装有报道指挥app的“音讯”服务的手机中,实时识别该音频并转为文字。

3.固定电话座机中麦克风、听筒的音频信号采集识别转写。当采编人员通过电话座机进行电话采访的时候,通过该硬件连接到一台装有报道指挥app的“音讯”服务的手机中,同时捕捉通话双方的说话声音,识别转写。

以上前两种场景中,为了使报道指挥客户端的“音讯”服务能够接收到高质量的音频信号,音讯盒子采用了电信号的方式进行信号传播,此方法一方面避免了模拟波形在自然介质中传播时的衰减,并大幅降低了环境音对信号的干扰;另一方面,也使得用户在操作的同时,可以与外界进行不间断的语音交流。盒子通过3.5毫米trs耳机接口连接音源,对立体声音源进行左右声道的混音,并进行了直流隔离、信号降噪、信号衰变等处理工作,使得信号转换成能够被各种拥有音频收放功能的电子设备识别的输入信号,从而可以方便地进行后续的信号处理。针对大量标准不同的手持移动设备的音频输出、输入接口,音讯盒子自定义了输入端的trrs插口,以适应更广泛的使用场景,而输出端,简化了插口的连线方式,从根源上切断了来自接收端输出的信号干扰。并且音讯盒子预留了双相监听功能接口,除了能满足目前的音频信号收录功能外,也可以扩展出对输入、输出信号的监听功能。

对于固定电话版本的音讯盒子,由于普通模拟电话机和多功能网络电话机在手柄接口、结构上的定义不相同,音讯盒子开发出拥有高兼容性的印刷电路底板,通过不同的元件接入方式,实现了一块电路底板可以同时适配模拟电话机和网络电话机的功能,决定于固定电话的使用场景,音讯盒子演变出专门针对模拟电话的盒子和网络电话专用盒子两款设备。电话版本的音讯盒子对通过电话手柄双向音频信号的截取,对使用者方的麦克风、扬声器音频信号进行了混音,即获取了通话双方的语音信息信号,此信号通过音讯盒子的处理后转变为移动设备客户端可以接收采用的输入信号并由移动设备进行后续的处理,实现方法为使用两个4p4c与对应的水晶头、4芯线,将固定电话的手柄线跳出。针对市面上大多数的模拟电话机,其中中心两根线为处理过的扬声器信号,其中包含了其话机本身的麦克风信号,大多数的数字ip电话机,中心两根线为麦克风信号,两侧为麦克风信号。多成对的信号,通过电阻的分压、电容滤波,输出为能够为手机trrs端子识别的麦克风信号,模拟成手机端的麦克风输入装置,通过手机端的应用程序转写成文字。

对电视音讯盒子附图为连接结构,如图3中所示,系统使用hdmi一分二装置将音视频信号进行复制,一份信号正常输出到电视,另一份使用hdmi音视频分离装置,剥离出音频信号,通过音讯盒子进行处理并连接手机客户端的转写文字服务。

固定电话盒子连接方式如图4所示,将话机主体和手柄连接线从话机端分离,接入音讯盒子,盒子将信号输出到手机客户端的转写文字服务。

主要实现以下功能:

本发明在报道指挥客户端中集成了统一认证平台的相关技术,实现了用户登录的鉴权与安全防护。

开始“音讯”语音实时转写的任务。作为世界性现代通讯社,记者遍布世界100多个国家和地区,权威、准确、及时地播发国内外重要新闻和重大突发事件。结合实际采编需求,本发明在报道指挥客户端中集成了中、英、西、法、俄、阿、葡、日、韩等9种语种的语音转写技术,记者编辑用户可以借助客户端语音转写功能快速对语音进行实时分析。

对文字进行快速编辑、新华社采编系统稿件签发等操作。报道指挥客户端作为新华社全媒体采编发平台的手机端形态,可以实现稿件采编发操作、报道指挥及即时通讯等新闻生产功能。由于语音转写技术与专业速记相比,还有一定错误率,所以本发明将多语种语音识别技术有效嵌入到客户端后,还实现了对转写文字的编辑修改功能。为了增强用户使用体验,客户端与新采编稿件签发接口打通,本发明实现了转写结果文字与录音的一键建稿、签发等功能。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1