一种基于语音识别的声纹打卡系统的制作方法

文档序号:18436747发布日期:2019-08-16 21:37阅读:983来源:国知局
一种基于语音识别的声纹打卡系统的制作方法

本实用新型属于考勤打卡技术领域,具体涉及一种基于语音识别的声纹打卡系统。



背景技术:

目前大部分语音打卡装置或者客户端实现的功能较单一,不能识别语音内容,只能固定播报提前录制好的音频文件,其智能化程度非常低,以及当音频文件库中文件数量多时,特别浪费存储空间成本高。例如申请号号为201410736115.7的专利文献,公开了一种通过打卡机播放语音信息的方法,该技术是当有人打卡时,通过计算机控制播放提前录制好的音频文件,其不能识别出打卡人所说的语音内容来给予正确的回复,如打卡机不能识别出打卡人询问的是实时天气还是实时时间或者是询问某一个同事是否已经来到公司等,也不能回复实时天气和实时时间以及某一个公司成员的上班信息等,它只能机械式播放已经录制好的音频文件,于此同时,如果他的语音库中内容比较多的时候,花费的存储空间大,智能化与人性化程度低以及硬件成本高。



技术实现要素:

本实用新型针对现有技术的不足,提出了一种基于语音识别的声纹打卡系统,该系统在进行回复打卡人时,服务器采用的是文字解答,之后打卡装置获取到文字后自动转换成音频,减少用来存储音频文件的硬盘成本,同时采用语音识别技术和自然语言处理(NLP)算法能针对具体问题进行实时性的具体回答,智能化更高,具有更好的交互式体验。

为解决上述技术问题,本实用新型采取的技术方案为:

一种基于语音识别的声纹打卡系统,包括:打卡装置及服务器,所述打卡装置包括:CPU模块、音频采集处理模块、WIFI模块和音频输出模块,其中,所述音频采集处理模块与所述CPU模块相连,用于将采集处理后的音频信息传输至所述CPU模块;所述服务器通过所述WIFI模块与所述CPU模块相连,将所述音频信息进行语音识别得到文字数据并对该文字数据进行自然语言处理后,将该文字数据对应的回复文字发送至所述CPU模块进行处理为音频数据;所述音频输出模块与所述CPU模块相连,用于对所述音频数据进行播放。

进一步的,所述语音采集处理模块包括:麦克风模块、MCU模块和声音信号处理模块,其中,所述麦克风模块用于将声波信号转换为电压信号,所述MCU模块与所述麦克风模块相连,用于将所述电压信号采集成音频信息,所述声音信号处理模块分别与所述MCU模块和所述CPU模块相连,用于对所述音频信息进行处理后发送至所述CPU模块。

进一步的,所述服务器包括:语音识别单元、打卡信息存储单元和自然语言处理单元,其中,所述打卡信息存储单元用于存储打卡人的打卡信息。

进一步的,所述音频输出模块为扬声器。

本实用新型的有益效果至少包括:本实用新型减少了用来存储音频文件的硬盘成本,同时采用语音识别技术和自然语言处理(NLP)算法能针对具体问题进行实时性的具体回答,智能化更高,具有更好的交互式体验。

附图说明

图1为本实用新型声纹打卡系统结构框图。

图2为本实用新型打卡方法流程图。

具体实施方式

为了使本领域技术人员更好地理解本实用新型的技术方案,下面结合具体实施例对本实用新型作进一步的详细说明。下面描述的实施例是示例性的,仅用于解释本实用新型,而不能理解为对本实用新型的限制。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。

本实用新型为解决上述技术问题,采取的主要实用新型构思为:

采用语音识别的技术实现声纹打卡,旨在进一步提高打卡的交互式体验,尤其解决了实时信息等不能提前制作音频答复的问题;区分与以往的不能检测出语音的具体内容只能进行提前录制好的音频文件的播报不同,本实用新型通过智能nlp算法能分析出打卡人的语音内容,并给出正确对应的实时答复,答复在云端形成是文字形式的,文字被发送到打卡装置本地,然后本地打卡装置将文字转换成音频播报:例如此答复的内容涉及实时性则会通过网络检索来得到正确的文字答案,然后在本地打卡装置将文字转换成音频播报。此答复如果涉及本企业的相关信息,则会根据公司本地数据库或服务器的所述打卡信息存储单元来形成对应文字回复,之后打卡装置转换成音频播报等等。因为音频是根据文字来自动生成的, 这样可以实时准确回复打卡人的打卡询问,相比于现有技术大大提高了人工智能化与减少用来存储音频文件所带来的硬件成本。

根据本实用新型的实施例,图1为本实用新型声纹打卡系统结构框图,参照图1所示,本实用新型所述基于语音识别的声纹打卡系统,主要包括:打卡装置及服务器,所述打卡装置包括:音频采集处理模块、CPU模块、WIFI模块和音频输出模块,优选的,所述音频输出模块为扬声器。

根据本实用新型的实施例,参照图1所示,所述语音采集处理模块包括:麦克风模块、MCU模块和声音信号处理模块,其中,所述麦克风模块用于将声波信号转换为电压信号,所述MCU模块与所述麦克风模块相连,用于将所述电压信号采集成音频信息,所述声音信号处理模块与所述MCU模块相连,用于对所述音频信息进行处理,如:噪音信号过滤和功放处理等。

根据本实用新型的实施例,参照图1所示,所述声音信号处理模块与所述CPU模块相连,用于将处理后的音频信息传输至所述CPU模块;所述服务器通过所述WIFI模块与所述CPU模块相连,接收所述CPU模块发送过来的所述音频信息并对其进行语音识别得到文字数据,同时对该文字数据进行自然语言处理(NLP)后,将该文字数据对应的回复文字实时发送至所述CPU模块进行处理为音频数据;所述音频输出模块与所述CPU模块相连,用于对所述音频数据进行播放。

根据本实用新型的实施例,本实用新型所述服务器包括:云声纹数据库单元、语音识别单元、打卡信息存储单元和自然语言处理单元,图2为本实用新型打卡方法流程图,参照图2所示,本实用新型打卡方法具体包括以下步骤。

步骤1:公司成员的声纹进行注册后上传至服务器的云声纹数据库单元,当打卡人唤醒打卡装置(例如:麦琪同学,让张xx来到公司后去经理办公室开会;再如:麦琪同学,查询今天下午xx市天气)时,采集该语音音频信息录入上传至服务器的云声纹数据库单元。根据本实用新型的实施例,该上传的音频信息经过噪音信号过滤和功放处理等处理。

步骤2:判断当前语音的声纹是否为已注册打卡成员,是则记录当前打卡人以及打卡时间等信息存入到服务器的所述打卡信息存储单元或者本地数据存储模块中,便于公司随时调取打卡记录。

步骤3:同时通过语音识别单元将该采集的音频信息转换成文字字符串,再通过所述自然语言处理单元对所述音频信息进行语音分析,采用NLPP算法,将文字字符串进行区段解析,解析出以下区段并获取行为意图。

步骤4:将行为意图获取后,对事件行为分类进行分析产生对应的文字回复与操作,然后将生成的文字回复发送至打卡装置。

可以理解的是,事件不限于上述的通知和查询,还有聊天问候、点歌、提醒等等。

步骤5:打卡装置将获取到的回复文字进行转码生成音频进行播报。

所述步骤3-步骤5具体例如:使用语音识别技术,将语音音频信息转换成以下文字,采用NLP算法,将文字进行区段解析,解析出以下区段并获取意图:

动作:通知 查询;

对象:张xx 天气;

地点:经理办公室 xx市;

时间:马上 今天下午。

通知事件行为意图:通知张xx马上到经理办公室;与此同时传输回复文字“好的,会在第一时间通知张xx到经理办公室”到打卡装置,打卡装置进行文字转音频播报。

查询事件行为意图:查询xx市今天下午天气,从网络获取xx市今天下午天气,然后将天气文字回复传输到打卡装置,打卡装置将文字转化成音频进行播报。

根据本实用新型的实施例,本实用新型所述声纹打卡系统可以用在智能语音音箱等相关等电子产品中。

综上所述,本实用新型所述基于语音识别的声纹打卡系统,在进行回复打卡人时,服务器采用的是文字解答,打卡装置获取到文字后自动转换成音频,减少用来存储音频文件的硬盘成本,同时采用语音识别技术和自然语言处理(NLP)算法能针对具体问题进行实时性的具体回答,智能化更高,具有更好的交互式体验。

在本实用新型中,除非另有明确的规定和限定,术语“相连”、“连接”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本实用新型中的具体含义。

尽管上面已经示出和描述了本实用新型的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本实用新型的限制,本领域的普通技术人员在本实用新型的范围内可以对上述实施例进行变化、修改、替换和变型,同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1