一种信息输出方法、装置及终端设备与流程

文档序号:12964600阅读:203来源:国知局
一种信息输出方法、装置及终端设备与流程

本发明属于数据处理技术领域,尤其涉及一种信息输出方法、装置及终端设备。



背景技术:

在进行信用审核时,审核的工作人员会电话沟通并核查申请人的一些信息,此时,系统会对电话进行录音数据存储,以便后续对申请人信息的再次核查。由于信用审核中,需要对申请人进行电话核查的信息比较多,往往会导致电话沟通时间比较长,从而使得存储的录音数据也较长。

现有技术中,若需要对申请人信息再次核查,工作人员会将申请人录音数据进行调取并从头听到尾,以获取申请人信息进行再次核查。但在实际情况中,工作人员往往只是想核查申请人的某些特定信息,如申请人的身份证号,而并不需要对申请人信息进行通篇核查;此时将录音数据从头听到尾,会浪费大量的人力和时间。而且长时间的听录音数据,往往会对工作人员产生听觉疲劳使得其注意力不集中,从而导致工作人员极其容易听漏申请人的信息,使得对申请人信息的获取核查效率变得极其低下。

综上可知,现有技术中对录音数据进行申请人信息获取核查的效率低下,难以从录音数据中有效地获取到所需的申请人信息。



技术实现要素:

有鉴于此,本发明实施例提供了一种信息输出方法、装置及终端设备,以解决现有技术中对录音数据进行申请人信息获取核查的效率低下,难以从录音数据中有效地获取到所需的申请人信息的问题。

本发明实施例的第一方面提供了一种信息输出方法,包括:

对获取到的录音数据进行特征信息识别;

当识别出的所述特征信息为预设的关键字时,根据所述关键字在所述录音数据中的位置以及关键字类别,在所述录音数据中确定出所述关键字对应的标记起点以及标记终点;

将所述标记起点与所述标记终点之间的录音数据段,标记为与所述关键字相对应的录音数据段;

接收用户输入的关键字查询指令,根据所述关键字匹配出与所述关键字查询指令相对应的所述录音数据段,并输出所述录音数据段。

本发明实施例的第二方面提供了一种信息输出装置,包括:

特征识别模块,用于对获取到的录音数据进行特征信息识别;

第一标记确定模块,用于当识别出的所述特征信息为预设的关键字时,根据所述关键字在所述录音数据中的位置以及关键字类别,在所述录音数据中确定出所述关键字对应的标记起点以及标记终点;

第一关键字标记模块,用于将所述标记起点与所述标记终点之间的录音数据段,标记为与所述关键字相对应的录音数据段;

信息输出模块,用于接收用户输入的关键字查询指令,根据所述关键字匹配出与所述关键字查询指令相对应的所述录音数据段,并输出所述录音数据段。

本发明实施例的第三方面提供了一种信息输出终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的信息输出方法的步骤。

本发明实施例的第四方面提供了一种计算机可读存储介质,包括:存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的信息输出方法的步骤。

本发明实施例与现有技术相比存在的有益效果是:对录音数据进行特征信息识别,并在特征信息为预设的关键字时,根据关键字的位置以及类别来进行标记起点终点的确定,并进行相对应的关键字标记。从而能对录音数据中的不同的申请人信息对应的关键字,进行录音数据段关键字的分别标记,如对申请人的身份证号和申请人的家庭地址对应的录音数据段分别进行标记。并在关键字标记完成后,根据用户输入的关键字查询指令进行关键字匹配,从而输出用户所需的申请人信息的录音数据段。使得用户在需要获取申请人信息的时候,只需要输入相对应的关键字查询指令,即可输出所需的申请人信息对应的录音数据段,无需再将录音数据从头听到尾,极大地提升了用户对申请人信息的获取效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的信号输出方法的实现流程示意图;

图2是本发明实施例二提供的信号输出方法的实现流程示意图;

图3是本发明实施例三提供的信号输出方法的实现流程示意图;

图4是本发明实施例四提供的信号输出方法的实现流程示意图;

图5是本发明实施例五提供的信号输出方法的实现流程示意图;

图6是本发明实施例六提供的信号输出装置的结构示意图;

图7是本发明实施例七提供的信息输出终端设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电话以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

应当理解地,本发明提出的技术方案,适用于所有包含用户语音的音频数据的用户信息提取,为了便于读者理解以及说明,本说明书中,以信用审核实际场景中申请人信息提取为例,来进行了所有相关实施例解释说明,但这并不会对本发明技术方案的保护范围构成任何限定。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

应当说明的,在本发明实施例中,为了更好更为准确地识别出申请人信息相关录音数据段,技术人员会预先对申请人信息进行关键字提取整理,如对申请人的身份证号码进行提取得到对应的关键字为“身份证号”,对申请人的家庭地址进行提取得到对应的关键字为“家庭地址”,以得出与申请人信息对应的关键字,以供后续的识别。由于这些关键字是对申请人信息的一种特征信息,因此在进行申请人信息对应的录音数据段的提取的时候,可以通过识别这些特征信息,来确定特征信息,从而确定所需标记的起点与终点。

其中,具体的关键字对应提取规则,本发明实施例中不予限定,可以由技术人员根据实际应用情况进行确定,如,对于申请人的身份证号码,其关键字既可以提取为“身份证号”,也可以提取为“身份证”,还可以是包含多个近似词语的集合。

图1示出了本发明实施例一提供的信息输出方法的实现流程图,详述如下:

s101,对获取到的录音数据进行特征信息识别。

其中,特征信息是指录音数据中包含的,带有申请人信息的相关特征的录音数据,如包含有申请人信息对应的关键字的录音数据。

进行特征信息识别,是为了识别出关键字。因此,此时会对录音数据进行语音识别,识别出录音数据中所包含的语音内容,并对内容进行关键字匹配,判断识别出的语音内容中是否包含申请人信息对应的关键字。

s102,当识别出的特征信息为预设的关键字时,根据关键字在录音数据中的位置以及关键字类别,在录音数据中确定出关键字对应的标记起点以及标记终点。

在识别匹配出关键字时,即找到了其对应的申请人信息所处的录音数据段在录音中的大概位置,但还需要进一步地确定录音数据段的标记起点以及标记终点,以准确确定出包含该关键字对应的申请人信息的录音数据段。

由于信用审核时需要核查申请人信息非常多,不同申请人信息可能衍生的对话情况也不尽相同,例如,像身份证号码这一类的申请人信息,往往只需要一两对话就能确定好申请人信息的具体内容,此时产生的录音数据段较短。而像贷款情况这一类的申请人信息,往往需要工作人员和申请人来回进行多次对话,才能确定出具体的申请人信息,此时会产生较长的录音数据段。为了更为准确地进行申请人信息对应的录音数据段的标记确定,本发明实施例中,技术人员会预先对申请人信息对应的关键字进行类别划分,对于不同类别的关键字采取不同的标记设定,以提高对申请人信息标记的准确度。并在确定出关键字的类别后,以关键字所在的句子的位置为基础,根据关键字具体的类别来进行标记起点与终点的确定。

作为本发明的一个具体实现方式,例如,对于身份证号码这一类的,只需要一两对话就能确定好申请人信息的具体内容的申请人信息,考虑到一般都是工作人员主动询问申请人后,申请人才进行回答,因此,在识别出这一类的关键字后,可以以该关键字所在的句子的句头为标记起点,向后进行句子识别,并将其后面的第n个句子的句末设为标记终点。其中n可由技术人员根据需要自行设定。优选地,可设定n为2或3。

s103,将标记起点与标记终点之间的录音数据段,标记为与关键字相对应的录音数据段。

在确定出标记起点标记终点后,即确定出了关键字对应的录音数据段,此时对该录音数据段进行对应的关键字标记,使得后续能根据关键字对录音数据段进行对应识别。其中,标记方法包括但不限于,将关键字与对应的录音数据段一同存储,或者,生成一个关键字与录音数据段的对应关系表数据并进存储,利用该对应关系表数据将关键字与录音数据段的对应关系进行存储,以使得后续可以根据关键字以及对应关系表数据,来进行关键字对应的录音数据段的确定。

本发明实施例中,在标记出与关键字对应的录音数据段后,既对标记后的录音数据进行直接存储,也可以对录音数据段进行截取存储,即可以将录音数据分割成许多个录音数据段分别进行存储。

s104,接收用户输入的关键字查询指令,根据关键字匹配出与关键字查询指令相对应的录音数据段,并输出录音数据段。

在标记出申请人信息关键字对应的录音数据段后,用户若想对申请人信息进行获取核查,只需要输入相对应获取的申请人信息对应的关键字查询指令即可。本发明实施例中,在获取到用户输入的关键字查询指令之后,会对关键字查询指令进行关键字匹配,并根据匹配到的关键字,读取相对应的录音数据段,并对该录音数据段进行输出。如接收到用户输入身份证号查询指令后,对该指令进行关键字匹配,并匹配出了对应的关键字“身份证号”,此时,会读取出身份证号对应的录音数据段,并输出给用户。其中,本发明实施例中的录音数据段输出方式,包括但不限于如直接对录音数据段进行音频播放,或者将录音数据段发送给客户指定的设备,具体需根据实际用户需求进行设定。

在输出方式为直接播放录音数据段时,由s103相关说明可知,由于对录音数据段存储的方式不同,相对应的,对于不同的录音数据段存储方式,其播放输出的方式也有所不同。当存储方式为对标记后的录音数据进行直接存储,此时录音数据段仍是录音数据中的一部分数据,因此,在进行播放输出时,会自动读取录音数据中的录音数据段进行播放,而不会对该录音数据段以外的录音数据进行任何操作。当存储方式为截取录音数据段存储时,此时,只需直接读取出存储的录音数据段进行播放即可。

作为s102的一个具体实施方式,作为本发明实施例二,如图2所示,包括:

s201,当关键字类别为非特殊关键字,且是申请人通话对端说出的关键字时,根据关键字在录音数据中的位置以及关键字类别,在录音数据中确定出关键字对应的标记起点以及标记终点。

本发明实施例中,在对关键字进行分类时,将关键字分为三类,分别为短对话关键字、长对话关键字以及特殊关键字。

其中,短对话关键字是指如身份证号以及家庭地址等,一般只需短短的几次对话,就可以确定出对应的申请人信息的关键字。长对话关键字是指如贷款情况等,需要工作人员与申请人进行较长的多次对话,才能确定出相对应的申请人信息的关键字。

而第三种类别,特殊关键字,是基于信用审核的特殊性所提出来的一类关键字。在信用审核中,工作人员有时候需要对申请人或者其相关人员(亲人、朋友或者同事等)进行申请人信息核实,此时工作人员会将部分已掌握的申请人信息告知申请人或者其相关人员,并要求其对该申请人信息进行核实确认,此时可能出现申请人或者其相关人员认为该申请人信息存在问题,并对该申请人信息的真实性进行质疑或者否认的情况,对于这些质疑或者否认回答可能涉及到的关键词,如“不是我”、“是假的”以及“搞错了”等,在本发明实施例中将其归纳为第三类关键字特殊关键词。特殊关键词虽然不能直接与具体申请人进行关联,但当出现特殊关键词时,也同时意味着申请人信息核查出现了问题,即申请人信息的获取出现了异常,而这本身也是信用审查时需要对申请人进行核查的内容,因此,对该录音数据进行核查,也需要获取此类的关键词以及其对应录音数据段,以保证获取到的申请人信息的真实有效。

其中,申请人通话对端是指负责信用审查时电话沟通的工作人员。

在实际的申请人信息核查时,经常会出现申请人说话发音不标准的情况,此时在对录音数据进行语音识别时,难以保证语音识别的准确率,从而使得后续的关键字匹配以及录音数据段的选取准确度难以得到保证。考虑到负责审核的工作人员说话发音一般较为标准,且实际情况中,也可以通过筛选培训等方式提高工作人员说话发音的标准程度,同时在进行申请人信息核查时,工作人员会引导和确认申请人提供所需的信息,即对每个申请人信息的关键字,工作人员都会进行引导或者复述。因此,为了更好地标记出申请人信息对应的录音数据段,本发明实施例中,在对录音数据进行语音识别的同时,还会语音数据进行说话人身份的识别,并只对工作人员说出的短对话关键字或者长对话关键字进行相对应响应操作,从录音数据中确定出关键字对应的标记起点以及标记终点。

通过只对工作人员说出的关键字,进行录音数据中关键字对应的标记起点以及标记终点的确定,避免了因申请人发音不标准所带来的影响,从而使得对申请人信息对应的录音数据段的确认更加准确可靠。

s202,当关键字类别为特殊关键字时,根据关键字在录音数据中的位置以及关键字类别,在录音数据中确定出关键字对应的标记起点以及标记终点。

对于特殊关键字而言,由上述对s201的说明可知,其对应的情况较为特殊,工作人员难以进行引导。因此,在本发明实施例中,若识别出来关键字是特殊关键字时,无需识别其说话人的身份,只需直接确定录音数据中关键字对应的标记起点以及标记终点即可。

本发明实施例中,通过对不同类型的关键字以及不同身份的说话人进行识别,在关键字类型为短对话关键字或者长对话关键字时,只对说话人为工作人员时进行关键字响应操作,而在关键字类型为特殊关键字时,直接进行关键字响应操作,使得对申请人信息关键字对应的录音数据段的提取更加准确可靠。

作为s201的一个具体实施方式,作为本发明实施例三,如图3所示,包括:

s2011,当非特殊关键字为短对话关键字,将短对话关键字所处的句子的句头作为标记起点,并将录音时间在标记起点之后,与标记起点间隔为预设句子数量的句子的句末作为标记终点。

由于对于短对话关键字而言,一般只需要较短的几次对话即可确定出所需的申请人信息,同时实际情况中,一般是由工作人员对申请人进行引导,从而使得申请人说出相对应的申请人信息。因此在本发明实施例中,会以识别出的短对话关键字类型的关键字所处的句子的句头作为标记起点,并向后进行句子计数,来确定标记终点的句子。其中预设句子数量的具体数值,可由技术人员根据实际情况进行设定,在本发明实施例中,优选地,设置为2句或者3句。

s2012,当非特殊关键字为长对话关键字时,将长对话关键字所处的句子的句末作为标记终点,并将位于长对话关键字之前的上一个关键字之后的第一个句子的句头作为标记起点。

对于长对话关键字,需要较多次的对话才能确定出所需的申请人信息,其具体所需的对话次数无法确定,但实际情况中,工作人员在确认完该长对话关键字类型的关键字对应的申请人信息后,会对该申请人信息进行复述确认核实。因此,若想获取到与该关键字相关的完整的录音数据段,只是通过s2011中简单的设置预设句子数量来进行标记起点终点的设定,必定会存在标记不准确的情况。考虑到上一个申请人信息所涉及到的对话未完成前,此次识别出的关键字对应的申请人信息所涉及到的对话必定还未开始,因此,为了保证获取到的与长对话关键字类型的关键字相对应的录音数据段的完整性,本发明实施例中,会识别出工作人员上一次说出的关键字,并将上一个关键字之后的第一个句子的句头作为标记起点,本次识别出的关键字所在的句子的句末作为终点,来标记录音数据段。

作为本发明的另一个优选实施例,考虑到工作人员对该申请人信息进行复述确认核实之后,申请人也可能会对该申请人信息进行补充说明,因此,在s2012的基础上,还可以将标记终点设置在关键字所处的句子后的预设句子数量间隔的句子句末中,以保证标记的录音数据段的完整性。

本发明实施例中,通过对短对话关键字和长对话关键字所对应对话情况的特点,进行针对性的设置不同的标记方法,使得标记得出的录音数据段更为准确完整,保证了对申请人信息关键字对应的录音数据段的提取的准确可靠。

作为s202的一个具体实施方式,作为本发明实施例四,如图4所示,包括:

s2021,当关键字类别为特殊关键字时,识别出录音时间在关键字之前的上一个关键字,以及录音时间在关键字之后的下一个关键字。

s2022,将上一个关键字之后的第一个句子的句头,作为标记起点,并将录音时间在下一个关键字之前的第一个句子的句末,作为标记终点。

对于特殊关键字而言,其涉及到的对话情况较为复杂。首先,由上述对s201的说明可知,在说话人说出特殊关键字之前,需要工作人员将部分已掌握的申请人信息告知申请人或者其相关人员,即至少会有一段工作人员的说的话,同时在说话人说出特殊关键字之后,工作人员也必定会询问申请人相关理由,因此,特殊关键字前后都存在与申请人信息相关的对话,且对话长度难以确定。在本发明实施例中,考虑到上述实际情况,为了保证对特殊关键字类型的关键字对应申请人信息的录音数据段标记的完整性,会对此次识别出关键字的前后,都进行关键字识别,找出距离其最近的上一个关键字以及下一个关键字,并将上一个关键字以及下一个关键字之间的录音数据,标记为此次识别出关键字对应的录音数据段。

作为本发明的一个优选实施例五,如图5所示,包括:

s105,当识别出的特征信息为,音频幅值超出幅度阈值范围的音频突变点时,在音频突变点之后的录音数据中,识别是否包含另外的音频突变点。

在实际申请人信息核查中,所需要记录核查申请人信息不仅仅只是申请人的一些个人基本信息,申请人在电话沟通核查过程中的相关情况,也是所需记录核查的申请人信息之一。特别是对于电话沟通核查过程中出现的一些特殊情况,如申请人环境突然变得嘈杂、申请人说话音量发生巨大变化以及申请人那边增加了新的说话人等,这些都需要记录至申请人信息中,以供信用审核的分析。而这些特殊情况发生时,都具有一个共同的特征,即都会使得电话录音中的音频幅值出现较大的波动,如申请人环境突然变得嘈杂时,音频幅值会增大,申请人说话音量减小时,音频幅值会减小,从而会产生一个对应音频突变点。

应当说明的是,本发明实施例中的音频突变点并不是指音频数据中的一个数据点,而是指一个连续且较短的音频数据段。详细说明如下:

在本发明实施例中,为了对申请人在电话沟通核查过程中的出现的特殊情况进行识别,会识别录音数据中出现较大音频幅值波动的音频突变点。由于对于不同录音数据而言,其音频幅值情况均存在差别,为了能对不同的录音数据均实现音频突变点的准确识别,本发明实施例中,设置了一个幅度阈值范围,该幅度阈值范围具有一个幅度上限阈值以及一个幅度下限阈值。在进行音频突变点识别时,会将音频数据以每n个比特数据位为单位,将录音数据划分为许多个长度为n比特数据位的音频数据段,并对每个音频数据段求幅值平均。若检测出某个音频数据段内的幅值平均大于幅度上限阈值或者小于幅度下限阈值,则认为录音数据从该处发生了音频突变,本发明实施例中,为了方便读者理解,将该音频数据段命名为音频突变点。其中,n值的具体大小,可由技术人员自行选定,但考虑到该音频数据段主要作用,是作为一个音频突变的标识点,其长度不宜过长,即优选地,n值取值不能过大。

进一步地,作为本发明的一个优选实施例,幅度阈值范围的幅度上限阈值以及一个幅度下限阈值,需要根据正在进行音频突变点判断的音频数据段,其前面的m个n比特数据位长的音频数据段的平均幅值计算得出,其中,设置幅度上限阈值为,音频数据段前面的,m个n比特数据位长的音频数据段的平均幅值的h倍,其中h大等于1,设置幅度下限阈值为,音频数据段前面的,m个n比特数据位长的音频数据段的平均幅值的i倍,其中i大于0小于1。即当正在进行音频突变点判断的音频数据段的平均幅值,大于计算出的幅度上限阈值或者小于幅度下限阈值时,判定该音频数据段处发生了音频突变,该音频数据段即为音频突变点。其中,m、h以及l的具体取值,均可由技术人员根据实际调试结果进行设置。

s106,若识别结果为包含另外的音频突变点,将音频突变点所在的句子的句头作为标记起点,并在另外的音频突变点中,将与音频突变点最接近的音频突变点所在的句子的句末作为标记终点。

实际情况中,在出现一个音频突变点之后,极大可能地会出现与之对应的相邻的第二个音频突变点,如,申请人由于有路人从身边走过,降低了说话声音,但当路人走远后,又开始回复正常声音。此时,该两个音频突变点之间,包含了特殊情况的全部录音内容,因此,只需要将该两个音频突变点分别标记为标记起点以及标记终点,即可完成对音频突变特殊情况对应的录音数据段的标记,提取出相对应的申请人的信息。

由于音频突变点是一个很短的音频数据段,因此,将音频突变点标记为标记起点,是指将音频突变点的对应的音频数据段的段头标记为标记起点,而将音频突变点标记为标记终点,是指将音频突变点的对应的音频数据段的段末标记为标记终点。

s107,若识别结果为不包含另外的音频突变点,在音频突变点之后的录音数据中,识别出与音频突变点最接近的关键字;将音频突变点作为标记起点,并将最接近的关键字之前的第一个句子的句末作为标记终点。

实际情况中,若不存在第二个音频突变点,说明申请人那边出现音频突变后,一直保持至较为稳定的音频幅值状态。此时,申请人的音频突变特殊情况无需全程记录核查,只需将音频突变点到下一个关键字之间的录音数据内容进行标记,以便后续核查即可。

s108,对标记起点与标记终点之间的录音数据段进行关键字标记。

在识别并标记完特殊情况对应的录音数据段的标记起点终点之后,为了便于后续用户的查询,本发明实施例中,会对特殊情况对应的录音数据段也进行关键字标记,如可以将录音数据段的关键字标记为“特殊录音”,此时用户只需要输入特殊录音查询指令,即可查询到录音数据中特殊情况相对应的录音数据段。

s109,接收用户输入的关键字查询指令,根据关键字匹配出与关键字查询指令相对应的录音数据段,并输出录音数据段。

在本发明实施例中,对录音数据进行特征信息识别,并在特征信息为预设的关键字时,根据关键字的位置、关键字类别以及说话人是否为工作人员,来进行标记起点终点的确定,并进行相对应的关键字标记。在特征信息为音频突变点时,根据是否包含相邻的第二个音频突变点,来进行标记起点终点的确定,并进行相对应的关键字标记。从而本发明实施例能对录音数据中的不同的申请人信息,进行录音数据段关键字的分别标记,如对申请人的身份证号、申请人的家庭地址以及录音数据中的特殊情况对应的录音数据段,分别进行标记。并在关键字标记完成后,根据用户输入的关键字查询指令进行关键字匹配,从而输出用户所需的申请人信息的录音数据段。使得用户在需要获取申请人信息的时候,只需要输入相对应的关键字指令,即可输出所需的申请人信息对应的录音数据段,无需再将录音数据从头听到尾,极大地提升了用户对申请人信息的获取效率。

对应于上文实施例所述的方法,图6示出了本发明实施例提供的信息输出装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。

参照图6,该信息输出装置包括:

特征识别模块61,用于对获取到的录音数据进行特征信息识别。

第一标记确定模块62,用于当识别出的所述特征信息为预设的关键字时,根据所述关键字在所述录音数据中的位置以及关键字类别,在所述录音数据中确定出所述关键字对应的标记起点以及标记终点。

第一关键字标记模块63,用于将所述标记起点与所述标记终点之间的录音数据段,标记为与所述关键字相对应的录音数据段。

信息输出模块64,用于接收用户输入的关键字查询指令,根据所述关键字匹配出与所述关键字查询指令相对应的所述录音数据段,并输出所述录音数据段。

进一步地,第一标记确定模块62,包括:

第一标记确定子模块,用于当所述关键字类别为非特殊关键字,且是申请人通话对端说出的所述关键字时,根据所述关键字在所述录音数据中的位置以及所述关键字类别,在所述录音数据中确定出所述关键字对应的标记起点以及标记终点。

第二标记确定子模块,用于当所述关键字类别为特殊关键字时,根据所述关键字在所述录音数据中的位置以及所述关键字类别,在所述录音数据中确定出所述关键字对应的标记起点以及标记终点。

进一步地,所述第一标记确定子模块,包括:

当所述非特殊关键字为短对话关键字,将所述短对话关键字所处的句子的句头作为标记起点,并将录音时间在所述标记起点之后,与所述标记起点间隔为预设句子数量的句子的句末作为标记终点。

当所述非特殊关键字为长对话关键字时,将所述长对话关键字所处的句子的句末作为标记终点,并将位于所述长对话关键字之前的上一个关键字之后的第一个句子的句头作为标记起点。

进一步地,所述第二标记确定子模块,包括:

当所述关键字类别为特殊关键字时,识别出录音时间在所述关键字之前的上一个关键字,以及录音时间在所述关键字之后的下一个关键字。

将所述上一个关键字之后的第一个句子的句头,作为标记起点,并将录音时间在所述下一个关键字之前的第一个句子的句末,作为标记终点。

进一步地,该信息输出装置,还包括:

音频突变点识别模块,用于当识别出的所述特征信息为,音频幅值超出幅度阈值范围的音频突变点时,在所述音频突变点之后的所述录音数据中,识别是否包含另外的音频突变点。

第二标记确定模块,用于若识别结果为包含另外的音频突变点,将所述音频突变点所在的句子的句头作为所述标记起点,并在所述另外的音频突变点中,将与所述音频突变点最接近的音频突变点所在的句子的句末作为所述标记终点。

第三标记确定模块,用于若识别结果为不包含另外的音频突变点,在所述音频突变点之后的所述录音数据中,识别出与所述音频突变点最接近的关键字。将所述音频突变点作为所述标记起点,并将所述最接近的关键字之前的第一个句子的句末作为所述标记终点。

第二关键字标记模块,对所述标记起点与所述标记终点之间的所述录音数据段进行关键字标记。

信息输出模块,用于接收用户输入的关键字查询指令,根据所述关键字匹配出与所述关键字查询指令相对应的所述录音数据段,并输出所述录音数据段。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

图7是本发明一实施例提供的信息输出终端设备的示意图。如图7所示,该实施例的信息输出终端设备7包括:处理器70、存储器71以及存储在所述存储器71中并可在所述处理器70上运行的计算机程序72,例如信息输出程序。所述处理器70执行所述计算机程序72时实现上述各个信息输出方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器70执行所述计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块61至64的功能。

所述信息输出终端设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述信息输出终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是信息输出终端设备7的示例,并不构成对信息输出终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述信息输出终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器70可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电话(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器71可以是所述信息输出终端设备7的内部存储单元,例如信息输出终端设备7的硬盘或内存。所述存储器71也可以是所述信息输出终端设备7的外部存储设备,例如所述信息输出终端设备7上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器71还可以既包括所述信息输出终端设备7的内部存储单元也包括外部存储设备。所述存储器71用于存储所述计算机程序以及所述信息输出终端设备所需的其他程序和数据。所述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相对应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1