一种语音通信处理方法及装置与流程

文档序号:11710132阅读:135来源:国知局
一种语音通信处理方法及装置与流程

本发明实施例涉及通信技术领域,具体涉及一种语音通信处理方法及装置。



背景技术:

随着移动通信技术的发展,手机得到了广泛的应用。用户使用手机进行通信,例如拨打电话,使用即时通讯(英文全称为instantmessaging,英文简称为im)软件进行语音或者视频通话等。在用户使用手机通信过程中,常常遇到需要记录关键信息的情形。例如,用户a与用户b打电话时,用户b告诉用户a另一联系人的电话号码,用户a需要记录此电话号码。若用户a手边没有纸笔不方便记录时,只能够凭用户a的记忆强记电话号码。若用户记忆能力不佳,稍后还需请用户b通过发短信的方式告知用户a此电话号码。无论哪种方式,都不方便用户操作,而且还增加了用户之间的交互操作,增加了网络资源的占用。现有技术并不存在一种可以自动记录通话过程中的关键信息的方法。



技术实现要素:

本发明实施例提供了一种语音通信处理方法及装置,自动存储用户在通话过程中提及的关键信息,方便用户操作,提升用户体验,减少用户交互,降低网络资源占用。

为此,本发明实施例提供如下技术方案:

一方面,本发明实施例提供了一种语音通信处理方法,所述方法包括:

当第一通信终端与第二通信终端进行通信时,获取通信音频数据;

分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配;

若匹配,提取所述通信音频数据的关键信息;

将所述关键信息存储至对应的存储位置。

另一方面,本发明实施例提供了一种语音通信处理装置,包括:

音频数据获取单元,用于当第一通信终端与第二通信终端进行通信时,获取通信音频数据;

分析单元,用于分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配;

关键信息提取单元,用于若匹配,提取所述通信音频数据的关键信息;

存储单元,用于将所述关键信息存储至对应的存储位置。

再一方面,本发明实施例提供了一种用于语音通信处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

当第一通信终端与第二通信终端进行通信时,获取通信音频数据;

分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配;

若匹配,提取所述通信音频数据的关键信息;

将所述关键信息存储至对应的存储位置。

本发明实施例提供的语音通信处理方法及装置,可以在第一通信终端与第二通信终端进行通信时,获取通信音频数据,并分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配;若匹配,提取所述通信音频数据的关键信息,将所述关键信息存储至对应的存储位置。本发明可以自动提取通话过程中用户提及的关键信息,并自动存储所述关键信息,方便用户操作,减少了用户之间的交互操作,减少了网络通信资源的占用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例语音通信处理方法流程图;

图2为本发明另一实施例提供的语音通信处理方法流程图;

图3为本发明再一实施例提供的语音通信处理方法流程图;

图4为本发明实施例提供的语音通信处理装置示意图;

图5是根据一示例性实施例示出的一种用于语音通信处理的装置的框图。

具体实施方式

本发明实施例提供了一种语音通信处理方法语音通信处理方法及装置,自动存储用户在通话过程中提及的关键信息,方便用户操作,提升用户体验,减少用户交互,降低网络资源占用。

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

参见图1,为本发明一实施例语音通信处理方法流程图。如图1所示,所述方法可以包括:

s101,当第一通信终端与第二通信终端进行通信时,获取通信音频数据。

其中,所述第一通信终端与第二通信终端进行通信包括以下任意一种情况:

(1)所述第一通信终端与所述第二通信终端进行语音通信;

(2)所述第一通信终端与所述第二通信终端进行视频通信。

举例说明,所述第一通信终端与第二通信终端进行通信的方式包括但不限于拨打语音电话、视频电话,通过即时通讯软件,例如qq、微信、易信等,进行语音通话、视频通话、发送或接收语音信息等。当然,第一通信终端与第二通信终端进行通信还可以是其他通信方式,本发明对此不进行限定。

需要说明的是,获取通信音频数据的方式可以是主动获取或者响应于用户的触发获取。

在一些实施方式中,所述获取通信音频数据包括:响应于用户触发第一控件的输入,获取通信音频数据。其中,所述第一控件用于录制通信音频数据。举例说明,可以设置一个硬件或者软件的开关,当用户需要记录关键信息的时候,用户主动开启所述开关,此时开始获取用户的通信音频数据。

在一些实施方式中,所述获取通信音频数据包括:响应于用户同意在通信时获取通信音频数据的设置,获取通信音频数据。举例说明,出于保护用户隐私的需要,可以预先设置控件或者显示提示信息,当用户设置将所述控件开启或者响应于所述提示信息设置同意在通信时获取通信音频数据时,才获取用户的通信音频数据。

在另一些实施方式中,所述获取通信音频数据包括:可以获取所述第一通信终端与所述第二通信终端的通信音频数据的全部或部分内容。具体实现时,可以对用户的全部通信内容进行侦听,即获取通信音频数据的全部,也可以仅获取通信音频数据的部分内容。

在一些实施方式中,获取所述第一通信终端与所述第二通信终端的通信音频数据的部分内容包括:可以仅获取第二通信终端发送至第一通信终端的音频数据。举例说明,通常用户希望将通话对端的用户告知的联系人信息进行记录,出于节省资源、降低算法复杂度的目的,可以仅对通话对端即第二通信终端发送至第一通信终端的音频数据进行侦听。

在一些实施方式中,获取所述第一通信终端与所述第二通信终端的通信音频数据的部分内容包括:可以仅获取所述第一通信终端发送至所述第二通信终端的音频数据。举例说明,在记录日程类信息的过程中,当由第一通信终端对应的用户发起会议、约会时,这时往往需要为用户进行日程的记录。而出于节省资源、降低算法复杂度的目的,可以仅对通话发起端即第一通信终端发送至第二通信终端的音频数据进行侦听。

在一些实施方式中,获取所述第一通信终端与所述第二通信终端的通信音频数据的部分内容包括:实时获取预设长度的音频数据。举例说明,为避免用户对隐私问题的担忧,除了对通话过程全程侦听以外,还可以设置一个录音缓存,由用户指定缓存的时长,例如1分钟。当缓存的音频数据超过预设长度时,例如超过一分钟时,按照先进先出的原则,删除最先缓存的数据,使得缓存的 音频数据不超过预设长度。在这种实施方式中,只在手机端记录通信的对话信息,并不做分析处理。以提取的关键信息为联系人为例进行说明,用户设置缓存的长度为1分钟,当用户在1分钟以内有谈论过联系人电话等信息时,且希望将联系人信息添加到通讯录中时,通过响应于用户触发第二控件的输入,分析所述通信音频数据。例如,当检测到用户触发“添加联系人”操作按钮时,自动启动对缓存通话录音数据的分析,弹窗提示用户是否将分析中获取的联系人信息加入通讯录,由用户确认后加入通讯录中。

s102,分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配。

在一些实施方式中,在分析所述通信音频数据之前,进一步可以包括:对所述通信音频数据进行语音识别处理,将所述通信音频数据转换为文本数据。则所述分析所述通信音频数据,提取所述通信音频数据的对话模式特征包括:分析所述文本数据,提取所述文本数据的对话模式特征。在这一实施方式中,是将语音对话内容通过语音识别技术转化为文本信息进行分析。当然,也可以直接使用音频数据进行分析。当直接使用音频数据进行分析时,在判断所述通信音频数据的对话模式特征与预先建立的样本对话模式特征匹配时,可以将音频数据的对话模式特征转换为文本数据,再提取文本数据中的关键信息进行存储。当然,在直接使用音频数据进行分析时,若判断所述通信音频数据的对话模式特征与预先建立的样本对话模式特征匹配,也可以直接提取音频数据中的关键信息,若需要存储提取的关键信息,可以将所述关键信息转换为文本信息进行存储。

在一些实施方式中,对通信音频数据的分析是实时的。在另一些实施方式中,对通信音频数据的分析并不是实时的。举例说明,当获取的通信音频数据为实时获取的预设长度的音频数据时,检测用户触发第二控件的输入;当检测到用户触发第二控件的输入时,分析所述通信音频数据。在这种方式中,并不对获取的通信音频数据进行实时分析,而是在用户触发第二控件时,例如添加联系人或者添加日程的按钮时,才对获取的通信音频数据进行分析。

在本发明实施例具体实现时,预先通过分析样本数据,建立了样本对话模式特征。举例说明,基于大量样本数据的统计分析,从样本数据中获取与联系 人有关的对话模式,例如:xxx的电话是xxx;xxx的手机号为xxx等等对话模式。又如,还可以从样本数据中获取与日程信息有关的对话模式,例如:如xxx在xxx开会;明天xxx点去xxx面谈;周xxx早上xxx点在xxx大厦xxx层面试等对话模式。当然,以上仅为示例性说明,还可以建立其他类型的样本对话模式,本发明在此不进行限定。

当获取了第一通信终端与所述第二通信终端的通信音频数据时,基于预先建立的对话模式特征,对通信音频数据进行分析,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配。例如,所述通信音频数据的对话模式是xxx的手机号是xxxxxxxxxxx,即与样本对话模式中的联系人模式匹配。

s103,若匹配,提取所述通信音频数据的关键信息。

若确定提取的通信音频数据的对话模式特征与预先建立的样本对话模式特征匹配,即提取与所述对话模式特征或者样本对话模式特征对应的关键信息。本发明实施例预先建立了样本对话模式特征与关键信息的对应关系,可以依照所述对应关系提取相应的关键信息。例如,若匹配的是样本对话模式特征中的联系人模式特征,即提取联系人信息作为关键信息。若匹配的是样本对话模式特征中的日程模式特征,即提取日程信息作为关键信息。当然,以上仅为示例性说明,还可以提取其他关键信息。

s104,将所述关键信息存储至对应的存储位置。

在一些实施方式中,提取关键信息后,还显示第一提示信息,用于提示用户是否同意存储提取的关键信息。而后,响应于用户同意存储提取的关键信息的确认,将所述关键信息存储至对应的存储位置。例如,提取关键信息后,提示用户是否添加所述关键信息;若用户确认添加,则将所述关键信息存储。

在另一些实时方式中,提前关键信息后,即将所述关键信息存储至对应的存储位置。而后,显示第二提示信息,用于提示用户已经关键信息存储至对应的存储位置。进一步地,还可以响应于用户触发删除所述关键信息的操作,删除所述关键信息。

在一些实施方式中,在存储所述关键信息之前还包括:对提取的关键信息进行处理,获取处理后的关键信息;所述将所述关键信息存储至对应的存储位 置包括:将所述处理后的关键信息存储至对应的存储位置。对关键信息的处理可以包括:(1)将关键信息转换成预设的格式。例如,将提取的联系人信息按照姓名、电话号码的格式存储。又如,将提取的日程信息按照时间、地点、人物、事项的标准格式进行转换。(2)转换关键信息中的用户信息。例如,获取第二通信终端的用户标识,将所述用户标识作为姓名信息存储。又如,获取第二通信终端的通信标识,例如电话号码,根据通讯录存储的电话号码与用户姓名的对应关系,获取用户的姓名。举例说明,在用户a与用户b的通信音频数据中,用户b提到:“咱俩明天下午3点在五道口星巴克碰面,好好聊聊”。这时,通过分析所述通信音频数据,确定所述通信音频数据的对话模式特征与样本对话模式特征匹配,提取的关键信息为“明天3点”+“五道口星巴克”+“咱俩”,可以通过获取用户b所在的终端的通信标识,例如电话号码,并根据通讯录存储的电话号码与姓名的对应关系,提取出用户b的姓名,将用户b的姓名作为处理后的关键信息存储。(3)转换关键信息中的时间信息。例如,若时间为明天,则根据当前日期,将时间转换为对应的日期。又如,若时间为周六,则根据当前日期,将时间转换为具体的日期。(4)转换关键信息中的地点信息。当然,以上仅为示例性说明,不视为对本发明的限制。

在一些实施方式中,所述将所述关键信息存储至对应的存储位置包括:将所述关键信息存储至与所述对话模式特征对应的存储位置。例如,预先建立了对话模式特征与存储位置的对应关系,或者关键信息、对话模式特征、存储位置的对应关系,在提取关键信息后,即将所述关键信息存储至与所述对话模式特征对应的存储位置。举例说明,可以根据预先建立的各种样本对话模式特征,判断当前识别处理后的关键信息需要存储到手机的哪个相应位置等。例如,提取的对话模式特征为联系人模式特征,将联系人信息存储至通讯录。提取的对话模式特征为日程模式特征,将日程信息存储至记事本或者日程表等应用中。

在一些实施方式中,所述将所述关键信息存储至对应的存储位置包括:根据用户预先设置的关键信息与存储位置的对应关系,将所述关键信息存储至对应的存储位置。举例说明,可以由用户设置不同识别处理后的关键信息存储在不同的应用app或位置等。

在一些实施方式中,所述将所述关键信息存储至对应的存储位置包括:根 据所述关键信息的类型,将所述关键信息存储至与所述关键信息的类型对应的存储位置。举例说明,提取的关键信息的类型为联系人,将联系人信息存储至通讯录。提取的关键信息的类型为日程,将日程信息存储至记事本或者日程表等应用中。需要说明的是,可以为用户建立一个专门的备忘录或记事本等,所有通话过程中(包括即时通讯软件例如qq、微信等中的语音通话或者语音信息等)的识别处理后的关键信息都可以添加到这个备忘录或记事本中,这个备忘录或记事本也可以设置一下子类别:备忘通讯录、近期备忘约会事项、备忘优惠劵账单类事项等等,所有通话过程中的识别处理后的关键信息可以根据上述设置的子类别自动添加(或应用户确认后)到相应子类别。

在一些实施方式中,提取所述提取所述通信音频数据中的关键信息包括:提取所述通信音频数据中的联系人信息。所述将所述关键信息存储至对应的存储位置包括:将所述联系人信息存储至通讯录中。下文将参照图2对这一实施方式进行详细介绍。

在一些实施方式中,所述提取所述通信音频数据中的关键信息包括:提取所述通信音频数据中的日程信息,所述日程信息包括时间、地点、人物、事项信息中的一种或者多种。所述将所述关键信息存储至对应的存储位置包括:将所述日程信息存储至记事本或者日程表中。下文将参照图3对这一实施方式进行详细介绍。

在这一实施例中,可以自动提取通话过程中用户提及的关键信息,并自动存储所述关键信息,方便用户操作,减少了用户之间的交互操作,减少了网络通信资源的占用。

参见图2,为本发明另一实施例提供的语音通信处理方法流程图。在这一实施例中,通过语音识别技术,在通话过程中通过对语音的分析,提取出与联系人有关的信息,自动帮用户添加联系人到通讯录中。

s201,预先建立联系人对话模式特征。

基于大量数据的统计分析,从数据中获取与联系人有关的对话模式,如:xxx的电话是xxxxxxxx;xxx的手机号是xxxxxxxxxxx等等。

s202,检测到用户使用第一通信终端与第二通信终端进行通信时,获取通 信音频数据。

具体地,当检测到用户使用通信终端通信时,对整个对话过程进行侦听,获取通信音频数据。

s203,对所述通信音频数据进行语音识别处理,将所述通信音频数据转换为文本数据。

s204,分析所述文本数据,提取所述文本数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本联系人对话模式特征匹配。

s205,当确定所述对话模式特征与预先建立的样本联系人对话模式特征匹配时,提取联系人信息。

s206,展示第一提示信息,用于提示用户是否添加联系人信息。

举例说明,一旦发现对话内容与联系人信息相关,可以立即将相关信息提取,并提示用户(例如弹窗、铃声提示等)是否添加联系人到通讯录中。

s207,响应于用户同意添加联系人的确认,将联系人信息存储到通讯录中。

例如,如果用户希望加入联系人,则点击确定按钮,自动将联系人信息保存到通讯录中。

举例对上述过程进行说明,用户a通过例如号码通等app与朋友进行通话,通话过程中对方告知a“李明”的联系方式,例如:“李明的电话是18866668888”,号码通等app可以对对话内容进行分析,通过语音技术将内容转化为文本,对文本内容的分析发现,文本内容命中模式:aaa的电话是bbb,于是从中提取出联系人姓名:李明,电话:18866668888;将此信息格式化处理以后,当通话结束后或通话中以弹窗等形式提醒用户,例如“是否将李明添加到通讯录”,用户收到提示以后,点击确定按钮,一键将李明添加到通讯录中。

上述实例通过对对话语音的分析,从中提取出与联系人相关的信息,提示用户可以添加联系人,用户只需点击确认即可将联系人信息添加到通讯录中。而无需用纸笔记录或用户强行记忆号码。由于本发明实施例可以自动识别用户通话过程中的联系人信息,并可以自动存储至通信录中,简化了用户操作,并减少了不必要的用户交互,节省了网络通信资源。

参见图3,为本发明再一实施例提供的语音通信处理方法流程图。在这一实施例中,在通话过程中还可以添加日程安排(又可以称之为待办事项)等其他重要的信息。

s301,预先建立日程对话模式特征。

基于大量数据的分析,从数据中获取与日程相关的对话模式特征,例如xxx在xxx开会;明天xxx点去xxx面谈;周xxx早上xxx点在xxx大厦xxx层面试等。

s302,检测到用户使用第一通信终端与第二通信终端进行通信时,获取通信音频数据。

s303,对所述通信音频数据进行语音识别处理,将所述通信音频数据转换为文本数据。

s304,分析所述文本数据,提取所述文本数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本日程对话模式特征匹配。

s305,当确定所述对话模式特征与预先建立的样本日程对话模式特征匹配时,提取日程关键信息。

具体地,基于预先设定的模式,对文本信息进行分析,如果匹配上日程的模式特征,则将日程相关的关键信息提取出来,如时间、地点、人物、待办事项等等。

s306,对提取的日程关键信息进行处理。

例如,将日程中的重要信息进行处理,如时间为“明天”,则根据当前日期,将时间转化为对应的日期,如果时间为周末,则根据当前日期也转化为具体的日期。

s307,展示第三提示信息,用于提示用户是否添加日程信息。

具体地,将关键信息以格式化方式展现给用户,提示用户是否添加到相应的app或记事本中。

s308,响应于用户同意添加日程信息的确认,将日程信息存储到记事本或者日程表中。

举例说明,用户a与用户b通话过程中,用户a提到明天下午3点五道口星巴克碰面,咱俩聊聊**事,这时对对话内容进行分析,通过语音技术将内容 转化为文本,对文本内容的分析发现,文本内容命中模式:时间+地点+人物,于是从中提取出关键信息:明天15:00+五道口星巴克+咱俩,并调取本地时间信息,确定“明天”为2015-12-**日,人物通过调取通讯录获取对方身份为用户a,将此信息格式化处理以后,当通话结束后或通话中以弹窗等形式提醒用户,例如“是否将2015-12-**日15:00与用户a在五道口星巴克面谈”加入到记事本等提示类app中,用户收到提示以后,点击确定按钮,一键将所述日程信息添加到记事本。

需要说明的是,如果通话过程中识别出的时间为已经完成的时间,比如说到“昨天我和李四去了游乐园,超好玩”,虽然也包括了时间+地点+人物,但记录该信息对于用户本身意义不大,本发明实施例可以识别时间是否为未到时间,如果不是未到时间,可以不记录该信息或者将该信息记录到记事类的应用中。

由于本发明实施例可以自动识别用户通话过程中的日程信息,并自动存储至记事本或者日程表中,简化了用户操作,并减少了不必要的用户交互,节省了网络通信资源。

需要说明的是,本发明实施例可以识别出通话过程中需要记录的各种信息,不局限于联系人信息和日程信息,对于识别处理后的信息,可以自动存储到与所述信息对应的存储位置中,简化了用户操作。

参见图4,为本发明实施例提供的语音通信处理装置示意图。

语音通信处理装置一种语音通信处理装置400,包括:

音频数据获取单元401,用于当第一通信终端与第二通信终端进行通信时,获取通信音频数据;

分析单元402,用于分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配;

关键信息提取单元403,用于若匹配,提取所述通信音频数据的关键信息;

存储单元404,用于将所述关键信息存储至对应的存储位置。

进一步地,所述装置还包括:

语音识别单元,用于对所述通信音频数据进行语音识别处理,将所述通信音频数据转换为文本数据;

所述分析单元具体用于:

分析所述文本数据,提取所述文本数据的对话模式特征。

进一步地,所述音频数据获取单元具体用于:

响应于用户触发第一控件的输入,获取通信音频数据;所述第一控件用于录制通信音频数据;或者,响应于用户同意在通信时获取通信音频数据的设置,获取通信音频数据。

进一步地,所述音频数据获取单元具体用于:

获取所述第一通信终端与所述第二通信终端的通信音频数据的全部或者部分内容。

进一步地,所述音频数据获取单元具体用于:

仅获取第二通信终端发送至第一通信终端的音频数据;或者,

仅获取所述第一通信终端发送至所述第二通信终端的音频数据;或者,

实时获取预设长度的音频数据。

进一步地,所述装置还包括:

检测单元,用于检测用户触发第二控件的输入;

所述分析单元具体用于:

当检测到用户触发第二控件的输入时,分析所述通信音频数据。

进一步地,所述装置还包括:

处理单元,用于在将所述关键信息存储至对应的存储位置之前,对提取的关键信息进行处理,获取处理后的关键信息。

所述存储单元具体用于:

将所述处理后的关键信息存储至对应的存储位置。

进一步地,所述装置还包括:

提示信息显示单元,用于显示第一提示信息,用于提示用户是否同意存储提取的关键信息;

所述存储单元具体用于:

响应于用户同意存储提取的关键信息的确认,将所述关键信息存储至对应 的存储位置。

进一步地,所述存储单元具体用于:

将所述关键信息存储至与所述对话模式特征对应的存储位置;或者,

根据用户预先设置的关键信息与存储位置的对应关系,将所述关键信息存储至对应的存储位置;或者,

根据所述关键信息的类型,将所述关键信息存储至与所述关键信息的类型对应的存储位置。

进一步地,所述关键信息提取单元具体用于:

提取所述通信音频数据中的联系人信息;

进一步地,所述存储单元具体用于:

将所述联系人信息存储至通讯录中。

进一步地,所述关键信息提取单元具体用于:提取所述通信音频数据中的日程信息,所述日程信息包括时间、地点、人物、事项信息中的一种或者多种;

进一步地,所述存储单元具体用于:

将所述日程信息存储至记事本或者日程表中。

其中,本发明装置各单元或模块的设置可以参照图1至图3所示的方法而实现,在此不赘述。

图5是根据一示例性实施例示出的一种用于语音通信处理的装置的框图。

例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件506,音频组件510,输入/输出(i/o)的接口512,传感器组件514,以及通信组件516。

处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理部件502可以包括多媒体模块,以方便多媒体组件506和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。

多媒体组件506包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件506包括一个前置摄像头和/或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(mic),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。

i/o接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的 状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件516还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

具体地,本发明实施例提供了用于语音通信处理的装置500,包括有存储器504,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器504中,且经配置以由一个或者一个以上处理器520执行所述一个或者一个以上程序包含用于进行以下操作的指令:

当第一通信终端与第二通信终端进行通信时,获取通信音频数据;

分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所述对话模式特征是否与预先建立的样本对话模式特征匹配;

若匹配,提取所述通信音频数据的关键信息;

将所述关键信息存储至对应的存储位置。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用 于进行以下操作的指令:

对所述通信音频数据进行语音识别处理,将所述通信音频数据转换为文本数据;

分析所述文本数据,提取所述文本数据的对话模式特征。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

响应于用户触发第一控件的输入,获取通信音频数据;所述第一控件用于录制通信音频数据;

或者,

响应于用户同意在通信时获取通信音频数据的设置,获取通信音频数据。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取所述第一通信终端与所述第二通信终端的通信音频数据的全部或者部分内容。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

仅获取第二通信终端发送至第一通信终端的音频数据;或者,

仅获取所述第一通信终端发送至所述第二通信终端的音频数据;或者,

实时获取预设长度的音频数据。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

检测用户触发第二控件的输入;

当检测到用户触发第二控件的输入时,分析所述通信音频数据。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

在将所述关键信息存储至对应的存储位置之前,对提取的关键信息进行处理,获取处理后的关键信息;

将所述处理后的关键信息存储至对应的存储位置。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用 于进行以下操作的指令:

显示第一提示信息,用于提示用户是否同意存储提取的关键信息;

响应于用户同意存储提取的关键信息的确认,将所述关键信息存储至对应的存储位置。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

将所述关键信息存储至与所述对话模式特征对应的存储位置;或者,

根据用户预先设置的关键信息与存储位置的对应关系,将所述关键信息存储至对应的存储位置;或者,

根据所述关键信息的类型,将所述关键信息存储至与所述关键信息的类型对应的存储位置。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

提取所述通信音频数据中的联系人信息;

将所述联系人信息存储至通讯录中。

进一步地,所述处理器520还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:

提取所述通信音频数据中的日程信息,所述日程信息包括时间、地点、人物、事项信息中的一种或者多种;

将所述日程信息存储至记事本或者日程表中。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种语音通信处理方法,所述方法包括:

当第一通信终端与第二通信终端进行通信时,获取通信音频数据;

分析所述通信音频数据,提取所述通信音频数据的对话模式特征,判断所 述对话模式特征是否与预先建立的样本对话模式特征匹配;

若匹配,提取所述通信音频数据的关键信息;

将所述关键信息存储至对应的存储位置。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相 似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1