一种自动保存联系人信息的方法和智能终端的制作方法

文档序号：7813250阅读：209来源：国知局

一种自动保存联系人信息的方法和智能终端的制作方法
【专利摘要】本发明提出一种自动保存联系人信息的方法和智能终端，其中方法包括：在通话过程中，根据用户指令获取用户通话录音；根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；语音分析引擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。本发明能够实现由智能终端自动保存联系人信息。
【专利说明】一种自动保存联系人信息的方法和智能终端

【技术领域】
[0001]本发明涉及智能终端【技术领域】，尤其涉及一种自动保存联系人信息的方法和智能终端。

【背景技术】
[0002]智能终端已经成为我们生活中不可缺少的一部分，是人们与外界通讯联系的重要工具。在实际使用中，用户希望尽可能简便有效的将联系人的有效信息添加进智能终端的通讯录中。
[0003]在智能终端的使用中，经常会遇到通话过程中需要记录联系人信息的场景，目前通常采用的方法是由人工记录联系人信息，并将联系人信息录入到智能终端中；目前的技术，智能终端无法自动保存通话内容中涉及到的联系人信息。

【发明内容】

[0004]本发明提供了一种自动保存联系人信息的方法，能够由智能终端自动保存通话过程中涉及到的联系人信息。
[0005]本发明还提供了一种自动保存联系人信息的智能终端，能够自动保存通话过程中涉及到的联系人信息。
[0006]本发明的技术方案是这样实现的:
[0007]—种自动保存联系人信息的方法，包括:
[0008]在通话过程中，根据用户指令获取用户通话录音；
[0009]根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；
[0010]语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；
[0011]语音分析弓I擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；
[0012]显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。
[0013]一种自动保存联系人信息的移动终端，包括:
[0014]录音模块，用于在通话过程中根据用户指令获取用户通话录音；
[0015]选择模块，用于根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；
[0016]语音识别模块，用于指示语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；并指示语音分析引擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；
[0017]修订模块，用于显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。
[0018]可见，本发明提出的自动保存联系人信息的方法和智能终端，在用户通话过程中获取通话录音，选用合适的语音分析引擎和语音特征库从通话录音中提取联系人信息，从而实现了自动保存联系人信息。

【专利附图】

【附图说明】
[0019]图1为本发明提出的自动保存联系人信息的方法实现流程图；
[0020]图2为获取通话录音的实现流程图；
[0021]图3为选择语音分析引擎及加载语音特征库的实现流程图；
[0022]图4为语音预处理的实现流程图；
[0023]图5为联系人号码匹配实现流程图；
[0024]图6为在社交应用中创建联系人信息的实现流程图；
[0025]图7为特征库更新实现流程图；
[0026]图8为本发明提出的自动保存联系人信息的智能终端结构示意图。

【具体实施方式】
[0027]本发明提出一种自动保存联系人信息的方法，如图1为该方法实现流程图，包括:
[0028]步骤101:在通话过程中，根据用户指令获取用户通话录音；
[0029]步骤102:根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；
[0030]步骤103:语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；
[0031]步骤104:语音分析引擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；
[0032]步骤105:显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。
[0033]上述步骤102的具体方式可以为:当当前网络已连接并且用户许可时，选择云端语音分析引擎和在线语音特征库；当当前网络未连接或者用户未许可时，选择本地的离线语音分析引擎和离线语音特征库。
[0034]上述步骤102中，可以进一步根据用户位置信息选择对应的语音特征库。
[0035]上述步骤103的具体方式可以为:将用户通话录音按照语音特征分割为多个帧；其中，语音特征为:语音能量、频谱或过零率；对于相邻的两个帧，对前一帧的末尾Tl时间段内容和后一帧的初始T2时间段内容进行词句连续性分析，如果满足连续性要求，则将该相邻的两帧进行归并，形成一个语音段；否则，将一个帧单独作为一个语音段；其中，所述Tl和T2为预先设定的时间段。
[0036]上述步骤104的具体方式可以为:将语音段与语音特征库中的关键字进行对比，识别出联系人信息，并通过相应接口判断所述联系人信息是否格式正确，获取格式正确的联系人信息；其中，所述关键字为连续数字、单位、地址或姓名。
[0037]上述方法可以进一步包括:
[0038]步骤106:将所述保存的联系人信息转化为社交应用支持的格式，调用社交应用提供的接口，在社交应用中保存格式转化后的该联系人信息。
[0039]步骤107:将用户修改的联系人信息及对应的语音段上传至云端服务器，用于修正云端语音分析引擎和在线语音特征库；或者，根据用户修改的联系人信息及对应的语音段修正本地的离线语音分析引擎和离线语音特征库。
[0040]以下参照附图，分别介绍上述方法的各个步骤。
[0041]如图2为获取通话录音的实现流程图。
[0042]如图2所示，当用户需要记录录音的时候，可以通过特定的开关，启动智能终端的录音功能；当用户点击预定义的停止按钮或者用户挂机之后，停止录音，并将录音按照特定的文件名保存在特定的目录中。通话录音作为后续整个应用的基础元素。
[0043]上述特定的开关或按键包括:智能终端的物理按键开关，屏幕上的虚拟按键开关，用户特定的语音命令开关，或者用户特定的手势命令开关等。
[0044]如图3为选择语音分析引擎及加载语音特征库的实现流程图。
[0045]如图3所示，通过分析当前网络状况和用户配置信息，选择合适的语音分析引擎和语音特征库。具体来说，在智能终端连接网络并且获得用户许可的情况下，为取得更加精确的效果，选用云端语音分析引擎和在线语音特征库；在智能终端未连接网络或者没有获得用户许可的情况下，选用本地的离线语音分析引擎和离线语音特征库。同时，为了提高对通讯录已有人员语音的识别率，智能终端也可以加载本地的通讯录人员语音识别库。
[0046]此外，在选择语音特征库时，还可以考虑用户位置信息；S卩，自动获取用户位置信息，查询当地区域所用语言，加载相对应的语音特征库。同时，用户可以在软件配置中选择希望采用的语音特征库，这些语音特征库可以识别用户特殊的语言习惯，以满足特定用户要求，用于语音中特定信息的提取。
[0047]如图4为语音预处理的实现流程图。
[0048]如图4所示，语音分析引擎会将用户通话录音转化成能快速分析的语音段，主要通过以下步骤实现:
[0049]首先，语音分析引擎根据语音能量、频谱和过零点等语音特征信息计算语音间隔，据此对录音进行分成若干帧；
[0050]然后对每帧进行分析。当当前帧的末尾部分文字与下个帧的初始部分文字分析结果为连续时，将这2个帧进行归并，形成一个语音段；反之，直接将当前帧作为一个语音段。这些语音段将会用于后面的步骤。
[0051]之后，语音分析引擎将语音段与语音特征库中的数据进行对比，从中得出通讯录所需要的联系人信息。
[0052]如图5是一个简单的联系人号码匹配的流程图。
[0053]首先加载一个语音段，然后将该语音段和语音特征库中的特殊关键字进行比较，比如“地址”，“名字”，“住址”，“身份证”等。如果存在这些特殊关键字，则会将该语音段与对应特征库进行比较，提取信息。如果没有，则检测该语音段中是否存在11位连续数字，如果存在，则分析该段数字是否满足中国移动电话号码的号码首，如果满足就可以简单认为这是一个用户的移动电话号码。对于某些内容，比如身份证信息，QQ号等，还可以通过网络接口进行确认，从而保证数据的正确性。对于分析出来存在有效信息的语音段，智能终端手机会保存起来，供用户回溯使用。
[0054]另外，可以根据用户的选择增加语音特征库，从而实现对某些特定内容的识别功能，提高识别某一特殊的语音模式的正确率。
[0055]录音分析完成之后，将识别的联系人信息显示给用户，同时可以根据用户的指令播放对应的语音片段。用户收听之后，输入修改指令或确认信息；如果接收到用户输入的修改指令，对所述联系人信息进行相应修改，并保存修改后的联系人信息；如果接收到用户输入的确认指令，则直接保存自动识别出的联系人信息。在保存联系人信息时，可以调用通过智能终端的接口，将最终确定的联系人信息创建一个新的联系人，并保存在联系人列表中。
[0056]本发明还可以进一步将最终识别出的联系人信息保存在社交应用中，图6为在社交应用中创建联系人信息的实现流程图。
[0057]如图6所示，可以通过数据格式转化模块将获得的联系人信息转化成其他社交应用支持的格式，之后调用这些社交应用提供的接口，在社交应用中新建联系人。
[0058]如图7所示，本发明还可以在用户允许的条件下，将用户认为不正确的识别结果(也就是用户对自动识别的联系人信息的修改情况)及对应的语音段上传至云端服务器，用于修正云端语音分析引擎和在线语音特征库，从而帮助系统提升正确率和性能；同时，也可以根据用户修改的联系人信息及对应的语音段修正本地的离线语音分析引擎和离线语首特征库，以提闻识别率。
[0059]以上逐个步骤介绍了本发明提出的方法。以下举一个具体的实施例。
[0060]实施例一:
[0061]甲乙两人电话联系中，甲得知乙有丙的联系方式，便向乙询问。此时甲便可以在智能手机的菜单中选择“开始录音”这个按钮，启动智能手机的录音功能。智能手机便会将此次通话内容记录下来，并存在程序设定的文件夹之中。
[0062]通话结束之后，智能手机的程序会自动检索设定的文件夹，发现存在之前通话的录音文件，便会弹出提示窗口，提醒用户是否需要通过电话录音新建联系人。用户选择是之后，智能手机会开始对此段录音进行分析。
[0063]智能手机通过应用接口检测当前智能手机是否联接网络，之后检测用户的配置选项，是否允许使用云端的语音特征库和语音分析引擎。如果手机联接网络且获得了用户的授权，则智能手机联接云端的服务器。云端服务器收到语音分析请求之后，获取用户的配置选项，并根据用户当前的位置信息，加载对应的电话号码特征库，地址特征库，用户通讯录人员语音特征库和用户配置的其他语音特征库。这些特征库定义了特定词汇的一些模式，比如一串11位且符合中国移动电话号码构成规则的数字就可简单判定为电话号码，A市B街N号且能在数据库中搜索到对应地点的就可认为是地址。
[0064]云端服务器中的语音分析引擎会分析录音文件中语音的能量、频谱和过零率等特征信息，从而计算出语音间隔，然后根据间隔长度将录音进行分成若干帧。然后对每帧进行语音识别，然后得到每帧对应的语言文字。对于相邻的两个帧，会选取前一帧末尾的一段时间Tl和后一帧开始的一段时间T2(0〈T1，T2〈5s)，进行词句连续性分析；如果满足连续性要求，则将相邻的两帧进行归并，形成一个语音段，通过这种方法实现对录音的智能分段。
[0065]然后，对于每个语音段进行信息提取，具体来说就是将这些语音段与不同的语音特征库进行比对，判断是否含有满足特征模式的信息，如果存在此类信息，则将这些信息提取出来，最后反馈给用户。
[0066]以上步骤结束之后，智能手机会将识别的结果展示给用户，同时用户也可以播放识别结果对应的录音段加以确认，如果用户对某些信息不满意，可以根据需要进行修改。如果用户有需求，可以对识别的结果进行补充，以满足用户个性化的需求。
[0067]用户修改或补充完毕之后，可以点击导入按钮，智能手机会调用创建联系人的接口，从而以这些信息在通讯录中新建一个联系人。
[0068]本发明还可以支持用户将这些信息在社交应用中创建联系人。具体地，在获取到联系人信息之后，用户可以通过菜单选择在社交应用中创建该联系人，本发明会根据用户选择的社交应用，自动的将这些数据转化为该社交应用支持的格式，并通过这些社交应用提供的接口，将社交应用中为用户新建该联系人。
[0069]对于通讯录中存在的人员，智能手机会根据分析结果更新本地通讯录人员语音库。智能手机同时也会读取用户的设置，如果用户允许帮助云端提升性能，智能手机会将用户认为需要修改的信息和对应的语音段上传至云端，用于修正语音分析引擎和语音特征库。
[0070]上述实施例中所描述的内容是本发明较佳的实施方式，并非对本发明的限制，在不脱离本发明思想的前提下，任何显而易见的替换均在本发明的保护范围之内。
[0071]相应的，本发明还提出一种自动保存联系人信息的智能终端，如图8为该装置结构示意图，包括:
[0072]录音模块801，用于在通话过程中根据用户指令获取用户通话录音；
[0073]选择模块802，用于根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；
[0074]语音识别模块803，用于指示语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；并指示语音分析引擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；
[0075]修订模块804，用于显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。
[0076]上述智能终端中，选择模块802可以用于，当当前网络已连接并且用户许可时，选择云端语音分析引擎和在线语音特征库；当当前网络未连接或者用户未许可时，选择本地的离线语音分析引擎和离线语音特征库。
[0077]并且，选择模块802可以进一步根据用户位置信息选择对应的语音特征库。
[0078]上述智能终端中，语音分析引擎对用户通话录音进行预处理，生成多个语音段的方式可以为:将用户通话录音按照语音特征分割为多个帧；其中，语音特征为:语音能量、频谱或过零率；对于相邻的两个帧，对前一帧的末尾Tl时间段内容和后一帧的初始T2时间段内容进行词句连续性分析，如果满足连续性要求，则将该相邻的两帧进行归并，形成一个语音段；否则，将一个帧单独作为一个语音段；其中，所述Tl和T2为预先设定的时间段。
[0079]语音分析引擎将语音段与语音特征库中的数据进行对比，获取联系人信息的方式可以为:将语音段与语音特征库中的关键字进行对比，识别出联系人信息，并通过相应接口判断所述联系人信息是否格式正确，获取格式正确的联系人信息；其中，所述关键字为连续数字、单位、地址或姓名。
[0080]上述智能终端可以进一步包括:
[0081]数据格式化模块805，用于将所述保存的联系人信息转化为社交应用支持的格式，调用社交应用提供的接口，在社交应用中保存格式转化后的该联系人信息。
[0082]改进数据上传模块806，用于将用户修改的联系人信息及对应的语音段上传至云端服务器，用于修正云端语音分析引擎和在线语音特征库；或者，根据用户修改的联系人信息及对应的语音段修正本地的离线语音分析引擎和离线语音特征库。
[0083]综上，本发明克服了询问、记录、输入这种传统的创建联系人的方式，提供了一种直接从通话录音中提取联系人信息并创建联系人的方法，其包括获取通话录音，语音分析引擎选择和特征数据库加载，语音预处理，特征信息匹配，添加修改信息，创建联系人、数据格式转化和上传改进数据过程，有效避免了在询问他人联系方式的时候需要纸笔记录或者发送短信的麻烦，让用户能够轻松的谈话，并在通话之后得到相关的信息，轻松的生成所需要的联系人。
[0084]以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。
【权利要求】
1.一种自动保存联系人信息的方法，其特征在于，所述方法包括: 在通话过程中，根据用户指令获取用户通话录音；根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；语音分析引擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。
2.根据权利要求1所述的方法，其特征在于，所述根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库的方式为: 当当前网络已连接并且用户许可时，选择云端语音分析引擎和在线语音特征库；当当前网络未连接或者用户未许可时，选择本地的离线语音分析引擎和离线语音特征库。
3.根据权利要求1或2所述的方法，其特征在于，进一步根据用户位置信息选择对应的语首特征库。
4.根据权利要求1所述的方法，其特征在于，所述语音分析引擎对用户通话录音进行预处理，生成多个语音段的方式为: 将用户通话录音按照语音特征分割为多个帧；其中，语音特征为:语音能量、频谱或过零率；对于相邻的两个帧，对前一帧的末尾Tl时间段内容和后一帧的初始T2时间段内容进行词句连续性分析，如果满足连续性要求，则将该相邻的两帧进行归并，形成一个语音段；否则，将一个帧单独作为一个语音段；其中，所述Tl和T2为预先设定的时间段。
5.根据权利要求1所述的方法，其特征在于，所述语音分析引擎将语音段与语音特征库中的数据进行对比，获取联系人信息的方式为: 将语音段与语音特征库中的关键字进行对比，识别出联系人信息，并通过相应接口判断所述联系人信息是否格式正确，获取格式正确的联系人信息；其中，所述关键字为连续数字、单位、地址或姓名。
6.根据权利要求1、2、4或5所述的方法，其特征在于，所述方法进一步包括: 将所述保存的联系人信息转化为社交应用支持的格式，调用社交应用提供的接口，在社交应用中保存格式转化后的该联系人信息。
7.根据权利要求1、2、4或5所述的方法，其特征在于，所述方法进一步包括: 将用户修改的联系人信息及对应的语音段上传至云端服务器，用于修正云端语音分析引擎和在线语音特征库；或者，根据用户修改的联系人信息及对应的语音段修正本地的离线语音分析引擎和离线语音特征库。
8.一种自动保存联系人信息的移动终端，其特征在于，所述移动终端包括: 录音模块，用于在通话过程中根据用户指令获取用户通话录音；选择模块，用于根据当前网络状况和用户配置信息选择语音分析引擎及语音特征库；语音识别模块，用于指示语音分析引擎对所述用户通话录音进行预处理，生成多个语音段；并指示语音分析引擎将所述语音段与语音特征库中的数据进行对比，获取联系人信息；修订模块，用于显示所述联系人信息，并播放包含所述联系人信息的语音段；接收用户输入的修改指令，对所述联系人信息进行相应修改，保存修改后的联系人信息；或者，接收用户输入的确认指令，保存所述联系人信息。
9.根据权利要求8所述的智能终端，其特征在于，所述选择模块用于，当当前网络已连接并且用户许可时，选择云端语音分析引擎和在线语音特征库；当当前网络未连接或者用户未许可时，选择本地的离线语音分析引擎和离线语音特征库。
10.根据权利要求8或9所述的智能终端，其特征在于，所述选择模块进一步根据用户位置信息选择对应的语音特征库。
11.根据权利要求8所述的智能终端，其特征在于，所述语音分析引擎对用户通话录音进行预处理，生成多个语音段的方式为: 将用户通话录音按照语音特征分割为多个帧；其中，语音特征为:语音能量、频谱或过零率；对于相邻的两个帧，对前一帧的末尾Tl时间段内容和后一帧的初始T2时间段内容进行词句连续性分析，如果满足连续性要求，则将该相邻的两帧进行归并，形成一个语音段；否则，将一个帧单独作为一个语音段；其中，所述Tl和T2为预先设定的时间段。
12.根据权利要求8所述的智能终端，其特征在于，所述语音分析引擎将语音段与语音特征库中的数据进行对比，获取联系人信息的方式为: 将语音段与语音特征库中的关键字进行对比，识别出联系人信息，并通过相应接口判断所述联系人信息是否格式正确，获取格式正确的联系人信息；其中，所述关键字为连续数字、单位、地址或姓名。
13.根据权利要求8、9、11或12所述的智能终端，其特征在于，所述智能终端进一步包括: 数据格式化模块，用于将所述保存的联系人信息转化为社交应用支持的格式，调用社交应用提供的接口，在社交应用中保存格式转化后的该联系人信息。
14.根据权利要求8、9、11或12所述的智能终端，其特征在于，所述智能终端进一步包括: 改进数据上传模块，用于将用户修改的联系人信息及对应的语音段上传至云端服务器，用于修正云端语音分析引擎和在线语音特征库；或者，根据用户修改的联系人信息及对应的语音段修正本地的离线语音分析引擎和离线语音特征库。
【文档编号】H04M1/65GK104202458SQ201410444452
【公开日】2014年12月10日申请日期:2014年9月2日优先权日:2014年9月2日
【发明者】高伟, 朱俊申请人:三星电子（中国）研发中心, 三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高伟;朱俊
技术所有人：三星电子（中国）研发中心;三星电子株式会社
我是此专利的发明人

上一篇：通过nit版本号实现机顶盒节目更新的方法
上一篇：基于北斗短报文实现位置共享的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。