电话自然对话中关键信息的挖掘系统及其方法

文档序号:6458782阅读:186来源:国知局
专利名称:电话自然对话中关键信息的挖掘系统及其方法
技术领域
本发明通信网络语音数据挖掘技术,具体是指电话自然对话中关键信息的 挖掘系统及其方法。
背景技术
近年来,各种文本数据挖掘(Data Mining)技术(如潜在语义分析技术LSA 等等)已经广泛应用于电子商务中的商品推荐、文献搜索中的类似文献推荐等。 它能够找出购买该种商品的用户通常会购买其他何种商品,搜索该文献的用户 通常会査阅其他何种文献等有用信息,让用户更惬意地享受信息服务。信息提供 商根据数据挖掘技术收集统计、预测分析得到的数据、信息,为企业分析发现 商机,有针对性、有步骤地进行商业拓展、市场营销活动提供了有力的支撑。专利申请号为200610012722. 4的中国发明专利申请"一种预测新业务潜在 用户的数据挖掘模型"公幵了一种预测新业务潜在用户的数据挖掘模型,该数据挖掘模型包括以下步骤l)业务理解;2)数据理解;3)数据分析;4)数据挖掘,得到潜在用户。其采用了数据挖掘、数据仓库、0LAP分析等技术,通过分 析客户所有行为特征中的相似行为特征,搜索数据库,从而得到具有该相似行 为特征的其他客户,该其他客户即为潜在客户;所述相似行为特征包括有通信 次数、通信费用、短信次数、短信费用、GPRS费用、WAP费用等等;通过本发 明可以形成各种关联分析和预测分析,可以为企业的营销决策提供有效支持。 但是其所选取的行为特征只是属于"面"层次...匕的数据信息挖掘分析,无法获 取并分析客户的兴趣爱好或消费需求、习惯、范围、类别等更加具体、属于"点" 层次上的数据信息,从而使信息提供商无法为企业提供更具体更有针对性的数 据信息,所提供数据信息的商业价值受到局限。而人们在日常购物的电话对话中,往往会蕴含着大量反映通话双方的兴趣 爱好或消费需求、习惯、范围、类别等更加具体、属于"点"层次上的数据。 若能将目前己经发展成熟的语音识别(Speech Recognition)、数据挖掘(Data Mining)、 i吾音行为检测( Voice Activity Detection)、关键词检索(KWS, Key Word Spotting)、大型数据库平台(如SQL Server、 Oracle等)、数据库访问编程等技术进行整合,将语音技术和文本数据挖掘合为一体,形成一种从 语音中提取有用信息的数据挖掘方法,则该方法将具有广泛的商业应用前景。发明内容本发明的目的就是为了解决和克服现有技术存在的问题和缺陷,提供一种 电话自然对话中关键信息的挖掘系统,其可以从自有的电话语音数据库中挖掘 用户的兴趣爱好或消费需求、习惯、范围、类别等数据信息,建立用户偏好数 据库,可以为企业的营销决策提供更为可靠且全面有效的支持。本发明的另 一 目的是提供上述系统的电话自然对话中关键信息的挖掘方法。本发明的目的通过下述技术方案实现本电话自然对话中关键信息的挖掘 系统,包括依次连接的电话语音检出模块、语音关键词抽取模块、语音关键词 数据库、数据挖掘模块、用户偏好数据库,所述语音关键词抽取模块、语音关 键词数据库、数据挖掘模块、用户偏好数据库设置在计算机内;所述电话语音检出模块通过PSTN(Public Switched Tel印hone Network,公共交换电话网络) 或者Internet (采用VI0P: Voice over Internet Protocol,互联网协议语音 技术)与语音输出设备连接。为更好地实现本发明,所述语音关键词抽取模块包括维特比解码器及其分 别连接的特征提取模块、声学模型训练及转换模块、关键词配置及转换模块。所述数据挖掘模块包括无效词过滤模块及其分别连接的同义及近义分析推 荐模块、关联分析推荐模块、汇总模块;无效词过滤模块与所述语音关键词数 据库连接;所述同义及近义分析推荐模块包括依次连接的人工编辑模块、同义 及近义分析模块,所述关联分析推荐模块包括依次连接的潜在语义分析模块、 关联分析模块,所述同义及近义分析模块、关联分析模块分别与无效词过滤模 块连接;汇总模块与所述同义及近义分析模块、关联分析模块、用户偏好数据 库分别连接。所述语音输出设备包括固定电话、移动电话、麦克风。采用上述电话自然对话中关键信息的挖掘系统的挖掘方法,其包括以下步骤..(1) 通过电话语音检出模块从通信网络中采用VAD方法检出电话用户通话 过程中的语音片段,并传送给计算机内的语音关键词抽取模块;(2) 根据本系统使用者的数据挖掘需要,语音关键词抽取模块进行关键词配置操作,并从上述语音片段中抽取关键词;(3) 根据所述语音关键词抽取模块抽取的关键词,建立语音关键词数据库, 保存所述关键词和对应的电话用户信息;(4) 通过数据挖掘模块对所述语音关键词数据库进行挖掘分析处理,挖掘 出该电话用户多次使用的关键词,过滤掉无效的关键词,并挖掘所述关键词的 推荐的同义词、近义词、高度关联词的集合即用户使用偏好关键词进行汇总输 出;(5) 建立用户偏好数据库,保存并管理相应电话用户信息及用户使用偏好 关键词。为更好地实现本发明,所述关键词根据本系统使用者的需要进行设定。根 据应用领域的不同,关键词可以灵活配置。例如点歌台的服务器上的关键词, 可以配置所有歌手名字、所有歌曲名字、所有音乐流派名字、划分港台、划分 中日英韩等等。上述步骤(2)中,所述语音关键词抽取模块进行关键词配置操作,并从上述语音片段中抽取关键词的步骤包括通过关键词配置及转换模块对用户感兴趣的关键词进行配置操作,包括査 找、修改、添加、删除以及设定不同的语种(如汉语、英语、日语等等),得出 所有待检关键词,再转换成维特比解码器识别的格式后供给维特比解码器使用; 根据上述设定的语种,通过声学模型训练及转换模块,预先训练不同语种的声 学模型,转换成维特比解码器识别的格式后供给维特比解码器使用;语音经过 特征提取模块时,将语音波形信号转换成倒谱特征的语音信号,并输入到维特 比解码器中,同时,输入上述转换格式后的关键词和声学模型,通过维特比解 码器进行KWS检索即关键词检索,从而抽取语音片段中的关键词。上述步骤(4)中,所述数据挖掘模块对所述语音关键词数据库进行挖掘分 析处理的步骤包括(a)通过所述同义及近义分析推荐模块的人工编辑模块编辑、设定,输出关键词的同义词表及近义词表给同义及近义分析模块;根据语音关键词数据库 提供的用户多次使用关键词的记录,通过关联分析推荐模块的潜在语义分析模 块分析,获得一个潜在语义映射表,同时,针对每一个单独的用户,将其使用 一次以上的关键词的纪录经过无效词过滤模块过滤,得到有效的关键词集合, 将此集合求取划分,得到各个不同划分(如果若干个小集合的并集等于一个大集合,则称这几个小集合是大集合的- 个覆盖。如果覆盖的各个集合之间是没有交集,则该覆盖是一个划分。例如{1,2,3}和{3,4,5}并起来是{1,2,3,4,5}, 则称{1, 2, 3}和{3, 4, 5}是{1, 2, 3, 4, 5}的覆盖,但不是划分;同理U, 2, 3}和{4, 5} 也是{1, 2, 3, 4, 5}的覆盖,同时也是 一个划分);(b)同义及近义分析模块根据同义及近义词表、有效关键词进行分析、翻 译,得到所述关键词的推荐的同义词、近义词集合;通过关联分析模块从潜在 语义映射表中计算出各个划分的概率,取概率最大的划分作为最佳划分,对此划分应用映射关系,得到所述关键词的推荐的高度关联词集合;上述推荐的同 义词、近义词集合与高度关联词集合即是用户使用偏好关键词;(C)通过汇总模块将上述推荐的同义词、近义词、高度关联词集合进行汇 总输出。所述潜在语义映射表记录了 (原始关键词组合,推荐关键词组合)的二元 映射关系,并通过训练获得每一种映射关系的概率值。步骤(2)所述语音关键词数据库与步骤(5)所述用户偏好数据库可以采 用大型数据库平台实现,包括SQL Server、 Oracle等。本发明的工作原理是从自有的电话语音数据库中发掘用户的偏好,从而 为用户提供更贴心服务,同时发现潜在的商机,这在国内和国际上都是首创。 近年来,随着电子商务的快速发展,商家迫切需要知道用户购买商品时的偏好, 从而尽可能准确地向用户推荐自己的产品,于是文本数据挖掘技术迅速兴起, 它可以从多位用户多次购买的历史资料中发现产品之间的相关性,并有效地向 用户推荐自己的其他产品。由于语音技术的瓶颈,从语音中挖掘用户偏好,一 直没有人使用。语音并不像文字一样可以直接匹配,不同人说同样内容频谱信 息却不同,甚至同一个人两次说同样的话其频谱信息也不相同。语音的感知主 要靠频谱包络,频谱包络上下平移并不影响对语音内容的感知,频谱包络的高 频衰减或者高频提升也不影响对语音内容的感知。因此,语音的匹配是一种模 糊匹配,而字符串的匹配是一种机器内码的精确匹配。从语音中进行数据挖掘 困难重重。本发明利用维特比解码器进行KWS解码,将语音转换为文本信息, 从而将模糊的频谱匹配问题转换为机器内码的精确匹配问题。从而解决了语音 无法直接匹配的困难。然而任何语音识别算法都无法使识别率达到百分之百的 准确率,因此,本发明提出从海量数据库中挖掘用户偏好的思想,这样只需要 识别率超过50%就可以进行数据挖掘。总之,本发明利用成熟应用的潜在语义分析技术结合逐渐成熟的语音识别技术,首次提出了从电话语音中发掘用户偏好 的思想以及技术方案。针对语音识别技术的识别率瓶颈问题,采用海量数据库 进行数据挖掘,从而避免识别错误对用户偏好挖掘的影响。本发明的工作原理 要点如下(1) 由于KWS技术需要的计算复杂度大,所述电话语音模块利用VAD技术 进行有声无声检查,大大减轻了 KWS负担,减少了不必要的计算,加快了关键词检索的速度;(2) 所述语音关键词抽取模块利用成熟的KWS技术,从语音中检索出可能 的关键词;该模块通过声学模型和关键词配置模块,可以灵活地査找、添加、 删除、修改关键词,可以灵活设定不同的语言种类(汉语、英语、日语等等)。(3) 所述语音关键词数据库利用大型关系数据库系统(SQL Server、 Oracle 等等)对用户信息和用户通话的关键词进行管理,积累数据挖掘所需的文本信 息。任何语音关键词抽取技术都会有错检的时候,对一次通话进行数据挖掘时, 难免会将错误的关键词也进行挖掘;而当数据挖掘模块对一个巨大的多人多次 使用的数据库进行挖掘的时候,错误关键词表现出随机的扰动,而真正的关键 词则表现出一致的集聚,该问题可以避免。(4) 所述数据挖掘模块利用成熟的数据挖掘方法,可以找到关键词的同义 词,关键词的高度相关词。本发明的数据挖掘模块还具有另外一种功能即过 滤掉关键词数据库中的无效关键词的功能。随着数据库规模的一步步增大,通 过海量对数据挖掘,可以避免关键词抽取的随机错误带来的负面影响。(5) 用户偏好数据库利用大型关系数据库系统对用户信息和用户偏好进行 管理。它保存了数据挖掘模块的输出结果。综上所述,与现有的技术相比,本发明具有如下的优点及有益效果(1) 本发明将目前己经发展成熟的语音识别、数据挖掘、VAD、 KWS、大型 数据库平台、数据库访问编程等技术进行整合,将语音技术和文本数据挖掘合 为一体,形成一种从语音中提取有用信息的数据挖掘方法,可应用于固定电话、 移动电话、IP电话等场合,具有广泛的商业应用前景;(2) 通过本发明从自有的电话语音数据库中挖掘用户偏好信息和关联偏好 信息,可以为用户提供更贴心的服务;(3) 通过本发明从自有的电话语音数据库中挖掘用户偏好信息和关联偏好 信息,可以为广告客户提供更有效的广告对象;(4)本发明可以获取并分析客户的兴趣爱好或消费需求、习惯、范围、类 别等更加具体、属于"点"层次上的数据信息,可以据此为企业提供更具体更有针对性、富有商业价值的数据信息。


图1是本发明电话自然对话中关键信息的挖掘系统的结构框图。 图2是本发明所述语音关键词抽取模块的内部结构框图。 图3是本发明所述数据挖掘模块的内部结构框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述。 实施例一如图1所示,本电话自然对话中关键信息的挖掘系统,包括依次连接的电 话语音检出模块、语音关键词抽取模块、语音关键词数据库、数据挖掘模块、 用户偏好数据库,所述语音关键词抽取模块、语音关键词数据库、数据挖掘模 块、用户偏好数据库设置在计算机内;所述电话语音检出模块通过PSTN或者 Internet (采用VI0P技术)与语音输出设备连接。所述语音输出设备包括固定电话、移动电话、麦克风,可应用于固定电话、 移动电话、IP电话等场合。如图2所示,所述语音关键词抽取模块包括维特比解码器及其分别连接的 特征提取模块、声学模型训练及转换模块、关键词配置及转换模块。如图3所示,所述数据挖掘模块包括无效词过滤模块及其分别连接的同义 及近义分析推荐模块、关联分析推荐模块、汇总模块;无效词过滤模块与所述 语音关键词数据库连接;所述同义及近义分析推荐模块包括依次连接的人工编 辑模块、同义及近义分析模块,所述关联分析推荐模块包括依次连接的潜在语 义分析模块、关联分析模块,所述同义及近义分析模块、关联分析模块分别与 无效词过滤模块连接;汇总模块与所述同义及近义分析模块、关联分析模块、 用户偏好数据库分别连接。采用上述电话自然对话中关键信息的挖掘系统的挖掘方法,其包括以下步骤(1) 如图1所示,通过电话语音检出模块从通信网络中采用VAD方法检出 电话用户通话过程中的语音片段,并传送给计算机内的语音关键词抽取模块;(2) 根据本系统使用者的数据挖掘需要,语音关键词抽取模块进行关键词配置操作,并从上述语音片段中抽取关键词;所述关键词根据本系统使用者的 需要进行设定。根据应用领域的不同,关键词可以灵活配置。例如点歌台的服 务器上的关键词,可以配置所有歌手名字、所有歌曲名字、所有音乐流派名字、 划分港台、划分中日英韩等等。其中,如图2所示,所述语音关键词抽取模块进行关键词配置操作,并从 上述语音片段中抽取关键词的步骤包括通过关键词配置及转换模块对用户感兴趣的关键词进行配置操作,包括查 找、修改、添加、删除以及设定不同的语种(如汉语、英语、日语等等),得出 所有待检关键词,再转换成维特比解码器识别的格式后供给维特比解码器使用; 根据上述设定的语种,通过声学模型训练及转换模块,预先训练不同语种的声 学模型,转换成维特比解码器识别的格式后供给维特比解码器使用;语音经过 特征提取模块时,将语音波形信号转换成倒谱特征的语音信号,并输入到维特 比解码器中,同时,输入上述转换格式后的关键词和声学模型,通过维特比解 码器进行KWS检索即关键词检索,从而抽取语音片段中的关键词。(3) 根据所述语音关键词抽取模块抽取的关键词,建立语音关键词数据库, 保存所述关键词和对应的电话用户信息;(4) 通过数据挖掘模块对所述语音关键词数据库进行挖掘分析处理,挖掘 出该电话用户多次使用的关键词,过滤掉无效的关键词,并挖掘所述关键词的 推荐的同义词、近义词、高度关联词的集合即用户使用偏好关键词进行汇总输 出;其中,如图3所示,所述数据挖掘模块对所述语音关键词数据库进行挖掘分析处理的步骤包括(a) 通过所述同义及近义分析推荐模块的人工编辑模块编辑、设定,输出 关键词的同义词表及近义词表给同义及近义分析模块;根据语音关键词数据库提供的用户多次使用关键词的记录,通过关联分析推荐模块的潜在语义分析模 块分析,获得一个潜在语义映射表,同时,针对每一个单独的用户,将其使用 一次以上的关键词的纪录经过无效词过滤模块过滤,得到有效的关键词集合,将此集合求取划分,得到各个不同划分;(b) 同义及近义分析模块根据同义及近义词表、有效关键词进行分析、翻 译,得到所述关键词的推荐的同义词、近义词集合;通过关联分析模块从潜在 语义映射表中计算出各个划分的概率,取概率最大的划分作为最佳划分,对此划分应用映射关系,得到所述关键词的推荐的高度关联词集合;上述推荐的同 义词、近义词集合与高度关联词集合即是用户使用偏好关键词;(c)通过汇总模块将上述推荐的同义词、近义词、高度关联词集合进行汇 总输出。所述潜在语义映射表记录了 (原始关键词组合,推荐关键词组合)的二元 映射关系,并通过训练获得每- 种映射关系的概率值。(5)建立用户偏好数据库,保存并管理相应电话用户信息及用户使用偏好 关键词。步骤(2)所述语音关键词数据库与步骤(5)所述用户偏好数据库可以采 用大型数据库平台实现,包括SQL Server、 Oracle等。从而可以根据上述语音关键词数据库、用户偏好数据库为企业提供更具体 更有针对性、富有商业价值的数据信息。如上所述,便可较好地实现本发明,上述实施例仅为本发明的较佳实施例, 并非用来限定本发明的实施范围;即凡依本发明内容所作的均等变化与修饰, 都为本发明权利要求所要求保护的范围所涵盖。
权利要求
1、电话自然对话中关键信息的挖掘系统,其特征在于包括依次连接的电话语音检出模块、语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库,所述语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库设置在计算机内;所述电话语音检出模块通过PSTN或者Internet与语音输出设备连接。
2、 根据权利要求1所述电话自然对话中关键信息的挖掘系统,其特 征在于所述语音关键词抽取模块包括维特比解码器及其分别连接的特征 提取模块、声学模型训练及转换模块、关键词配置及转换模块。
3、 根据权利要求2所述电话自然对话中关键信息的挖掘系统,其特 征在于所述数据挖掘模块包括无效词过滤模块及其分别连接的同义及近 义分析推荐模块、关联分析推荐模块、汇总模块;无效词过滤模块与所述 语音关键词数据库连接;所述同义及近义分析推荐模块包括依次连接的人 工编辑模块、同义及近义分析模块,所述关联分析推荐模块包括依次连接 的潜在词义分析模块、关联分析模块,所述同义及近义分析模块、关联分 析模块分别与无效词过滤模块连接;汇总模块与所述同义及近义分析模 块、关联分析模块、用户偏好数据库分别连接。
4、 根据权利要求l一3任一项所述电话自然对话中关键信息的挖掘系 统,其特征在于所述语音输出设备包括固定电话、移动电话、麦克风。
5、 采用权利要求4所述电话自然对话中关键信息的挖掘系统的电话 自然对话中关键信息的挖掘方法,其特征在于包括以下步骤(1) 通过电话语音检出模块从通信网络中采用VAD方法检出电话用 户通话过程中的语音片段,并传送给计算机内的语音关键词抽取模块;(2) 根据本系统使用者的数据挖掘需要,语音关键词抽取模块进行 关键词配置操作,并从上述语音片段中抽取关键词;(3) 根据所述语音关键词抽取模块抽取的关键词,建立语音关键词 数据库,保存所述关键词和对应的电话用户信息;(4) 通过数据挖掘模块对所述语音关键词数据库进行挖掘分析处理, 挖掘出该电话用户多次使用的关键词,过滤掉无效的关键词,并挖掘所述 关键词的推荐的同义词、近义词、高度关联词的集合即用户使用偏好关键词进行汇总输出;(5)建立用户偏好数据库,保存并管理相应电话用户信息及用户使 用偏好关键词。
6、 根据权利要求5所述电话自然对话中关键信息的挖掘方法,其特征在于所述关键词根据本系统使用者的需要进行设定。
7、 根据权利要求5所述电话自然对话中关键信息的挖掘方法,其特征在于步骤(2)中,所述语音关键词抽取模块进行关键词配置操作, 并从上述语音片段中抽取关键词的步骤包括通过关键词配置及转换模块对用户感兴趣的关键词进行配置操作,包 括查找、修改、添加、删除以及设定不同的语种,得出所有待检关键词,再转换成维特比解码器识别的格式后供给维特比解码器使用;根据上述设定的语种,通过声学模型训练及转换模块,预先训练不同语种的声学模型,转换成维特比解码器识别的格式后供给维特比解码器使用;语音经过特征提取模块时,将语音波形信号转换成倒谱特征的语音信号,并输入到维特 比解码器中,同时,输入上述转换格式后的关键词和声学模型,通过维特比解码器进行KWS检索即关键词检索,从而抽取语音片段中的关键词。
8、 根据权利要求5所述电话自然对话中关键信息的挖掘方法,其特 征在于步骤(4)中,所述数据挖掘模块对所述语音关键词数据库进行挖掘分析处理的步骤包括(a)通过所述同义及近义分析推荐模块的人工编辑模块编辑、设定, 输出关键词的同义词表及近义词表给同义及近义分析模块;根据语音关键 词数据库提供的用户多次使用关键词的记录,通过关联分析推荐模块的潜 在语义分析模块分析,获得一个潜在语义映射表,同时,针对每一个单独 的用户,将其使用一次以上的关键词的纪录经过无效词过滤模块过滤,得 到有效的关键词集合,将此集合求取划分,得到各个不同划分;(b)同义及近义分析模块根据同义及近义词表、有效关键词进行分析、翻译,得到所述关键词的推荐的同义词、近义词集合;通过关联分析模块从潜在语义映射表中计算出各个划分的概率,取概率最大的划分作为 最佳划分,对此划分应用映射关系,得到所述关键词的推荐的高度关联词集合;上述推荐的同义词、近义词集合与高度关联词集合即是用户使用偏 好关键词;(C)通过汇总模块将上述推荐的同义词、近义词、高度关联词集合 进行汇总输出。
9、 根据权利要求8所述电话自然对话中关键信息的挖掘方法,其特征在于所述潜在语义映射表记录了 (原始关键词组合,推荐关键词组合) 的二元映射关系,并通过训练获得每一种映射关系的概率值。
10、 根据权利要求5所述电话自然对话中关键信息的挖掘方法,其特征在于步骤(2)所述语音关键词数据库与步骤(5)所述用户偏好数据 库可以采用大型数据库平台实现,包括SQL Server、 0mcle。
全文摘要
本发明提供电话自然对话中关键信息的挖掘系统及其方法,其系统包括依次连接的电话语音检出模块、语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库,所述语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库设置在计算机内;所述电话语音检出模块通过PSTN或者Internet与语音输出设备连接。本发明可以从电话语音中挖掘用户的兴趣爱好或消费需求、习惯、范围、类别等数据信息,建立用户偏好数据库,可以为企业的营销决策提供更为可靠且全面有效的支持;可应用于固定电话、移动电话、语音聊天等场合,具有广泛的商业应用前景。
文档编号G06F17/30GK101231660SQ20081002636
公开日2008年7月30日 申请日期2008年2月19日 优先权日2008年2月19日
发明者超 林 申请人:超 林
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1