基于蚁群聚类算法的码书分类方法及其码书分类装置的制作方法

文档序号：2830193阅读：309来源：国知局

专利名称：基于蚁群聚类算法的码书分类方法及其码书分类装置的制作方法
技术领域：
本发明涉及一种语音信号处理及群智能算法技术，具体是一种采用优化蚁群聚类算法进行的码书分类方法及其码书分类装置。
背景技术：
矢量量化技术在实际中的应用非常广泛，涉及到了数字图像和语音压缩编码、语音识别、情感识别、文献检索及数据库检索等领域。矢量量化器主要由编码器和解码器组成，其中包含有相同或不同的码书。量化时输入矢量通常需要根据失真测度和矢量量化系统编码器码书中的所有码字进行失真计算，以找到失真最小的匹配码字，即采用的是穷尽搜索矢量量化的方法。穷尽搜索矢量量化器的主要优点是可以根据某一失真测度找到最匹配的码字，但其量化时的计算复杂度最大。因此提出了许多降低量化复杂度的策略，这些策略一方面从矢量量化器的构成来考虑，另一方面从码字搜索算法考虑。约束矢量量化器就是在穷尽搜索矢量量化器基础上附加各种约束条件以降低量化复杂度为目的而提出的，由此产生相应的一些编码算法和码书设计技术。一种能降低量化复杂度的方法是对量化器码书中的码字进行一些约束，使其码字不再具有任意分布，而是以一种受约束的方式分布，从而使最近邻搜索变得更容易。作为一种约束矢量量化器，分类矢量量化器原理是根据量化参数的特性对输入矢量进行分类，然后在相应类的码书中搜索最近码字，各类码书的大小可以互不相同，合起来就构成量化器的总码书。由于这种量化器各子码书的尺寸都比较小，所以时间复杂度得到了降低。分类矢量量化器量化时会产生两个索引，一个是码书索引，一个是码字索引，其中码书索引用于确定输入矢量码字搜索过程需要在哪个码书中进行，码字索引是输入矢量在确定好的码书中搜索到最近邻码字的索引。分类矢量量化器码书的设计过程通常是先用分类器将输入训练矢量集合分为若干个子集，然后采用码书设计算法产生相应的码书，这些码书合起来就构成最终的总码书。影响分类矢量量化器性能的关键还在于在总码书大小一定的条件下如何确定各类码书的大小使得量化器的总体性能最佳。通常采用两种方法来确定各类码书大小，一种是比特分配算法，另一种是在总码书大小一定的情况下，认为各类码书的大小与训练子集的大小成正比。由于分类矢量量化器需要码书索引和码字索引，因此其量化比特数与分类器个数及各码书大小都有关。现有蚁群算法是一种用来在图中寻找优化路径的概率搜索算法，由意大利学者 MarcoDorigo等人于20世纪90年代初期提出，其灵感源于蚂蚁在寻找食物过程中发现路径的行为，是一种启发式仿生寻优算法，主要用于求解复杂的组合优化问题。迄今为止，蚁群算法已经成功地解决了许多实际问题，如旅行商问题、二次分配问题、Job-Shop调度问题及离散优化问题等。将蚁群算法用于聚类分析，灵感源于蚂蚁堆积他们的尸体和分类他们的幼体行为。由于现实的蚁群运动过程接近于实际的聚类问题，所以近年来涌现出大量的蚁群聚类算法。基于蚁堆形成原理的聚类算法最早是Deneubourg等提出的，他们根据数据对象与其周围对象的相似性，让蚂蚁随机地移动、拾起或放下数据对象，以达到聚类数据的目的，这个基本模型已成功地应用于机器人等领域。Lumer等首先改进此算法，提出了 LF算法，在用蚁群算法进行聚类分析方面取得了一定成效。蚁群搬运物体的基本机制是一只随机移动的无负载蚂蚁在遇到一个物体时，如果该物体与之所在位置周围物体的相似度越小，则“拾起”该物体的概率越大；反之，一只随机移动的有负载蚂蚁所背物体与其所在位置物体相似度越大，则“放下”该物体的概率越大。这种机制可以保证不破坏大堆的物体，并且能够聚集小堆的物体。基于此，研究者提出了蚁群聚类算法的基本思路。其主要思想是将待聚类数据初始随机地散布在一个二维平面内，然后在该平面上产生一些虚拟蚂蚁对其进行聚类分析。首先将数据对象随机地投影到一个二维平面，然后每只蚂蚁随机选择一个数据对象，根据该对象在局部区域的相似性而得到的概率，决定蚂蚁是否“拾起”、“移动”或“放下”该对象。经过有限次迭代，平面上的数据对象按其相似性而聚集，最后得到聚类结果和聚类数目。上述蚁群聚类算法影响算法收敛速度的主要因素有负载蚂蚁放下物体的速度以及无负载蚂蚁拾起物体的速度，而影响这两个速度的关键在于算法中的放下概率函数以及拾起概率函数与系统产生的随机概率之间的关系。由于现有蚁群聚类算法相似度函数取值变化时，放下概率函数和拾起概率函数随其取值改变所发生的变化不是很显著，使放下概率函数和拾起概率函数取值长时间不能大于系统产生的随机概率，导致有负载蚂蚁应该放下物体时不能立即放下物体，无负载蚂蚁应该拾起物体时不能立即拾起物体，使二维平面内的物体不能以较快的速度按其相似性形成聚类结果，从而直接影响了聚类算法的收敛速度和聚类结果。

发明内容
本发明的目的是提供一种基于蚁群聚类算法的码书分类方法及其码书分类装置，以解决穷尽搜索矢量量化器码书中码字的排列方式无序，码字搜索范围大，时间复杂度高的问题，本发明为了解决上述问题所采取的技术方案如下一种基于蚁群聚类算法的码书分类方法，基于导抗谱频率参数，该方法包括码书分类过程用码书设计算法设计的码书，用基于蚁群聚类算法的码书分类方法分类为子码书，每个子码书用一个子码书特征值代表；码书重排过程用码书分类方法分类的各子码书，按与子码书特征值相同的排列顺序组合在一起构成分类码书。本发明上述技术方案中所述的蚁群聚类算法是采用下述相似度函数
权利要求
一种基于蚁群聚类算法的码书分类方法，基于导抗谱频率参数，该方法包括如下步骤码书分类过程码书设计算法设计的码书，用基于蚁群聚类算法的码书分类方法分类为子码书，每个子码书用一个子码书特征值代表；码书重排过程用码书分类方法分类的各子码书，按与子码书特征值相同的排列顺序组合在一起构成分类码书。
2.如权利要求1所述的方法，其蚁群聚类算法是采用下述相似度函数
3.如权利要求1或2所述的方法，其蚁群聚类算法中的拾起概率函数和放下概率函数表示如下拾起概率函数式(2-4)中相似度f根据式(1)确定；b = 0. 3，ki = 11. 11 ；放下概率函数
4.如权利要求1或2所述的方法，其蚁群聚类算法中的孤立点和非典型分类区的处理方法如下其孤立点处理方法是用最近邻准则进行重新分类；其非典型分类区处理方法是用最近邻准则与其它分类区进行合并。
5.如权利要求1或2所述的方法，其蚁群聚类算法中的随机概率范围是根据式(2-4) 和式(3-6)的计算值统计结果确定。
6.一种基于蚁群聚类算法的码书分类方法的码书分类装置，该装置包括子码书特征值单元、子码书码字个数单元和分类码书单元；所述的子码书特征值单元是存储用码书分类方法得到的子码书特征值，用于对输入的待量化矢量进行码书分类时确定子码书的位置，子码书特征值单元位于码书分类矢量量化器装置的编码器单元中；所述的子码书码字个数单元是存储用码书分类方法得到的各子码书包括的码字个数，用于对输入的待量化矢量进行码书分类时确定子码书的位置以及子码书的范围，子码书码字个数单元位于码书分类矢量量化器装置的编码器单元中；分类码书单元是存储由子码书按与子码书特征值单元内容相同的顺序排列得到的码书，位于码书分类矢量量化器装置编码器单元和解码器单元。
7.如权利要求6所述的码书分类装置，其码书分类矢量量化器是包含码书分类装置的矢量量化器；码书分类矢量量化器装置是由编码器单元和解码器单元构成。
8.如权利要求6和7所述的码书分类装置，其编码器单元包括码书分类装置和码书分类量化模块，码书分类量化模块用于对输入的待量化矢量在码书分类装置中确定对应的量化矢量，并将量化矢量的量化索引写入码流。
9.如权利要求6和7所述的码书分类装置，其解码器单元包括分类码书单元和解码模块，所述的解码模块用于接收通过码流传送到解码器单元的量化索引，并在分类码书单元中搜索对应量化索引值的输入待量化矢量的重构矢量。
全文摘要
一种基于蚁群聚类算法的码书分类方法及其码书分类装置，本方法码书分类过程是将设计的码书用码书分类方法分为多个子码书，分类子码书由子码书特征值代表，码书分类方法采用蚁群聚类算法，蚁群聚类算法中提出了拾起概率函数和放下概率函数，并使随机概率取值范围与概率函数取值相结合，加快了算法收敛速度；码书重排过程是将子码书按子码书特征值顺序排列构成分类码书；本装置由子码书特征值单元、子码书码字个数单元和分类码书单元构成。本发明构成的码书分类矢量量化器量化时通过子码书特征值和子码书码字个数信息，将码书分类矢量量化器码字搜索范围限定为分类码书的子码书，减小了矢量量化器码字的搜索范围，降低了矢量量化器的时间复杂度。
文档编号G10L15/14GK101944358SQ20101026715
公开日2011年1月12日申请日期2010年8月27日优先权日2010年8月27日
发明者张雪英, 李凤莲, 王峰, 马朝阳申请人:太原理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李凤莲;张雪英;马朝阳;王峰
技术所有人：太原理工大学
我是此专利的发明人

上一篇：一种电子耳蜗及其声音信号处理方法
上一篇：基于重音突显度的英语发音质量评价方法