控制方法、控制程序以及控制装置的制造方法

文档序号:8927071阅读:514来源:国知局
控制方法、控制程序以及控制装置的制造方法
【技术领域】
[0001 ] 本发明涉及控制方法、控制程序以及控制装置。
【背景技术】
[0002]已知一种为了在从对象用户终端向其它用户终端分配图像时,减少对网络的负荷,对象用户终端根据图像数据计算特征量并向其它用户终端发送的技术(例如,参照下述专利文献I)。另外,已知一种根据特征量来分组各数据的技术。
[0003]另外,已知一种为了减少移动电话中的处理负荷,代理服务器代替移动电话,对根据来自移动电话的内容的阅览请求,从内容服务器获取的内容进行分析的技术(例如,参照下述专利文献2)。
[0004]专利文献1:日本特开2004 - 46641号公报
[0005]专利文献2:日本特开2005 - 56096号公报
[0006]然而,在根据各数据具有的特征量来分组各数据时,存分类精度因特征量的种类而降低的问题点。

【发明内容】

[0007]在一个方面,本发明的目的在于提供一种能够实现分类精度的提高的控制方法、控制程序以及控制装置。
[0008]根据本发明的一个方面,提出一种控制方法、控制程序以及控制装置,其中,根据规定数据具有的各种特征量中的规定种类的特征量将上述规定数据分类为多个组中的任意一个并使存储部存储的计算机执行如下的处理:针对上述多个组的每个,将分类出的表示上述规定数据中的特征量的分布位置的信息写入上述存储部;基于写入的表示上述特征量的分布位置的信息来计算表示上述多个组间的上述特征量的分布位置间的接近度的信息;在计算出的表示上述分布位置间的接近度的信息满足规定条件的情况下,根据上述各种特征量中的与上述规定种类不同种类的特征量将与上述规定数据同种的数据分类为上述多个组中的任意一个,并使上述存储部存储。
[0009]根据本发明的一个方面,能够实现分类精度的提高。
【附图说明】
[0010]图1是表示增加特征量的种类的例子的说明图。
[0011]图2是表示减少特征量的种类的例子的说明图。
[0012]图3是表示实施方式所涉及的控制装置和分类装置的每个的硬件构成例的框图。
[0013]图4是表示存储针对各簇的多个种类的每个的特征量的数据库的说明图。
[0014]图5是表示分类装置的功能构成的框图。
[0015]图6是表示基于簇分析部的聚类的说明图。
[0016]图7是表示控制装置的功能构成的框图。
[0017]图8是表示基于分类装置的聚类处理顺序的一个例子的流程图。
[0018]图9是表示基于控制装置的控制处理顺序的一个例子的流程图。
[0019]图10是表示基于控制装置的详细的控制处理顺序的一个例子的流程图。
[0020]图11是表示基于控制装置的详细的控制处理顺序的其它例子的流程图。
【具体实施方式】
[0021]以下参照添加附图,详细地对本发明所涉及的控制方法、控制程序以及控制装置的实施方式进行说明。
[0022]图1是表示增加特征量的种类的例子的说明图。进行图1的聚类的系统100具有控制装置101和分类装置102。在图1的例子中,根据各数据具有的特征量X以及特征量Y将各数据分类为3个组。图表111中示出各数据的特征量X和特征量Y的组合的分布位置。此处的组称为簇,将进行分类称为聚类。聚类的利用例例如例举用于对录音的会议的声音数据的各数据标记出席者的聚类。例如,作为数据,例举录音的声音数据等,作为簇,例举录音成声音数据的会议的出席者。
[0023]控制装置101是对根据规定数据具有的各种特征量中的规定种类的特征量将规定数据聚类为多个簇中的任意一个的计算机即分类装置102进行控制的计算机。规定数据如上述,例举声音数据等。控制装置101例如是服务器。分类装置102例如是移动终端装置。例如从数字化的声音数据获得MFCC (Mel — Frequency Cepstral Coefficient:梅尔频率倒谱系数)、音调、GPR(Glottal Pulse Rate:声门脉冲率)、VTL(Vocal Tract Length:声道长度)等多个种类的特征量。分类装置102能够计算多个种类的特征量的全部,并能够根据来自控制装置101的指示来变更对多个种类中的哪个种类进行计算。对于多个种类中的规定种类,是分类装置102能够计算的特征量的种类中的、任意或者由用户指定,或者过去通过控制装置101指示的种类。在图1的例子中,规定种类为I个以上的种类。
[0024]控制装置101针对多个簇的每个,将表示规定数据中的特征量的分布位置的信息写入存储部。此处,该信息是通过分类装置102分类出的表示规定数据中的特征量的分布位置的信息。对于表示特征量的分布位置的信息,可以从分类装置102接收,也可以从控制装置101能够访问的存储装置读取,也可以通过输入单元从控制装置101的用户输入。此处,设控制装置101接收从分类装置102发送的与分布位置有关的信息。另外,存储部是RAM、磁盘等的控制装置101具有的存储装置。表示有关各簇的特征量的分布位置的信息例如可以是被分类成各簇的数据的特征量本身,也可以是通过将特征量模型化而获得的表示有关各簇的特征量的分布范围的信息。
[0025]在图1的例子中,各图表111、112上所示的三角形、正方形,菱形的形状的各点表示与被归一化的特征量的分布位置有关的信息。图表111上所示的各圆圈是表示通过根据被归一化的特征量进行模型化而获得的有关各簇的分布范围arll、arl2、arl3的信息。图表112上也同样地,未附加符号,但存在表示有关簇的分布范围的信息。具体地表示分布范围aril、arl2、arl3的信息具有中心位置、椭圆的直径的长度等即可。与特征量的分布位置有关的信息可以是多个信息的集合,也可以如表示有关各簇的特征量的分布范围arll、arl2、arl3的信息那样是一个信息。
[0026]由于与特征量的分布位置有关的信息被归一化,所以图1所示的各图表111、112的轴的单位相同,即使是不同的种类的特征量,控制装置101也能够比较位置、长度。对于归一化,可以由分类装置102进行,也可以由控制装置101进行。通过在分类装置102进行聚类时对各特征量被归一化所得的值进行模型化,而能够使从分类装置102向控制装置101的通信量降低。
[0027]接下来,控制装置101基于写入到存储部的表示特征量的分布位置的信息,导出表示多个簇之间的特征量的分布位置的接近度的信息。在图1的例子中,表示接近度的信息是表示分布范围arll、arl2、arl3的重复程度的信息。更具体而言,是连结各分布范围arll、arl2、arl3的中心间的线段中的重复的区域所包含的线段的长度。如上述,由于表示分布范围arll、arl2、arl3的信息被归一化,所以即使是不同的种类的特征量也能够进行比较。在图1的例子中,表示簇a与簇b的接近度的信息为长度dl,但表示簇a与簇c的接近度的信息为0,表示簇b与簇c的接近度的信息为O。
[0028]或者,例如,表示接近度的信息可以是有关多个簇的每个的特征量的平均值、中央值间的分布位置的距离。或者,例如,表示接近度的信息也可以是有关多个簇的每个的特征量中的分布位置最近的特征量的分布位置间的距离,也可以是最远的特征量的分布位置间的距离。
[0029]控制装置101判定导出的表示接近度的信息是否满足规定条件。例如,规定条件是指比规定的接近度近。规定的接近度由控制装置101的设计者设定。在图1的例子中,例如,控制装置101判定表示簇a与簇b的接近度的信息即dl是否是阈值以上。阈值也可以由控制装置101的设计者设定,也可以是经由输入单元由用户输入的值。另外,阈值被存储在控制装置101能够访问的存储装置中。
[0030]控制装置101在判定为满足规定条件的情况下,进行根据各种特征量中的与规定种类不同种类的特征量使分类装置102将与规定数据同种的数据聚类为多个簇中的任意一个的控制。与规定数据同种的数据是具有与规定数据同种的特征量的数据,与规定数据同种的数据可以是同一数据,也可以是不同的数据。从各种特征量中的与规定种类不同的种类选择哪个种类后述。例如,控制装置101可以通过对分类装置102发送表示根据不同的种类进行分类的信息来控制分类装置102。由此,能够变更特征量的种类,并实现分类精度的提高。
[0031]另外,控制装置101在判定为满足规定条件的情况下,进行根据追加与规定种类不同的种类后的种类的特征量使分类装置102将与规定数据同种的数据聚类为多个簇中的任意一个的控制。在图表112中,由于追加了特征量Z,所以与图表111相比轴增加一个。由此,能够追加特征量的种类,并实现分类精度的提高。<
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1