视频会议装置、控制方法和程序的制作方法

文档序号：5837842阅读：143来源：国知局

专利名称：视频会议装置、控制方法和程序的制作方法
技术领域：
本发明涉及^L频会议装置、控制方法和程序，具体地涉及使得对诸如成像方向的成像信息的自动设置能够例如在视频会议中对演讲者成像的视频会议装置、控制方法和程序。
背景技术：
例如，在视频会议所用的视频会议装置中，控制视频会议装置的摄像机以便在预定尺寸内捕获正在演讲的演讲者的图像，并且由摄像机获得的被捕获图像被发送给通信伙伴的视频会议装置。例如，JP-A-7-92988 (专利文献1 )公开了一种视频切换装置，其控制摄像机以便将视频切换到对处于检测声音的麦克风的位置处的画面进行成像 (具体地，见专利文献1的
、
和
段)。发明内容但是在专利文献1中公开的视频切换装置中，需要预先手动设置各个麦克风的位置。另外，在改变各个麦克风的位置的情况下，用户需要在改变后再次手动设置各个麦克风的位置。期望使得能够自动设置诸如成像方向的成像信息以对演讲者成像。根据本发明的实施例的视频会议装置或程序是用于视频会议的视频会议装置或使得计算机运作为用于视频会议的视频会议装置的程序，该视频会议装置包括发光控制部件，用于使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光；发光位置检测部件，用于检测发光位置，该发光位置是通过由第一成像部件对来自声音采集部件中所包括的发光部件的光进行成像而获得的图像中的光的位置；布置方向检测部件，用于基于发光位置来检测布置方向，该布置方向是布置声音采集部件的方向；以及成像控制部件，用于基于布置方向来控制成像方向，该成像方向是用于成像图像的第二成像部件捕获图像的方向。第一成像部件可以对低分辨率图像进行成像，并且第二成像部件可以对高分辨率图像进行成像。第一和第二成像部件可以是相同的。发光控制部件可以使得在声音采集部件中所包括的多个发光部件中的每个以预定顺序发光，或可以使得在声音采集部件中所包括的多个发光部件中的每个以各自的发光模式同时发光，发光位置检测部件可以检测多个声音采集部件的每个的发光位置，布置方向检测部件可以基于发光位置来检测多个声音采集部件中的每个的布置方向，以及成像控制部件可以基于在多个声音采集部件中正在采集最高级声音的声音采集部件的布置方向来控制成像方向。根据本发明的实施例的视频会议装置还可以包括距离计算部件，用于从声音采集部件采集从用于输出预定声音的声音输出部件输出的预定声音的时刻和声音输出部件输出该预定声音的时刻，来计算声音输出部件和声音采集部件之间的距离，其中，成像控制部件还基于声音输出部分和声音采集部件之间的距离，控制在由第二成像部件成像时的放大倍率。在根据本发明的实施例的视频会议装置中，可以以复数提供声音釆集部件、第一成像部件和第二成像部件中的一个或多个。根据本发明的实施例的控制方法是一种控制用于视频会议的视频会议装置的方法，该方法包括步骤使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光；检测发光位置，该发光位置是通过由第一成像部件对来自在声音采集部件中所包括的发光部件的光进行成像而获得的图像中的光的位置；以及基于发光位置来检测布置方向，该布置方向是布置声音采集部件的方向，其中，在该视频会议装置中，成像方向是基于布置方向来控制用于成像图像的第二成像部件捕获图像的方向。根据本发明的实施例，使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光，检测发光位置，该发光位置是通过由第一成像部件对来自在声音采集部件中所包括的发光部件的光进行成像而获得的图像中的光的位置，以及基于发光位置来检测布置方向，该布置方向是布置声音采集部件的方向。然后基于布置方向控制成像方向，该成像方向是用于成像图像的第二成像部件捕获图像的方向。根据本发明的实施例，可以自动地设置用于对视频会议中的演讲者进行成像的诸如成像方向的成像信息。

图1示出描述本发明的实施例适用的视频会议系统的示范配置的方块图；图2示出描述配置图1所示的视频会议系统的视频会议装置11的第一实施例的示范配置的方块图；图3示出描述由运行预定程序的、图2所示的CPU32功能地实现的控制部分32a的示范配置的方块图；图4示出图3所示的发光位置检测部分101检测发光位置(x, y)的发光位置检测处理的图；图5示出图示^r测布置麦克风37至39的方向的布置方向^r测处理的流程图；图6示出图示控制摄像机34的摄像机控制处理的流程图；图7示出描述配置图1所示的视频会议系统的视频会议装置11的第二实施例的示范配置的方块图；图8示出描述由运行预定程序的、图7所示的CPU32功能地实现的控制部分232a的示范配置的方块图；图9示出图示由图8所示的距离计算部分301进行的计算扬声器203和麦克风37至39的每个之间的距离的方法的图；图10示出图示计算摄像机34的放大倍率的缩放因子计算处理的流程图；图11示出描述视频会议装置401和基于从LED发射的光来控制视频会议装置401的定向设备402的图；图12示出描述由运行预定程序的、图11所示的CPU432功能地实现的控制部分432a的示范配置的方块图；以及图13示出图示远程控制视频会议装置401的远程控制处理的流程图。
具体实施方式
下文中，将描述本发明的实施例。以下是本发明的配置要求与说明书或附图的实施例之间的对应关系的例子。描述其用于确认在说明书或附图中描述了支持本发明的实施例。因此，即使有在说明书或附图中描述、但在此没有作为对应于本发明的配置要求的实施例而描述的实施例，也不意味着该实施例不对应于那些配置要求。相反，即使在此作为对应于配置要求的实施例描述了该实施例，也不意味着该实施例不对应于除了那些配置要求以外的配置要求。根据本发明的实施例的视频会议装置或程序是用于视频会议的视频会议装置(例如，图1所示的视频会议装置lla或lib),或使得计算机运作为用于视频会议的视频会议装置的程序，该视频会议装置包括发光控制部分(例如，图3所示的发光控制部分100),用于使得被包括在采集声音的声音采集部件(例如，图2所示的麦克风37、 38或39)中的用于发光的发光部件(例如图2所示的LED37a、 38a或39a)以特定发光模式来发射光；发光位置检测部分(例如，图3所示的发光位置检测部分101 ),用于在由用于成像图像的第一成像部件(例如，图2所示的摄像机34)获得的图像中检测作为光的位置的发光位置，该第一成像部件捕捉来自在声音采集部件中所包括的发光部件的光；布置方向检测部件(例如，图3所示的摇动/倾斜角获取部分104), 用于基于发光位置检测作为布置声音采集部件的方向的布置方向；以及成像控制部件(例如，图3所示的PTZ控制部分106),用于基于布置方向来控制作为用于成像图像的第二成像部件(例如图2所示的摄像机34)捕获图像的方向的成^f象方向。根据本发明的实施例的视频会议装置可以进一步包括距离计算部件(例如，图8中的距离计算部分301),用于从声音采集部件采集预定声音的定时和声音输出部分输出预定声音的定时计算声音输出部分与声音采集部件之间的距离，该预定声音是从用于输出预定声音的声音输出部分输出的，其中成像控制部件还在第二成像部件成像时基于声音输出部分和声音采集部件之间的距离来控制放大倍率。根据本发明的实施例的控制方法是控制用于视频会议的视频会议装置的方法，该方法包括步骤使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光(例如图5所示的步骤S32 );检测作为通过第一成像部件对来自声音采集部件中的发光部件的光成像而获得的图像中的光的位置的发光位置(例如，图5所示的步骤S34);以及基于发光位置检测作为布置声音采集部件的方向的布置方向(例如，图5所示的步骤 S41),其中在该视频会议装置中，基于布置方向控制作为用来成像图像的第二成像部件捕获图像的方向的成像方向。下文中，将参考附图描述本发明的实施例。图1示出描述本发明的实施例适用的视频会议系统的示范配置的方块图。图1所示的视频会议系统配置有视频会议装置lla和llb。例如，^L频会议装置lla和llb通过诸如因特网或LAN (局域网)的通信线路彼此连接，其中在用于视频会议的视频会议装置lla和llb之间交换图像和声音。换句话说，例如，^L频会议装置lla和11b每个都向通信伙伴的^L频会议装置发送通过捕获会议场景或通过采集会议中的演讲的声音而获得的捕获图像或声音(的信号)，其中，该会议是在安置了视频会议装置lla和lib的会议室中举行的。另外，视频会议装置lla和lib接收从通信伙伴视频会议装置发送的捕获图像和声音，并向监视器和扬声器输出图像和声音。此外，在下文中，在不需要区分视频会议装置lla和lib的情况下，视频会议装置lla和lib筒称为视频会议装置11。图2示出描述视频会议装置11的第一实施例的示范配置的方块图。图2所示的视频会议装置11配置有操纵部分31、 CPU(中央处理单元)32、具有内插的存储器33a的电动机操作的摇动头33、摄像机34、图像处理单元35、存储部分36、每个都具有LED (发光二极管)37a到39a的麦克风 37至39、声音处理单元40、通信部分41和输出部分42。操纵部分31配置有视频会议装置11的电源按钮。例如，当用户操纵该操纵部分31时，操纵部分31向CPU32供应对应于用户操纵的操纵信号。 CPU 32执行被存储在存储部分36中的程序来控制电动机操作的摇动头33、摄像机34、图像处理单元35、存储部分36、麦克风37至39、 LED 37a 到39a、声音处理单元40、通信部分41和输出部分42,并进行各种其他处理。换句话说，例如，操纵部分31向CPU 32供应操纵信号，然后CPU 32 进行对应于来自操纵部分31的操纵信号的处理。另外，CPU32供应来自通信伙伴视频会议装置lla或llb的捕获图像和声音，该捕获图像和声音被从通信部分41供应至输出部分42以输出。另外，CPU32向通信部分41供应来自图像处理单元35的、经过图像处理之后的捕获图像和对应于来自声音处理单元40的声音信号的声音，以将它们发送给通信伙伴视频会议装置lla或llb。另外，CPU 32基于稍后描述的从图像处理单元35供应的经过图像处理的LED图像和从声音处理单元40供应的声音信号，进行稍后描述的各种处理。另外，需要时，CPU 32读取被存储在存储部分36中的信息，以及将所需信息供应给存储部分36以将其存储。电动机操作的摇动头33横向或纵向旋转地驱动在电动机操作的摇动头 33上提供的摄像机34,由此其控制摄像机34的方位角(attitude),以便作为成像方向一摄像机34的成像方向一的摇动角或倾斜角变成预定方向上的摇动角或倾斜角。在此，摇动角是指示当摄像机34被设置为预定方位角(例如，光轴垂直于垂直方向的预定方位角)时摄像机34的光轴在横向(水平方向)上相对于摄像机34的光轴倾斜的度数的角度。例如，在摄像机34的光轴以IO度的角度向右倾斜的情况下，摇动角是+10度的角度，而在向左倾斜IO度的角度的情况下，摇动角是-IO度的角度。另外，倾斜角是指示当摄像机34被设置为预定方位角时摄像机34的光轴在垂直方向(纵向)上相对于摄像机34的光轴倾斜的度数的角度。例如，在摄像机34的光轴以IO度的角度向上倾斜的情况下，倾斜角是+10度的角度，而在摄像机34的光轴向下倾斜IO度的角度的情况下，倾斜角是-io度的角度。另外，电动机操作的摇动头33具有内插的存储器33a,并在需要时以重写的方式在存储器33a中存储摄像机34的最近的摇动角和倾斜角。摄像机34被固定到电动机操作的摇动头33,用于对由电动机操作的摇动头33所控制的方位角上的画面进行成像。然后，摄像机34使用CCD (电荷耦合器件)或CMOS (互补金属氧化物半导体)传感器来获得在例如安置了视频会议装置11的会议室等中举行的会议的场景的图像和其他图像，并将捕获图^象供应给图像处理单元35。图像处理单元35使从摄像机34供应的捕获图像经过诸如去噪声的图像处理，并将经过图像处理后的捕获图像供应给CPU 32。例如，存储部分36配置有非易失性存储器、HD (硬盘)等等，其存储控制摄像机34所需的信息，包括例如稍后描述的参考位置(xc, ye)、阈值 Th一x和Th_y、成像信息和由CPU 32执行的程序。例如，麦克风37至39釆集在安置了视频会议装置11的会议室等中举行的会议中的演讲的声音，将这些声音转换成对应的声音信号，并将它们供应给声音处理单元40。另外，麦克风37至39分别具有LED 37a到39a，并且例如，LED 37a 到39a在CPU 32进行的控制下，以预定发光模式发光。另外，从LED 37a 到39a发出的光可以是任何光，只要该光可以被摄像机34成像即可。例如，该光可以是能够由人眼感知的可见光，或可以是诸如难以被人眼感知的红外线的不可见光。在此，由摄像机34获得的捕获图像包括捕获了从麦克风37至39的LED 37a到39a发出的光的图像，并且该图像被具体称为LED图像。声音处理单元40使从麦克风37至39供应的声音信号经过诸如防止回声或嚏声的回声消除器的声音处理，并将经过声音处理后的声音信号供应给 CPU 32。通信部分41接收从通信伙伴视频会议装置lla或llb发送的捕获图像和声音信号，并将它们供应给CPU 32。另外，通信部分41向通信伙伴视频会议装置lla或11b发送从CPU32供应的捕获图像和声音信号。例如，输出部分42是诸如LCD (液晶显示器)的显示器和扬声器，其显示从CPU 32供应的捕获图像以及输出对应于声音信号的声音。图3示出描述由运行被存储在存储部分36中的预定程序的图2所示的 CPU 32功能地实现的控制部分32a的示范配置的方块图。控制部分32a配置有发光控制部分100、发光位置检测部分IOI、误差计算部分102、确定部分103、摇动/倾斜角获得部分104、摇动/倾斜角计算部分105、 PTZ控制部分106和声级确定部分107。例如，发光控制部分100控制麦克风37至39的LED 37a到39a,并使得LED 37a到39a以预定顺序以预定发光模式发光。图像处理单元35向发光位置检测部分101供应捕获图像。发光位置检测部分101在从图像处理单元35供应的捕获图像中的LED 图像中检测作为从麦克风37至39的LED 37a到39a发出的光的位置的发光位置(x, y),并将该位置供应给误差计算部分102。另外，下文中，由附图上侧所示的XY-坐标系统的坐标来表示发光位置 (x, y),其中从图像处理单元35供应的LED图像131的左上端是原点(0,0)。且从原点(0, 0)向右的方向是X轴，以及向下的方向是Y轴。误差计算部分102读取被存储在存储部分36中的参考位置(xc， yc),计算误差值x-Xc和y-ye,它们指示在X坐标和Y坐标中参考位置(xc， yc)和从发光位置4企测部分101供应的发光位置(x, y)之间的偏移，并将这些值供应给确定部分103。在此，在本实施例中，例如，存在这样一种假设以如下方式，一个出席者坐在靠近单个麦克风的座位上视频会议的出席者是等于麦克风37至 39的数量的三个人(或以下)，且三个出席者中的一个坐在靠近麦克风37的座位上，另一个坐在靠近麦克风38的座位上，最后一个坐在靠近麦克风39 的座位上。因此，布支设现在一个出席者得到了靠近例如在麦克风37至39中的麦克风37的座位。当摄像机34拍摄图像使得在捕获图像中的特定位置上看到麦克风37时，可以获得该出席者的这种捕获图像注意力集中于坐在靠近麦克风37的该出席者。如上所述，参考位置(Xc, yc)是当摄像机34可以获得注意力集中于坐在靠近麦克风37的出席者的捕获图像时在捕获图像中拍到的麦克风37的位置。误差计算部分102将麦克风37的LED37a的位置，即发光位置(x， y) 作为麦克风37的位置，并确定发光位置(x, y)和参考位置(Xe， ye)之间的误差。另外，例如，对于参考位置(Xc, yc),可以采取位于LED图像131中心 (重心)的位置。另外，可以根据操纵部分31的操纵来改变参考位置(xc,yc)。确定部分103计算从误差计算部分102供应的误差值x-Xc和y-y。的绝对值以确定误差绝对值l x-Xel和ly-yd。另外，确定部分103从存储了阚值Th—x和Th—y的存储部分36中读出用于确定发光位置(x, y)是否位于(靠近)参考位置(Xe, ye)的阈值Th—x 和Th一y。基于误差绝对值l x-Xel和ly-yd、即误差值x-xc和y-yc的绝对值和从存储部分36读出的阈值Th—x和Thj,确定部分103确定由发光位置^f企测部分101 检测的发光位置(x, y)是否匹配于(被认作)参考位置(xc, ye),即确定部分103确定误差绝对值l x-xd是否小于阈值Th_x并且误差绝对值ly-y。l是否当确定发光位置(x, y)匹配参考位置(xc, yc)，即误差绝对值l x-xc| 小于阈值Th—x并且误差绝对值ly-yd小于阈值Th—y时，确定部分103向摇动 /倾斜角获得部分104供应根据该确定的确定结果。另一方面，当确定发光位置(x, y)不匹配参考位置(xc, yc)，即误差绝对值| x-xd等于或大于阈值Th_x或误差绝对值ly-yd等于或大于阈值Th一y 时，确定部分103向摇动/倾斜角获得部分104供应根据该确定的确定结果和从误差计算部分102供应的误差值x-Xe和y-yc。摇动/倾斜角获得部分104基于从确定部分103供应的确定结果而进行处理。换句话说，例如，在作为麦克风37的LED37a的位置的发光位置(x, y) 现在匹配参考位置(xc, yc)的情况下，确定部分103向摇动/倾斜角获得部分104供应发光位置(x, y)匹配参考位置(xe, yc)的确定结果。在这种情况下，摇动/倾斜角获得部分104检测指示在发光位置(x， y)匹配参考位置 (Xc, ye)时被存储在存储器33a中的摄像机34的成像方向的摇动角和倾斜角，作为指示从摄像机34看去安置具有LED 37a的麦克风37的布置方向的摇动角和倾斜角，并将这些角度作为关于麦克风37的成像信息供应给存储部分36,以存储与识别麦克风37的识别信息关联的这些角度。在此，关于麦克风的成像信息是用于控制摄像机34以捕获在视频会议中靠近麦克风就坐的出席者的信息。另一方面，在作为麦克风37的LED37a的位置的发光位置(x， y)不匹配参考位置(xc， yc)的情况下，确定部分103向摇动/倾斜角获得部分104 供应发光位置(x, y)不匹配参考位置(xe, ye)的确定结果。在这种情况下，摇动/倾斜角获得部分104从存储器33a读出指示被存储在存储器33a中的摄像机34的成像方向的摇动角和倾斜角，并向摇动/倾斜角计算部分105供应这些角度以及从确定部分103供应的误差值x-Xc和y-yc。基于从摇动/倾斜角度获得部件104供应的摇动角、倾斜角和误差值x-xc 和y-yc,摇动/倾斜角计算部分105计算作为发光位置(x, y)匹配参考位置 (xc， yc)的摄像机34的成像位置的摇动角或倾斜角，并向PTZ控制部分106 供应该角度。换句话说，例如，在从摇动/倾斜角获得部分104供应给摇动/倾斜角计算部分105的误差值x-Xc是正值的情况下，即，在发光位置(x, y)比参考位置(xc, yc)更位于右方的情况下，摇动/倾斜角计算部分105通过当以预定角度选旋转地向右驱动摄像机34时将从摇动/倾斜角获得部分104供应的摇动角加上用于旋转驱动的角度，来计算能够获得这样的LED图像的摄像机34 的摇动角在该LED图像中，发光位置(x， y)的X坐标的值x采用更靠近参考位置(xe, yc)的X坐标的值Xe的值。另外，例如，在从摇动/倾斜角获得部分104供应给摇动/倾斜角计算部分 105的误差值x-Xc是负值的情况下，即，在发光位置(x, y)比参考位置(Xc， yc)更位于左方的情况下，摇动/倾斜角计算部分105通过从摇动/倾斜获得角部件104供应的摇动角减去用于以预定角度旋转地向左驱动摄像机34的角度，来计算能够获得这样的LED图像的摄像机34的摇动角在该LED图像中，发光位置(x, y)的X坐标的值x采用更靠近参考位置(xc, yc)的X坐标的值Xe的值。此外，例如，在从摇动/倾斜角获得部分104供应给摇动/倾斜角计算部分 105的误差值y-yc是正值的情况下，即，在发光位置(x， y)比参考位置(Xc, yc)更位于下方的情况下，摇动/倾斜角计算部分105通过从摇动/倾斜获得角部件104供应的倾斜角减去用于以预定角度旋转地向下驱动摄像机34的角度，来计算能够获得这样的LED图像的摄像机34的倾斜角在该LED图像中，发光位置(x， y)的Y坐标的值y采用更靠近参考位置(xc, yc)的Y 坐标的值y。的值。另外，例如，在从摇动/倾斜角获得部分104供应给摇动/倾斜角计算部分 105的误差值y-yc是负值的情况下，即，在发光位置(x, y)比参考位置(Xc， yc)更位于上方的情况下，摇动/倾斜角计算部分105通过从摇动/倾斜获得角部件104供应的倾斜角减去用于以预定角度旋转地向上驱动摄像机34的角度，来计算能够获得这样的LED图像的摄像机34的倾斜角在该LED图像中，发光位置(x, y)的Y坐标的值y采用更靠近参考位置(xc, yc)的Y 坐才示的^直y。的^直。PTZ控制部分106控制电动机操作的摇动头33，以便作为摄像机34的成像方向的摇动角和倾斜角变成从摇动/倾斜角计算部分105供应的摇动角和倾斜角。另外，声级确定部分107向PTZ控制部分106供应识别麦克风37至39的识别信息。PTZ控制部分106从存储部分36中读出关于由来自声级确定部分107的识别信息识别的麦克风的成像信息，并基于成像信息控制电动机操作的摇动头33。换句话说，PTZ控制部分106基于从存储部分36读出的关于麦克风的成像信息来控制电动机操作的摇动头33,以便摄像机34的成像方向是由识别信息识别的麦克风的布置方向。例如，声级确定部分107基于来自声音处理单元40的声音信号，在麦克风37至39中辨别以最大级别供应声音信号(最亮声级的声音信号)的麦克风，并将识别该麦克风的识别信息供应给PTZ控制部分106。换句话说，例如，声音处理单元40通过各种电缆将声音信号从麦克风 37至39供应到声级确定部分107。声级确定部分107向PTZ控制部分106 供应在麦克风37至39中识别与最亮级声音信号被输送到的电缆连接的麦克风的识别信息。图4示出了图示图3所示的发光位置检测部分101检测发光位置(x, y) 的发光位置检测处理的图。图3所示的发光位置检测部分101配置有延迟存储器161、减法部分162 和位置^f全测部分163。图像处理单元35向延迟存储器161和减法部分162供应捕获图像。在此，例如，在图4中，LED图像是由在麦克风37至39中捕获麦克风 38的LED 38a以特定发光模式发光(闪亮)的场景的摄像机34所成像的捕获图像，并且从图像处理单元35将该捕获图像供应给发光位置检测部分101 的延迟存储器161和减法部分162。延迟存储器161暂时存储从图像处理单元35供应的LED图像，以延迟 LED图像达一帧的时间段，然后将其供应给减法部分162。因此，假设从图像处理单元35供应给减法部分162的LED图像的帧被作为感兴趣的帧。然后，当图像处理单元35向减法部分162供应感兴趣的帧的LED图像时，延迟存储器161向减法部分162供应在感兴趣的帧之前一帧的先前帧的LED图像。减法部分162计算从图像处理单元35供应的感兴趣的帧的LED图像的像素的像素值与来自延迟存储器161的先前帧的LED图像的相应像素的像素值之间的差，并将差异图像供应给位置检测部分163,该差异图像是具有所获得的差值作为像素值的图像。位置检测部分163计算从减法部分162供应的差异图像的像素值的绝对值，然后确定在差异图像中是否存在等于或大于预定阈值的像素值。当确定差异图像具有等于或大于预定阔值的像素值时，位置检测部分163基于具有等于或大于预定阈值的像素值的像素来检测作为发光位置(x, y)的位置，诸如在像素中的单个像素的位置或由从所有像素的X坐标和Y坐标的平均值获得的X坐标和Y坐标指示的位置，并将该位置供应给图3所示的误差计算部分102。另外，在参考图4描述的发光位置检测处理中，预定麦克风的LED在由发光控制部分100以如下方式进行的控制下，按预定发光模式发光图3所示的发光位置检测部分101容易从图2所示的图像处理单元35供应的LED 图像来检测预定麦克风的LED的发光位置(x, y)。换句话说，例如，在图2所示的摄像机是根据NTSC (全国电视系统委员会)系统的具有每秒30帧(每秒60场)的帧频的摄像机并且图2所示的摄像机一秒捕获30帧LED图像的情况下，图3所示的发光控制部分100( CPU 32 )可以以如下方式控制预定麦克风的LED的发光仅在由图2所示的摄像机34 —秒捕获的例如30个LED图像中的偶数LED图像中拍摄从预定麦克风的LED发出的光。在这种情况下，通过由图2所示的摄像机34进行的成像，在一秒捕获的 30个LED图像中的奇数LED图像中拍摄不发光的LED,并且在偶数LED 图像中拍摄发光的LED。接下来，将参考图5所示的流程图来描述检测布置麦克风37至39的方向的布置方向^f企测处理。在重新设置麦克风37至39之后或当设置风37至39以进行一次布置方向检测处理、然后改变了麦克风37至39的位置时，需要进行布置方向检测处理。例如，用户操纵操纵部分31 (图2)以进行布置方向检测处理，然后开始该处理。在步骤S31中，发光控制部分100设置麦克风37至39中的一个麦克风为感兴趣的麦克风，并且处理从步骤S31去往步骤S32。发光控制部分100 控制感兴趣的麦克风的LED以预定发光模式发光，然后处理去往步骤S33。在此，可以通过电缆或通过无线电进行由发光控制部分IOO进行的对感兴趣的麦克风的LED的控制。在步骤S33中，PTZ控制部分106横向或纵向旋转地驱动摄像才几34，以便对从感兴趣的麦克风的LED发出的光进行成像，并向图像处理单元35供应由摄像机34成像的捕获图像。图像处理单元35使从摄像机34供应的捕获图像经过诸如去噪声的图像处理，并将经过图像处理的图像供应给发光位置检测部分101 (CPU 32)。发光位置检测部分101从来自图4描述的图像处理单元35的捕获图像生成差异图像。然后，发光位置检测部分101获得具有等于或大于阈值的像素值的差异图像，即，它获得拍摄了感兴趣的麦克风的LED的LED图像，然后，PTZ控制部分106停止被旋转驱动的摄像机34。之后，处理从步骤S33去往步骤S34。发光位置检测部分101进行图4 描述的发光位置检测处理，以在从图像处理单元35供应的LED图像中检测感兴趣的麦克风的LED的发光位置(x, y),并将其供应给误差计算部分102, 然后处理去往步骤S35。在步骤S35中，误差计算部分102读取被存储在存储部分36中的参考位置(xc, yc)，并且处理从步骤S35去往步骤S36。误差计算部分102计算参考位置(xc， yc)和从发光位置检测部分101供应的发光位置(x, y)之间的误差值x-Xe和y-ye,并将这些值供应给确定部分103。在完成步骤S36中的处理步骤后，处理去往步骤S37。确定部分103计算从误差计算部分102供应的误差值x-Xe和y-ye的绝对值，以确定误差绝对值lx-Xcl和ly-yd。另外，在步骤S37中，确定部分103从存储部分36读取阈值 Th—x和Th—y，并基于误差绝对值lx-xd和ly-yel和阈值Th—x和Th—y确定由发光位置检测部分101检测的发光位置(x, y)是否匹配参考位置(xc, yc), 即误差绝对值l x-xd是否小于阈值Th—x并且误差绝对值ly-yd是否小于Th—y。在步骤S37中，如果确定发光位置(x， y)不匹配参考位置(xc, yc)，即如果误差绝对值lx-Xel等于或大于阔值Th—x或误差绝对值ly-yel等于或大于 Th_y,则确定部分103向摇动/倾斜角获得部分104供应发光位置不匹配的确定结果和从误差计算部分102供应的误差值x-Xe和y-ye,并且处理去往步骤 S38。确定部分103供应发光位置(x, y)不匹配参考位置(xc, yc)的确定结果。在步骤S38中，摇动/倾斜角获得部分104然后读取被存储在存储器33a中的摇动角和倾斜角，即指示摄像机34的当前成像方向的摇动角和倾斜角，并向摇动/倾斜角计算部分105供应这些角度以及从确定部分103供应的误差值x-Xc和y-yc。然后，处理从步骤S38去往步骤S39。基于从摇动/倾斜角获得部分104 供应的摇动角、倾斜角和误差值x-Xc和y-y。摇动/倾斜角计算部分105计算作为获得发光位置(x, y)匹配参考位置(Xc， yc)的LED图像的摄像机34 的成像方向的摇动角和倾斜角，并向PTZ控制部分106供应这些角，然后处理去往步骤S40。在步骤S40中，PTZ控制部分106控制电动机操作的摇动头33,以便摄像机34的成像方向是从摇动/倾斜角计算部分105供应的摇动角和倾斜角，并且处理返回到步骤S33。摄像机34根据步骤S40中控制的摇动角和倾斜角，对从感兴趣的麦克风的LED发出的光成像，并向图像处理单元35供应得到的LED图像。图像处理单元35使从摄像机34供应的LED图像经过诸如去噪声的图像处理，并将经过图像处理后的LED图像供应给发光位置检测部分101。处理从步骤S33去往步骤S34,并且以下，重复相似的处理步骤。另一方面，在步骤S37中，如果确定发光位置(x， y)匹配参考位置(Xc, yc),即如果误差绝对值lx-Xel小于阈值Th_x并且误差绝对值ly-yd小于Th_y，则确定部分103向摇动/倾斜角获得部分104供应发光位置匹配的确定结果，并且处理去往步骤S41。当确定部分103供应发光位置(x， y)位于参考位置(Xe， yc)处的确定结果时，在步骤S41中，摇动/倾斜角获得部分104读取^L存储在存储器33a 中的作为摄像机34的当前成像方向的摇动角和倾斜角，作为识别感兴趣的麦克风的布置方向的摇动角和倾斜角，并将这些角度作为关于感兴趣的麦克风的成像信息供应给存储部分36，以与关于感兴趣的麦克风的识别信息关联地存储这些角度，然后处理去往步骤S42。在此，在关于感兴趣的麦克风的成像信息被存储在存储部分36中以后，发光控制部分100停止感兴趣的麦克风的LED的发光。在步骤S42中，发光控制部分100确定是否所有的麦克风37至39都被设置为感兴趣的麦克风。在步骤S42中，如果确定不是所有的麦克风37至39都被设置为感兴趣的麦克风，则处理返回步骤S31。发光控制部分100在麦克风37至39中新选择未被选择作为感兴趣的麦克风的一个麦克风作为感兴趣的麦克风。处理去往步骤S32，并且以下，重复相似的处理步骤。另一方面，在步骤S42中，如果确定所有麦克风都祐:设置为感兴趣的麦克风，则处理结束。如上所述，在图5所示的布置方向检测处理中，计算布置麦克风37至 39的方向，并将其存储作为麦克风37至39的成像信息的项目。因此，在视频会议装置ll中，当重新布置麦克风37至39时，或当改变麦克风37至39的布置时，用户不需要手动设置麦克风37至39的成像信息的项目，从而用户不会感觉到该设置很繁重。另外，即使改变了麦克风37至39的布置，也再次进行图5所示的布置方向检测处理，以灵活地应付麦克风37至39的布置的变化。接下来，将参考图6所示的流程图描述控制摄像机34的摄像机控制处理，这在通过交换视频会议装置lla和lib之间的图像和声音而管理视频会议中进行。另外，假设将单个麦克风分配给参加视频会议的每个出席者，并且出席靠近在麦克风37至39中被分配给他/她的麦克风而就坐。另外，假设已经进行并结束了图5描述的布置方向检测处理。在步骤S70中，声级确定部分107确定在靠近麦克风37至39就坐的出席者中是否存在正在发表演讲的人(演讲者)，即出席者之一是否在发表演讲。在步骤S70中，如果确定没有人正发表演讲，即声音处理单元40没有以等于或大于用于确定发表演讲的语音阈值的级别向声级确定部分107供应声音信号，则处理去往步骤S71。这样控制摄像机34:以拍摄视频会议中的所有三个出席者的方式获得捕获图像，然后处理返回步骤S70。换句话说，PTZ控制部分1065从存储部分36读出三个麦克风37至39 的成像信息的项目，以例如从成像信息中确定在捕获图像中拍摄的三个麦克风37至39的成像方向，并以这样的方式控制电动机操作的摇动头33:摄像机34拍摄这些成像方向上的图像。因此，摄像机34对拍摄了靠近三个麦克风37至39的所有三个出席者的捕获图像进行成像。另外，在步骤S70中，如果确定正发表演讲，即例如，靠近麦克风37至 39就坐的出席者之一正在发表演讲并且由靠近发表演讲的出席者(演讲者)的麦克风采集的演讲的话音，并且得到的声音信号通过声音处理单元40被供应给声级确定部分107,则处理去往步骤S72。基于从声音处理单元40供应的声音信号，声级确定部分107在麦克风37至39中辨别例如以最大级别供应声音信号的麦克风，并将识别该麦克风的识别信息供应给PTZ控制部分 106。换句话说，在从每个麦克风37至39通过声音处理单元40向声级确定部分107供应处于等于或大于语音阈值的级别的声音信号的情况下，声级确定部分107向PTZ控制部分106供应识别麦克风的识别信息。另外，在从麦克风37至39中的多个麦克风通过声音处理单元40向声级确定部分107供应处于等于或大于语音阈值的级别的声音的情况下，例如，声级确定部分107向PTZ控制部分106供应识别在多个麦克风中采集最大级别声音的麦克风的识别信息。在完成步骤S72中的处理步骤以后，处理从步骤S72去往步骤S73。 PTZ 控制部分106从存储部分36读出关于由来自声级确定部分107的识别信息识别的麦克风的成像信息，然后处理从步骤S73去往步骤S74。基于从存储部分36读出的成像信息，PTZ控制部分106以这样的方式控制电动机操作的摇动头33:摄像机34的成像方向变成由来自声级确定部分107的识别信息识别的麦克风的布置方向，然后，处理结束。如上所述，在图6所示的摄像机控制处理中，基于关于靠近演讲者的麦克风的成像信息，以这样的方式控制电动机操作的摇动头33:摄像机34的成像方向变成演讲者使用的麦克风的布置方向。因此，可以在不由用户操纵摄像机34的情况下对演讲者进行成像。另外，通过计算来自图像处理单元35的LED图像之间的差异可以容易实现由图3所示的发光位置检测部件101进行的发光位置检测处理。因此，可以将这种功能添加到现有的视频会议装置，而不需要(或需要少量)用于进行发光位置检测处理的附加功能的花费。图7示出描述本发明的实施例适用的视频会议装置11的第二实施例的示范配置的方块图。另外，在附图中，与图2所示的那些对应的组件被指定了相同的标号和符号，并且下文中适当地省略对于那些组件的描述。换句话说，图7所示的^L频会议装置11被提供有取代声音处理单元40的声音处理单元204，除了新提供了声音生成部分201、放大器202和扬声器 203之外，该声音处理单元204与图2所示类似地配置。声音生成部分201在CPU 32进行的控制下生成用于计算摄像机34和麦克风37至39之间的距离的声音信号A,并向放大器202供应该距离。在此，对于声音信号A,例如，可以使用预定频率的正弦波形。放大器202在需要时放大从声音生成部分201供应的声音信号A，并将其供应给扬声器203和声音处理单元204。在摄像机34附近布置扬声器203,并且扬声器203输出对应于从放大器 202供应的(经过放大的)声音信号A的声音。从放大器202和麦克风37至39向声音处理单元204供应声音信号。声音处理单元204将来自麦克风37至39的声音信号作为进行回声消除器的声音处理的对象，然后检测来自麦克风37声音信号中所包括的声音信号 A。然后，声音处理单元204将从放大器202供应声音信号A的时刻设置为从扬声器203输出声音信号A (所对应的预定声音)的时刻，以及将声音信号A被包含在来自麦克风37的声音信号中的时刻设置为由麦克风37采集从扬声器203输出的声音信号A的时刻，并向CPU 32供应指示从扬声器203 输出声音信号A的时刻和由麦克风37采集声音信号A的时刻的时间信息。类似地，声音处理单元204向CPU 32供应指示从扬声器203输出声音信号A的时刻和由麦克风38采集声音信号A的时刻的时间信息、和指示从扬声器203输出声音信号A的时刻和由麦克风39采集声音信号A的时刻的时间信息。另外，在图7中，存储部分36存储与图2所示的程序不同的程序，并且 CPU 32运行被存储在存储部分36中的程序，以进行与图2所示的处理类似的处理，以及CPU32控制声音生成部分201。此外，CPU 32从自声音处理单元204供应的时间信息(指示从扬声器203 输出声音信号A的时刻和由麦克风37至39的每个采集声音信号A的时刻的时间信息)计算扬声器203与麦克风37至39之间的距离，并将该距离作为用于控制摄像机34的放大倍率(缩放因子)的、靠近扬声器203安置的摄像机34与麦克风37至39之间的距离。图8示出描述由运行被存储在存储部分36中的程序的、图7所示的CPU32功能地实现的控制部分232a的示范配置的方块图。另外，在图中，与图3所示的控制部分32a对应的组件被指定了相同的编号和符号，并且下文中适当地省略对于那些组件的描述。换句话说，除新提供了距离计算部分301和缩放因子计算部分302之外，与图3所示的控制部分32a类似地配置图8所示的控制部分232a。从声音处理单元204向距离计算部分301供应时间信息。距离计算部分301从自声音处理单元204供应的时间信息，即从麦克风 37至39采集从扬声器203输出的声音信号A的时刻和扬声器203输出声音信号A的时刻，来计算扬声器203与麦克风37至39之间的距离，作为摄像机34与麦克风37至39之间的距离，并将该距离供应给缩放因子计算部分 302。另外，将参考图9描述由距离计算部分301计算扬声器203与预定麦克风37至39之间的距离的具体方法。基于从距离计算部分301供应的距离，缩放因子计算部分302计算摄像机34的放大倍率，通过该放大倍率，由摄像机34获得的捕获图像中的麦克风37至39的尺寸变成预定尺寸，这依次使得靠近麦克风37至39就坐的出席者的尺寸变成预定尺寸，并且缩放因子计算部分302将该放大倍率供应给存储部分36以将其存储在其中，作为关于麦克风37至39的成像信息的一部分。接下来，图9示出由图8所示的距离计算部分301进行的计算扬声器203 和麦克风37至39的每个之间的距离的方法的图。在图中，上方的波形示出从放大器202供应到声音处理单元204的声音信号的波形，下方的波形示出例如从麦克风37至39中的麦克风37供应到声音处理单元204的声音信号的波形。声音处理单元204向距离计算部分301供应指示例如从放大器202供应到声音处理单元204的声音信号的顶点时刻t,和例如从麦克风37供应到声音处理单元204的声音信号的顶点时刻12的时间信息。距离计算部分301从由时间信息指示的时刻t2中减去从由声音处理单元 204供应的时间信息指示的时刻^，然后计算从扬声器203输出的声音到达麦克风37的到达时间t^rti ( s )。另外，距离计算部分301将被存储在存储部分36中的声音的速度值k (m/s )(例如340m/s )乘以到达时间t ( s )，以计算扬声器203和麦克风37之间的距离kt (m)。距离计算部分301类似地确定扬声器203与麦克风38或39之间距离。接下来，将参考图10所示的流程图描述当摄像机34在其成像方向是布置麦克风37至39的方向时来捕获图像时计算摄像机34的放大倍率的缩放因子计算处理。例如，就在进行了图5所示的布置方向检测处理之后，进行缩放因子计算处理。在步骤Slll中，距离计算部分301选择麦克风37至39中的一个麦克风作为感兴趣的麦克风，并且处理去往步骤S112。声音生成部分201生成声音信号A，并将其供应给放大器202。另外，在步骤S112中，放大器202放大从声音生成部分201供应的声音信号A，并将其供应给扬声器203和声音处理单元204。因此，扬声器203输出与从放大器202供应的声音信号A对应的声音，由感兴趣的麦克风采集该声音，并该相应的声音信号被供应至声音处理单元 204。然后，处理从步骤S112去往步骤S113。声音处理单元204确定乂人放大器202供应给声音处理单元204的声音信号A的顶点时刻t!、和从麦克风37 供应给声音处理单元204的声音信号的顶点时刻t2，并将指示时刻t!和k的时间信息供应给距离计算部分3 01 。然后，处理从步骤S113去往步骤S114。距离计算部分301根据从声音处理单元204供应的时间信息，来计算从扬声器203输出的声音到达感兴趣的麦克风的到达时间t-tr" (s),并且处理去往步骤S115。在步骤S115中，距离计算部分301将被存储在存储部分36中的声音的速度值k ( m/s )乘以到达时间t ( s )，以计算扬声器203与感兴趣的麦克风之间的距离kt (m),并将其供应给缩放因子计算部分302。在完成步骤S115中的处理步骤后，处理去往步骤S116。缩放因子计算部分302将从距离计算部分301供应的距离作为摄像机34和感兴趣的麦克风 (附近就坐的出席者)之间的距离，并基于该距离，縮放因子计算部分302 计算摄像机34的放大倍率，通过该放大倍率，由摄像机34获得的捕获图像中感兴趣的麦克风的尺寸变成预定尺寸，即，靠近感兴趣的麦克风的出席者的面部的尺寸变成预定尺寸，然后处理去往步骤S117。在步骤S117中，缩放因子计算部分302向存储部分36供应正在之前的步骤S116中计算的放大倍率，以将其存储作为关于感兴趣的麦克风的成像信息的一部分，并且处理去往步骤S118。在步骤S118中，距离计算部分301确定是否选择了所有麦克风37至39 作为感兴趣的麦克风。在步骤S118中，如果确定还没有选择所有麦克风37至39作为感兴趣的麦克风，则处理返回步骤Slll。距离计算部分301在麦克风37至39中新选择还没有被选择作为感兴趣的麦克风的一个麦克风，作为感兴趣的麦克风，处理去往步骤S112，并且以下重复相似的处理步骤。另一方面，在步骤S118中，如果确定选择了所有麦克风37至39作为感兴趣的麦克风，则处理结束。如上所述，在图10所示的缩放因子计算处理中，在摄像机34附近布置的扬声器203和麦克风37至39之间的距离被认为是用于计算的、摄像机34 与麦克风37至39之间的距离，并且这些距离被包括在成像信息中用于存储。因此，当在摄像机34的成像方向是布置麦克风37至39的方向时摄像机34 捕获图像时，可以获得以适当的尺寸拍摄了靠近麦克风37至39的出席者的面部的捕获图像。换句话说，在图7所示的视频会议装置11中，进行与图6所述处理类似的摄像机控制处理。但是，在步骤S74中，PTZ控制部分106以这样的方式控制电动机操作的摇动头33:摄像机34的成像方向是在关于由来自声级确定部分107的识别信息所识别的麦克风的成像信息中所包括的布置方向，以及PTZ控制部分106以这样的方式控制摄像机34:摄像机34的放大倍率是在关于由来自声级确定部分107的识别信息识别的麦克风的成^f象信息中所包括的放大倍率。另外，由于可以通过使用通常进行的回声消除器的技术来实现图7所示的声音处理单元204获得由时间信息所指示的时刻t!和t2的处理，因此可以将这种功能添加到现有视频会议装置中，而不需要(或需要少量)用于进行获得由时间信息所指示的时刻h和t2的处理的附加功能的花费。在此，在图3所示的视频会议装置11中，如此配置，其中，基于从麦克风37至39的LED 37a至39a发射的光，计算麦克风37至39的布置方向，并且基于该布置方向来控制摄像机34。例如，基于从LED发射的光的发光模式，可以控制摄像机。图11示出描述视频会议装置401和基于从LED发出的光来控制视频会议装置401的定向设备(directing device ) 402的图。视频会议装置401配置有操纵部分431、 CPU432、电动机操作的摇动头 433、摄像机434、图像处理单元435、存储部分436、摄像机437、通信部分 438和输出部分439。操纵部分431配置有视频会议装置401的电源按钮。例如，当用户操纵该操纵部分431时，该操纵部分431向CPU432供应对应于用户的操纵的操纵信号。CPU 432运行被存储在存储部分436中的程序，以控制电动机操作的摇动头433、摄像机434、图像处理单元435、摄像机437、通信部分438和输出部分439,并以进行各种其他处理。换句话i兌，例如，当操纵部分431供应操纵信号时，CPU 432进行对应于来自操纵部分431的操纵信号的处理。此外，CPU 432向输出部分439供应从通信部分438供应的、来自通信伙伴视频会议装置的捕获图像，用于显示。另外，CPU432向通信部分438供应从图像处理单元435供应的、经过图像处理后的捕获图像，以将该图像发送给通信伙伴视频会议装置。此外，基于从图像处理单元435供应的、经过图像处理后的LED图像， CPU 432控制电动机操作的摇动头433和摄像机434。另外，如需要，CPU 432从存储部分436读出被存4诸在存储部分436中的信息。电动机操作的摇动头433在横向或纵向上旋转地驱动被提供在电动机操作的摇动头433上的摄像机434,从而其控制摄像机434的方位角，以便作为成像方向的摇动角或倾斜角变成在预定方向上的摇动角或倾斜角，该成像方向是摄像机34的成像方向。将摄像机434固定于电动机操作的摇动头433,用于对由电动机操作的摇动头433控制的方位角上的画面成像。然后，例如，摄像机434使用CCD 或CMOS传感器来获得在布置了视频会议装置11的会议室中举行的会议的场景的图像以及其他捕获图像，并将这些图像供应给图像处理单元435。图像处理单元435使从摄像机434供应的捕获图像和从摄像机437供应的、捕获从定向设备402发出的光的LED图像经过诸如去噪声的图像处理，并将经过图像处理后的捕获图像和LED图像供应给CPU 432。例如，存储部分436配置有非易失性存储器、硬盘等等，并且基于从定向设备402发出的光，存储部分436将用于控制电动机操作的摇动头433和摄像机434所需的信息、由CPU432运行的程序等等存储在其中。另外，例如，在存储部分436中，可以根据操纵部分431的操纵来存储所需信息。例如，摄像机437被固定在可以捕获安置了视频会议装置401的整个会议室的位置上，用于对整个会议室进行成像。然后，摄像机437使用CCD或 CMOS传感器来获得捕获了从定向设备402的LED 462发出的光的LED图像，并将这些图像供应给图像处理单元435。通信部分438接收从通信伙伴视频会议装置发送的捕获图像，并将这些图像供应给CPU 432。另外，通信部分438向通信伙伴视频会议装置发送从 CPU 432供应的捕获图像。例如，输出部分439是诸如LCD的显示器，其在其上显示从CPU 432 供应的捕获图像。控制一见频会议装置401的定向设备402配置有纟喿纵部分461和LED 462。例如，操纵部分461配置有用于设置摄像机434的成像方向和放大倍率的设置按钮和用于接通和断开被嵌入摄像机434中的麦克风的电源的按钮。LED 462以特定发光模式来发光。换句话说，例如，当用户操纵该操纵部分461时，LED462以对应于该操纵的发光模式来发光。另外，从LED462 发出的光可以是任意光，只要摄像机437可以捕获这些光即可。例如，这些光可以是可以被人眼感知的可见光，也可以是诸如红外线的难以被人眼感知的不可见光。图12示出描述由运行被存储在存储部分436中的程序的、图11所示的 CPU 432功能地实现的控制部分432a的示范配置的方块图。控制部分432a配置有发光模式计算部分501和摄像机控制部分502。图像处理单元435向发光模式计算部分501供应LED图像。发光模式计算部分501根据从图像处理单元435供应的LED图像来计算定向设备402的LED 462的发光模式，并向摄像机控制部分502供应指示发光模式的模式信息。另外，对于计算发光模式的方法，例如，在摄像机437 —秒捕获30个LED图像的情况下，检测在30个LED图像中哪个LED图像具有发光的LED 462,从而计算LED 462的发光模式。摄像机控制部分502从存储部分436读出被存储在存储部分436中的对应表。另外，基于从存储部分436读出的对应表，摄像机控制部分502确定对应于从发光模式计算部分501供应的模式信息的指令，然后基于该指令控制电动机操作的摇动头433和摄像机434。在此，对应表是将由发光模式计算部分501计算的、用于指示发光模式的模式信息与对应于模式信息的、用于控制电动机操作的摇动头433和摄像机434的指令相关联的表。接下来，将参考图13所示的流程图描述基于从定向设备402的LED 462 发出的光的发光模式来远程控制视频会议装置401的远程控制处理。例如，当用户将摄像机434的成像方向指定为用户他/她本身并操纵定向设备402的操纵部分461以便以预定放大倍率来放大或缩小用户他/她本身时，开始远程控制处理。此时，定向设备402的LED462根据与由用户对操纵部分461的操纵对应的发光模式来发光。在步骤S141中，摄像机437捕获从定向设备402的LED 462发出的光，并将得到的LED图像供应给图像处理单元435。图像处理单元435使从摄像机437供应的LED图像经过诸如去噪声的图像处理，并将经过图像处理后的LED图像供应给发光模式计算部分501( CPU 432)。之后，处理从步骤S141去往步骤S142。发光模式计算部分501根据从图像处理单元435供应的经过图像处理后的LED图像来计算从定向设备402 的LED 462发出的光的发光模式，并向摄像机控制部分502供应指示发光模式的模式信息，并且处理去往步骤S143。在步骤S143中，摄像机控制部分502 >^人存储部分436读出被存储在存储部分436中的对应表，确定对应于从发光模式计算部分501供应的模式信息的指令，并基于该指令，摄像机控制部分502控制电动机操作的摇动头433 和摄像机434。例如，摄像机控制部分502将摄像机434的成像方向定向到用户，以及以预定放大倍率来放大或缩小该用户。因此，由于根据用户进行的操纵部分461的操纵而将摄像机434的成像方向定向到用户，以及以预定放大倍率来放大或缩小该用户，因此可以容易地实现以预定尺寸预定成像方向来捕获该用户的这种功能。之后，处理结束。如上所述，在图13所示的远程控制处理中，配置为基于从定向设备402 的LED462发出的光的发光模式来远程地控制视频会议装置11。例如，即使用户位于远离视频会议装置11的位置，也能够容易地操作视频会议装置11，而不需要操纵位于远离用户的位置处的视频会议装置11的操纵部分431。另外，由于可以通过计算来自图像出来单元435的LED图像之间的差异来容易地实现图12所示的发光模式计算部分501的计算发光模式的处理，因此，可以在不需(或需要少量)用于进行计算发光模式的处理的附加功能的花费将这种功能添加到之前的现有视频会议装置。另外，如下配置，通过使得CPU 32或CPU 432运行程序来引导图5所示的布置方向检测处理、图6所示的摄像机控制处理、图IO所示的缩放因子计算处理和图13所示的远程控制处理的一系列处理步骤，但还可以通过专用硬件来实现这些处理步骤。预先在存储部分36或存储部分436中存储由CPU 32或CPU 432运行的程序。除此之外，例如，可以在可移动介质上存储该程序，该可移动介质是诸如磁盘(包括软盘)、光盘(包括CD-ROM (紧致盘只读存储器)和DVD (数字通用盘))、磁光盘或半导体存储器的分组介质，或者可以通过电缆或诸如因特网的无线网络来提供该程序。另外，在本说明书中，描述过程的将程序记录在程序记录介质上的步骤包括沿着所述顺序以时间顺序来进行的处理步骤，并且还包括不需要以时间顺序处理独立或并行进行的处理步骤。此外，在本说明书，系统代表由多个设备配置的全部装置。另外，在图5所示的布置方向检测处理中，如下配置，依次选择麦克风 37至39作为感兴趣的麦克风，使得感兴趣的麦克风的LED以预定发光模式发光，以计算感兴趣的麦克风的布置方向。例如，如下方案是可能的，允许麦克风37至39的LED 37a到39a同时以独立发光模式来发光，以检测布置麦克风37至39的方向。在这种情况下，可以将进行布置方向检测处理所需的时间段缩短得比使得麦克风37至39的LED 37a到39a依次发光的情况更多。此外，在图2和图7所示的实施例中，如下配置，使用相同的摄像机34 用于捕获LED图像作为在图5所示的布置方向检测处理中使用的捕获图像的摄像机、和用于作为在图6所示的摄像机控制处理中用成像信息的控制的对象的摄像机。但是，捕获LED图像的摄像机和作为用成像信息的控制的对象的摄像机可以是单独的摄像机。在这种情况下，期望的是，靠近将要作为用成像信息的控制的对象的摄像机来放置捕获LED图像的摄像机。另外，捕获LED图像的摄像机可以是低分辨率摄像机，用于捕获LED图像，并且作为用成像信息的控制的对象的摄像机可以是用于捕获图像的高分辨率摄像机。在这种情况下，由于可以引导图5所示的布置方向检测处理用于低分辨率LED图像，因此可以减少处理量。另外，可以通过提供所谓的磁滞现象来改变摄像机34的成像方向。换句话说，例如，在靠近麦克风37至39附近就坐的出席者正在争论的情况下，供应最高级的声音信号的麦克风频繁变化。每次当改变供应最高级的声音信号的麦克风时而变化了摄像机34的成像方向时，捕获图像是具有粗糙运动的难以看到的图像。然后，例如，在即使供应最高级的声音信号的麦克风从麦克风#1改变为麦克风#2并且供应最高级的声音信号的麦克风是麦克风#2的这种状况持续了预定的时间段、摄像机34的成像方向也不快速变化的情况下，可以将摄像机34的成像方向改变为麦克风#2。在这种情况下，可以防止如下事件因为频繁地改变摄像机34的成像方向而使得捕获图像是难以看见的图像。此外，在供应最高级的声音信号的麦克风在麦克风37至39中的多个麦克风之间改变的情况下，可以控制摄像机34的成像方向以便拍摄所有这多个麦克风。另外，在图7所示的实施例中，如下配置，基于摄像机34和麦克风37 至39之间的距离，控制摄像机34的放大倍率。除此之外，例如，可以以如下方式控制摄像机34的放大倍率检测在捕获图像中拍摄的出席者的脸部的区域，并且在捕获图像中以预定比率的像素数来占据该区域。此外，在图2和图7所示的实施例中，如下配置，仅提供单个摄像机34 作为捕获作为用成像信息控制的对象的视频会议出席者的摄像机。另外，可以提供多个摄像机作为捕获作为用成像信息控制的对象的视频会议出席者的摄像机。例如，在提供两个摄像机作为捕获作为用成像信息控制的主体的视频会议出席者的摄像机的情况下，这样的方案是可能的当两个出席者在争论时，一个摄像机捕获一个出席者，而另一摄像机捕获另一出席者。另外，在图2和7所示的实施例中，如下配置，发光控制部分100控制 LED 37a至39a的发光。但是，例如，用户可以操纵开关等等而使得LED 37a 至39a以预定发光模式发光。接下来，在图11所示的视频会议装置401中，如下配置，使用摄像机 437作为捕获在图13所示的远程控制处理中使用的LED图像的摄像机，并且使用摄像机434作为捕获该捕获图像的摄像机。例如，捕获LED图像的摄像机和捕获该捕获图像的摄像机可以是同一摄像机。另外，在捕获LED图像的摄像机和捕获该捕获图像的摄像机是同一摄像机的情况下，期望的是，该摄像机可以是广角、高分辨率摄像机。此外，在图11所示的定向设备402中，如下配置，定向设备402使得 LED 462发光，以使得视频会议装置401进行对应于LED 462的发光模式的处理。例如，假设如下配置，用户使得LED462发光，并且在该状态下，由视频会议装置401检测可以通过移动具有LED 462的定向设备402而获得的、从LED462发出的光的轨迹。用这种配置，可以给视频会议装置401提供标记功能。换句话说，例如，视频会议装置401可以通过叠加(组合)所检测的光的轨迹与由摄像机434成像的捕获图像来在捕获图像中标记光的轨迹。因此，例如，标记捕获图像中的预定对象以指出该预定对象。更具体地，在视频会议装置401中，例如，将由摄像机434获得的捕获图像与围绕感兴趣的区域的圓圈的轨迹叠加，并且可以生成强调该感兴趣的区域的捕获图像，其中在该感兴趣的区域中，会议素材(material)被捕获在捕获图像中。另外，在图13中所示的远程控制处理中，如下配置，定向设备402使得 LED 462发光，以使得视频会议装置401进行对应于从LED 462发出的光的发光模式的处理。例如，假设当发光的LED462作为对象时，CPU 432进行图5所示的布置方向检测处理。可以计算LED462的布置方向，其中LED 462 的发光位置(x, y)位于参考位置(xc, yc)。因此，将摄像机434的成像方向设置为所计算的布置方向，从而可以将摄像机434定向为具有LED462的定向设备402的方向。另外，本发明的实施例不局限于上述实施例，在不脱离本发明的实施例的讲授的范围内，可以对其修改。本领域技术人员应该理解，根据设计需求和其他音素，可以进行各种修改、组合、子组合和变更，只要它们处于所附权利要求或其等同物的范围内。相关申请的交叉引用本发明包含与2007年4月6日在日本专利局提交的日本专利申请 JP2007-100121相关的主题，其全部内容^皮引用附于此。
权利要求
1. 一种用于视频会议的视频会议装置，包括发光控制部件，用于使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光；发光位置检测部件，用于检测发光位置，所述发光位置是通过由用于成像的第一成像部件对来自所述声音采集部件中所包括的所述发光部件的光进行成像而获得的图像中的光的位置；布置方向检测部件，用于基于所述发光位置来检测布置方向，所述布置方向是布置所述声音采集部件的方向；以及成像控制部件，用于基于所述布置方向来控制成像方向，所述成像方向是用于对图像进行成像的第二成像部件捕获图像的方向。
2. 根据权利要求1所述的视频会议装置，其中，所述第一成像部件对低分辨率图像进行成像，以及所述第二成像部件对高分辨率图像进行成像。
3. 根据权利要求1所述的视频会议装置，其中所述第一和第二成像部件是相同的。
4. 根据权利要求1所述的视频会议装置，其中，所述发光控制部件使得在所述声音采集部件中所包括的多个所述发光部件中的每个以预定顺序发光，或使得在所述声音采集部件中所包括的多个所述发光部件中的每个以各自的发光模式同时发光，所述发光位置检测部件检测所述多个声音采集部件的每个的发光位置，所述布置方向检测部件基于所述发光位置来检测所述多个声音采集部件中的每个的布置方向，以及所述成像控制部件基于在所述多个声音采集部件中正在采集高级别声音的声音采集部件的布置方向来控制所述成像方向。
5. 根据权利要求1所述的视频会议装置，还包括距离计算部件，用于基于所述声音采集部件采集从用于输出预定声音的声音输出部件输出的预定声音的时刻和所述声音输出部件输出所述预定声音的时刻，来计算所述声音输出部件和所述声音釆集部件之间的距离，其中，所述成像控制部件还基于所述声音输出部件和所述声音采集部件之间的距离，控制在由所述第二成像部件成像时的放大倍率。
6. 根据权利要求1所述的视频会议装置，其中，还提供所述声音采集部件、所迷第一成像部件和所述第二成像部件中的一个或多个。
7. —种控制用于视频会议的视频会议装置的方法，所述方法包括步骤使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光；检测发光位置，该发光位置是通过由用于成像的第一成像部件对来自在所述声音采集部件中所包括的所述发光部件的光进行成像而获得的图像中的光的位置；以及基于所述发光位置来检测布置方向，该布置方向是布置所述声音采集部件的方向，其中，在所述视频会议装置中，基于所述布置方向来控制成像方向，所述成像方向是用于成像图像的第二成像部件捕获图像的方向。
8. —种使得计算机运作为用于视频会议的视频会议装置的程序，所述程序使得所述计算机运作为发光控制部件，用于使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光；发光位置检测部件，用于检测发光位置，所述发光位置是通过由用于成像的第一成像部件对来自所述声音采集部件中所包括的所述发光部件的光进行成像而获得的图像中的光的位置；布置方向检测部件，用于基于所述发光位置来检测布置方向，所述布置方向是布置所述声音采集部件的方向；以及成像控制部件，用于基于所述布置方向来控制成像方向，所述成像方向是用于成像图像的第二成像部件捕获图像的方向。
9. 一种用于视频会议的视频会议装置，包括发光控制单元，被配置用于使得在声音采集单元中所包括的发光单元以特定发光模式发光；发光位置检测单元，被配置用于检测发光位置，该发光位置是通过由第一成像单元对来自所述发光单元的光进行成像而获得的图像中的光的位置；布置方向检测单元，被配置用于基于所述发光位置来检测布置方向，该布置方向是布置所述声音采集单元的方向；以及成像控制单元，被配置用于基于所述布置方向来控制成像方向，该成像方向是第二成像单元捕获图像的方向。
全文摘要
用于视频会议的视频会议装置包括发光控制部件，用于使得在用于采集声音的声音采集部件中所包括的用于发光的发光部件以特定发光模式发光；发光位置检测部件，用于检测发光位置，该发光位置是通过由用于成像的第一成像部件对来自在所述声音采集部件中所包括的发光部件的光进行成像而获得的图像中的光的位置；布置方向检测部件，用于检测布置方向，该布置方向是基于发光位置来布置所述声音采集部件的方向；以及成像控制部件，用于基于所述布置方向来控制成像方向，该成像方向是用于成像图像的第二成像部件捕获图像的方向。
文档编号G01B11/00GK101282452SQ200810091120
公开日2008年10月8日申请日期2008年4月7日优先权日2007年4月6日
发明者安居宏之, 川口贵义申请人:索尼株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安居宏之;川口贵义
技术所有人：索尼株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。