视频会议装置的制作方法

文档序号：7678955阅读：114来源：国知局

专利名称：视频会议装置的制作方法
技术领域：
本发明涉及一种视频会议装置，其在彼此远离的会议室之间进行视频会议时使用，对影像或图像、以及声音进行通信。
背景技术：
当前，在彼此远离的多个地点之间进行视频会议的情况下，在各个地点配置如专利文献l所示的视频会议装置(电视会议装置)，会议参加者以围绕该视频会议装置的方式就座，进行会议。
在专利文献1的视频会议装置中，为各会议参加者配备带有电磁波发生器的传声器，从接收到最高电平的声音的传声器发射电磁波。人物拍摄用照相机通过接收该电磁波而检测出发言者方向，将照相机朝向该发言者方向，拍摄以发言者为中心的影像。对该影像数据和音频数据进行编码，并发送至对方的视频会议装置。
专利文献l:特开平6 — 276514号公报

发明内容
在进行视频会议的情况下，有时不仅如上述所示发送发言者等会议参加者的影像，还希望在远离的地点之间共同参照资料等。在专利文献1的装置中，虽然可以进行切换而获取发言者的影像，但无法直接放映资料。因此，在利用专利文献1的结构放映资料时，虽然会议参加者手持资料放在照相机的前方即可，但由于无法将资料完全固定，所以会使图像模糊。另外，受到透镜造成的弯曲的影响，无法如实(像源图像一样)地拍摄出资料。另外，作为共同参照资料的其他方法，也可以将资料数据化而进行发送，但无法提供在会议中通过书写而进行说明等的直接且富于灵活性的资料。
因此，本发明的目的在于提供一种视频会议装置，其可以准确且清晰地发送声音、影像、乃至富于灵活性的资料。
本发明涉及一种视频会议装置，其具有摄像部，其对规定区域进行拍摄；影像数据生成部，其基于该摄像部拍摄到的影像，生成影像数据；框体，其具有拾音放音部，该拾音放音部接收本装置周围的声音而生成接收音频数据，对播放音频数据进行播放；通信部，其生成具有接收音频数据和影像数据的通信数据，将该通信数据向外部发送，同时，从来自外部的通信数据中获取播放音频数据，并发送至拾音放音部；以及支撑部，其以规定的形态支撑摄像部。在该视频会议装置中，支撑部以第1形态和第2形态中的某一种来支撑所述摄像部，该第1形态是使摄像部朝向框体周围的会议参加者拍摄区域的形态，该第2形态是使所述摄像部朝向框体附近的接近所述摄像部的区域的形态。此外，(A)如果检测出选择了第1形态，则该视频会议装置的影像数据生成部从影像数据中仅截取与接收音频数据的拾音方位信息对应的方位区域，通过与第1形态对应的第1修整处理，对截取出的影像数据进行修整。另外，(B)如果检测出选择了第2形态，则该影像数据生成部从影像数据中截取以摄像部的正面方向为中心的规定区域，通过不同于第1修整处理的与第2形态对应的第2 修整处理，对截取出的影像数据进行修整。
在该结构中，本发明的视频会议装置在摄像部被设定为朝向会议参加者拍摄区域的第1形态时，仅截取拾音方位的影像数据，利用第1修整处理适当地进行修整，以易于辨认。然后，视频会议装置根据该影像数据和接收音频数据生成通信数据，并发送至对方装置。另一方面，视频会议装置在摄像部被设定为对设置在框体附近的接近区域中的资料等进行拍摄的第2形态的情况下，利用第2修整处理对照相机从正面拍摄的影像进行适当修整，以使其易于辨认。然后，视频会议装置生成包含该影像数据的通信数据，并发送至对方装置。此时，由于存在第1形态和第2形态下所拍摄的区域不同的情况，所以利用由与各个形态对应的不同的修整处理构成的第1修整处理和第2修整处理，对影像进行修整。
由此，由于将会议参加者影像和资料等静止图像对应于各自的拍摄规格进行修整，所以可以向对方装置发送分别适当地修整后的会议参加者影像和资料图像。
另外，本发明的视频会议装置的支撑部的特征在于，具有用于切换第l形态和第2形态的关节机构，同时，利用该关节机构形成开关。另外，该视频会议装置的影像数据生成部的特征在于，基于由关节机构形成的开关的选择状况，检测第1形态和第2形态的选择情况。
该结构的视频会议装置，通过使支撑部的关节机构动作而对开关进行切换，由此选择第l形态或第2形态，所以可以在结构上简单
地设定第l形态和第2形态。
另外，本发明涉及一种视频会议装置，其具有摄像部，其对规定区域进行拍摄；影像数据生成部，其基于该摄像部拍摄到的影像，生成影像数据；拾音放音部，其接收本装置周围的声音而生成接收音频数据，对播放音频数据进行播放；通信部，其生成具有接收音频数
据和影像数据的通信数据，将该通信数据向外部发送，同时，从来自
外部的通信数据中获取播放音频数据，并发送至所述拾音放音部；以及支撑部，其将摄像部以固定的形态支撑在框体上。在该视频会议装置中，摄像部同时对会议参加者拍摄区域和框体附近的接近所述摄像部的区域进行拍摄。影像数据生成部从与会议参加者拍摄区域对应的第1部分影像数据中，仅截取与接收音频数据的拾音方位信息对应的
方位区域，利用第3修整处理对截取出的第1部分影像数据进行修整，利用与第3修整处理不同的第4修整处理，对与接近摄像部的区域对应的第2部分影像数据进行修整。
该结构的视频会议装置利用一个摄像部，同时获取与会议参加者拍摄区域对应的第1部分影像数据、和与接近摄像部的配置有资料的区域对应的第2部分影像数据。并且，针对第1部分影像数据，仅截取与接收音频数据对应的方位区域，利用第3修整处理进行适当修整。将第2部分影像数据利用对应的第4修整处理进行适当修整，以使其易于辨认。
由此，同时获取会议参加者影像和资料等静止图像，并且对应于各自的拍摄规格进行修整。其结果，可以同时向对方装置发送分别适当地修整后的会议参加者影像和资料图像。
本发明的视频会议装置具有选择部，其选择用于通信数据的部分影像数据。视频会议装置的影像数据生成部将由选择部选择出的部分影像数据发送至通信部。
在该结构中，选择会议参加者影像和静止图像中的某一种进行发送。由此，可以仅在需要时发送几乎不随时间推移而变化的静止图像，所以不会对通信系统增加多余的负荷。
另外，本发明的视频会议装置的特征在于，摄像部具有鱼眼透镜，将通过该鱼眼透镜拍摄的区域的中心区域作为接近摄像部的区域，至少将中心区域外侧的周边区域作为会议参加者拍摄区域。
在该结构的视频会议装置中，作为具体的摄像部的规格，利用鱼眼透镜。另外，将与鱼眼透镜的中心对应的区域作为接近摄像部的区域，利用与该区域对应的修整处理进行适当修整。在进行形态切换的情况下，会议参加者拍摄区域有时也使用中心区域，但主要使用周边区域。因此，对于会议参加者区域的影像，与不同的情况对应而通过与所选择的区域对应的修整处理进行适当修整。由此，即使经由鱼眼透镜对摄像部附近的接近区域的影像(图像)和会议参加者拍摄区域的影像进行拍摄，也可以对各个影像进行适当修整。
另外，本发明的视频会议装置的影像数据生成部与摄像部一体形成。另外，本发明的视频会议装置的通信部与拾音放音部一起，一
体形成在框体上。另外，本发明的视频会议装置的影像数据生成部与拾音放音部一起，一体形成在框体上。由此，使视频会议装置紧凑地构成。
另外，本发明的视频会议装置具有显示器，其用于再生影像数据。该视频会议装置的通信部获取包含在通信数据中的影像数据，并发送至显示器。
由此，仅通过在进行通信会议的各地点配置本发明的视频会议装置并进行连接，就可以使双方简单地共享会议参加者影像和资料。
发明的效果根据本发明，由于通过简单的摄像部的方向操作，利用与发言者的影像对应的修整处理对发言者的影像进行修整，利用与资料的图像对应的修整处理对资料的图像进行修整，所以可以将发言者影像以及资料图像这两者准确且清楚地发送至对方侧装置。由此，在使用本装置的视频会议中，可以简单地实现更具临场感、彼此容易沟通的会议。

图1是实施方式1的视频会议装置的会议参加者拍摄模式时的外观图。
图2是实施方式1的视频会议装置的资料拍摄模式时的外观图。图3是表示实施方式1的视频会议装置的主要结构的框图。图4是表示配置实施方式1的视频会议装置，并与通过网络连接的其他地点进行视频会议的状况(会议参加者拍摄模式)的图。图5是用于说明会议参加者拍摄模式时影像数据的生成的说明图。
图6是表示配置实施方式1的视频会议装置，并与通过网络连接的其他地点进行视频会议的状况(资料拍摄模式)的图。
图7是用于说明资料拍摄模式时影像数据的生成的说明图。
图8是实施方式2的视频会议装置中，由拾音放音装置1、照相机2和支撑体7构成的组合部件的外观图。
图9是表示使用实施方式2的视频会议装置时的视频会议装置的使用状况的图。
图10是说明由实施方式2的视频会议装置生成影像数据的图。
符号的说明
l一拾音放音装置
2—照相机
3 —支架
4一开关5 —通信终端
6 —显示器
7 —支撑体
8 —载置台 ll一框体 12_脚部 21 —摄像部 22—影像处理部 31 —主体部 32—照相机支撑部 33 —主体支撑部 34—拾音放音装置安装部
102 —输入输出I/F
103 —播放控制部
105 — A/D — AMP
106 —拾音控制部
107 —回声消除部 110—凹部 lll一操作部 203—铰链 500—网络
601 605 —会议参加者
610 —整体区域图像数据
611、 615 —人物像
621 —修整图像数据
622—修整图像数据
631、 635 —修整人物像
641 644_人物像
650—资料
654 —修整人物像670 —修整资料像
680、 681 —修整图像数据
682—周边部图像数据
683 —部分图像数据
700 —桌子
具体实施例方式
参照

本发明的实施方式1所涉及的视频会议装置。图l、图2是本实施方式中的视频会议装置的外观图，(A)是俯视图，(B)是侧视图。在图1、图2中，仅示出在结构上具有特征的拾音放音装置、照相机、支架的结构，对于将通信终端、拾音放音装置、以及照相机电气连接的电缆省略图示。另外，图l表示会议参加者拍摄模式时的机构状态，图2表示资料拍摄模式时的机构状态。
图3是表示本实施方式中的视频会议装置的主要构成的框图。此外，在图1、图2、图3以及下面的本说明书将要参照的图中，以"MC"来代表或者统称地表示传声器，以"SP"来代表或者统称地表示扬声器。本实施方式的视频会议装置具有在俯视观察下形状为圆盘状的拾音放音装置1;照相机2，其具有拍摄功能以及影像数据生成功能；以及支架3，其将照相机2相对于拾音放音装置1设置在规定位置上。另外，虽然在图l、图2中未图示，但拾音放音装置 1和照相机2电气连接，而且视频会议装置具有与拾音放音装置1和照相机2电气连接的通信终端。
通信终端5对从经由网络500连接的对方的视频会议装置的通信终端接收到的通信数据进行解调，获取播放用音频信号、对方装置 ID、发言者方位数据，并发送至通过电缆连接的本装置侧的拾音放音装置l。另外，通信终端5基于从本装置侧的拾音放音装置1接收到的接收音频信号以及发言者位置数据、和从照相机2接收到的影像数据，生成通信数据。通信终端5将生成的通信数据发送至对方视频会议装置的通信终端。另外，通信终端5根据情况而协助拾音放音装置1和照相机2之间发送/接收发言者位置数据。
拾音放音装置1具有圆板状的框体11。具体地说，框体11在俯视观察下的形状为圆形，顶面和底面的面积比垂直方向的中间部分的面积窄，侧视观察下的形状构成为，从高度方向上的一点开始朝向顶面而逐渐变窄，同时从上述一点开始朝向底面而逐渐变窄。即，构成为上述一点的上部侧以及下部侧分别具有倾斜面的形状。在框体11 的顶面形成有比该顶面的面积小、具有规定深度的凹部110，设定为凹部110的俯视观察下的中心与顶面的中心一致。
沿凹部110的侧面在框体11的顶面侧内部设置16个传声器
MC1 MC16，将拾音放音装置1俯视观察下的中心作为旋转中心而等角度间距(在此情况下，间隔大约22.5。)地配置各传声器MC1 MC16。此时，如果假定传声器MC1为9 = 0°的方向，则各传声器 MC1 MC16沿着0以22.5°递增的方向依次配置。例如，传声器 MC5配置在e二9(T的方向上，传声器MC9配置在0=180°的方向上，传声器MC13配置在6 = 270°的方向上。另外，各传声器MC1 MC16具有单一指向性，各自配置为在上述俯视观察的中心方向上具有较强的指向性。例如，传声器MC1以9=180°的方向为指向性的中心，传声器MC5以0 = 270°的方向为指向性的中心，传声器MC9 以6 = 0 (360) °的方向为指向性的中心，传声器MC13以9 = 90° 的方向为指向性的中心。此外，传声器的数量不限于上述数量，可以根据规格适当设定。
4个扬声器SP1 SP4分别设置为使得框体11的下部侧的倾斜面与放音面一致，各扬声器SP1 SP4将拾音放音装置1俯视观察下的中心作为旋转中心而以等角度间距(在此情况下，间隔大约90。) 进行配置。此时，扬声器SP1的角度配置在0 = 0°的方向上，扬声器SP2相对于扬声器SP1配置在9 = 90°的方向上，扬声器SP3相对于扬声器SP1配置在0=180°的方向上，扬声器SP4相对于扬声器 SP1配置在6 = 270°的方向上。另外，各扬声器SP1 SP4在放音面的正面方向上具有较强的指向性，扬声器SP1以0 = 0°的方向为中心进行放音，扬声器SP2以6二90。的方向为中心进行放音，扬声器 SP3以6=180°的方向为中心进行放音，扬声器SP4以6 = 270°的方向为中心进行放音。
如上述所示，通过在框体11的下部侧配置扬声器SP1 SP4，在框体11的上部侧配置传声器MC1 MC16，将传声器MC1 MC16 的拾音方向设为框体11的中心方向，使得各传声器MC1 MC16不易接收来自扬声器SP1 SP4的返回音。因此，在后述的发言者位置检测中，不易受到返回音的影响，可以精度更高地进行发言者位置检
操作部111设置在框体11的上部侧的倾斜面上，虽然未图示，但具有各种操作按钮及液晶显示面板。
输入输出I/F 102 (图1、 2中未图示)在框体11的下部侧的倾斜面上设置于没有设置扬声器SP1 SP4的位置上，具有可以对音频数据及各种控制数据进行通信的端子。另外，利用电缆等将输入输出 I/F 102的端子和通信终端进行连接，由此在拾音放音装置1和通信终端之间进行通信。
拾音放音装置1在具有上述构造上的结构的同时，具有如图3 所示的功能上的结构。
控制部101对拾音放音装置1进行设定、拾音、放音等全面控制，同时基于通过操作部111输入的操作指示内容，对拾音放音装置 1的各部分进行控制。 (1)放音
输入输出I/F102将从通信终端5接收到的播放用音频信号S1 S3，分别输出至频道CH1 CH3。此外，频道的分配可以按照接收到的播放用音频信号的数量而适当设定。另外，输入输出I/F102从通信终端5接收对方装置ID，为每个对方装置ID分配频道CH。例如，在连接中的对方装置为一台的情况下，将来自该对方装置的音频数据作为播放用音频信号S1，分配至频道CH1。另外，在连接中的对方装置为两台的情况下，将来自这两台对方装置的音频数据分别作为播放用音频信号Sl、 S2，各自分配至频道CH1、 CH2。相同地，在连接中的对方装置为三台的情况下，将来自这三台对方装置的音频数据
分别作为播放用音频信号Sl、 S2、 S3，各自分配至频道CH1、 CH2、 CH3。频道CH1 CH3经由回声消除部107与播放控制部103连接。
另外，输入输出I/F 102从通信终端5提取对方拾音放音装置的发言者方位数据Py，与频道信息一起发送至播放控制部103。
播放控制部103基于播放用音频信号S1 S3和发言者方位信息 Py，生成向各扬声器SP1 SP4发送的扬声器输出信号SPD1 SPD4。
D/A — AMP 104对各扬声器输出信号SPD1 SPD4进行数字一模拟变换，以一定的放大率放大，分别发送至扬声器SP1 SP4。扬声器SP1 SP4对发送来的扬声器输出信号SPD1 SPD4进行音频变换并进行播放。
通过进行上述播放处理，使从各扬声器SP1 SP4播放的声音具有规定的延迟关系及振幅关系，所以可以给会议参加者带来如同从所设定的虚拟声源进行播放的感觉。 (2)拾音
传声器MC1 MC16对会议参加者发出的声音等来自外部的声音进行接收，生成接收音频信号MS1 MS16。各A/D —AMP105将对应的接收音频信号MS1 MS16以规定的放大率进行放大，在进行模拟一数字变换后输出至拾音控制部106。
拾音控制部106对获取到的接收音频信号MS1 MS16，分别以不同的延迟控制形式及振幅形式进行合成，生成分别以不同的方向作为指向性中心方向的接收声束信号。例如以拾音放音装置1为中心，以将圆周360°进行8等分的角度即45°逐次改变指向性的中心方向，而生成8个接收声束信号。拾音控制部106对这些接收声束信号的振幅电平进行比较，选择振幅电平最高的接收声束信号MBS，输出至回声消除部107。拾音控制部106获取与选择出的接收声束信号对应的发言者方位，生成发言者方位信息Pm，发送至输入输出I/F 102。
回声消除部107由自适应型滤波器和后置处理器构成，该自适应型滤波器对于输入的接收声束信号MBS,基于各播放用音频信号返回音信号，该后置处理器从接收声束信号MBS中
减去虚拟返回音信号。回声消除电路通过一边对自适应型滤波器的滤
波系数逐次进行优化，一边从输出用接收声束信号MBS中减去虚拟返回音信号，由此去除包含在输出用接收声束信号MBS中的从扬声器SP1 SP4向传声器MC1 MC16返回的成分。将去除了该返回成分的接收声束信号MBS输出至输入输出I/F 102。
输入输出I/F 102将通过回声消除部107去除了返回音的接收声束信号MBS、和来自拾音控制部106的发言者方位信息Pm相关联，输出至通信终端5。
如图l、图2所示，照相机2通过支架3相对于拾音放音装置1 设置在固定的位置上。此时，照相机2通过支架3以可在水平方向(图 l所示的照相机2朝向)和垂直下方(图2所示的照相机2朝向)之间转动的方式设置。
支架3具有主体部31、照相机支撑部32、主体支撑部33、以及拾音放音装置安装部34。主体部31由具有规定宽度的直线状部件构成，通过主体支撑部33而设置为沿与垂直方向成规定角度的方向延伸的形状。在主体部31的延伸方向的一侧端部上，经由铰链203设置照相机支撑部32，在另一侧端部上设置拾音放音装置安装部34。拾音放音装置安装部34由具有开口部的平板构成，例如与主体部31 一体形成，该开口部具有用于嵌入安装框体11的脚部12的形状。
主体部31的照相机支撑部32侧的端部形成仅保留宽度方向的两端壁部而宽度方向的中央部开口的形状。该开口部的形状构成为，使设置于照相机支撑部32上的照相机2在水平方向和垂直下方之间转动时，不与主体部31接触。
铰链203形成将照相机支撑部32相对于主体部31可转动地进行设置的构造。另外，铰链203以及照相机支撑部32具有将照相机 2以及照相机支撑部32在朝向水平方向的情况和朝向垂直下方的情况下进行半固定的构造。例如，将铰链203固定在主体部31上，在铰链203的水平方向的位置和垂直下方的位置上分别形成凹部。在照相机支撑部32的铰链侧端部上，设置用于与上述凹部嵌合的形状的凸部，将该凸部通过弹簧等从照相机支撑部32内进行预紧。由此，照相机2可以在水平方向和垂直下方之间转动，且将机构状态维持在水平方向和垂直下方上。
由该铰链203以及照相机支撑部32构成的机构部，作为开关4 起作用。例如，在上述凹部以及凸部中分别设置电极，对上述电极的电气导通、断开进行检测。此时，以水平方向的凹部和垂直下方的凹部得到不同信号的方式进行连线或者对检测信号进行设定。通过这种构造形成开关4，将该开关4的检测结果发送至照相机2。由此，照
相机2可以识别自身是朝向水平方向还是朝向垂直下方，并获取影像。
照相机2具有摄像部21和影像处理部22。摄像部21具有鱼眼透镜，以照相机2的正面方向为中心，针对所有方位，对从无限远至鱼眼透镜的设置面为止的区域进行拍摄。将摄像数据发送至影像处理部22。
影像处理部22获取根据支架3的开关4 (铰链203以及照相机支撑部32)检测出的照相机2的朝向(以下，称为拍摄方向)。影像处理部22基于获取到的拍摄方向以及经由通信终端5发送来的来自拾音放音装置1的发言者方位数据Pm，从摄像数据中仅提取必要部分进行图像修整，生成影像数据。将生成的影像数据发送至通信终端5。
下面，对该视频会议装置的使用方法以及影像处理部22的影像数据生成方法，进一步进行具体说明。此外，在以下的说明中，示出本装置侧的会议参加者为5名的情况，但会议参加者数并不特别限为该数目。
图4是表示配置本实施方式中的视频会议装置，并与通过网络连接的其他地点进行视频会议的状况的图，是表示照相机2对会议参加者601 605进行拍摄的情况的图。
图5是用于说明影像数据的生成的说明图，(A)表示经由鱼眼透镜拍摄到的影像(图像)，(B) 、 (C)表示各个会议参加者方位的图像修整的概要。图6是表示配置本实施方式的视频会议装置，并与通过网络连
接的其他地点进行视频会议的状况的图，是表示照相机2对资料650
进行拍摄的情况的图。
图7是用于说明影像数据的生成的说明图，(A)表示经由鱼眼透镜拍摄到的影像(图像)，(B)表示拍摄资料时的图像修整的概要。
在进行视频会议的情况下，会议参加者601 605相对于椭圆形的桌子700，就座于除了长度方向的一端之外的位置上。在桌子700 上，设置由圆形的拾音放音装置1和通过支架3固定于拾音放音装置 l上的照相机2组成的一体部件。此时，照相机2处于朝向水平方向的状态，设置为与桌子700的长度方向平行的轴和鱼眼透镜的中心轴一致。在桌子700的下方设置通信终端5。通信终端5与拾音放音装置l、照相机2电气连接，且与网络500连接。另外，通信终端5与显示器6电气连接。显示器6由例如液晶显示器等构成，设置在桌子 700的没有会议参加者601 605就座的一侧端部附近。此时，显示器6设置为显示面朝向桌子700的方向。
如果在这种状态下进行视频会议，则包含拾音放音装置1、照相机2、通信终端5的视频会议装置，通过两种模式将会议的影像发送至对方的视频会议装置。
(1)会议参加者拍摄模式
如果会议参加者601 605中任意一位将照相机2设置为水平方向，则通过来自开关4的检测信号，照相机2的影像处理部22检测出选择了会议参加者拍摄模式这一情况。影像处理部22检测出会议参加者拍摄模式之后，将该模式的选择信号发送至通信终端5。
照相机2的摄像部21，通过鱼眼透镜获取对就座于本装置侧的所有会议参加者601 605进行拍摄而获得的摄像数据，并输出至影像处理部22。在这里，由于摄像数据是通过鱼眼透镜得到的，所以拍摄区域如图5 (A)所示成为圆形。在选择会议参加者拍摄模式的情况下，影像处理部22在以方位角0表示圆弧状弯曲的水平方向、以仰角4表示垂直方向的坐标系中，获取圆形的摄像数据。即，在与透镜轴相同的高度设定为》=0° 、 0=0° 。另外，设定为在从该坐标向左方向扩展的方向上0负向增加，在向右方向扩展的方向上力正向增加。因此，从照相机2的鱼眼透镜的最前端，相对于拍摄方向在左方向上与鱼眼透镜的轴垂直的方向
为d)=_90° ，从照相机2的鱼眼透镜的最前端，相对于拍摄方向在右方向上与鱼眼透镜的轴垂直的方向为0=+90° 。另外，设定为在从该坐标向上方向扩展的方向上4正向增加，在向下方向扩展的方向上0负向增加。因此，从照相机2的鱼眼透镜的最前端，相对于拍摄方向在上方向上与鱼眼透镜的轴垂直的方向为0二+90° ，从照相机2的鱼眼透镜的最前端，相对于拍摄方向在下方向上与鱼眼透镜的轴垂直的方向为0=—90° 。
拾音放音装置1通过前述处理，获取正在发言的会议参加者的声音，同时检测会议参加者方位，将接收音频数据和发言者方位信息e发送至通信终端5。例如，如果图4所示的会议参加者601进行发言，则拾音放音装置1检测会议参加者601的方位61，将基于来自
会议参加者601方向的声音的接收音频数据和发言者方位信息ei发
送至通信终端5。另外，如果会议参加者605进行发言，则拾音放音装置1检测会议参加者605的方位02，将基于来自会议参加者605方向的声音的接收音频数据和发言者方位信息e2发送至通信终端5。通信终端5将发言者方位信息e发送至照相机2的影像处理部22。
影像处理部22基于来自通信终端5的发言者方位信息e对摄像数据进行修整。影像处理部22预先存储有发言者方位信息e和针对摄像数据设定的方位角0之间的关系。这样，如果影像处理部22
接收到发言者方位信息e，则读出所对应的方位角0。例如，如果影
像处理部22接收到与会议参加者601对应的发言者方位信息ei，则读出所对应的方位角0=0° 。另外，例如，如果影像处理部22接收到与会议参加者605对应的发言者方位信息92,则读出所对应的方位角0 =—90° 。
影像处理部22设定图像提取方位角范围，该图像提取方位角范围是由包含所读出的方位角0的规定方位角宽度构成的。另外，影像处理部22设定图像提取仰角范围，该图像提取仰角范围是由包含
仰角0=0°的规定仰角宽度构成的。然后，影像处理部22通过所
设定的方位角范围和仰角范围而确定图像提取区域，获取与该区域对应的摄像数据作为图像数据。
例如，如果影像处理部22读出方位角0=0° ，则将包含0 =0°的方位角0 1 方位角d)2(0K(r <02)的范围设定为方位角范围。另外，影像处理部22将包含《=0°的仰角0 1 仰角0 2(c/;K(/)2)的范围设定为仰角范围。然后，影像处理部22根据方位角范围01 (/)2、仰角范围0 1 02而设定图像提取区域，获取图像数据621。另外，例如，如果影像处理部22读出方位角力=一90° ，则将包含0=—90°的方位角(/)3 方位角<^4(0 3<—90°<04)的范围设定为方位角范围。另外，影像处理部22将包含^=0°的仰角0 3 仰角4 4((^3〈44)的范围设定为仰角范围。然后，影像处理部22根据方位角范围》3 04、仰角范围03 04而设定图像提取区域，获取图像数据622。
影像处理部22对获取到的每个图像提取区域进行图像的修整变换。具体地说，将以两个角度方向即(f)方向和^方向定义的各像素进行修整变换，以转换为二维正交平面坐标(X — Y坐标系)的像素。此时，影像处理部22预先存储0 — c/)坐标系和X —Y坐标系之间的变换处理表，基于获取到的各像素的0 — 0坐标计算出X — Y坐标，而进行修整变换。此外，影像处理部22也可以预先存储坐标变换运算式，使用该坐标变换运算式进行修整变换。
例如图5 (B)所示，影像处理部22将以方位角范围^1 02、仰角范围0 l 0 2设定的图像数据621变换为修整图像数据621'，该修整图像数据621'是以平面坐标系即水平方向为X轴、垂直方向为Y轴的xl x2、 yl y2进行设定的。通过该变换，将在0 — ^坐标系中获取的会议参加者601的人物像611变换为X — Y坐标系(平面坐标系)的修整人物像631。通过如上述所示变换至X — Y坐标系，修整人物像631接近于会议参加者601的自然体像。
另外，例如图5(C)所示，影像处理部22将以方位角范围03 04、仰角范围(/)3 04设定的图像数据622变换为修整图像数据622'，该修整图像数据622'是以平面坐标系即水平方向为X轴、垂直方向为Y轴的x3 x4、 y3 y4进行设定的。通过该变换，将在d)一 4坐标系中获取的会议参加者605的人物像615变换为X — Y坐标系(平面坐标系)的修整人物像635。通过如上述所示变换至X —Y坐标系，修整人物像635接近于会议参加者601的自然体像。
影像处理部22在包含如上述所示与自然体相近的修整人物图像的修整图像数据中添加时间信息，并作为影像数据输出至通信终端
5。上述修整图像数据的生成及输出是逐次进行的，如果接收到的发言者方位信息e变化，则对应于该变化，修整图像数据的中心方向也进行切换。
通信终端5将来自影像处理部22的影像数据、接收音频数据和发言者方位信息9相关联而生成通信数据，经由网络500发送至对方的视频会议装置。由此，可以向在对方的视频会议装置周围就座的会议参加者提供与正在发言的会议参加者的自然体相近的影像和该会议参加者的发言。
(2)资料拍摄模式
如果会议参加者601 605中任意一位如图6所示，将照相机2设置为垂直下方，则通过来自开关4的检测信号，照相机2的影像处理部22检测出选择了资料拍摄模式这一情况。影像处理部22检测出资料拍摄模式后，将该模式的选择信号发送至通信终端5。
另外，会议参加者601 605中任意一位，在桌子700上以铰链203的垂直下方位置为中心放置资料650。此时，只要预先在桌子700上进行了资料放置用标记，就可以容易且恰当地放置资料650。
照相机2的摄像部21，通过鱼眼透镜获取对放置在桌子700上的资料650进行拍摄而获得的摄像数据，并输出至影像处理部22。在这里，由于摄像数据是通过鱼眼透镜而得到的，所以拍摄区域如图7 (A)所示成为圆形。
在选择了资料拍摄模式的情况下，影像处理部22在r 一T7坐标系中获取圆形的摄像数据，该r一T7坐标系以摄像数据的中心为原向延伸的距离r 、和相对于规定方向(在图
7中，是从原点朝向摄像数据，以右方向作为0°方向)的角度77进行表示。影像处理部22从获取到的摄像数据中，截取预先设定的范围的图像数据680。
影像处理部22通过将r 一 77坐标系的图像数据680变换为X一Y平面坐标系的修整图像数据680，而进行修整。此时，影像处理部22预先存储有r 一 "坐标系和X — Y坐标系之间中心坐标一致的坐标变换处理表，基于获取的各像素的r 一 77坐标计算出X — Y坐标，而进行修整变换。此外，影像处理部22也可以预先存储坐标变换运算式，使用该坐标变换运算式进行修整变换。
通过该变换，将在r一r 坐标系中获取到的资料650的资料像660变换为X — Y坐标系(平面坐标系)的修整资料像670。通过如上述所示变换至X — Y坐标系，修整资料像670接近于资料650的自然体像。即，可以获取文字没有变形的资料650的图像数据。
通信终端5生成包含从影像处理部22获取的资料650的图像数据的通信数据，经由网络500发送至对方的视频会议装置。由此，可以向在对方的视频会议装置周围就座的会议参加者提供清晰且容易辨认的资料图像。另外，此时如果通信终端5从拾音放音装置1获取到接收音频数据，则也可以生成同时包含资料650的图像数据和接收音频数据的通信数据并进行发送。
如上述所示，通过使用本实施方式的结构以及处理，可以在与各自的规格相匹配的状态下，获取会议参加者的影像和资料的图像并进行发送。此时，仅通过使照相机可以在水平方向和垂直下方这两个方向上变化，就可以容易地获取与各自的规格对应的会议参加者影像和资料图像。
下面，参照

实施方式2所涉及的视频会议装置。
图8是本实施方式的视频会议装置中，由拾音放音装置1、照相
机2和支撑体7构成的组合部件的外观图，(A)是俯视图，(B)
是侧视图。
图9是表示使用本实施方式的视频会议装置时的视频会议装置的使用状况的图，(A)是俯视图，(B)是侧视图。此外，在图8、
图9中，对于将拾音放音装置l、照相机2连接的电缆之类的部件，
省略图示。
图10是说明由本实施方式中的视频会议装置生成影像数据的图，(A)是表示摄像数据的图，(B)是摄像数据的中心部的图像修整的概念图，(C)是摄像数据的周围部分的图像修整的概念图。
本实施方式的视频会议装置中，拾音放音装置1以及通信终端5的结构及处理，与实施方式1的视频会议装置相同。另一方面，本实施方式的视频会议装置中，照相机2的设置构造即支撑体7的构造、以及照相机2中的影像处理部22的影像处理方法，与实施方式1不同，省略了开关4。
如图8所示，在圆板状的拾音放音装置1的周围配置支撑体7。支撑体7具有下述部分而构成四根垂直支撑轴，其沿垂直方向延伸；两根水平支撑轴，其相对于拾音放音装置1的上表面配置在距离为hl的位置上；以及四根水平支撑轴，其相对于拾音放音装置1的上表面配置在距离为h2 (〉hl)的位置上。配置在距离hl处的两根水平支撑轴，构成为俯视观察拾音放音装置1时在大致中心的位置处相交，由四根垂直支撑轴保持在距离hl处。配置在距离h2处的水平支
撑轴以俯视观察下呈大致正方形的方式进行连接，由四根垂直支撑轴保持在距离h2处。
照相机2设置在位于距离hl处的两根水平支撑轴的交点上。照相机2设置为拍摄方向朝向垂直上方。
载置台8由位于距离h2处的四根水平支撑轴进行支撑，载置台8由透射性高的玻璃或丙烯板等形成。此时，载置台8和照相机2设置为，在俯视观察的状态下载置台8的中心和照相机2的鱼眼透镜的轴大致一致。
在载置台8上，以印刷面朝向垂直下方、即与载置台8接触的方向的方式放置资料650。
在这里，照相机2的高度以及载置台8的高度、即距离hl、h2，如图9所示，只要设定为可以由照相机2至少拍摄到会议参加者601 604的面部，且不会被对载置台8进行支撑的水平支撑轴遮挡即可。
在使用上述结构的视频会议装置的情况下，由照相机2的摄像部21获取的摄像数据如图10 (A)所示。g卩，由于摄像数据是通过鱼眼透镜进行拍摄的，所以形成整个拍摄区域为圆形的整体区域图像数据610，其中心显映出资料650的资料像660，其周边部显映出各会议参加者601 604的人物像641 644。
影像处理部22在r — 77坐标系中获取圆形的摄像数据，该r 一77坐标系以摄像数据的中心为原点，通过从原点向放射方向延伸的距离r、和相对于规定方向(在图10中，是从原点朝向摄像数据，以右方向为(T方向)的角度r 进行表示。影像处理部22从获取到的摄像数据中，截取预先设定的范围的图像数据681。
影像处理部22通过将r 一 77坐标系的图像数据681变换为X一Y平面坐标系的修整图像数据681'而进行修整。此时，影像处理部22预先存储有r _ 7 坐标系和X — Y坐标系之间中心坐标一致的坐标变换处理表，基于获取到的各像素的r 一 77坐标计算出X — Y坐标，而进行修整变换。此外，影像处理部22也可以预先存储坐标变换运算式，使用该坐标变换运算式进行修整变换。
通过该变换，如图10 (B)所示，将在r 一 r 坐标系中获取的资料650的资料像660变换为X — Y坐标系(平面坐标系)的修整资料像670。通过如上述所示变换至X — Y坐标系，修整资料像670接近于资料650的自然体像。即，可以获取文字没有变形的资料650的图像数据。
另外，影像处理部22获取从整体区域图像数据610中去掉中心附近的图像数据681后的周边部图像数据682。影像处理部22基于经由通信终端5从拾音放音装置1获取的发言者位置信息，与实施方式1相同地设定进行提取的区域。即，影像处理部22提取包含正在发言的会议参加者的像的区域，获取部分图像数据683。此时，影像处理部22在r 一 77坐标系中获取部分图像数据。具体地说，如图10(C)所示，影像处理部22基于发言者方位信息，将包含该会议参加者的像的扇形形状四个角部的坐标设定为(r 10， 77 10)、 (r10，77 20)、 (r20， 7 20)、 ( r 20， r 10)而进行获取。
影像处理部22对获取到的部分图像数据683进行修整变换。具体地说，将以r一"坐标系定义的各像素进行修整转换，以转换为二维正交平面坐标(X — Y坐标系)的像素。此时，影像处理部22预先存储有r一r 坐标系和X — Y坐标系之间的变换处理表，基于获取到的各像素的r一r)坐标计算X — Y坐标，而进行修整变换。此外，影像处理部22也可以预先存储坐标变换运算式，使用该坐标变换运算式进行修整变换。
例如图10(C)所示，影像处理部22将以距离范围r 10 r20、方位角范围77 10 ^ 20设定的部分图像数据683变换为修整图像数据683'，该修整图像数据683'是以平面坐标系即水平方向为X轴、垂直方向为Y轴的xl0 x20、 yl0 y20进行设定的。通过该变换，将在r 一 "坐标系中获取的会议参加者604的人物像644变换为X一Y坐标系(平面坐标系)的修整人物像654。通过如上述所示变换至X —Y坐标系，修整人物像654接近于会议参加者604的自然体像。
影像处理部22在包含获取到的修整资料像670的修整图像数据和包含修整人物像654的修整图像数据中添加时间信息，作为影像数据输出至通信终端5。上述修整图像数据的生成以及输出是逐次进行
的，如果接收到的发言者方位信息e变化，则与该变化对应，输出仅
对包含修整人物像的修整图像数据进行了替换的影像数据。
通信终端5将来自影像处理部22的影像数据、接收音频数据和发言者方位信息e相关联而生成通信数据，经由网络500发送至对方的视频会议装置。由此，可以向在对方的视频会议装置周围就座的会议参加者提供与正在发言的会议参加者的自然体相近的影像和该会议参加者的发言，同时提供资料图像。
如上述所示，通过使用本实施方式的结构以及处理，可以以比较简单的构造实现同时获取正在发言的会议参加者影像和资料图像
并进行发送的视频会议装置。
此外，在本实施方式中，示出了同时获取会议参加者影像和资料图像并进行发送的例子，但资料图像的获取也可以不是始终进行，而是暂时进行，并仅在该定时进行发送。在此情况下，由于除了更换资料时之外资料图像不会变化，所以与始终发送资料图像的情况相比较，发送至对方的信息内容并没有减少。另一方面，由于在不发送资料图像的期间，处理以及网络负荷与资料图像的数据量相应地减少，所以可以更加高速地进行处理以及发送。此外，对于获取资料图像的定时，可以是在放置新的资料时从操作部进行获取操作输入，也可以设置图像解析部，将获取到的图像与此前的图像不同时设定为新的获取定时。
另外，在上述各实施方式中，示出了在照相机内具有影像处理部的例子，但也可以将该影像处理部使用独立于照相机的装置而实现，或安装在拾音放音装置或通信终端上。由此，由于照相机的构造更加简单，所以只要具有可以对上述必要区域进行拍摄的透镜，也可
以使用通用的摄影机。
另外，在上述说明中，示出了将通信终端与拾音放音装置独立设置的例子，但也可以使拾音放音装置具有通信终端所具有的功能。由此，由于视频会议装置的构成要素的数量减少，所以可以实现更简单且小型的视频会议装置。
详细且参照特定的实施方式对本发明进行了说明，但对于本领域的技术人员而言，显然可以在不脱离本发明的精神、范围或意图的范围内进行各种变更或修正。
本发明是基于2006年12月19日提交的日本专利申请(特愿 2006 — 341175)而提出的，在这里，作为参照而引用其内容。
权利要求
1.一种视频会议装置，其具有摄像部，其对规定区域进行拍摄；影像数据生成部，其基于该摄像部拍摄到的影像，生成影像数据；框体，其具有拾音放音部，该拾音放音部用于接收本装置周围的声音而生成接收音频数据，对播放音频数据进行播放；通信部，其生成具有所述接收音频数据和所述影像数据的通信数据，将该通信数据向外部发送，同时，从来自外部的通信数据中获取播放音频数据，并发送至所述拾音放音部；以及支撑部，其以规定的形态支撑所述摄像部，在该视频会议装置中，所述支撑部，以第1形态和第2形态中的某一种来支撑所述摄像部，该第1形态是使所述摄像部朝向所述框体周围的会议参加者拍摄区域的形态，该第2形态是使所述摄像部朝向所述框体附近的接近所述摄像部的区域的形态，所述影像数据生成部，如果检测出选择了所述第1形态，则从所述影像数据中仅截取与所述接收音频数据的拾音方位信息对应的方位区域，利用与所述第1形态对应的第1修整处理，对截取出的影像数据进行修整，如果检测出选择了所述第2形态，则从所述影像数据中截取以所述摄像部的正面方向为中心的规定区域，利用不同于所述第1修整处理的与所述第2形态对应的第2修整处理，对截取出的影像数据进行修整。
2. 根据权利要求1所述的视频会议装置，其中，所述支撑部具有用于切换所述第1形态和所述第2形态的关节机构，同时，利用该关节机构形成开关，所述影像数据生成部基于由所述关节机构形成的开关的选择状况，检测所述第1形态和所述第2形态的选择情况。
3. —种视频会议装置，其具有摄像部，其对规定区域进行拍摄；影像数据生成部，其基于该摄像部拍摄到的影像，生成影像数据；框体，其具有拾音放音部，该拾音放音部用于接收本装置周围的声音而生成接收音频数据，对播放音频数据进行播放；通信部，其生成具有所述接收音频数据和所述影像数据的通信数据，将该通信数据向外部发送，同时，从来自外部的通信数据中获取播放音频数据，并发送至所述拾音放音部；以及支撑部，其将所述摄像部以固定的形态支撑在所述框体上，在该视频会议装置中，所述摄像部同时对会议参加者拍摄区域和所述框体附近的接近所述摄像部的区域进行拍摄，所述影像数据生成部，从与所述会议参加者拍摄区域对应的第1部分影像数据中，仅截取与所述接收音频数据的拾音方位信息对应的方位区域，利用第3 修整处理对截取出的第1部分影像数据进行修整，利用与所述第3修整处理不同的第4修整处理，对与接近所述摄像部的区域对应的第2部分影像数据进行修整。
4. 根据权利要求3所述的视频会议装置，其中，该视频会议装置具有选择部，其选择用于所述通信数据的部分影像数据，所述影像数据生成部将由所述选择部选择出的部分影像数据发送至所述通信部。
5. 根据权利要求1至4中任一项所述的视频会议装置，其中，所述摄像部具有鱼眼透镜，将通过该鱼眼透镜拍摄的区域的中心区域作为接近所述摄像部的区域，至少将所述中心区域外侧的周边区域作为所述会议参加者拍摄区域。
6. 根据权利要求1至5中任一项所述的视频会议装置，其中，所述影像数据生成部与所述摄像部一体形成。
7. 根据权利要求1至6中任一项所述的视频会议装置，其中，所述通信部与所述拾音放音部一起，一体形成在所述框体上。
8. 根据权利要求1至5、7中任一项所述的视频会议装置，其中，所述影像数据生成部与所述拾音放音部一起，一体形成在所述框体上。
9. 根据权利要求1至8中任一项所述的视频会议装置，其中，该视频会议装置具有显示器，其用于再生影像数据，所述通信部获取包含在通信数据中的影像数据，并发送至所述显示器。
全文摘要
本发明提供一种视频会议装置，其可以准确且清晰地发送会议参加者声音、会议参加者影像及资料。照相机(2)通过支架(3)相对于圆盘状的拾音放音装置(1)进行定位。照相机(2)可转动地设置在该位置上，可以在水平方向和垂直下方这2种形态下进行半固定。此时，使用开关来检测照相机(2)的形态。如果使照相机(2)朝向水平方向，则照相机(2)对会议参加者进行拍摄，提取并获得正在发言的会议参加者的影像。另一方面，如果使照相机(2)朝向垂直下方，则对预先设置的资料进行拍摄。由于在照相机(2)上安装有鱼眼透镜，所以通过与各形态对应的方式对获取的影像进行修整，而生成进行发送的图像数据。
文档编号H04N7/15GK101518049SQ200780034288
公开日2009年8月26日申请日期2007年12月19日优先权日2006年12月19日
发明者田丸卓也, 畑纪行申请人:雅马哈株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：畑纪行;田丸卓也
技术所有人：雅马哈株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。