视频交互控制方法和装置与流程

文档序号：12731871阅读：429来源：国知局

本发明涉及监控
技术领域：
，特别涉及一种视频交互控制方法和装置。
背景技术：
：随着现代社会的发展，人口老龄化是当今世界人口发展的趋势，人口老龄化已日益成为世界各国关注的重大人口问题。老人的增多，在一方面意味着需要对这些老人在生活上进行照顾，以避免因其身体状况，出现意外时，不能得到及时的救助。现代社会，老年人主要依靠子女或者护理人员来看护，但是，由于生活节奏快，子女一般忙于工作，难以有大量的时间来陪伴，而护理人员数量有限，难以照顾到数量日益增多的老年人群体，在老年人日常生活中常常出现独居情况，如遇到突发疾病或者身体不适，并不能确保能及时得到救助，容易出现安全问题。除了老人在有需要时希望与看护人或子女进行视频通话，孩子与家长、病人与医生以及家人之间等也有类似视频呼救、视频互动需要。虽然手机可以随时随地视频通话，但需要人去操作，要把手机摄像头对准需要交互的人，很是麻烦，有时错失交互的情形。而现有技术并不存在一种在需要时自动与家人接通视频呼叫或视频交互的技术。技术实现要素：本发明是为克服现有技术不足，提供一种可解决自动启动视频看护、视频呼叫和视频互动的问题，具体地说，本发明实施例提供了一种视频交互控制方法和装置。按照本发明的第一方面，本发明提供了一种视频交互控制装置，所述装置包括：摄像云台，用于获取视频信息；第一方向声音采集单元，用于获取第一声音信息；第二方向声音采集单元，用于获取第二声音信息，所述第二声音信息与所述第一声音信息由同一声源发出；处理单元，分别有输入端口与所述第一方向声音采集单元和所述第二方向声音采集单元电连接，用于识别获取的声音信息，所述处理单元还与所述摄像云台电连接，还用于当获取的声音信息属于预存的声音样本数据时，根据所述第一声音信息和所述第二声音信息计算出所述声源的位置信息，并根据计算出的所述位置信息，控制所述摄像云台转向所述声源；通信单元，与所述处理单元电连接，用于与预设视频交互对象进行视频信息交互。在本发明上述的视频交互控制装置中，所述第一方向声音采集单元用于获取第一声音信息，由一个或一个以上麦克风实现，所述第二方向声音采集单元用于获取第二声音信息，由一个或一个以上麦克风实现。在本发明上述的视频交互控制装置中，所述处理单元根据所述第一声音信息和所述第二声音信息的时延来对所述声源进行定位。在本发明上述的视频交互控制装置中，所述处理单元为带声音定位算法的主控芯片。在本发明上述的视频交互控制装置中，所述处理单元预存有至少两个视频交互对象的通信地址，所述通信地址与预存的所述声音样本数据对应，所述处理单元用于当识别出所述第一方向声音采集单元和所述第二方向声音采集单元获取的声音信息对应的声音样本数据时，指示所述通信单元接通与识别出的所述声音样本数据对应的通信地。在本发明上述的视频交互控制装置中，所述通信单元为基于QQ物联平台的视频通信模块。在本发明上述的视频交互控制装置中，所述通信单元为蓝牙单元、或者WIFI单元、或者局域网接入单元。按照本发明另一方面，提供了一种视频交互控制方法，所述方法包括：从不同的方向获取同一声源的第一声音信息和第二声音信息；根据预存的声音样本数据，对获取的声音信息进行识别；当获取的声音信息属于预存的所述声音样本数据时，根据所述第一声音信息和所述第二声音信息计算出所述声源的位置信息；根据所述声源的位置信息，获取所述声源处的视频信息，所述视频信息用于与预设的视频交互对象进行视频信息交互。在本发明上述视频交互控制方法中，所述方法还包括：当获取的声音信息属于预存的所述声音样本数据时，根据预存的与所述声音样本数据对应的通信地址，得到获取的声音信息对应的通信地址；根据获取的通信地址与相应的视频交互对象进行视频信息交互。在本发明上述的视频交互控制方法中，所述声音样本数据为声源者的呼唤声音数据或紧急呼救的特定声音数据。本发明实施例提供的技术方案带来的有益效果是：通过第一方向声音采集单元和第二方向声音采集单元来获取同一声源发出的第一声音信息和第二声音信息，然后，在处理单元识别出获取的声音信息属于预存的声音样本数据时，根据第一声音信息和第二声音信息对声源进行定位，最后，处理单元控制摄像云台转向声源，并通过通信单元与预设的视频交互对象进行视频信息交互。这样通过对声源者发出的声音进行识别，当识别出声源者发出的声音属于预设声音样本数据时，控制摄像云台转向声源处并将获取声源者的视频信息与预设视频交互对象进行交互，可以将声源者的突发状况及时反馈给视频交互对象，使得声源者得到及时救助，实现紧急情况下的自动视频呼叫和视频交互。此外，该视频交互控制装置结构简单，使用便利，利于大规模推广。附图说明为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1是本发明实施例一提供的一种视频交互控制装置的结构示意图；图2是本发明实施例一提供的一种视频交互控制装置的结构示意图；图3是本发明实施例二提供的一种视频交互控制方法的流程图；图4是本发明实施例二提供的一种视频交互控制方法的流程图。具体实施方式为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。实施例一本发明实施例提供了一种视频交互控制装置，参见图1，该装置包括：摄像云台1、第一方向声音采集单元2、第二方向声音采集单元3、处理单元4、以及通信单元5。摄像云台1，用于获取视频信息，摄像云台1包括摄像头以及控制摄像头选择的伺服机构，摄像云台1与处理单元4连接，期间传输的信号包括视频音频数据以及来自处理单元4的云台旋转控制信号，也可以包括云台升降信号。在本实施例中，处理单元4可以与摄像平台1做成一体。第一方向声音采集单元2，用于获取第一声音信息。可以由一个或一个以上麦克风实现。第二方向声音采集单元3，用于获取第二声音信息，也可以由一个或一个以上麦克风实现。第二声音信息与第一声音信息是指第一和第二方向采集单元对由同一声源发出的声音进行采集所分别得到的信息，由于两个采集单元可以用一字形排成阵列的多个麦克风实现，只要声源与各个麦克风距离不同，因此延迟就不同，本发明是计算声音到达两个采集单元即阵列各个麦克风的延迟的不同，来获取声源所在方向的。声源到达两个采集单元的延迟及声源所在方向的计算，是由处理单元4中运行的程序实现的。在具体实施中，第一第二方向声音采集单元除了可以集成为一个麦克风阵列外，还可以与摄像平台1及处理单元4、通信单元5等做成一体，可以是可拆卸组合式结构。处理单元4，分别有输入端口与第一方向声音采集单元2、第二方向声音采集单元3连接用于识别获取的声音信息，处理单元4还与摄像云台1电连接，还用于当获取的声音信息属于预存的声音样本数据时，根据第一声音信息和第二声音信息计算出声源的位置信息，并根据计算出的位置信息，控制摄像云台1转向声源。作为一种变形，处理单元4可以有自己的麦克风，用于识别，而在识别出后再利用第一和第二方向声音采集单元进行声源定向。在本发明的装置中，处理单元4预先存储有一个声音样本数据，例如“救命啊”，“快来救我”，“爸爸啊”等，每个声音样本都有一个或多个对应的视频交互对象。为实现视频交互，本装置包括通信单元5，与处理单元4电连接，用于与预设视频交互对象进行视频信息交互。在本实施例中，第一方向声音采集单元2和第二方向声音采集单元3位于同一声源的不同方向上，并同时采集同一声源发出的声音信息。处理单元4在识别出声源者发出特定的声音后，控制摄像云台1转向声源方向，并开启摄像头及其麦克风，获取声源处的视频信息，并将获取到的视频信息通过通信单元5与预设的视频交互对象进行视频信息交互，这样可以让预设的视频交互对象及时获知声源者的具体信息，达到及时看护的目的。采用摄像云台1可以增大视频交互控制装置的监控范围，采用处理单元4对声源进行声音定位，可以准确获取声源处的视频信息。需要说明的是，在本实施例中，视频交互控制装置可以不仅仅只包括第一方向声音采集单元2和第二方向声音采集单元3两个声音采集单元，可以根据监控范围设置更多的方向声音采集单元。在具体实施过程中，第一和第二方向声音采集单元可以根据实际的需求采用成阵列排布的多个麦克风。例如：如图2所示的视频交互控制装置中，采用了7个用于声源定位的麦克风6(包括了第一方向声音采集单元2和第二方向声音采集单元3)，这些声音采集麦克风6以列阵的形式设置在摄像云台1的两侧，使得采集到的声音信息更加丰富，对声源7的定位更加精确。在本实施例中，该视频交互控制装置不仅可以用于看护老年人，还可以用于看护病人、小孩子等需要看护的人群。具体地，第一方向声音采集单元2用于获取第一声音信息，由一个或一个以上麦克风实现，第二方向声音采集单元3用于获取第二声音信息，由一个或一个以上麦克风实现。在本实施例中，由于传统的单个麦克风获取声音信号的范围有限，且获取的声音信号质量有限，第一方向声音采集单元2和第二方向声音3采用麦克风阵列构成，这样不仅可以提高声音信号的获取范围，还可以提高获取的声音信号质量，进而提高视频交互控制装置对声源定位的准确性。当麦克风阵列较长，可以定向的角度也大，因此可监控的范围也大。换言之，在本发明中，运行一个定位程序的处理单元4，可以根据第一声音信息和第二声音信息的时延来对声源进行定位，从而保证视频交互的对象与摄像头相对。在本实施例中，处理单元4采用时延来进行定位，该定位方式不受获取声音信息设备的结构限制(即不受第一方向声音采集单元2和第二方向声音采集单元3的结构限制)，可以简化视频交互控制装置的结构，降低视频交互控制装置的制造成本，同时该定位方法计算量小，视频交互控制装置的响应速度快，能及时对声源者的突发状况进行反应。进一步地，处理单元4可以为带声音定位算法的主控芯片，可以减小视频交互控制装置的体积，便于安装和使用，同时又能降低视频交互控制装置的制造成本。为实现自动视频交互的控制，处理单元4可预存有至少两个视频交互对象的通信地址，通信地址与预存的声音样本数据对应。如下表声音样本数据视频通信地址备注“我是XXX”192.168.x.y视频呼叫社区服务中心“我在X栋X室”192.168.z.y视频呼叫社区家庭医生处理单元4用于当获取的声音信息属于预存的声音样本数据时，得到获取的声音信息对应的通信地址，并指示通信单元5接通与获取的声音信息对应的通信地。在本实施例中，在处理单元4中可预存多个视频交互对象的通信地址，并且将这些通信地址与预存的声音样本数据进行关联，当声源者需要与特定的视频交互对象进行视频信息视频交互时，可以通过发出特定的声音信息来直接选定视频交互对象，例如：声源者可以呼叫视频交互对象的名称，处理单元4中存储有与视频交互对象名称对应的视频交互对象的通信地址，此时，处理单元4在识别出声源者发出的声音信息为预存的声音样本信息，控制通信单元5接通相应的通信地址。这样可以便于使用者(即声源者)快速与特定的视频交互对象进行视频交互，提高了用户体验。作为一个更具体的例子，通信单元5可以为基于QQ物联平台的视频通信模块，可以利用现有的QQ物联平台来进行视频信息交互，进而简化视频交互控制装置的结构，减少视频交互控制装置的制造成本。此处，交互对象的地址可以表述为QQ号，如下表。其中，当识别出“爸爸救我”时，云台转向声源，启动视频交互，顺序接通相应的人进行视频交互，当第一接通QQ无法接通，则接通第二接通QQ，依次类推。在本实施例中，涉及到的声音样本数据以及对应的视频交互通信地址，可以预先设置于处理单元4中，也可以通过其他方式进行修改。可选地，通信单元5可以为蓝牙单元、或者WIFI单元、或者局域网接入单元，通信单元5可以有多种通信方式，增加了视频交互控制装置的适用范围。本发明实施例通过第一方向声音采集单元和第二方向声音采集单元来获取同一声源发出的第一声音信息和第二声音信息，也可以通过其他麦克风获取呼叫语音，当处理单元4通过麦克风识别出获取的声音信息属于预存的声音样本数据时，再根据第一声音信息和第二声音信息对声源进行定位，确定摄像头调整角度后，处理单元控制摄像云台1转向声源，并通过通信单元与预设的视频交互对象进行视频信息交互。这样通过对声源者发出的声音进行识别，当识别出声源者发出的声音属于预设声音样本数据时，控制摄像云台转向声源处并将获取声源者的视频信息与预设视频交互对象进行视频交互，可以将声源者的突发状况及时反馈给视频交互对象，使得声源者得到及时救助，实现紧急情况下的自动视频呼叫和视频交互。此外，该视频交互控制装置结构简单，使用便利，利于大规模推广。实施例二本发明实施例提供了一种视频交互控制方法，适用于实施例一所述的视频交互控制装置，参见图3，该方法包括：步骤S21，从不同的方向获取同一声源的第一声音信息和第二声音信息。在本实施例中，可以采用第一方向声音采集单元和第二方向声音采集单元从不同的方向来获取同一声源的声音信息。步骤S22，根据预存的声音样本数据，对获取的声音信息进行识别。在本实施例中，可以采用视频交互控制装置的处理单元来进行识别工作，即判断获取的声音信息是否属于预存的声音样本数据。步骤S23，当获取的声音信息属于预存的声音样本数据时，根据第一声音信息和第二声音信息计算出声源的位置信息。在本实施例中，可以根据第一声音信息和第二声音信息的时延来计算出声源的位置信息。步骤S24，根据声源的位置信息，获取声源处的视频信息，该视频信息用于与预设的视频交互对象进行视频信息交互。在本实施例中，根据声源的位置信息，可以控制视频交互控制装置的摄像云台转向声源，并获取声源处的视频信息。进一步地，参见图4，该方法还包括：步骤S25，当获取的声音信息属于预存的声音样本数据时，根据预存的与声音样本数据对应的通信地址，得到获取的声音信息对应的通信地址。在本实施例中，当获取的声音信息属于预存的声音样本数据时，先得到获取的声音信息对应的声音样本数据，然后根据得到的声音样本数据来获取对应的通信地址。这样声源者可以通过发出特定声音来直接连通特定的视频交互对象，提高了声源者的用户体验。具体的，声音样本数据可以为声源者的呼唤声音数据或紧急呼救的特定声音数据。这样可以减少其他外部声音的干扰，提高识别声源者发出声音的准确性。需要说明的是，上述步骤S25与步骤S23没有先后之分，这里对顺序不作限制。步骤S26，根据获取的通信地址与相应的视频交互对象进行网络连接，进而进行视频信息交互。本发明实施例通过获取同一声源发出的第一声音信息和第二声音信息，在识别出获取的声音信息属于预存的声音样本数据时，根据第一声音信息和第二声音信息对声源进行定位，最后，控制摄像云台1转向声源，并与预设的视频交互对象进行视频信息交互。这样通过对声源者发出的声音进行识别，当识别出声源者发出的声音属于预设声音样本数据时，控制摄像云台转向声源处并将获取声源者的视频信息与预设视频交互对象进行视频交互，可以将声源者的突发状况及时反馈给视频交互对象，使得声源者得到及时救助，实现紧急情况下的自动视频呼叫和视频交互。上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈芒
技术所有人：深圳市轻生活科技有限公司
我是此专利的发明人

上一篇：防倾倒托盘支撑结构及其应用的机柜的制作方法与工艺
上一篇：一种VTM机安装支架的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。