一种声音控制方法及显示设备与流程

文档序号：25538173发布日期：2021-06-18 20:32阅读：96来源：国知局

本发明涉及显示设备领域，尤其涉及一种声音控制方法及显示设备。

背景技术：

在实际应用场景中，例如当用户坐在沙发上未移动时，用户与电视之间的相对距离不变，用户可通过遥控器手动调节电视功放音量，也可在电视的设置菜单来设置音效和声音模式，从而使功放输出适应于当前距离并且使用户听觉清晰舒适的声音，除非用户再次手动调节声音，否则声音设置保持固定不变。然而当用户身体发生移位，在不同位置观看电视时，声音可能存在一定程度的音质损失或音量不适，只有用户重新回归到未移动之前的位置或者再次调节声音，才能使声音播放效果得以改善，导致用户体验差。

技术实现要素：

为解决上述背景技术中存在的问题，本发明提供一种声音控制方法及显示设备，可以根据实时检测的用户位置，自适应地将声音自动调整到最佳播放效果，提升用户体验。

第一方面提供的显示设备，包括：

本机内置的摄像头或用于外接摄像头的第一接口，所述摄像头用于采集显示设备前方的图像；

本机内置的声音播放器或用于外接声音播放器的第二接口，所述声音播放器用于播放音频；

控制器，用于执行：

响应于启用所述摄像头的操作，控制所述摄像头采集用户图像；

根据所述用户图像检测用户状态，所述用户状态为静止状态或运动状态；

如果所述用户状态在预设时间内保持静止状态，则根据用户图像检测用户当前相对于所述摄像头的位置，并将当前的用户位置记录为基准位置，以及，将声音播放器的当前音量记录为基准音量，所述基准音量为用户在所述基准位置处设定的音量值；

控制摄像头继续采集用户图像；

当检测到用户位置相较于所述基准位置发生变化时，根据用户图像检测用户状态；

当所述用户状态在预设时间内保持静止状态时，根据变化后的用户位置、所述基准音量和预设声音曲线，控制声音播放器调节音量。

第二方面提供的声音控制方法，用于显示设备中，包括：

响应于启用摄像头的操作，控制所述摄像头采集用户图像；

根据所述用户图像检测用户状态，所述用户状态为静止状态或运动状态；

控制摄像头继续采集用户图像；

当检测到用户位置相较于所述基准位置发生变化时，根据用户图像检测用户状态；

当所述用户状态在预设时间内保持静止状态时，根据变化后的用户位置、所述基准音量和预设声音曲线，控制声音播放器调节音量。

本申请技术方案中，声音播放器可以是显示设备自身内置的扬声器，或者是显示设备外接的音响等设备。显示设备自身可以内置摄像头，或者通过第一接口外接摄像头，摄像头可以拍摄显示设备前方视野区域内的用户图像，通过用户图像可以检测用户位置以及用户状态。用户位置比如是用户与摄像头之间的直线距离，用以衡量用户与显示设备之间的远近，用户位置还可以是用户相对于摄像头的方位角，用以衡量用户所处的方位；用户状态即用户是静止状态或运动状态，用以确定用户位置是否固定。

当用户启用摄像头时，即可采集用户图像，并根据用户图像检测用户状态，如果用户状态在预设时间内始终保持静止，说明用户已经调整好自身位置并固定不变，将检测到的当前用户位置作为基准位置，用户在基准位置处可操作遥控器的音量调节键设定好合适的音量，则将用户调音后声音播放器的当前音量作为基准音量，基准位置和基准音量会作为后续调节声音播放器音量的参照基准。

基准位置和基准音量获取之后，摄像头继续采集用户图像，当检测到用户位置相对于基准位置变化时，由于用户位置会直观影响用户对音量的听觉感受，因此满足音量调节条件，则进一步检测用户状态，当用户状态在预设时间内始终保持静止状态不变，则说明用户已经重新调整好位置并保持在该位置不动，则根据变化后的用户位置在和基准音量，结合显示设备预先设置好的预设声音曲线，即可将声音播放器的音量自适应调整到适应于当前用户位置。本申请可以通过摄像头ai识别用户位置及用户状态，从而自适应调节声音播放器的音量，使用户在显示设备附近的任意位置都能享受到最优的声音播放效果，提升用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要访问的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据一些实施例的显示设备的使用场景；

图2示出了根据一些实施例的控制装置100的硬件配置框图；

图3示出了根据一些实施例的显示设备200的硬件配置框图；

图4示出了根据一些实施例的显示设备200中软件配置图；

图5示出了根据一些实施例的显示设备200中应用程序的图标控件界面显示图；

图6中示例性示出了一种声音控制方法的流程图；

图7中示例性示出了预设声音曲线的示意图；

图8中示例性示出了显示设备两侧分别设有外部功放场景下的声音控制方法的流程图；

图9中示例性示出了用户方位分布俯视图；

图10中示例性示出了预设平衡调整曲线的示意图。

具体实施方式

为使本申请的目的和实施方式更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施方式进行清楚、完整地描述，显然，描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

需要说明的是，本申请中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本申请的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明。应该理解这样使用的用语在适当情况下可以互换。

术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的所有组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

图1为根据实施例中显示设备的使用场景的示意图。如图1所示，显示设备200还与服务器400进行数据通信，用户可通过智能设备300或控制装置100操作显示设备200。

在一些实施例中，控制装置100可以是遥控器，遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式中的至少一种，通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令，来控制显示设备200。

在一些实施例中，智能设备300可以包括移动终端、平板电脑、计算机、笔记本电脑，ar/vr设备等中的任意一种。

在一些实施例中，也可以使用智能设备300以控制显示设备200。例如，使用在智能设备上运行的应用程序控制显示设备200。

在一些实施例中，也可以使用智能设备300和显示设备进行数据的通信。

在一些实施例中，显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制，例如，可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制，也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。

在一些实施例中，显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(lan)、无线局域网(wlan)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群，也可以是多个集群，可以包括一类或多类服务器。

在一些实施例中，一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的，服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行，反之亦然。

图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示，控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令，且将操作指令转换为显示设备200可识别和响应的指令，起用用户与显示设备200之间交互中介作用。

在一些实施例中，通信接口130用于和外部通信，包含wifi芯片，蓝牙模块，nfc或可替代模块中的至少一种。

在一些实施例中，用户输入/输出接口140包含麦克风，触摸板，传感器，按键或可替代模块中的至少一种。

图3示出了根据示例性实施例中显示设备200的硬件配置框图。

在一些实施例中，显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。

在一些实施例中控制器包括中央处理器，视频处理器，音频处理器，图形处理器，ram，rom，用于输入/输出的第一接口至第n接口。

在一些实施例中，显示器260包括用于呈现画面的显示屏组件，以及驱动图像显示的驱动组件，用于接收源自控制器输出的图像信号，进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控ui界面等。

在一些实施例中，显示器260可为液晶显示器、oled显示器、以及投影显示器中的至少一种，还可以为一种投影装置和投影屏幕。

在一些实施例中，调谐解调器210通过有线或无线接收方式接收广播电视信号，以及从多个无线或有线广播电视信号中解调出音视频信号，如以及epg数据信号。

在一些实施例中，通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如：通信器可以包括wifi模块，蓝牙模块，有线以太网模块等其他网络通信协议芯片或近场通信协议芯片，以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。

在一些实施例中，检测器230用于采集外部环境或与外部交互的信号。例如，检测器230包括光接收器，用于采集环境光线强度的传感器；或者，检测器230包括图像采集器，如摄像头，可以用于采集外部环境场景、用户的属性或用户交互手势，再或者，检测器230包括声音采集器，如麦克风等，用于接收外部声音。

在一些实施例中，外部装置接口240可以包括但不限于如下：高清多媒体接口接口(hdmi)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(cvbs)、usb输入接口(usb)、rgb端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。

在一些实施例中，控制器250和调谐解调器210可以位于不同的分体设备中，即调谐解调器210也可在控制器250所在的主体设备的外置设备中，如外置机顶盒等。

在一些实施例中，控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器260上显示ui对象的用户命令，控制器250便可以执行与由用户命令选择的对象有关的操作。

在一些实施例中，所述对象可以是可选对象中的任何一个，例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有：显示连接到超链接页面、文档、图像等操作，或者执行与所述图标相对应程序的操作。

在一些实施例中控制器包括中央处理器(centralprocessingunit，cpu)，视频处理器，音频处理器，图形处理器(graphicsprocessingunit，gpu)，ramrandomaccessmemory，ram)，rom(read-onlymemory,rom)，用于输入/输出的第一接口至第n接口，通信总线(bus)等中的至少一种。

cpu处理器。用于执行存储在存储器中操作系统和应用程序指令，以及根据接收外部输入的各种交互指令，来执行各种应用程序、数据和内容，以便最终显示和播放各种音视频内容。cpu处理器，可以包括多个处理器。如，包括一个主处理器以及一个或多个子处理器。

在一些实施例中，图形处理器，用于产生各种图形对象，如：图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器，通过接收用户输入各种交互指令进行运算，根据显示属性显示各种对象；还包括渲染器，对基于运算器得到的各种对象，进行渲染，上述渲染后的对象用于显示在显示器上。

在一些实施例中，视频处理器，用于将接收外部视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种，可得到直接可显示设备200上显示或播放的信号。

在一些实施例中，视频处理器，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中，解复用模块，用于对输入音视频数据流进行解复用处理。视频解码模块，用于对解复用后的视频信号进行处理，包括解码和缩放处理等。图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的gui信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。帧率转换模块，用于对转换输入视频帧率。显示格式化模块，用于将接收帧率转换后视频输出信号，改变信号以符合显示格式的信号，如输出rgb数据信号。

在一些实施例中，音频处理器，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等处理中的至少一种，得到可以在扬声器中播放的声音信号。

在一些实施例中，用户可在显示器260上显示的图形用户界面(gui)输入用户命令，则用户输入接口通过图形用户界面(gui)接收用户输入命令。或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户输入接口通过传感器识别出声音或手势，来接收用户输入命令。

在一些实施例中，“用户界面”，是应用程序或操作系统与用户之间进行交互和信息交换的介质接口，它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(graphicuserinterface，gui)，是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素，其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、widget等可视的界面元素中的至少一种。

在一些实施例中，用户接口280，为可用于接收控制输入的接口(如：显示设备本体上的实体按键，或其他等)。

在一些实施例中，显示设备的系统可以包括内核(kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构，它们让用户可以管理文件、运行程序并使用系统。上电后，内核启动，激活内核空间，抽象硬件、初始化硬件参数等，运行并维护虚拟内存、调度器、信号及进程间通信(ipc)。内核启动后，再加载shell和用户应用程序。应用程序在启动后被编译成机器码，形成一个进程。

参见图4，在一些实施例中，将系统分为四层，从上至下分别为应用程序(applications)层(简称“应用层”)，应用程序框架(applicationframework)层(简称“框架层”)，安卓运行时(androidruntime)和系统库层(简称“系统运行库层”)，以及内核层。

在一些实施例中，应用程序层中运行有至少一个应用程序，这些应用程序可以是操作系统自带的窗口(window)程序、系统设置程序或时钟程序等；也可以是第三方开发者所开发的应用程序。在具体实施时，应用程序层中的应用程序包不限于以上举例。

框架层为应用程序层的应用程序提供应用编程接口(applicationprogramminginterface，api)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心，这个中心决定让应用层中的应用程序做出动作。应用程序通过api接口，可在执行中访问系统中的资源和取得系统的服务。

如图4所示，本申请实施例中应用程序框架层包括管理器(managers)，内容提供者(contentprovider)等，其中管理器包括以下模块中的至少一个：活动管理器(activitymanager)用与和系统中正在运行的所有活动进行交互；位置管理器(locationmanager)用于给系统服务或应用提供了系统位置服务的访问；文件包管理器(packagemanager)用于检索当前安装在设备上的应用程序包相关的各种信息；通知管理器(notificationmanager)用于控制通知消息的显示和清除；窗口管理器(windowmanager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。

在一些实施例中，活动管理器用于管理各个应用程序的生命周期以及通常的导航回退功能，比如控制应用程序的退出、打开、后退等。窗口管理器用于管理所有的窗口程序，比如获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕，控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。

在一些实施例中，系统运行库层为上层即框架层提供支撑，当框架层被使用时，安卓操作系统会运行系统运行库层中包含的c/c++库以实现框架层要实现的功能。

在一些实施例中，内核层是硬件和软件之间的层。如图4所示，内核层至少包含以下驱动中的至少一种：音频驱动、显示驱动、蓝牙驱动、摄像头驱动、wifi驱动、usb驱动、hdmi驱动、传感器驱动(如指纹传感器，温度传感器，压力传感器等)、以及电源驱动等。

在一些实施例中，显示设备启动后可以直接进入预置的视频点播程序的界面，视频点播程序的界面可以如图5中所示，至少包括导航栏510和位于导航栏510下方的内容显示区，内容显示区中显示的内容会随导航栏中被选中控件的变化而变化。应用程序层中的程序可以被集成在视频点播程序中通过导航栏的一个控件进行展示，也可以在导航栏中的应用控件被选中后进行进一步显示。

在一些实施例中，显示设备启动后可以直接进入上次选择的信号源的显示界面，或者信号源选择界面，其中信号源可以是预置的视频点播程序，还可以是hdmi接口，直播电视接口等中的至少一种，用户选择不同的信号源后，显示器可以显示从不同信号源获得的内容。

以上实施例介绍了显示设备的硬件/软件架构以及功能实现等内容。在某些应用场景中，显示设备的声音播放器可以是自身配置的扬声器，也可以是通过第二接口连接的外部功放，比如第二接口可以是外接音响输出端子，外部功放可以是音响等具有音频输出和播放能力的设备。外部功放可以的数量可以是零，这时音频输出走显示设备内置功放通道(即扬声器)；或者，也可设置至少一个外部功放，并将音频输出通道切换为外部功放，当外部功放连接两个时，第一外部功放和第二外部功放可分别设置在显示设备左右两侧，则可实现左右功放的立体声平衡音效。

在一些实施例中，当用户移动时，用户与显示设备之间的相对位置会发生改变，用户位置可通过距离、方位角等参数来检测和衡量。用户位置的变化必然会影响用户对声音音量的听觉感受，比如当用户远离显示设备时会觉得音量较小，往往会存在想要调高音量的需求；当用户靠近显示设备时，可能会觉得音量震耳，往往会存在想要调低音量的需求，而目前主要依靠用户在变换位置后手动调节至舒适的音量，导致用户体验差。

对此，本申请提供一种可以基于用户位置自适应、自动调节声音的方案。在一些实施例中，显示设备自身可以内置摄像头，或者通过第一接口去外接摄像头，摄像头比如可安装在屏幕边框的顶部中央等适当位置。摄像头启动后可以采集显示设备前方视野区域内的图像，并识别图像中是否存在人像，当识别到具有人像时，说明显示设备前方一定空间区域内存在真实用户，则基于图像动态检测用户位置和用户状态，从而监测用户的位置变化。

在一些实施例中，可以通过用户相对于摄像头的距离(即用户距离)来衡量用户位置的变化，用户距离即用户与摄像头之间直线距离，用于衡量用户与显示设备的相对远近；用户状态即用户当前是静止状态或者运动状态。摄像头比如可采用深度相机等具有距离检测能力的图像采集设备。

在一些实施例中，图6示出了一种声音控制方法，所述方法的执行主体是显示设备的控制器250，控制器250可以控制摄像头的启动和关闭，并接收摄像头采集的图像，以及对图像进行处理后获取声音参数，进而控制声音播放器调节声音，所述方法具体包括基准值获取逻辑和获取基准值后的声音自动控制逻辑，其中基准值包括基准位置和基准音量。

其中，基准值获取逻辑包括步骤s101～步骤s104：

步骤s101，响应于启用摄像头的操作，控制摄像头启动采集用户图像；

步骤s102，根据所述用户图像检测用户状态；所述用户状态为静止状态或运动状态；

步骤s103，检测用户状态在预设时间内是否保持静止状态；如果检测结果为是，则执行步骤s104；反之则返回步骤s102，继续检测用户状态以及检测在预设时间内用户是否始终保持静止状态；

步骤s104，根据用户图像检测用户当前相对于摄像头的位置，并将当前的用户位置记录为基准位置，以及，将声音播放器的当前音量记录为基准音量。

摄像头启用后即可采集用户图像并检测用户状态，在一些实施例中，可以每间隔预设周期(比如15秒，取值不限定)检测一次用户状态，如果检测到用户状态为静止状态，则启动计时，当累加计时大于或等于预设时间，即确定用户状态在预设时间内始终静止状态不变，确认用户已经固定在当前位置，未再移位，则将当前的用户位置记录为基准位置，用户在基准位置处，会操作遥控器的音量调节键，从而手动设置好合适的音量，将调音后声音播放器的当前音量记录为基准音量；如果检测到用户状态发生变化，则需要将计时清零，继续执行步骤s102和步骤s103。获取基准位置和基准音量，作为后续自适应调节参照的基准值。在一些实施例中，用户位置可以具体为用户与摄像头的相对距离，即用户距离。

当基准值获取逻辑执行完成后，启动声音自动控制逻辑。在一些实施例中，如果在执行声音自动控制逻辑的过程中，接收到用户调节音量的操作，则停止声音自动控制逻辑，返回基准值获取逻辑，重新获取更新后的基准值，从而保证后续基于基准值的声音自动控制逻辑的准确性。

声音自动控制逻辑包括步骤s105～步骤s109：

步骤s105，控制摄像头继续采集用户图像，以及，根据用户图像检测用户位置；

步骤s106，检测用户位置相较于所述基准位置是否发生变化；如果用户位置相较于基准位置发生改变，则执行步骤s107；反之，用户位置未发生变化，则重复执行步骤s105和步骤s106，继续检测用户位置是否变化；

步骤s107，根据用户图像检测用户状态；；

步骤s108，检测用户状态在预设时间内是否保持静止状态；如果检测结果为是，则执行步骤s109；反之则返回步骤s107，继续检测用户状态以及检测在预设时间内用户是否始终保持静止状态；

步骤s109，根据变化后的用户位置、基准音量和预设声音曲线，控制声音播放器调节音量。

如果用户位置相较于基准位置变化，说明在获取基准值后，用户又开始移动位置，满足声音调节条件，则检测用户状态，在一些实施例中，可以每间隔预设周期(比如15秒，取值不限定)检测一次用户状态，如果检测到用户状态为静止状态，则启动计时，当累加计时大于或等于预设时间，即确定用户状态在预设时间内始终保持静止状态不变，确认用户已经固定在变化后的位置不再移位，则根据变化后的用户位置和基准音量，并结合本机型预置的预设声音曲线，从而将声音自动调节至适应于变化后的用户位置的音量。

在一些实施例中，对于不同机型的显示设备，其出厂时一般已预置完成声音曲线，图7示出了三种不同机型对应的预设声音曲线，预设声音曲线为距离与声音调整比率的关系曲线，图7中曲线横坐标为用户距离，纵坐标为不同用户距离对应的声音调整比率。声音调整比率具有一定的可调范围，图7中可调范围的下限值为0，即当声音调整比率为0时需要将声音调至静音模式。

在一些实施例中，在获取基准值之后，当用户状态在预设时间内始终未变时，控制器调取本机的预设声音曲线，根据变化后的用户位置对应的距离值，即当前的用户距离从预设声音曲线中获取目标声音调整比率，目标声音调整比率与当前的用户距离对应，然后根据目标声音调整比率和基准音量，计算目标音量，控制声音播放器将音量调节至目标音量。其中，目标音量＝目标声音调整比率×基准音量。以图7中预设声音曲线2为例，当前的用户距离为1.5米时，可以获取到目标声音调整比率为0.6，假设基准音量为20，则计算出目标音量为12，控制声音播放器输出的音频的音量为12即可。

考虑到摄像头监测时可能存在的安全隐私问题，因此摄像头可以不采用常启模式，而是在用户想要启用声音自动控制功能时，可通过语音或其他操作指令方式启动摄像头，摄像头启动后自动进入基准值获取逻辑以及后续的声音自动控制逻辑。在一些实施例中，用户也可根据使用需求关闭声音自动控制功能，当控制器接收到关闭摄像头的操作指令时，控制摄像头关闭，退出声音自动控制逻辑，则停止根据用户位置调整声音播放器的音量，以及，控制声音播放器将音量调节至基准音量。由于用户可能多次手动调节音量，每次手动调节音量时，都需要中断声音自动控制逻辑，切换回基准值获取逻辑，去重新获取基准值，因此基准值可能涉及多次更新，则在关闭摄像头后，可将声音音量调节至最新记录的基准音量。

在一些应用场景中，显示设备200连接有第一外部功放500和第二外部功放600，第一外部功放500和第二外部功放600分别放置于显示设备的左右两侧，两个外部功放可以采用音响等具有音频输出和播放能力的设备，可以实现立体声平衡音效。对于这种应用场景，不仅要考虑用户与显示设备之间的距离，当用户方位角变化时，用户与左右两侧外部功放之间的相对位置关系也会发生改变，因此还要考虑如何根据用户方位角协调两个外部功放的声音播放，即两个外部功放间的平衡，从而为用户提供更好的音效。该场景下用户位置涉及用户距离和用户方位角。

在一些实施例中，图8示出了上述应用场景下的声音控制方法的流程，该方法的执行主体同样是显示设备的控制器250，与图6的声音自动控制逻辑相比，包括基于用户距离自动调节音量的第一子逻辑，以及增设的基于用户方位角自动调节双外部功放平衡的第二子逻辑，在执行完基准值获取逻辑之后，第一子逻辑和第二子逻辑可同步执行。

其中，图8中基准值获取逻辑包括步骤s201～步骤s203：

步骤s201，响应于启用摄像头的操作，控制摄像头采集用户图像；

步骤s202，根据用户图像检测用户状态；

步骤s203，如果用户状态在预设时间内保持静止状态，则根据用户图像检测用户当前相对于摄像头的位置，并将当前的用户位置记录为基准位置，以及，将声音播放器的当前音量记录为基准音量。

图8中基于用户距离自动调节音量的第一子逻辑包括步骤s204～步骤s206：

步骤s204，控制摄像头继续采集用户图像，以及根据用户图像检测用户距离；

步骤s205，当检测到用户距离相较于基准位置对应的距离值发生变化时，根据用户图像检测用户状态；

步骤s206，当用户状态在预设时间内保持静止状态时，根据变换位置后的用户距离、基准音量和预设声音曲线，控制声音播放器调节音量。

本实施例中，基准值获取逻辑和基于用户距离自动调节音量的第一子逻辑可适应性参照图6实施例的说明，这里不再赘述。

本实施例中，基于用户方位角自动调节双外部功放平衡的第二子逻辑包括步骤s207～步骤s212。

步骤s207，根据用户图像检测当前用户位置对应的用户方位角。

在用户图像中识别人像，通过人像在用户图像中的相对位置，即可确定用户方位角。如图9所示，摄像头与人像之间的连线为l1，两侧外部功放之间的连线为l2，l1与l2之间的夹角β即为用户方位角，0°≤β≤180°。

步骤s208，检测用户方位角在预设时间内是否保持不变；如果检测结果为是，则执行步骤s209；反之，则返回步骤s207，继续检测用户方位角以及检测用户方位角在预设时间内是否保持不变。

步骤s209，根据当前的用户方位角确定用户在显示设备前方所处的位置区域。

在一些实施例中，可以每间隔预设周期检测一次用户方位角，并启动计时，如果用户方位角不变则累加计时，如果用户方位角改变，则将计时清零。当累加计时大于或等于预设时间，即用户方位角在预设时间内始终未变，确认用户已经固定在调整后的方位不再移位，则根据当前的用户方位角确定用户具体处于哪一位置区域内。

参照图9，示出了用户在显示设备前方的方位分布，主要被划分为三个区域，第一个区域是显示设备前方[-θ，+θ]的辐散区域a、小于-θ的辐散区域b以及大于+θ的辐散区域c，这里θ为预设的相较于摄像头正前方位的临界角。其中，辐散区域b对应的用户方位角变化范围是[0°，90°-θ)，辐散区域a对应的用户方位角变化范围是[90°-θ，90°+θ]，辐散区域c对应的用户方位角变化范围是(90°+θ，180°]。其中，临界角θ的取值不限定，比如可设定为45°。根据用户位置所属的位置区域，划分为步骤s210～步骤s212三种情形。

步骤s210，在用户位置处于显示设备前方[90°-θ，90°+θ]的区域内时，控制声音播放器按照预设立体声平衡音效播放音频。当用户处于[90°-θ，90°+θ]的区域内时，说明用户相较于左右两侧的外部功放的位置差异不大，可以直接使用默认的立体声平衡音效去播放音频。

当用户位置处于[0°，90°-θ)或(90°+θ，180°]的区域内时，需要调用本机预置的预设平衡调整曲线，并根据当前的用户方位角和预设平衡调整曲线，同步调节第一外部功放和第二外部功放。

具体地，步骤s211，用户位置处于显示设备前方[0°，90°-θ)的区域内时，根据当前的用户方位角，从预设平衡调整曲线中获取第一目标平衡值，根据第一目标平衡值，按比例增强第二外部功放的声音强度以及减弱第一外部功放的声音强度。

如图10所示，预设平衡调整曲线为用户方位角与双功放平衡值的关系曲线，曲线中横坐标为用户方位角，纵坐标为平衡值，平衡值具有一定的可调范围，图10中为[-10，+10]。当用户方位角为90°时，说明用户方位是正对摄像头和屏幕中央，这种情况下平衡值为0。当用户位置处于显示设备前方[0°，90°-θ)的区域内时，说明用户位置相对偏左，即更接近于左侧的第一外部功放500，而更远离于右侧的第二外部功放600，在根据当前的用户方位角确定对应的第一目标平衡值后，根据第一目标平衡值指示的调节参数，对应减弱左侧第一外部功放500的声音强度，以及同步增强右侧第二外部功放600的声音强度，使用户听到的双外部功放的音频播放更加平衡，不会出现两侧声音强弱不均的情况，从而提升用户听感。

步骤s212，用户位置处于显示设备前方(90°+θ，180°]的区域内时，根据当前的用户方位角，从预设平衡调整曲线中获取第二目标平衡值，根据所述第二目标平衡值，按比例增强第一外部功放的声音强度，以及减弱第二外部功放的声音强度。

当用户位置处于显示设备前方(90°+θ，180°]的区域内时，说明用户位置相对偏右，即更远离于左侧的第一外部功放500，而更接近于右侧的第二外部功放600，在根据当前的用户方位角确定对应的第二目标平衡值后，根据第二目标平衡值指示的调节参数，对应增强左侧第一外部功放500的声音强度，以及同步减弱右侧第二外部功放600的声音强度，使用户听到的双外部功放的音频播放更加平衡，不会出现两侧声音强弱不均的情况，从而提升用户听感。

本申请的关键在于获取目标音量和目标平衡值等调节参数，后续根据调节参数去控制声音播放的方式可参照现有技术实现，本申请实施例不再赘述。

由以上技术方案可知，本申请通过摄像头识别人像，并具体识别用户距离、用户状态和用户方位角等关键参数，在获取标准值后，能够基于用户位置自适应、自动控制声音的音量，无需用户在每次移位后手动调节。此外，为适应立体声播放场景，还提供了基于用户方位角自适应、自动同步控制双外部功放音效平衡的方案，使用户听到的双外部功放的音频播放更加平衡，不会出现两侧声音强弱不均的情况，从而提升用户听感。本申请实现用户在显示设备附近的任意位置(涉及距离/方位角)都能享受到最优的声音播放效果，显著提升了用户体验。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。具体实现中，本发明还提供一种计算机存储介质，该计算机存储介质可存储有程序。当计算机存储介质位于显示设备中时，该程序执行时可包括控制器被配置执行的声音控制方法涉及的程序步骤。其中，计算机存储介质可为磁碟、光盘、只读存储记忆体(英文：read-onlymemory，简称rom)或随机存储记忆体(英文：randomaccessmemory，简称ram)等。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

为了方便解释，已经结合具体的实施方式进行了上述说明。但是，上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导，可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用，从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔文华;辛化东;王之奎
技术所有人：海信视像科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。