一种智能终端语音控制方法、系统及可读存储介质与流程

文档序号:23794075发布日期:2021-01-30 09:26阅读:147来源:国知局
一种智能终端语音控制方法、系统及可读存储介质与流程

[0001]
本发明涉及语音识别技术领域,尤其涉及一种智能终端语音控制方法、系统及可读存储介质。


背景技术:

[0002]
目前,基于人工智能的语音控制android系统的方法主要是系统将用户输入的语音内容转换为文字内容,再将文字内容进一步转换为控制指令,最后根据控制指令细分领域并最终实现终端的控制。一般而言,现有技术语音控制技术中每一条语音内容最终会实现对应于终端的一个控制操作,如图1安装有安卓智能系统的智能电视主界面所示的场景一,该场景一中所示的图形用户界面(graphic user interface,gui)中包含“少儿”文本信息的菜单和功能元素包括少儿频道和少儿菜单,如果用户在该界面下通过语音功能输入“少儿”的语音命令,系统在接收到语音信息并将其转换为少儿的文本控制命令后,在确定切换到少儿频道还是切换到当前界面的少儿菜单上的控制命令时会出现命令控制冲突。类似情况如图2安装有安卓智能系统的智能电视主界面所示的场景二,该场景二中的图形用户界面包含切换信源的“hdmi3”和菜单中的“hdmi3”的文本,如果用户在该场景二的图形用户界面通过语音功能输入“hdmi3”的语音命令时,系统在接收到语音并将其转换为“hdmi3”的文本控制命令后,在确定切换到信源的“hdmi3”或直接进行当前菜单切换的控制命令时也会出现命令控制冲突。此处仅为应用场景的两个实例,在实际使用中还有很多类似的情况,即当前输入的语音内容在转换成控制指令进行决策的问题。
[0003]
因此,现有技术还有待于改进和发展。


技术实现要素:

[0004]
鉴于上述现有技术的不足之处,本发明提出一种能够解决用户在语音操作智能终端设备时因控制命令出现冲突问题的智能终端语音控制方法。
[0005]
本发明解决技术问题所采用的技术方案如下:
[0006]
一种智能终端语音控制方法,用于安卓系统智能终端语音命令的控制,包括如下步骤:
[0007]
所述智能终端接收待处理语音命令,并将所述待处理语音命令转换成控制文本;
[0008]
若所述控制文本同时对应所述智能终端交互界面上的菜单文本和待操作应用文本,则根据用户历史行为记录,确定所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数;
[0009]
根据所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数,确定目标操作对象;其中,所述目标操作对象包括所述菜单文本对应的操作控件或所述待操作应用文本对应的操作控件。
[0010]
作为一种改进技术方案,所述用户历史行为记录的统计具体包括如下步骤:
[0011]
所述智能终端启动第一应用,并获取启动所述第一应用时的系统时间,将启动所
述第一应用时的系统时间记录为所述第一应用的启动时间;
[0012]
所述智能终端间隔预设时间获取所述智能终端系统中最新运行的应用;
[0013]
判断所述第一应用与所述智能终端系统中最新运行的应用是否为同一个应用;
[0014]
如果所述第一应用与所述智能终端系统中最新运行的应用不为同一应用则获取系统时间记录,并将所述系统时间记录为所述第一应用的结束时间;
[0015]
所述智能终端记录所述第一应用的启动时间和结束时间作为用户历史行为记录。
[0016]
作为一种改进方案,在所述判断所述第一应用与所述智能终端系统中最新运行的应用是否为同一个应用步骤之后,所述方法还包括:如果判断所述第一应用与所述智能终端系统中最新运行的应用不为同一应用时,所述智能终端将所述第一应用结束时间记录为最新运行应用的开始时间,后续再循环所述间隔预设时间获取所述智能终端系统中最新的应用进行判断,并记录所述最新运行的应用的开始时间和结束时间,直至智能终端关机。
[0017]
作为一种改进方案,在所述智能终端在记录所述第一应用的启动时间和结束时间作为用户历史行为记录之后,所述方法还包括:将用户行为记录的统计信息形成统计文件,所述统计文件中统计信息包括应用包名、应用使用次数和应用使用时长。
[0018]
作为一种改进方案,所述统计文件上传存储到云端。
[0019]
作为一种改进方案,所述菜单文本和所述待操作应用文本对应的使用指数具体计算包括如下步骤:
[0020]
分别获取所述菜单文本和所述待操作应用文本的使用时长和使用次数;
[0021]
根据使用指数=使用次数
×
a+使用时长
×
b的公式分别计算出所述菜单文本和所述待操作应用文本使用指数。
[0022]
作为一种改进方案,在根据所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数,确定目标操作对象步骤之后,所述方法还包括:所述智能终端选择所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数中使用指数最高的确定目标操作对象,当所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数相同时,则根据用户历史行为记录,确定历史操作时间最晚的确定目标操作对象。
[0023]
本发明还提供一种智能终端语音控制系统,用于安卓系统智能终端语音命令的控制,所述智能终端语音控制系统包括用户行为记录模块、语音信息转换模块和语音命令执行模块;
[0024]
所述用户行为记录模块用于所述智能终端统计用户行为记录;
[0025]
所述语音信息转换模块用于所述智能终端接收用户输入的语音信息并将所述语音信息转换成控制文本;
[0026]
所述语音命令执行模块用于判断当所述语音信息转换模块转换的控制文本与所述智能终端交互界面上菜单文本和待操作应用文本的内容相同时,所述智能终端从所述用户行为记录模块统计的用户行为记录中菜单文本和待操作应用文本使用指数最高者执行相应操作,若所述菜单文本和所述待操作应用文本的使用指数相同,所述智能终端则选择历史操作时间最晚的操作执行。
[0027]
作为一种改进方案,所述用户行为记录模块统计用户行为记录的功能具体包括:
[0028]
所述智能终端启动第一应用,并获取启动所述第一应用时的系统时间,将启动所述第一应用时的系统时间记录为所述第一应用的启动时间;
[0029]
所述智能终端间隔预设时间获取所述智能终端系统中最新运行的应用;
[0030]
判断所述第一应用与所述智能终端系统中最新运行的应用是否为同一个应用;
[0031]
如果所述第一应用与所述智能终端系统中最新运行的应用不为同一应用则获取系统时间记录,并将所述系统时间记录为所述第一应用的结束时间;
[0032]
所述智能终端记录所述第一应用的启动时间和结束时间作为用户历史行为记录。
[0033]
作为一种改进方案,在判断所述第一应用与所述智能终端系统中最新运行的应用是否同一个应用后,如果判断所述第一应用与所述智能终端系统中最新运行的应用不为同一应用时,所述智能终端将所述第一应用结束时间记录为最新运行应用的开始时间,后续再循环所述间隔预设时间获取所述智能终端系统中最新的应用进行判断,并记录所述最新运行的应用的开始时间和结束时间,直至智能终端关机。
[0034]
作为一种改进方案,所述用户行为记录模块在记录下所述第一应用的启动时间和结束时间作为用户历史行为记录之后,还将用户行为记录的统计信息形成统计文件,所述统计文件中统计信息包括应用包名、应用使用次数和应用使用时长。
[0035]
本发明还提供一种可读存储介质,所述可读存储介质存储有智能终端语音控制的程序,该智能终端语音控制的程序被处理器执行时实现上述智能终端语音控制方法的步骤。
[0036]
与现有技术相比较,本发明通过记录用户在使用智能终端期间的行为记录来统计智能终端中应用的使用情况,在使用智能终端语音控制系统时,当智能终端交互界面上出现多个应用或菜单内容与语音控制命令内容相同时,智能终端能够根据应用或菜单功能在智能终端中对应的使用指数高低进行自主选择,确定目标操作对象,使得用户在采用语音控制与智能终端进行人机交互时,智能终端可以根据用户历史行为记录数据进行智能决策,准确响应用户的语音控制命令。
附图说明
[0037]
下面结合附图对本发明的具体实施方式作进一步的说明,其中:
[0038]
图1是安装有安卓智能系统的智能电视主界面场景一的示意图。
[0039]
图2是安装有安卓智能系统的智能电视主界面场景二的示意图。
[0040]
图3是本发明一种智能终端语音识别方法优选实施例流程图。
[0041]
图4是本发明一种智能终端语音识别方法优选实施例统计用户行为记录流程图。
[0042]
图5是本发明一种智能终端语音识别系统优选实施例原理结构图。
具体实施方式
[0043]
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0044]
本发明提出一种语音控制方法和系统,主要针对在语音控制过程中由于界面上出现相同文本而导致语音识别后命令冲突的问题。本发明方法和系统可应用于智能终端设备上,例如,可以应用于安装有安卓系统的智能终端设备上,为了便于说明,在后续的介绍中,将主要以安装有安卓系统的智能终端设备为执行主体进行介绍。在本实施例中,智能终端
能够提供显示界面与用户之间进行交互操作,比如,安卓智能电视、安卓平板电脑等安卓智能终端设备,此处只做示例性说明,并非限制智能终端设备,应当说明的是,采用安卓(android)系统并带有交互操作界面,提供语音识别功能的智能终端设备均适应本发明技术方案。智能终端能够支持语音命令进行控制操作是本发明技术方案的基本条件,通过在系统开机到关机期间,即智能终端设备运行期间,系统统计各个应用的使用情况,并将各个应用的使用情况生成统计文件保存在本地,在系统每次重新开机使用时从云端获得配置文件中应用的使用情况,以获取各个应用在智能终端上的使用情况,包括各个应用的使用时长,频率等相关信息。当用户进行语音控制操作智能终端时,通过用户输入语音内容经转换为文字内容获取到控制待操作应用的指令后,根据统计文件比较当前输入语音内容在所在界面的应用使用时长与待操作的应用使用时长来确定执行界面上哪个语音内容匹配的操作。本发明技术方案可根据用户的使用习惯来决定其语音内容对应的界面操作,解决了界面上多个文本或功能内容与语音内容相同时操作冲突的问题,提高和优化了用户语音控制智能终端过程的体验。
[0045]
如图1所示为本发明一种语音控制方法优选实施例流程图,以下结合图1对该方法的实现步骤进行详细说明,本发明方法优选实施例包括如下步骤:
[0046]
步骤s100,所述智能终端接收待处理语音命令,并将所述待处理语音命令转换成控制文本。
[0047]
在本实施例中,待处理语音命令可以理解为用户在交互界面中所输入的携带有控制命令的语音信息。具体而言,所述智能终端在接收到用户在交互界面输入的待处理语音命令时,需要将待处理语音命令转化成为控制文本。所述控制文本,是通过语音识别技术将智能终端接收到的待处理语音命令转换成文本的形式,这种将待处理语音命令转换成的文本代表了用户想要输入的控制命令,即为控制文本。智能终端将该控制文本作为一种控制命令进行操作控制,比如,智能终端接收到用户语音输入“切换为hdmi信源”的待处理语音命令,通过语音识别技术将该待处理语音命令转换为文本“切换为hdmi信源”的控制文本,智能终端识别“切换为hdmi信源”控制文本为用户想要控制将智能终端的输入信源切换为hdmi信源,进而控制系统将输入信源切换为hdmi信源,从而达到将用户输入到智能终端的语音信息转换为控制文本,进而控制系统进行信源切换的目的。
[0048]
步骤s200,若所述控制文本同时对应所述智能终端交互界面上的菜单文本和待操作应用文本,则根据用户历史行为记录,确定所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数。所述交互界面上的菜单文本是指在智能终端设计的各个交互界面上设计的菜单中,包括一级菜单、二级菜单、三级菜单等菜单中的文本,比如,一级菜单为系统,该系统的一级菜单下还有语言设置、输入法设置、直播信源设置等等二级菜单的文本,而直播信源设置的二级菜单下一级还有hdmi3的三级菜单文本,这些一级、二级、三级菜单中的文本信息即为菜单文本。所述待操作应用文本则并非智能终端交互界面上出现的文本,是智能终端系统内部的系统命令,比如,智能终端系统中包含hdmi3的命令,或者是语言设置的命令等等系统命令的文本。而本实施例中所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数是指这些菜单文本和待操作应用文本在智能终端历史使用过程中被操作的次数及每次被操作的时间长短综合相加的一个使用频率的指数,所述菜单文本对应的实用指数和所述待操作应用文本对应的使用指数充分反映了智能终端在历史使
用过程中被系统所操作的频率,能够有效代表所述菜单文本和所述待操作应用文本被系统执行的次数、频率。
[0049]
其中,用户历史行为记录是指用户在使用智能终端设备期间,用户对智能终端设备的所有操作的记录,用户对智能终端设备操作的记录一般包括:
[0050]

开关机记录,智能终端记录用户启动终端的开机时间和关闭终端的时间,分别保存为用户的开机时间和关机时间,作为用户历史行为记录中的用户操作记录;
[0051]

应用记录,保存用户操作应用的信息,比如智能终端开机期间,用户启动进入某一应用的时间,以及离开该应用的时间,分别记录该应用的启动时间和退出时间,作为用户操作应用的行为记录;
[0052]

系统信息记录,保存系统信息以及系统内的应用信息,比如用户获取系统内存信息的操作,获取应用占用内存信息等的操作,均可作为用户操作的行为记录;
[0053]

按键信息记录,保存用户操作智能终端中使用按键的相关信息,比如用户操作中对按键操作的开始时间、结束时间和按键键值的记录,也可以作为用户操作的行为记录;
[0054]

外设信息记录,保存用户对外部输入设备操作的信息,如用户的u盘插入时间、u盘拔出时间,以及用户u盘存储大小等。
[0055]
上述用户行为记录中按键信息和外设信息记录触发条件是通过监听android系统中的按键操作、外部设备插入和拔出操作而进行相应的信息记录。系统信息记录中系统信息以及系统内的应用信息可根据应用记录信息计算出。其中,应用记录,即用户操作的应用信息是随用户的操作而产生的,本发明中的用户历史行为记录主要是指用户对系统的应用进行操作的记录,比如,用户在智能终端开机期间,启动某一应用使用,后续关闭该应用,其中启动某一应用和关闭该应用均视为用户对系统的应用进行的操作,分别记录用户启动应用、关闭应用的时间,形成用户对应用操作的用户历史行为记录。这些用户历史行为记录可以真实反映实际用户的具体操作行为,记录并统计用户的操作行为是后续交互界面上出现语音内容冲突选择用户操作行为的判断基础。
[0056]
具体而言,智能终端统计用户历史行为记录的过程可以结合图4示出的本发明方法优选实施例统计用户历史行为记录流程图来进行理解,具体包括如下步骤:
[0057]
所述智能终端的系统启动,判断系统是否处于关机状态,如果系统处于关机状态,智能终端获取到用户在开机到关机时间段内对应的操作记录,即用户历史行为记录,计算本次开关机用户的统计文件并将统计文件布署于云端。
[0058]
而如果系统处于开机状态时,所述智能终端启动第一应用,并获取启动所述第一应用时的系统时间,将启动所述第一应用时的系统时间记录为所述第一应用的启动时间。具体到android系统中,用户在启动应用后需要保存该应用的应用程序包名。
[0059]
所述智能终端间隔预设时间获取所述智能终端系统中最新运行的应用。在android系统中,系统中最新运行的应用可通过topactivity函数来获取,通过topactivity获取系统中最新运行的应用程序包名。
[0060]
在所述智能终端获取所述智能终端系统中最新运行的应用之后,判断所述第一应用与所述智能终端系统中最新运行的应用是否为同一个应用。在本实施例中,所述最新运行的应用是指智能终端系统中最近一次运行的应用。
[0061]
如果不为同一应用则获取系统时间记录,并将系统时间记录为所述第一应用的结
束时间。其中,统计所述第一应用可采用如下格式记录:
[0062]
应用程序包名t1=开始日期、时间t2=结束日期、时间;t1、t2分别为记录应用程序开始时间、结束时间的变量。
[0063]
当所述第一应用与最新运行的应用不同时,说明此时第一应用已经发生了变化,用户已经退出了第一应用,前文所述间隔预设时间中的预设时间可以根据经验值进行选择,此处不做限制。如果第一应用已经发生变化,即退出了系统或者暂时挂起,则可以记录其对应的应用程序包名,并保存该应用程序的开始时间和结束时间,即将智能终端开机期间用户行为记录下来以便于后续的数据统计。
[0064]
作为另外一种优选的方式,判断所述当前应用与智能终端系统中最新运行的应用不为同一应用时,所述智能终端还将所述第一应用结束时间记录为最近运行应用的开始时间,后续再循环所述间隔预设时间获取所述智能终端系统中最新的应用进行判断,判断最新运行的应用是否与第一应用为同一应用,当不为同一应用时,记录所述最新运行的应用的开始时间和结束时间,直至智能终端关机。比如统计某智能终端设备开机期间的用户行为记录如下表1,表1中的记录了用户的行为及相应行为的操作时间记录,共同来形成用户历史行为记录。
[0065]
表1
[0066][0067][0068]
从上表1可见,用户在开机到关机时间段内对应用的操作记录。所述智能终端在开机期间记录下用户行为记录后,根据用户行为记录统计开机期间应用的统计信息形成统计文件,所述统计文件中统计信息包括应用包名、应用使用次数和应用使用时长。优选的,可以将所述统计文件上传存储到云端,将统计文件上传到云端后,有利于节约智能终端有限的存储空间。比如,根据上表1用户行为操作记录计算首次开机期间用户行为的记录生成统计文件如下表2,其中,统计文件的格式为编号、应用程序包名、使用次数、使用时长。
[0069]
表2
[0070]
编号应用程序包名使用次数时长(单位:小时)1com.app1512com.app220.5
[0071]
应当说明的是,表2中示例说明统计文件记录的信息和文件格式。
[0072]
步骤s300,根据所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数,确定目标操作对象;其中,所述目标操作对象包括所述菜单文本对应的操作控件或所述待操作应用文本对应的操作控件。
[0073]
在所述智能终端将用户输入的语音信息内容转化为控制文本后,本发明技术方案针对交互界面上存在多个与控制文本相同内容的情况进行决策,出现与控制文本相同内容冲突的情况上述图1和图2中的描述。对于冲突时,系统需要智能进行决策选择用户最想要执行的操作来进行操作,这样能极大改善用户的体验感受,真正实现智能终端的智能化操作。其中,所述菜单文本对应的使用指数和所述待操作应用文本对应使用指数可以从上述用户历史行为记录统计得出,所述使用指数计算可根据以下公式计算得出:
[0074]
使用指数=使用次数
×
a+使用时长
×
b,其中参数a和b可根据实际使用情况调节到最优参数。通过上述使用指数的计算公式结合用户历史行为记录数据可以分别得出菜单文本使用指数和待操作应用文本使用指数,系统根据菜单文本使用指数和待操作应用文本指数的大小选择最高者来确定目标操作对象。需要说明的是,若菜单文本(或待操作应用文本)的使用指数越高,说明菜单文本(或待操作应用文本)的使用频率越高,代表本次用户想要控制该菜单文本(或待操作应用文本)的可能性越大;反之,若菜单文本(或待操作应用文本)的使用指数越低,说明菜单文本(或待操作应用文本)的使用频率越低,代表本次用户想要控制该菜单文本(或待操作应用文本)的可能性越小。此处,操作对象包括所述菜单文本对应的操作控件或所述待操作应用文本对应的操作控件。而当所述菜单文本对应的使用指数和所述待操作应用文本对应的使用指数相同时,则根据用户历史行为记录,确定历史操作时间最晚的确定目标操作对象。
[0075]
本发明还提供一种智能终端语音控制系统,用于安卓系统智能终端语音命令的控制,如图5所示为本发明一种智能终端语音识别系统优选实施例原理结构图,所述智能终端语音控制系统60包括用户历史行为记录模块61、语音信息转换模块62和语音命令执行模块63。
[0076]
所述用户行为记录模块61用于所述智能终端统计用户历史行为记录。用户历史行为记录模块统计用户行为记录的功能具体包括:
[0077]
所述智能终端启动第一应用,并获取启动所述第一用用时的系统时间,将启动所述第一应用时的系统时间记录为所述第一应用的启动时间;
[0078]
所述智能终端间隔预设时间获取所述智能终端系统中最新运行的应用;
[0079]
判断所述第一应用与所述智能终端系统中最新运行的应用是否为同一个应用;
[0080]
如果所述第一应用与所述智能终端系统中最新运行的应用不为同一应用则获取系统时间记录,并将所述系统时间记录为所述第一应用的结束时间;
[0081]
所述智能终端记录所述第一应用的启动时间和结束时间作为用户历史行为记录。
[0082]
作为另一种优选实施方式,在判断所述第一应用与所述智能终端系统中最新运行
的应用不为同一应用时,所述智能终端将所述第一应用结束时间记录为最新运行应用的开始时间,后续再循环所述间隔预设时间获取所述智能终端系统中最近的应用进行判断,并记录所述最新运行的应用的开始时间和结束时间,直至智能终端关机。
[0083]
所述用户历史行为记录模块在记录下用户历史行为记录后,还根据用户历史行为记录统计应用的统计信息形成统计文件上传云端,所述统计文件中统计信息包括应用包名、应用使用次数和应用使用时长。
[0084]
用户行为记录模块61中用户行为的具体记录过程与上述方法优选实施例中智能终端统计用户行为记录的内容相同,此处不赘述。
[0085]
所述语音控制内容转换模块62用于所述智能终端接收用户输入的语音信息并转换成控制文本。
[0086]
所述语音命令执行模块63用于判断当所述语音信息转换模块转换的控制文本与所述智能终端交互界面上菜单文本和待操作应用文本的内容相同时,所述智能终端从所述用户历史行为记录模块统计的用户历史行为记录中菜单文本和待操作应用文本使用指数最高者执行相应操作,若所述菜单文本和所述待操作应用文本的使用指数相同,所述智能终端则选择历史操作时间最晚的操作执行。
[0087]
所述语音命令执行模块63中语音命令的智能决策执行过程与上述方法优选实施例中步骤s300中智能终端决策操作功能相同,此处不赘述。
[0088]
本发明还提供了一种可读存储介质,所述可读存储介质存储有智能终端语音控制的程序,该智能终端语音控制的程序被处理器执行时实现上述智能终端语音控制方法的步骤,具体程序执行的方法步骤与上述方法优选实施例相同,此处赘述。
[0089]
应当理解的是,以上所述仅为本发明的较佳实施例而已,并不足以限制本发明的技术方案,对本领域普通技术人员来说,在本发明的精神和原则之内,可以根据上述说明加以增减、替换、变换或改进,而所有这些增减、替换、变换或改进后的技术方案,都应属于本发明所附权利要求的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1