一种拍照方法及终端设备与流程

文档序号:17148267发布日期:2019-03-19 23:11阅读:161来源:国知局
一种拍照方法及终端设备与流程

本发明实施例涉及终端技术领域,尤其涉及一种拍照方法及终端设备。



背景技术:

随着终端技术的不断发展,终端设备的拍照功能越来越强大,且用户对拍照的需求也越来越多。例如,用户有时需要获得复杂的拍摄场景中的一些物体的截取图像。

目前,最常用的获得截取图像的方法的流程为:先触发终端设备拍摄一张包括截取图像的图像,再触发终端设备打开图像处理软件,并选择截图功能,然后再触发终端设备进入相册之后选择需要截图的图像,最后再触发终端设备根据截取框将选择的图像截图,以获得需要的截取图像。

因此,现有技术获得截取图像的过程比较复杂繁琐,且耗时。



技术实现要素:

本发明实施例提供一种拍照方法及终端设备,以解决现有技术获得截取图像的过程复杂繁琐,且耗时的问题。

为了解决上述技术问题,本发明是这样实现的:

第一方面,本发明实施例提供了一种拍照方法,该方法包括:

接收用户的第一输入;

响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。

第二方面,本发明实施例提供了一种终端设备,该终端设备包括:接收模块、识别模块和生成模块;

该接收模块,用于接收用户的第一输入;

该识别模块,用于响应于该接收模块接收的该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;

该生成模块,用于生成m张截取图像,该m张截取图像中的每张截取图像中包括该识别模块识别的该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。

第三方面,本发明实施例提供了一种终端设备,包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面中的拍照方法的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面中的拍照方法的步骤。

在本发明实施例中,终端设备可以通过接收用户的第一输入;响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。即终端设备可以根据用户的截取拍摄输入,根据物件识别模型,自动从拍摄预览图像中识别多个对象,并对识别的对象分别截取拍摄获得截取图像。相比现有技术,该方案在拍摄过程中,就可以更准确快速的识别拍摄预览图像中的对象,并对对象进行截取拍摄,获得截取图像,从而可以现有技术获得截取图像的过程复杂繁琐,且耗时的问题。同时本方案还可以一次截取拍摄多张图像,可以提高截取拍摄的速度和效率。

附图说明

图1为本发明实施例提供的一种可能的安卓操作系统的架构示意图;

图2为本发明实施例提供的拍照方法的流程图之一;

图3为本发明实施例提供的拍照方法的流程图之二;

图4为本发明实施例提供的拍照方法的流程图之三;

图5为本发明实施例提供的拍照方法的流程图之四;

图6为本发明实施例提供的拍照方法的流程图之五;

图7为本发明实施例提供的拍照方法的流程图之六;

图8为本发明实施例提供的终端设备的结构示意图之一;

图9为本发明实施例提供的终端设备的结构示意图之二;

图10为本发明实施例提供的终端设备的结构示意图之三;

图11为本发明实施例提供的终端设备的结构示意图之四;

图12为本发明实施例提供的终端设备的硬件示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一输入、第二输入、第三输入和第四输入等是用于区别不同的输入,而不是用于描述输入的特定顺序。

在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本发明实施例的描述中,除非另有说明,“多个”的含义是指两个或者两个以上,例如,多个处理单元是指两个或者两个以上的处理单元;多个元件是指两个或者两个以上的元件等。

下面首先对本发明的权利要求书和说明书中涉及的一些名词或者术语进行解释说明。

截取拍摄:具体指从复杂的拍摄场景中拍摄得到一些对象的图像(该图像不包括背景图像)。

截取图像:是指从一个图像中截取得到的包括部分对象的图像(该图像不包括背景图像),或从复杂的拍摄场景中截取拍摄得到的包括部分对象的图像(该图像不包括背景图像)。

本发明实施例提供一种拍照方法,终端设备可以通过接收用户的第一输入;响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。即终端设备可以根据用户的截取拍摄输入,根据物件识别模型,自动从拍摄预览图像中识别多个对象,并对识别的对象分别截取拍摄获得截取图像。相比现有技术,该方案在拍摄过程中,就可以更准确快速的识别拍摄预览图像中的对象,并对对象进行截取拍摄,获得截取图像,从而可以现有技术获得截取图像的过程比较复杂繁琐,且耗时的问题。同时本方案还可以一次截取拍摄多张图像,可以提高截取拍摄的速度和效率。

下面以安卓操作系统为例,介绍一下本发明实施例提供的拍照方法所应用的软件环境。

如图1所示,为本发明实施例提供的一种可能的安卓操作系统的架构示意图。在图1中,安卓操作系统的架构包括4层,分别为:应用程序层、应用程序框架层、系统运行库层和内核层(具体可以为linux内核层)。

其中,应用程序层包括安卓操作系统中的各个应用程序(包括系统应用程序和第三方应用程序)。

应用程序框架层是应用程序的框架,开发人员可以在遵守应用程序的框架的开发原则的情况下,基于应用程序框架层开发一些应用程序。

系统运行库层包括库(也称为系统库)和安卓操作系统运行环境。库主要为安卓操作系统提供其所需的各类资源。安卓操作系统运行环境用于为安卓操作系统提供软件环境。

内核层是安卓操作系统的操作系统层,属于安卓操作系统软件层次的最底层。内核层基于linux内核为安卓操作系统提供核心系统服务和与硬件相关的驱动程序。

以安卓操作系统为例,本发明实施例中,开发人员可以基于上述如图1所示的安卓操作系统的系统架构,开发实现本发明实施例提供的拍照方法的软件程序,从而使得该拍照方法可以基于如图1所示的安卓操作系统运行。即处理器或者终端设备可以通过在安卓操作系统中运行该软件程序实现本发明实施例提供的拍照方法。

本发明实施例中的终端设备可以为移动终端设备,也可以为非移动终端设备。移动终端设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、超级移动个人计算机(ultra-mobilepersonalcomputer,umpc)、上网本或者个人数字助理(personaldigitalassistant,pda)等;非移动终端设备可以为个人计算机(personalcomputer,pc)、电视机(television,tv)、柜员机或者自助机等;本发明实施例不作具体限定。

本发明实施例提供的拍照方法的执行主体可以为上述的终端设备(包括移动终端设备和非移动终端设备),也可以为该终端设备中能够实现该方法的功能模块和/或功能实体,具体的可以根据实际使用需求确定,本发明实施例不作限定。下面以终端设备为例,对本发明实施例提供的拍照方法进行示例性的说明。

参考图2所示,本发明实施例提供了一种拍照方法,应用于终端设备,该方法可以包括下述的步骤201-步骤203。

步骤201、终端设备接收用户的第一输入。

该第一输入可以用于触发终端设备截取拍摄。

可选的,本发明实施例中,上述用户的第一输入的类型可以为触屏输入、重力输入以及按键输入等中的至少一种。例如,触屏输入可以为用户对终端设备的触控屏的长按输入、滑动输入或者点击输入等输入;重力输入可以为用户在特定方向晃动终端设备或者对终端设备晃动特定次数等输入;按键输入可以为用户对终端设备按键的单击输入、双击输入、长按输入或者组合按键输入等输入。

示例性的,在终端设备显示拍摄预览界面,且该拍摄预览界面显示拍摄预览图像的情况下,第一输入可以为用户点击“截屏拍摄”选项的输入。

步骤202、响应于该第一输入,终端设备根据物件识别模型,识别拍摄预览图像中的n个对象。

物件识别模型为服务器或终端设备根据历史物件图像数据以及机器学习算法模型生成的。

可选的,历史物件图像数据可以包括大量的物件图像数据。机器学习算法模型例如可以是基于深度学习的卷积神经网络的模型、循环神经网络的模型等,还可以是其他的机器学习算法模型,本发明实施例不作限定。

示例性的,服务器建立物件识别模型的过程可以包括:1、准备工作:服务器收集大量物件图像数据,以及建立机器学习算法模型;2训练模型:用收集的大量的物件图像数据不停地训练该机器学习算法模型,以生成一个满足目标要求的模型,即物件识别模型。

该目标要求可以是对拍摄预览图像中的对象的识别准确度的标准,例如通过物件识别模型是别的对象的边缘与对象的实际边缘相比的准确度或分值,当准确度或分值大于或等于阈值时,则判定满足目标要求。具体的建立物件识别模型的过程可以参考现有根据机器学习算法建立模型的过程,此处不予赘述。

上述物件识别模型可以是服务器为广大用户建立的模型,也可以是服务器为终端设备的用户建立的个人模型。若物件识别模型为用户的个人模型,则服务器可以给每个终端设备的用户分配专属账号,并根据用户自己的历史截取图像集建立特定的模型库。由于用户通常截取拍照的物件都很相似(例如,用户是卖衣服的,因此经常截取一些衣服的图像),因此可以选取用户的截取图像集中相似度较高的物件创建模型,截取图像集越大且相似度越高,模型和算法的准确性就越高。

可选的,在本发明实施例中,在建立物件识别模型的时候,服务器还可以在训练机器学习算法模型的过程中将收集的大量物件图像数据分类,然后按照不同的类型分别对机器学习算法模型进行训练,以生成可以按照类型识别对象的物件识别模型。

可以将物件图像数据按照建筑类、摆件类、植物类、动物类、人物类等进行分类,具体根据实际使用需求确定,本发明实施例不作限定。

这样分类识别可以加快识别速度,也可以根据用户需求进行识别,提高用户体验。

终端设备从服务器下载该物件识别模型,并根据该物件识别模型,识别拍摄预览界面中的对象。

终端设备建立物件识别模型的具体过程可以参考上述对服务器建立物件识别模型的过程的相关描述,此处不再赘述。

示例性的,终端设备将拍摄预览图像输入该物件识别模型,识别该预览图像中的n个对象,并输出识别出的对象,识别出的对象个数小于或等于n。

步骤203、终端设备生成m张截取图像。

该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。

可选的,具体生成m张截取图像的过程可以包括终端设备对m个对象分别进行重新聚焦,并拍摄的过程,这样获得的m张截取图像都是以其对应的对象为焦点来拍摄而得,图像质量比较好。其中,终端设备对m个对象分别进行重新聚焦的过程,参考现有技术,此处不予赘述。

终端设备根据识别出的对象,生成m张截取图像。

可选的,终端设备仅识别出m个对象,终端设备可以根据识别出的m个对象生成m张截取图像,一个对象对应一张截取图像,每个截取图像中的对象不同。

可选的,终端设备识别出n个对象,终端设备也可以按照某种规则,根据识别出的n个对象生成m张截取图像(m<n),示例性的,终端设备评价识别的n个对象的质量,将质量满足要求的m个对象中的每个对象,生成一张截取图像,以生成m张截取图像,每张截取图像包括的对象不同。或者,终端设备一次性仅能生成m张截取图像。

可选的,终端设备识别出n个对象,用户可以从识别的该n个对象中选择m个对象,终端设备将用户选择的n个对象生成m张截取图像,每张截取图像对应一个不同的对象。

示例性的,假设拍摄预览图像中包括猫、桌子、花盆、电脑四个对象,用户点击截取拍照,终端设备根据物件识别模型识别该四个对象,并生成该4个对象的截取图像,即生成一张只包括猫的截取图像、一张只包括桌子的截取图像、一张只包括花盆的截取图像和一张只包括电脑的截取图像。

需要说明的是:在本发明实施例中,终端设备可以先识别出所有n个对象,在生成m张截取图像;终端设备也可以一边识别对象,一边生成截取图像,具体可以识别一个对象生成一张截取图像,再识别一个对象生成一个截取图像,或者,可以识别固定个数的对象,生成固定个数的截取图像,再识别固定个数的对象,生成固定个数的截取图像;具体的根据实际使用需求确定,本发明实施例不作限定。

示例性的,结合图2,如图3所示,在步骤202之后,步骤203之前,本发明实施例提供的拍照方法还可以包括下述的步骤204-步骤205;该步骤203具体的可以通过下述的步骤203a实现。

步骤204、终端设备在该摄预览图像中显示n个标记。

该n个标记用于指示该n个对象,一个标记用于指示一个对象。

n个标记中的每个标记可以是任意标记,可以相同,也可以不相同,只要可以指示一个对象就可以,具体根据实际使用需求确定,本发明实施例不作限定。

优选的,每个标记可以是围绕一个对象的边缘设置的,例如可以是沿一个对象的边缘的虚线选取框。这样可以方便用户选取,而且方便用户更直观的感受,即用户可以看到终端设备识别的对象边缘是否准确。

步骤205、终端设备接收用户从该n个标记中选择m个标记的第二输入。

第二输入可以是用户从该n个标记中选中m个标记的输入,或者第二输入可以是用户删除该n个标记中除m个标记以外的(n-m)个标记的输入。则第二输入是m个子输入或n-m个子输入。

第一输入可以为用户在拍摄预览图像中的m个标记或n-m标记上的点击操作,也可以为用户在拍摄预览图像中的m个标记或n-m标记上的滑动操作,也可以为用户在拍摄预览图像中的m个标记或n-m标记上的其他可行性操作,具体的可以根据实际使用需求确定,本发明实施例不作限定。

示例性的,上述点击操作可以为单击操作,可以为长按的点击(点击时间大于或等于预设时间的)操作,也可以是短按的点击(点击时间小于预设时间的)操作等。上述滑动操作可以为向任意方向的滑动操作,例如向上滑动、向下滑动、向左滑动或者向右滑动等。

步骤203a、响应于该第二输入,终端设备生成与该m个标记对应的该m张截取图像。

具体描述可以参考上述对步骤203的相关描述,此处不再赘述。

这样用户可以根据自身需求选择要截取拍摄的对象,从而可以提高用户体验。

示例性的,结合图3,如图4所示,在步骤202之前,本发明实施例提供的拍照方法还可以包括下述的步骤206;该步骤202具体的可以通过下述的步骤202a实现。

步骤206、响应于该第一输入,终端设备从该拍摄预览图像中确定q个初始区域块。

该q个初始区域块中的每个初始区域块中包括一个对象。

示例性的,每个初始区域块是终端设备获得的拍摄预览图像中的各个对象的大致边界的粗略区域块,具体的终端设备可以基于下述识别方法中的至少一种实现:色差识别方法和色阶识别方法,还可以是其他的识别方法,本发明实施例不作限定。

步骤202a、终端设备根据物件识别模型,从该q个初始区域块中,识别属于第一类型的该n个对象。

q为大于或等于n的整数。

终端设备可以根据物件识别模型从该q个初始区域块中,识别q个对象,也可以根据物件识别模型从该q个初始区域块中,识别属于第一类型的该n个对象。

第一类型可以是一种类型,也可以是多种类型,具体根据实际使用需求确定,本发明实施例不作限定。

这样终端设备先将拍摄预览图像分区域块,再从区域块中识别对象的方法,可以提高识别速度,从而可以提高用户体验。

示例性的,结合图4,如图5所示,在步骤202a之前,本发明实施例提供的拍照方法还可以包括下述的步骤207;该步骤202a具体的可以通过下述的步骤202b实现。

步骤207、终端设备接收用户的第三输入。

该第三输入为用户将物件识别类型设置为第一类型的输入。

第三输入可以为用户在输入识别类型的区域输入第一类型的输入,也可以是用户在类型选择列表中选择第一类型的输入,还可以是其他的,具体根据实际使用需求确定,本发明实施例不作限定。

第一类型可以示用户输入的一个类型,也可以是用户输入的多个类型,本发明实施例不作限定。

步骤202b、响应于该第三输入,终端设备根据该物件识别模型,从该q个初始区域块中,识别属于该第一类型的该n个对象。

具体的可以参考上述对步骤202a的相关描述,此处不予赘述。

这样用户可以根据自身需求完成截取拍摄,可以提高识别速度,进而可以提高用户体验。

示例性的,结合图5,如图6所示,在步骤203a之后,本发明实施例提供的拍照方法还可以包括下述的步骤208-步骤209。

步骤208、终端设备向服务器发送目标信息。

该目标信息用于该服务器根据该目标信息更新该物件识别模型,该目标信息包括下述的至少一项:m张截取图像,以及获取的对m张截取图像中的每张截取图像的图像质量评价。目标信息还可以包括其他的信息,具体根据实际使用需求确定,本发明实施例不作限定。

示例性的,终端设备可以收集智能截取拍摄的效果埋点数据(即目标信息),发送给服务器,然后服务器根据效果埋点数据不断对物件识别模型进行调整优化。

若物件识别模型是大众的模型,则服务器可以根据任意一个终端设备上传的目标信息对物件识别模型进行优化;若物件识别模型是个人模型,则服务器必须根据对应终端设备的目标信息对物件识别模型进行优化。

步骤209、终端设备接收该服务器发送的更新后的该物件识别模型。

可选的,服务器更新物件识别模型后,就自动向终端设备下发更新后的物件识别模型,终端设备接收该更新后的物件识别模型。

可选的,终端定期检测服务器是否更新物件识别模型,如果检测到服务器更新物件识别模型,则从服务器下载更新后的物件识别模型。具体的,终端设备可以定期的向服务器发送是否更新物件识别模型的消息,服务器收到后,若已更新物件识别模型,则向终端设备下发更新后的物件识别模型,终端设备接收该更新后的物件识别模型。

终端设备用接收的更新后的物件识别模型更新本地原有的物件识别模型。

这样可以不断更新物件识别模型,可以不断提高物件识别模型的识别准确度,以及可以提高截取拍摄图像的图像质量。

可选的,在本发明实施例中,该截取图像的背景可以是透明的,可以是白色的,也可以是其它颜色的,用户可以根据自身需求设定颜色。

优选的,该截取图像的背景可以是透明的,这样可以方便用户后期根据自身需求为该截取图像添加背景图像。

示例性的,结合图5,如图7所示,在步骤203a之后,本发明实施例提供的拍照方法还可以包括下述的步骤210-步骤211。

步骤210、终端设备接收用户的第四输入。

第四输入可以包括用户为截取图像添加背景图像的操作,第四输入还可以包括用户从m张截取图像中选择至少一张截取图像,并为至少一张截取图像中的每张截取图像分别添加背景图像的操作。

第四输入可以是点击操作、滑动操作、拖动操作等中的至少一种,具体根据实际使用需求确定,本发明实施例不作限定。

步骤211、响应于该第四输入,终端设备将至少一张截取图像中的每张截取图像分别与一张背景图像合成一张目标图像,以生成至少一张目标图像。

该至少一张截取图像为该m张截取图像中的图像。

至少一张目标图像中的每张目标图像的背景图像可以可以相同,也可以不同,本发明实施例不作限定。

可选的,终端设备中存储有大量背景图像以供用户选择,用户可以根据需求手动为截取图像添加背景。

可选的,服务器和终端设备也可以建立一个添加背景模型,这样终端设备可以自动截取图像添加背景。具体过程参考上述建立物件识别模型的相关描述,此处不再赘述。

这样用户可以得到与原来背景不同的目标图像,可以提高用户体验。

需要说明的是:本发明实施例中的各个附图均是结合独权实施例附图示例的,具体实现时,各个附图还可以结合其它任意可以结合的附图实现,本发明实施例不作限定。

例如,上述步骤208-步骤209与步骤210-步骤211之间没有先后顺序,可以先执行上述步骤208-步骤209,再执行上述步骤210-步骤211;也可以先执行上述步骤210-步骤211,再执行上述步骤208-步骤209,也可以同时执行上述步骤208-步骤209和步骤210-步骤211;本发明实施例不作限定。

本发明实施例提供了一种拍照方法,终端设备可以通过接收用户的第一输入;响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。即终端设备可以根据用户的截取拍摄输入,根据物件识别模型,自动从拍摄预览图像中识别多个对象,并对识别的对象分别截取拍摄获得截取图像。相比现有技术,该方案在拍摄过程中,就可以更准确快速的识别拍摄预览图像中的对象,并对对象进行截取拍摄,获得截取图像,从而可以现有技术获得截取图像的过程比较复杂繁琐,且耗时的问题。同时本方案还可以一次截取拍摄多张图像,可以提高截取拍摄的速度和效率。

如图8所示,本发明实施例提供一种终端设备120,该终端设备120包括:接收模块121、识别模块122和生成模块123;

该接收模块121,用于接收用户的第一输入;

该识别模块122,用于响应于该接收模块121接收的该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;

该生成模块123,用于生成m张截取图像,该m张截取图像中的每张截取图像中包括该识别模块122识别的该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。

可选的,结合图8,如图9所示,该终端设备120还包括:显示模块124;该显示模块124,用于在该识别拍摄预览图像中的n个对象之后,该生成m张截取图像之前,在该摄预览图像中显示n个标记,该n个标记用于指示该识别模块122识别的该n个对象,一个标记用于指示一个对象;该接收模块121,还用于接收用户从该显示模块124显示的该n个标记中选择m个标记的第二输入;该生成模块123,具体用于响应于该接收模块121接收的该第二输入,生成与该m个标记对应的该m张截取图像。

可选的,结合图9,如图10所示,该终端设备120还包括:确定模块125;该确定模块125,用于在该根据物件识别模型,识别拍摄预览图像中的n个对象之前,从该拍摄预览图像中确定q个初始区域块,该q个初始区域块中的每个初始区域块中包括一个对象;该识别模块122,具体用于根据物件识别模型,从该确定模块125确定的该q个初始区域块中,识别属于第一类型的该n个对象,q为大于或等于n的整数。

可选的,该接收模块121,还用于在该根据物件识别模型,从该q个初始区域块中,识别属于第一类型的该n个对象之前,接收用户的第三输入,该第三输入为用户将物件识别类型设置为第一类型的输入;该识别模块122,具体用于响应于该接收模块121接收的该第三输入,根据该物件识别模型,从该q个初始区域块中,识别属于该第一类型的该n个对象。

可选的,结合图10,如图11所示,该终端设备120还包括:发送模块126;该发送模块126,用于在该生成m张截取图像之后,向服务器发送目标信息,该目标信息用于该服务器根据该目标信息更新该物件识别模型,该目标信息包括下述的至少一项:m张截取图像,以及获取的对m张截取图像中的每张截取图像的图像质量评价;该接收模块121,还用于接收该服务器发送的更新后的该物件识别模型。

可选的,该接收模块121,还用于在该生成m张截取图像之后,接收用户的第四输入;该生成模块123,用于响应于该接收模块121接收的该第四输入,将至少一张截取图像中的每张截取图像分别与一张背景图像合成一张目标图像,以生成至少一张目标图像,该至少一张截取图像为该m张截取图像中的图像。

本发明实施例提供的终端设备能够实现上述方法实施例中图2至图7任意之一所示的各个过程,为避免重复,此处不再赘述。

本发明实施例提供了一种终端设备,终端设备可以通过接收用户的第一输入;响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。即终端设备可以根据用户的截取拍摄输入,根据物件识别模型,自动从拍摄预览图像中识别多个对象,并对识别的对象分别截取拍摄获得截取图像。相比现有技术,该方案在拍摄过程中,就可以更准确快速的识别拍摄预览图像中的对象,并对对象进行截取拍摄,获得截取图像,从而可以现有技术获得截取图像的过程比较复杂繁琐,且耗时的问题。同时本方案还可以一次截取拍摄多张图像,可以提高截取拍摄的速度和效率。

图12为实现本发明各个实施例的一种终端设备的硬件结构示意图。如图12所示,该终端设备100包括但不限于:射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图12中示出的终端设备结构并不构成对终端设备的限定,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端设备、可穿戴设备、以及计步器等。

其中,用户输入单元107,用于接收用户的第一输入,该第一输入用于触发终端设备截取拍摄;处理器110,用于响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。

本发明实施例提供的终端设备,终端设备可以通过接收用户的第一输入,该第一输入用于触发终端设备截取拍摄;响应于该第一输入,根据物件识别模型,识别拍摄预览图像中的n个对象;并生成m张截取图像,该m张截取图像中的每张截取图像中包括该n个对象中的一个对象,且该每张截取图像包括的对象不同,n为大于1的整数,m为小于或等于n的正整数。即终端设备可以根据用户的截取拍摄输入,根据物件识别模型,自动从拍摄预览图像中识别多个对象,并对识别的对象分别截取拍摄获得截取图像。相比现有技术,该方案在拍摄过程中,就可以更准确快速的识别拍摄预览图像中的对象,并对对象进行截取拍摄,获得截取图像,从而可以现有技术获得截取图像的过程比较复杂繁琐,且耗时的问题。同时本方案还可以一次截取拍摄多张图像,可以提高截取拍摄的速度和效率。

应理解的是,本发明实施例中,射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信系统与网络和其他设备通信。

终端设备通过网络模块102为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元103可以将射频单元101或网络模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与终端设备100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103包括扬声器、蜂鸣器以及受话器等。

输入单元104用于接收音频或视频信号。输入单元104可以包括图形处理器(graphicsprocessingunit,gpu)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或网络模块102进行发送。麦克风1042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。

终端设备100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在终端设备100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器105还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。

显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板1061。

用户输入单元107可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。

进一步的,触控面板1071可覆盖在显示面板1061上,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图12中,触控面板1071与显示面板1061是作为两个独立的部件来实现终端设备的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现终端设备的输入和输出功能,具体此处不做限定。

接口单元108为外部装置与终端设备100连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到终端设备100内的一个或多个元件或者可以用于在终端设备100和外部装置之间传输数据。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器110是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行终端设备的各种功能和处理数据,从而对终端设备进行整体监控。处理器110可包括一个或多个处理单元;可选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。

终端设备100还可以包括给各个部件供电的电源111(比如电池),可选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外,终端设备100包括一些未示出的功能模块,在此不再赘述。

可选的,本发明实施例还提供一种终端设备,可以包括上述如图12所示的处理器110,存储器109,以及存储在存储器109上并可在该处理器110上运行的计算机程序,该计算机程序被处理器110执行时实现上述方法实施例中图2至图7任意之一所示的拍照方法的各个过程,且能达到相同的技术效果,为避免重复,此处不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例中图2至图7任意之一所示的拍照方法的各个过程,且能达到相同的技术效果,为避免重复,此处不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1