一种图片分类方法、终端及计算机可读存储介质与流程

文档序号：17361073发布日期：2019-04-09 22:04阅读：110来源：国知局

本发明涉及终端
技术领域：
，更具体地说，涉及一种图片分类方法、终端及计算机可读存储介质。
背景技术：
：随着科学技术的不断发展，终端技术也得到了飞速的发展，终端产品的种类也越来越多，人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的终端，享受随着科技发展带来的舒适生活。例如，智能手机、平板电脑等终端已经成为人们生活中一个重要的组成部分，用户可以使用手机、平板电脑等终端来拍照、浏览相册中的图片等等。在相关技术中，在对图片进行分类时，由终端直接给出最终的分类结果并在用户终端中显示最终的分类结果，然而终端给出的最终的分类结果有可能是错误的，并不符合图片实际的分类类别，对于错误分类的信息则没有有效判断，这种方式也没有考虑到分类结果的质量是否满足用户需求。技术实现要素：本发明的主要目的在于提出一种图片分类方法、终端及计算机可读存储介质，旨在解决现有技术中，在对图片进行分类时，由终端直接给出最终的分类结果，对于错误分类的信息则没有有效判断，也没有考虑到分类结果的质量是否满足用户需求的问题。为解决上述技术问题，本发明提供一种图片分类方法，所述图片分类方法包括以下步骤：获取图片；根据预设分类模型对所述图片的类别进行分析，得到不同类别，以及属于各类别的概率；获取按照从大到小的顺序进行排列时排名前n的概率；若排名前n的概率均小于预设概率阈值，则至少显示排名前n的概率对应的类别的选择项；将接收到选择操作的选择项作为所述图片的类别。可选的，在所述将接收到选择操作的选择项作为所述图片的类别之后，还包括：将接收到选择操作的选择项作为所述预设分类模型的训练数据。可选的，所述预设分类模型包括兼顾处理速度和精准度的分类器。可选的，在所述获取按照从大到小的顺序进行排列时排名前n的概率之后，还包括以下步骤：若排名前n的概率至少一个大于等于预设概率阈值，则将概率值最大的所属的类别作为所述图片的类别。可选的，在所述获取按照从大到小的顺序进行排列时排名前n的概率之后，还包括：若排名前n的概率均小于预设概率阈值，还显示除排名前n的概率对应的类别以外的所有类别的选择项。可选的，在所述将接收到选择操作的选择项作为所述图片的类别之前，还包括：检测是否接收到对选择项的选择操作；若是，则进入所述将接收到选择操作的选择项作为所述图片的类别的步骤；若否，则接收用户手动输入的类别，将所述用户手动输入的类别作为所述图片的类别。可选的，在所述接收用户手动输入的类别，将所述用户手动输入的类别作为所述图片的类别之后，还包括：将接收到用户手动输入的类别作为所述预设分类模型的训练数据。可选的，所述获取图片包括：获取通过摄像头当前拍摄的图片；或者，在接收到对终端相册中的图片进行分类的指令时，获取所述相册中的图片。进一步地，本发明提供一种终端，终端包括处理器、存储器及通信总线；通信总线用于实现处理器和存储器之间的连接通信；处理器用于执行存储器中存储的一个或者多个程序，以实现如上的图片分类方法的步骤。进一步地，本发明提供一种计算机可读存储介质，计算机可读存储介质存储有一个或者多个程序，一个或者多个程序可被一个或者多个处理器执行，以实现如上的一种图片分类方法的步骤。有益效果本发明提供了一种图片分类方法、终端及计算机可读存储介质，包括以下步骤：获取图片；根据预设分类模型对图片的类别进行分析，得到不同类别，以及属于各类别的概率；获取按照从大到小的顺序进行排列时排名前n的概率；若排名前n的概率均小于预设概率阈值，则至少显示排名前n的概率对应的类别的选择项；将接收到选择操作的选择项作为图片的类别；通过上述方案，在对图片进行分类时，在分类类别对应的排名前n的概率均小于预设概率阈值的情况下，引导用户人为选择图片的类别，可以规避后续可能的分类结果错误的情况，符合图片实际的分类类别，分类结果的质量满足用户需求。附图说明下面将结合附图及实施例对本发明作进一步说明，附图中：图1为实现本发明各个实施例一个可选的终端的硬件结构示意图；图2为本发明第一实施例提供的一种图片分类方法的基本流程图；图3为本发明第一实施例提供的一种在终端屏幕上显示某一图片的前5位类别以及分别属于前5位类别的概率的选择项的示意图；图4为本发明第一实施例提供的一种终端相册中存储的已经分类好的图片的示意图；图5为本发明第二实施例提供的一种图片分类方法的基本流程图；图6为本发明第三实施例提供的一种终端的示意图。具体实施方式应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身并没有特定的意义。因此，"模块"与"部件"可以混合地使用。本发明中描述的终端可以包括诸如智能手机、pad、阅读器、电脑、智能手环、智能手表等。请参阅图1，其为实现本发明各个实施例一个可选的终端的硬件结构示意图，该终端100可以包括：rf(radiofrequency，射频)单元101、wifi模块102、音频输出单元103、a/v(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109以及处理器110等部件。本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。下面结合图1对终端的各个部件进行具体的介绍：射频单元101可用于收发信息或通话过程中，信号的接收和发送，具体的，将基站的下行信息接收后，给处理器110处理；另外，将上行的数据发送给基站。通常，射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于gsm(globalsystemofmobilecommunication，全球移动通讯系统)、gprs(generalpacketradioservice，通用分组无线服务)、cdma1000(codedivisionmultipleaccess1000，码分多址1000)、wcdma(widebandcodedivisionmultipleaccess,宽带码分多址)、td-scdma(timedivision-synchronouscodedivisionmultipleaccess，时分同步码分多址)、fdd-lte(frequencydivisionduplexing-longtermevolution，频分双工长期演进)和tdd-lte(timedivisionduplexing-longtermevolution，分时双工长期演进)等。wifi属于短距离无线传输技术，终端通过wifi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。音频输出单元103可以在终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时，将射频单元101或wifi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元103还可以提供与终端100执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。a/v输入单元104用于接收音频或视频信号。a/v输入单元104可以包括图形处理器(graphicsprocessingunit，gpu)1041和麦克风1042，图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或wifi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据)，并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。终端100还包括至少一种传感器105，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度，接近传感器可在终端100移动到耳边时，关闭显示面板1061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061，可以采用液晶显示器(liquidcrystaldisplay，lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板1061。用户输入单元107可用于接收输入的数字或字符信息，以及产生与终端100的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)，并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器110，并能接收处理器110发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071，用户输入单元107还可以包括其他输入设备1072。具体地，其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种，具体此处不做限定。进一步的，触控面板1071可覆盖显示面板1061，当触控面板1071检测到在其上或附近的触摸操作后，传送给处理器110以确定触摸事件的类型，随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中，触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能，但是在某些实施例中，可以将触控面板1071与显示面板1061集成而实现终端的输入和输出功能，具体此处不做限定。接口单元108用作至少一个外部装置与终端100连接可以通过的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到终端100内的一个或多个元件或者可以用于在终端100和外部装置之间传输数据。存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器109可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。处理器110是终端100的控制中心，利用各种接口和线路连接整个终端100的各个部分，通过运行或执行存储在存储器109内的软件程序和/或模块，以及调用存储在存储器109内的数据，执行终端100的各种功能和处理数据，从而对终端100进行整体监控。处理器110可包括一个或多个处理单元；优选的，处理器110可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器110中。尽管图1未示出，终端100还可以包括蓝牙模块等，在此不再赘述。基于上述终端硬件结构，以下通过具体实施例对本发明进行详细说明。第一实施例为了解决现有技术中在对图片进行分类时，由终端直接给出最终的分类结果，对于错误分类的信息则没有有效判断，也没有考虑到分类结果的质量是否满足用户需求的问题，本实施例将提供一种图片分类方法，参见图2，图2为本实施例提供的一种图片分类方法的基本流程图，该图片分类方法包括以下步骤：s201：获取图片；本实施例的图片分类方法可以应用于终端中，终端可以包括诸如智能手机、pad、相机、阅读器、智能手环、智能手表等。在本实施例中，获取图片包括：获取通过摄像头当前拍摄的图片，也即，实时获取通过终端中的摄像头拍摄的图片；或者，在接收到对终端相册中的图片进行分类的指令时，获取相册中的图片，也即终端相册中存储有图片，可能是存储的图片都没有采用本实施例提供的预设分类模型进行分类，抑或是用户认为存储的图片的分类类别与图片的实际类别存在偏差，则用户可以下发指令以对终端相册中的图片进行分类；在对终端相册中的图片进行分类时，可以是一键指令实现对终端相册中的所有图片进行分类，也可以是由用户手动勾选所需进行分类的图片。本实施例的图片分类方法可以应用于图片智能分类、云端图片识别等使用场景。s202：根据预设分类模型对图片的类别进行分析，得到不同类别，以及属于各类别的概率；预设分类模型可以根据实际需求进行设置，可以采用系统默认设置，也可以由用户选择设置；图片的类别包括但不限于以下情况：运动类、人物类、动物类、食物类、风景类、建筑类、演出类、卡通类、夜景类等。通过分类模型对图片处理后，可以得到图片的类别、以及属于各类别的概率；对于一张图片来说，通过分类模型进行分类后，得到的图片的类别可以有多种，每种都有与之对应的属于该类别的概率，例如参见下表1：表1图片的类别属于该类别的概率aa％bb％cc％dd％ee％……表1中，示出了图片的类别以及与之对应的属于该类别的概率，通过分类模型对图片处理后，得到图片的类别有多种，分别为a、b、c、d、e等，属于类别a的概率为a％，属于类别b的概率为b％，属于类别c的概率为c％，属于类别d的概率为d％，属于类别e的概率为e％。例如一张图片中包含人物、建筑和食物，则在通过分类模型进行分类后，得到的图片的类别可以为人物类、建筑类和食物类，这张图片中，人物所占面积大于建筑所占面积，人物所占面积大于建筑所占面积，是以人物为主的，分类模型给出的结果是属于人物类的概率为40％，属于建筑类的概率为30％，属于食物类的概率为30％。不同的分类模型其性能不尽相同，有的分类模型精准度高，但是处理速度较慢，有的分类模型精准度不是那么的高，但是处理速度较快，本实施例可以根据实际需求确定选用何种分类模型；在本实施例中，可选的，预设分类模型包括兼顾处理速度和精准度的分类器。若是在拍摄过程中，需要分类模型实时对图片的类别进行分析，则会对分类模型的处理速度有一定的要求，要求处理速度要较快，所以在选择分类模型时，需考虑处理速度较快的分类器，同时分类得到的精准度也不能低。s203：获取按照从大到小的顺序进行排列时排名前n的概率；s204：若排名前n的概率均小于预设概率阈值，则至少显示排名前n的概率对应的类别的选择项；s205：将接收到选择操作的选择项作为图片的类别。在本实施例中，n的取值可以根据实际需求进行设置，可以采用系统默认设置，也可以由用户设置；在通过分类模型得出图片的类别以及属于各类别的概率之后，对概率按照从大到小的顺序进行排列；并将排名前n的概率分别与预设概率阈值进行比较，若排名前n的概率的值均小于预设概率阈值，则可以在终端屏幕上显示排名前n的概率对应的类别的选择项，以供用户选择；通过机器对图片分析出来的各个分类类别在较大程度上是可信的，图片的实际分类类别也较大程度上是在排名前n的概率对应的其中一个类别中，所以在排名前n的概率的值均小于预设概率阈值的情况下，在终端屏幕上显示排名前n的概率对应的类别的选择项，用户只需进行选择操作即可，将选中的类别作为该图片的类别进行标记，也即按照用户标记数据对图片进行分类；参见图3，图3中，示出了在终端屏幕上显示某一图片的前5位类别以及分别属于前5位类别的概率的选择项，前5位类别以及分别属于前5位类别的概率包括：属于类别a的概率为a％，属于类别b的概率为b％，属于类别c的概率为c％，属于类别d的概率为d％，属于类别e的概率为e％，用户选择了类别c，则将类别c作为该图片的类别。预设概率阈值可以根据实际需求进行设置，可以采用系统默认设置，也可以由用户设置。参见图4，图4中，示出了终端相册中存储的已经分类好的各个图片，图4中，有4个类别，分别是类别a、类别b、类别c、类别d，类别a下有30张图片，类别b下有25张图片，类别c下有22张图片，类别d下有20张图片。在本实施例中，可选的，在s205将接收到选择操作的选择项作为图片的类别之后，还包括：将接收到选择操作的选择项作为预设分类模型的训练数据，也即上传用户标记的分类信息加入训练集，将其作为提升分类模型效果的有效训练数据，以使后续分类模型在对类似的图片进行分类时，得到的分类结果的准确性更高。在本实施例中，可选的，在s203获取按照从大到小的顺序进行排列时排名前n的概率之后，还包括以下步骤：若排名前n的概率至少一个大于等于预设概率阈值，则将概率值最大的所属的类别作为图片的类别。若有概率大于等于预设概率阈值，则表明与之对应的分类类别比较可靠，若排名前n的概率只有一个是大于等于预设概率阈值的，则将该概率值的所属的类别作为图片的类别；若排名前n的概率有多个是大于等于预设概率阈值的，则将概率值最大的所属的类别作为图片的类别。在本实施例中，可选的，在s203获取按照从大到小的顺序进行排列时排名前n的概率之后，还包括：若排名前n的概率均小于预设概率阈值，还显示除排名前n的概率对应的类别以外的所有类别的选择项。也即，在排名前n的概率均小于预设概率阈值的情况下，除了可以只显示排名前n的概率对应的类别的选择项之外，还可以是显示通过分类模型处理后得到的所有类别的选择项。由于通过分类模型得到的分类结果存在一定的准确性，且排名前n的概率对应的类别相较于除排名前n的概率对应的类别以外的所有类别的准确性更高，所以可以只显示排名前n的概率对应的类别的选择项；而通过分类模型得到的所有分类结果中，虽然除排名前n的概率对应的类别以外的所有类别的概率都不够高，但是仍存在可能性，所以可以将通过分类模型处理后得到的所有类别的选择项进行显示，供用户选择。在本实施例中，可选的，在s205将接收到选择操作的选择项作为图片的类别之前，还包括：检测是否接收到对选择项的选择操作；若是，则进入s205将接收到选择操作的选择项作为图片的类别的步骤；若否，则接收用户手动输入的类别，将用户手动输入的类别作为图片的类别。也即，在终端显示界面除了提供给用户选择项的功能以外，还提供给用户对类别的手动编辑输入功能，将用户手动编辑输入的类别作为图片的类别。可选的，在接收用户手动输入的类别，将用户手动编辑输入的类别作为图片的类别之后，还包括：将接收到用户手动输入的类别作为预设分类模型的训练数据。也即上传用户输入的分类信息加入训练集，将其作为提升分类模型效果的有效训练数据，以使后续分类模型在对类似的图片进行分类时，得到的分类结果的准确性更高。通过本实施例的实施，在对图片进行分类时，在分类类别对应的排名前n的概率均小于预设概率阈值的情况下，引导用户人为选择图片的类别，可以规避后续可能的分类结果错误的情况，符合图片实际的分类类别，分类结果的质量满足用户需求。进一步地，将用户人为选择图片的类别加入训练集，将其作为提升分类模型效果的有效训练数据，以使后续分类模型在对类似的图片进行分类时，得到的分类结果的准确性更高。第二实施例本实施例基于第一实施例给出具体的例子进行进一步说明；本实施例提供一种图片分类方法，参见图5，图5为本实施例提供的一种图片分类方法的基本流程图，该图片分类方法包括以下步骤：s501：采用一个简化的兼顾性能和精准度的分类器，在用户拍照时实时分析图片类别；s502：若分类结果置信度较高，则不作处理；若分类结果置信度偏低(例如通过分类器对图片进行分析后，得到6个分类类别，以及属于每个分类类别的概率；若按照从大到小的顺序进行排列时排名前5的概率均小于预设概率阈值，则表明分类结果置信度偏低)，则弹出分类结果标记指引，引导用户人为对图片类别进行标记；s503：记录标记结果，并按用户标记数据进行分类；同时上传标记信息加入训练集，用以提升分类器效果。通过本实施例的实施，在对图片进行分类时，在分类类别对应的排名前5的概率均小于预设概率阈值的情况下，引导用户人为选择图片的类别，可以规避后续可能的分类结果错误的情况，符合图片实际的分类类别，分类结果的质量满足用户需求。进一步地，将用户人为选择图片的类别加入训练集，将其作为提升分类器效果的有效训练数据，以使后续分类器在对类似的图片进行分类时，得到的分类结果的准确性更高。第三实施例为了解决现有技术中在导航软件长时间运行时，终端发热，且终端耗电很快的问题，本实施例提供一种终端，参见图6，图6为本实施例提供的一种终端的示意图，该终端包括处理器601、存储器602及通信总线603，其中：通信总线603用于实现处理器601和存储器602之间的连接通信；处理器601用于执行存储器602中存储的一个或多个程序，以实现第一实施例、和/或第二实施例中图片分类方法的步骤。本实施例提供一种计算机可读存储介质，计算机可读存储介质存储有一个或者多个程序，一个或者多个程序可被一个或者多个处理器执行，以实现第一实施例、和/或第二实施例中图片分类方法的步骤。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例的方法。以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的
技术领域：
，均同理包括在本发明的专利保护范围内。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓博
技术所有人：努比亚技术有限公司
我是此专利的发明人

上一篇：一种基于单片机的可穿戴智能温控发热装置的制作方法
上一篇：一种线束管固定装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。