图像主体区域的识别方法及装置的制造方法_4

文档序号：8259582阅读：来源：国知局

的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0067]在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPR0M或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
[0068]应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。
[0069]本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0070]此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0071]上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
【主权项】
1.一种图像主体区域的识别方法，其特征在于，包括: 接收待识别的图像，并从所述图像中提取候选主体区域；对所提取到的候选主体区域中的非主体区域进行排除，以获得目标候选主体区域，并对所述目标候选主体区域进行调整和分类，以获得至少一个目标候选主体区域集合；以及对每个目标候选主体区域集合中的目标候选主体区域合并，以识别出所述图像的主体区域。
2.根据权利要求1所述的方法，其特征在于，所述对所提取到的候选主体区域中的非主体区域进行排除，包括: 使用不同级别的分类器对所提取到的候选主体区域进行识别，以排除所述非主体区域。
3.根据权利要求1所述的方法，其特征在于，所述对所述目标候选主体区域进行调整，包括: 针对每个目标候选主体区域，根据主体和当前目标候选主体区域之间的大小关系和位置关系对所述当前目标候选主体区域进行缩放处理和/或平移处理。
4.根据权利要求3所述的方法，其特征在于，所述对所述目标候选主体区域进行分类，包括: 获得调整前和调整后的每个目标候选主体区域的评分和所属的类别，并根据同一类别中目标候选主体区域的评分对对应的目标候选主体区域进行排序，并根据排序结果获得所述目标候选主体区域集合。
5.根据权利要求1所述的方法，其特征在于，所述对每个目标候选主体区域集合中的目标候选主体区域进行合并，以识别出所述图像的主体区域，包括: 根据目标候选主体区域之间的大小关系及位置关系对目标候选主体区域进行合并。
6.一种图像主体区域的识别装置，其特征在于，包括: 提取模块，用于接收待识别的图像，并从所述图像中提取候选主体区域；处理模块，用于对所提取到的候选主体区域中的非主体区域进行排除，以获得目标候选主体区域，并对所述目标候选主体区域进行调整和分类，以获得至少一个目标候选主体区域集合；以及合并模块，用于对每个目标候选主体区域集合中的目标候选主体区域合并，以识别出所述图像的主体区域。
7.根据权利要求6所述的装置，其特征在于，所述处理模块，具体用于: 使用不同级别的分类器对所提取到的候选主体区域进行识别，以排除所述非主体区域。
8.根据权利要求6所述的装置，其特征在于，所述处理模块，具体用于: 针对每个目标候选主体区域，根据主体和当前目标候选主体区域之间的大小关系和位置关系对所述当前目标候选主体区域进行缩放处理和/或平移处理。
9.根据权利要求8所述的装置，其特征在于，所述处理模块，还用于: 获得调整前和调整后的每个目标候选主体区域的评分和所属的类别，并根据同一类别中目标候选主体区域的评分对对应的目标候选主体区域进行排序，并根据排序结果获得所述目标候选主体区域集合。
10.根据权利要求6所述的装置，其特征在于，所述合并模块，具体用于:根据目标候选主体区域之间的大小关系及位置关系对目标候选主体区域进行合并。
【专利摘要】本发明提供了一种图像主体区域的识别方法及装置，其中，该方法包括：接收待识别的图像，并从图像中提取候选主体区域；对所提取到的候选主体区域中的非主体区域进行排除，以获得目标候选主体区域，并对目标候选主体区域进行调整和分类，以获得至少一个目标候选主体区域集合；以及对每个目标候选主体区域集合中的目标候选主体区域合并，以识别出图像的主体区域。本发明实施例的提供的图像主体区域的识别方法及装置，可以准确地获得图像的主体区域，且可以从包含多个主体的图像中识别出多个主体对应的主体区域。
【IPC分类】G06K9-62, G06K9-66, G06T7-60, G06F17-30
【公开号】CN104573715
【申请号】CN201410850511
【发明人】陈世佳, 李旭斌, 文石磊, 余轶南
【申请人】百度在线网络技术（北京）有限公司
【公开日】2015年4月29日
【申请日】2014年12月30日

完整全部详细技术资料下载

当前第4页1 2 3 4